Saturday 28 October 2017

Glidande Medelvärde Arima Modell


Autoregressive Integrated Moving Average - ARIMA. DEFINITION av Autoregressive Integrated Moving Average - ARIMA. A Statistisk analysmodell som använder tidsseriedata för att förutsäga framtida trender Det är en form av regressionsanalys som syftar till att förutsäga framtida rörelser längs den till synes slumpmässiga promenad som lagras Och den finansiella marknaden genom att undersöka skillnaderna mellan värden i serien istället för att använda de faktiska datavärdena. Lags av de olika serierna kallas autoregressiva och lags inom prognostiserad data kallas glidande medelvärde. BREAKA NED Autoregressivt integrerat rörligt medelvärde - ARIMA. Denna modelltyp betecknas generellt ARIMA p, d, q, med heltal som hänvisar till de autogegressiva integrerade och glidande delarna av datasatsen, respektive med ARIMA-modellering kan hänsyn tas till trender, säsongscykler, fel och icke-stationära Aspekter av en dataset när man gör prognoser. Introduktion till ARIMA nonseasonal models. ARIMA p, d, q forec Asting-ekvation ARIMA-modeller är i teorin den mest generella klassen av modeller för prognoser för en tidsserie som kan göras stationär genom differentiering om det behövs, kanske i samband med olinjära transformationer såsom loggning eller avflöde om nödvändigt En slumpmässig variabel som är En tidsserie är stillastående om dess statistiska egenskaper är konstanta över tiden En stationär serie har ingen trend, dess variationer runt dess medelvärde har en konstant amplitud och det vinklar på ett konsekvent sätt dvs dess korta slumpmässiga tidsmönster ser alltid ut I statistisk mening Det sistnämnda tillståndet betyder att dess autokorrelationer korrelationer med sina egna tidigare avvikelser från medelvärdet förblir konstanta över tiden eller likvärdigt att dess effektspektrum förblir konstant över tiden. En slumpmässig variabel i denna form kan ses som vanligt som en kombination Av signal och brus, och signalen om man är uppenbar kan vara ett mönster av snabb eller långsam medelbackning eller sinusformig oscillat jon eller snabb växling i tecken och det kan också ha en säsongskomponent. En ARIMA-modell kan ses som ett filter som försöker skilja signalen från bruset och signalen extrapoleras sedan in i framtiden för att få prognoser. ARIMA Prognoser ekvation för en stationär tidsserie är en linjär dvs regressionstypsekvation där prediktorerna består av lags av den beroende variabeln och eller lags av prognosfel som är. Predicted value of Y är en konstant och eller en vägd summa av en eller Senaste värdena på Y och eller en vägd summa av en eller flera nya värden av felen. Om prediktorerna endast består av fördröjda värden på Y är det en ren självregressiv självregresserad modell, vilket bara är ett speciellt fall av en regressionsmodell Och som kan vara utrustad med standard regressionsprogramvara Till exempel är en första-ordningsautoregressiv AR1-modell för Y en enkel regressionsmodell där den oberoende variabeln bara Y är försenad med en period LAG Y, 1 i Statgraphics eller Y LAG1 i RegressIt Om en del av prediktorerna är felaktiga, är en ARIMA-modell inte en linjär regressionsmodell, eftersom det inte går att ange det senaste periodens fel som en oberoende variabel, måste felen beräknas under en period till - periodsbasis när modellen är anpassad till data Tekniskt sett är problemet med att använda fördröjda fel som prediktorer att modellens förutsägelser inte är linjära funktioner för koefficienterna trots att de är linjära funktioner i tidigare data. Så koefficienter I ARIMA-modeller som innehåller fördröjda fel måste uppskattas genom olinjära optimeringsmetoder bergsklättring snarare än genom att bara lösa ett system av ekvationer. Akronymet ARIMA står för auto-regressivt integrerat rörligt medelvärde. Lags av den stationära serien i prognosen ekvationen kallas auto-regressiva Villkor, lags av prognosfel kallas glidande medelvärden, och en tidsserie som behöver differentieras för att göras stationär sägs vara en inte Riven version av en stationär serie Slumpmässiga och slumpmässiga modeller, autoregressiva modeller och exponentiella utjämningsmodeller är alla speciella fall av ARIMA-modeller. En icke-sasonlig ARIMA-modell klassificeras som en ARIMA p, d, q modell, where. p är Antalet autoregressiva termer. d är antalet icke-säsongsskillnader som behövs för stationaritet, ochqq är antalet fördröjda prognosfel i prediktionsekvationen. Prognosekvationen är konstruerad enligt följande. Först, låt y beteckna den andra skillnaden i Y Vilket betyder. Notera att den andra skillnaden i Y d2 fallet inte är skillnaden från 2 perioder sedan. Det är snarare den första skillnaden-av-första skillnaden som är den diskreta analogen av ett andra derivat, dvs den lokala Acceleration av serien i stället för den lokala trenden. När det gäller y är den allmänna prognostiseringsekvationen här. De rörliga genomsnittsparametrarna s definieras så att deras tecken är negativa i ekvationen, enligt konventionen införd av Box och Jen kins Några författare och programvara inklusive R-programmeringsspråket definierar dem så att de har plustecken i stället När faktiska siffror är anslutna till ekvationen finns det ingen tvetydighet, men det är viktigt att veta vilken konvention din programvara använder när du läser utmatningen Ofta betecknas parametrarna där av AR 1, AR 2 och MA 1, MA 2 etc. För att identifiera lämplig ARIMA-modell för Y börjar du genom att bestämma ordningen för differentiering d behöver stationera serien och ta bort bruttoegenskaperna Av säsongsmässighet, kanske i kombination med en variansstabiliserande transformation som loggning eller deflatering Om du slutar vid denna punkt och förutsäger att den olika serien är konstant, har du bara monterat en slumpmässig promenad eller slumpmässig trendmodell. Dock kan den stationära serien fortfarande Har autokorrelerade fel, vilket tyder på att ett antal AR-termer p 1 och eller några nummer MA termer q 1 också behövs i prognosförhållandet. Processen att bestämma th e-värdena p, d och q som är bäst för en given tidsserie kommer att diskuteras i senare avsnitt i anteckningarna vars länkar finns högst upp på denna sida, men en förhandsgranskning av några av de typer av icke-säsongsbaserade ARIMA-modeller som är Vanligast stöttas nedan. ARIMA 1,0,0 första ordningens autoregressiva modell om serien är stationär och autokorrelerad, kanske det kan förutsägas som ett flertal av sitt eget tidigare värde plus en konstant. Den prognosekvation i detta fall är. vilken är Y regresserad i sig själv fördröjd med en period Detta är en ARIMA 1,0,0 konstant modell Om medelvärdet av Y är noll, skulle den konstanta termen inte inkluderas. Om lutningskoefficienten 1 är positiv och mindre än 1 i storleken måste den vara mindre än 1 i storleksordningen om Y är stationär, beskriver modellen medelåterkallande beteende där nästa period s-värde bör förutses vara 1 gånger så långt bort från medelvärdet som detta period s-värde Om 1 är negativ, det förutspår medelåterkallande beteende med teckenbyte S, dvs det förutspår också att Y kommer att ligga under den genomsnittliga nästa perioden om det ligger över medelvärdet i denna period. I en andraordens autregressiv modell ARIMA 2,0,0 skulle det finnas en Y t-2 term till höger Beroende på tecknen och storlekarna på koefficienterna, kan en ARIMA 2,0,0-modell beskriva ett system vars genomsnittliga reversering sker på ett sinusformigt oscillerande sätt, som en massans rörelse på en fjäder som är utsatt för slumpmässiga shocks. ARIMA 0,1,0 slumpmässig promenad Om serien Y inte är stationär är den enklaste möjliga modellen för den en slumpmässig promenadmodell, vilken kan betraktas som ett begränsande fall av en AR 1-modell där den autogegrativa Koefficienten är lika med 1, dvs en serie med oändligt långsam medelvärde. Förutsägningsekvationen för denna modell kan skrivas as. where den konstanta termen är den genomsnittliga period-to-period-förändringen dvs den långsiktiga driften i Y Denna modell kan monteras som en icke-avlyssningsregressionsmodell där den första skillnaden i Y är d Ependent variabel Eftersom den endast innehåller en nonseasonal skillnad och en konstant term, klassificeras den som en ARIMA 0,1,0 modell med konstant. Den slumpmässiga walk-without-drift modellen skulle vara en ARIMA 0,1,0 modell utan konstant. ARIMA 1,1,0-differensierad första ordningsautoregressiv modell Om felen i en slumpmässig promenadmodell är autokorrelerad kanske problemet kan lösas genom att lägga en lag av den beroende variabeln i prediksionsekvationen - dvs genom att regressera den första skillnaden i Y i sig fördröjdes med en period. Detta skulle ge följande förutsägelsekvation. Det kan omordnas till. Det här är en första-orders autoregressiv modell med en ordning av icke-säsongsskillnader och en konstant term, dvs en ARIMA 1,1,0-modell. ARIMA 0,1,1 utan konstant enkel exponentiell utjämning En annan strategi för att korrigera autokorrelerade fel i en slumpmässig gångmodell föreslås av den enkla exponentiella utjämningsmodellen. Kom ihåg att för vissa icke-stationära tidsserier, t ex de som uppvisar bullrig fluss Tuations runt ett långsamt varierande medel, slumpmässig promenadmodellen utövar inte lika bra som ett glidande medelvärde av tidigare värden. Med andra ord, snarare än att ta den senaste observationen som prognosen för nästa observation, är det bättre att använda ett genomsnitt Av de sista observationerna för att filtrera bort bullret och mer exakt uppskatta det lokala medelvärdet. Den enkla exponentiella utjämningsmodellen använder ett exponentiellt vägt rörligt medelvärde av tidigare värden för att uppnå denna effekt. Förutsättningsekvationen för den enkla exponentiella utjämningsmodellen kan skrivas in Ett antal matematiskt ekvivalenta former, varav en är den så kallade felkorrigeringsformen, där den föregående prognosen justeras i riktning mot det fel som det gjorde. Eftersom e-1 Y t-1 - t-1 per definition, Detta kan skrivas om som en ARIMA 0,1,1-utan konstant prognosförening med 1 1 - Det betyder att du kan passa en enkel exponentiell utjämning genom att ange den som en ARIMA 0,1,1-modell utan att Stant och den uppskattade MA 1-koefficienten motsvarar 1-minus-alfa i SES-formeln. Minns att i SES-modellen är den genomsnittliga åldern för data i de 1-framåtprognoser 1 som innebär att de tenderar att ligga kvar trender eller vändpunkter med cirka 1 period. Det följer att den genomsnittliga åldern för data i de 1-framåtprognoserna för en ARIMA 0,1,1-utan konstant modell är 1 1 - 1 Så, till exempel om 1 0 8, medelåldern är 5 När 1 närmar sig 1 blir ARIMA 0,1,1-utan konstant modell ett mycket långsiktigt rörligt medelvärde, och när 1 närmar sig 0 blir det en slumpmässig promenad utan drift Modell. Vilket är det bästa sättet att korrigera för autokorrelation som lägger till AR-termer eller lägga till MA-termer I de tidigare två modellerna som diskuterats ovan fixades problemet med autokorrelerade fel i en slumpmässig promenadmodell på två olika sätt genom att lägga till ett fördröjt värde av de olika Serie till ekvationen eller lägga till ett fördröjt värde av prognosfelet Vilket tillvägagångssätt är bäst En tumregel för denna s ituation, som kommer att diskuteras mer i detalj senare, är att positiv autokorrelation vanligtvis behandlas bäst genom att addera en AR-term till modellen och negativ autokorrelation behandlas vanligtvis bäst genom att lägga till en MA-term i affärs - och ekonomiska tidsserier, negativ autokorrelation ofta Uppstår som en artefakt av differentiering I allmänhet minskar differentieringen positiv autokorrelation och kan till och med orsaka en växling från positiv till negativ autokorrelation Således används ARIMA 0,1,1-modellen, i vilken skillnad åtföljs av en MA-term, oftare än en ARIMA 1,1,0 modell. ARIMA 0,1,1 med konstant enkel exponentiell utjämning med tillväxt Genom att implementera SES-modellen som en ARIMA-modell får du viss flexibilitet. För det första får den uppskattade MA 1-koefficienten vara negativ detta motsvarar en utjämningsfaktor som är större än 1 i en SES-modell, vilket vanligtvis inte är tillåtet med SES-modellproceduren. För det andra har du möjlighet att inkludera en konstant term i t Han ARIMA-modell om du vill, för att uppskatta en genomsnittlig icke-noll-trend. ARIMA 0,1,1-modellen med konstant har förutsägelsesekvationen. Prognoserna för en period framåt från denna modell är kvalitativt lik SES modell, förutom att banan för de långsiktiga prognoserna typiskt är en sluttande linje vars lutning är lika med mu snarare än en horisontell linje. ARIMA 0,2,1 eller 0,2,2 utan konstant linjär exponentiell utjämning Linjära exponentiella utjämningsmodeller är ARIMA-modeller som använder två icke-säsongsskillnader i samband med MA-termer. Den andra skillnaden i en serie Y är inte bara skillnaden mellan Y och sig självfördröjt med två perioder, men snarare är det den första skillnaden i den första skillnaden - förändringen - in-förändringen av Y vid period t Således är den andra skillnaden hos Y vid period t lika med Y t-Y t-1-Y t-1-Y t-2 Y t-2Y t-1 Y t -2 En andra skillnad av en diskret funktion är analog med ett andra derivat av en kontinuerlig funktion som den mäter Res accelerationen eller krökningen i funktionen vid en given punkt i tiden. ARIMA 0,2,2-modellen utan konstant förutspår att den andra skillnaden i serien motsvarar en linjär funktion av de två sista prognosfelen. Som kan omordnas som. Där 1 och 2 är MA 1 och MA 2-koefficienterna Detta är en generell linjär exponentiell utjämningsmodell som är väsentligen densamma som Holt s-modellen och Brown s-modellen är ett speciellt fall. Det använder exponentiellt vägda glidmedel för att uppskatta både en lokal nivå och en lokal trend i serien De långsiktiga prognoserna från denna modell konvergerar till en rak linje vars lutning beror på den genomsnittliga trenden som observerats mot slutet av serien. ARIMA 1,1,2 utan konstant fuktad trend linjär exponentiell utjämning. Denna modell illustreras i de bifogade bilderna på ARIMA-modellerna. Den extrapolerar den lokala trenden i slutet av serien men plattar ut på längre prognoshorisonter för att presentera en konservatismeddelande, en övning som har empirisk stöd Se artikeln om Why the Damped Trend fungerar av Gardner och McKenzie och Golden Rule-artikeln från Armstrong et al för detaljer. Det är i allmänhet lämpligt att hålla sig till modeller där minst en av p och q inte är större än 1, det vill säga Försök inte passa in i en modell som ARIMA 2,1,2 eftersom det här sannolikt kommer att leda till överfitting och commonfactorproblem som diskuteras mer i detalj i anteckningarna om den matematiska strukturen för ARIMA-modeller. som de beskrivna ovan är enkla att implementera på ett kalkylblad. Förutsägningsekvationen är helt enkelt en linjär ekvation som hänvisar till tidigare värden av ursprungliga tidsserier och tidigare värden av felen. Således kan du ställa in ett ARIMA prognosräkningsblad genom att lagra data i kolumn A, prognosformeln i kolumn B och feldata minus prognoserna i kolumn C Förutsättningsformeln i en typisk cell i kolumn B skulle helt enkelt vara ett linjärt uttryck som hänvisar till värden i föregående rader av kolumnerna A och C Multipliceras med lämpliga AR - eller MA-koefficienter som lagras i cellerna någon annanstans på kalkylbladet. A RIMA står för autoregressiva integrerade rörliga genomsnittsmodeller Univariate single vector ARIMA är en prognosteknik som projekterar framtida värden för en serie baserad helt på egen tröghet. Den huvudsakliga Ansökan ligger inom korttids prognos som kräver minst 40 historiska datapunkter Det fungerar bäst när dina data uppvisar ett stabilt eller konsekvent mönster över tiden med en minimal mängd avvikare Ibland kallas Box-Jenkins efter de ursprungliga författarna, är ARIMA vanligtvis överlägsen Till exponentiella utjämningstekniker när data är relativt långa och korrelationen mellan tidigare observationer är stabil Om data är korta eller mycket volatila, kan en viss utjämningsmetod fungera bättre Om du inte har minst 38 datapunkter bör du överväga några andra metod än ARIMA. Det första steget i att tillämpa ARIMA-metodiken är att kontrollera stationäritet. Stationaritet imp ligger att serien förblir på en ganska konstant nivå över tiden Om det finns en trend, som i de flesta ekonomiska eller affärsapplikationer, så är dina data INTE stationära. Datan ska också visa en konstant varians i sina fluktuationer över tid. Detta syns lätt med en Serier som är väldigt säsongsbetonade och växer i snabbare takt. I så fall blir uppgångarna och nedgångarna i säsongsmässigheten mer dramatiska över tiden. Utan att dessa stationära förhållanden är uppfyllda kan många av beräkningarna i samband med processen inte beräknas. Om en grafisk plot av data indikerar icke-stationaritet, då ska du skilja skillnaden i serien. Differensiering är ett utmärkt sätt att omvandla en icke-stationär serie till en stationär en. Detta görs genom att subtrahera observationen i den aktuella perioden från föregående. Om denna omvandling görs enbart en gång till en serie säger du att uppgifterna först har avvikits. Denna process eliminerar i huvudsak trenden om din serie växer i en fairl y konstant ränta Om den växer i ökande takt kan du tillämpa samma procedur och skillnad data igen. Dina uppgifter skulle då bli annorlunda. Autokorrelationer är numeriska värden som indikerar hur en dataserie är relaterad till sig själv över tiden Mer precist mäter det hur starkt datavärdena vid ett visst antal perioder i varandra är korrelerade till varandra över tiden Antalet perioder ibland kallas vanligtvis lagret För Exempelvis mäter en autokorrelation vid lag 1 hur värdena 1 period från varandra korreleras med varandra i serien. En autokorrelation vid lag 2 mäter hur data två perioder i varandra korreleras genom serien. Autokorrelationer kan sträcka sig från 1 till -1 Ett värde nära 1 indikerar en hög positiv korrelation medan ett värde nära -1 innebär en hög negativ korrelation Dessa mätningar utvärderas oftast genom grafiska plottar som kallas korrelagram. Ett korrelagram avbildar autokorrelationsvärdena för en given serie på olika nivåer. Detta kallas autokorrelationsfunktionen och är mycket viktigt i ARIMA-metoden. ARIMA-metoden försöker beskriva rörelserna i en stationära tidsserier som en funktion av vad som kallas autoregressiva och rörliga genomsnittsparametrar. Dessa kallas AR-parametrar, autogegsiva och MA-parametrar som rör medeltal. En AR-modell med endast 1 parameter kan skrivas som. var X t-tidsserier som undersöks. A 1 Den autoregressiva parametern i ordning 1.X t-1 tidsserien lagrade 1 period. E t felet i modellen. Detta innebär helt enkelt att vilket givet värde Xt som helst kan förklaras med någon funktion av sitt tidigare värde, X t - 1, plus något oförklarligt slumpmässigt fel, E t Om det uppskattade värdet på A 1 var 30, skulle serievärdet nu vara relaterat till 30 av dess värde 1 period sedan Naturligtvis skulle serien kunna relateras till mer än bara Ett förflutet värde. Exempelvis. X t A 1 X t-1 A 2 X t-2 E t. Detta indikerar att det aktuella värdet av serien är en kombination av de två omedelbart föregående värdena, X t-1 och X t - 2, plus lite slumpmässigt fel E t Vår modell är nu en autoregressiv modell av ordning 2.Moving Aver Åldersmodeller. En andra typ av Box-Jenkins-modell kallas en rörlig genomsnittsmodell. Även om dessa modeller ser väldigt ut som AR-modellen är konceptet bakom dem ganska olika. Rörande genomsnittsparametrar relaterar vad som händer i period t endast till de slumpmässiga fel som inträffade under tidigare tidsperioder, dvs E t-1, E t-2, etc snarare än till X t-1, X t-2, Xt-3 som i de autoregressiva metoderna. En rörlig genomsnittsmodell med en MA-term kan skrivas Som följer. Termen B 1 kallas en MA i ordning 1 Negativt tecken framför parametern används endast för konventionellt och skrivs vanligen automatiskt ut av de flesta datorprogram. Ovanstående modell säger helt enkelt att ett givet värde av X t är direkt relaterat endast till det slumpmässiga felet i föregående period, E t-1, och till den aktuella felperioden, E t Som i fall av autregressiva modeller kan de rörliga genomsnittsmodellerna utvidgas till högre orderstrukturer som täcker olika kombinationer Och glidande medellängder. ARIMA metodologi als o tillåter modeller att byggas som innehåller både autoregressiva och glidande medelparametrar tillsammans. Dessa modeller kallas ofta som blandade modeller. Även om detta ger ett mer komplicerat prognosverktyg kan strukturen verkligen simulera serien bättre och producera en mer exakt prognos. Rena modeller antyder att strukturen bara består av AR - eller MA-parametrar - inte båda. Modellerna som utvecklas genom denna metod kallas vanligtvis ARIMA-modeller eftersom de använder en kombination av autoregressiv AR, integration I - hänvisar till omvänd process för differentiering för att producera prognosen, och flyttande genomsnittliga MA-operationer En ARIMA-modell anges vanligtvis som ARIMA p, d, q Detta representerar ordningen för de autogegrativa komponenterna p, antalet differeneringsoperatörer d och den högsta ordningen av den glidande medelfristen. Exempelvis ARIMA 2, 1,1 betyder att du har en andra ordningsautoregressiv modell med en första ordning som rör den genomsnittliga komponenten vars serie har differentierats onc e för att inducera stationaritet. Att hitta rätt specifikation. Huvudproblemet i klassiska Box-Jenkins försöker bestämma vilken ARIMA-specifikation som ska användas - hur många AR - och MA-parametrar som ska inkluderas. Detta är vad mycket av Box-Jenkings 1976 ägde rum åt Identifieringsprocessen Det berodde på grafisk och numerisk utvärdering av provautokorrelationen och partiella autokorrelationsfunktionerna. För dina grundläggande modeller är uppgiften inte för svår. Varje har autokorrelationsfunktioner som ser på ett visst sätt Men när du går upp i komplexitet , Mönstren är inte så lätt detekterade För att göra det svårare, representerar dina data bara ett urval av den underliggande processen. Det betyder att provtagningsfelsutjämnare, mätfel mm kan snedvrida den teoretiska identifieringsprocessen. Därför är traditionell ARIMA-modellering en konst Snarare än en vetenskap.

No comments:

Post a Comment