Autoregresywno Ruchomy Średni W R
Wprowadzenie do modeli nierównomiernych ARIMA. RAZDA ARIMA Procesy prognozowania Modele ARIMA są, teoretycznie, najbardziej ogólną klasą modeli prognozowania szeregów czasowych, które mogą być stacjonarne poprzez różnicowanie w razie konieczności, być może w połączeniu z transformacjami nieliniowymi takie jak rejestrowanie lub deflacja w razie potrzeby Zmienna losowa, która jest szeregiem czasowym, jest stacjonarna, jeśli jej właściwości statystyczne są stałe w czasie A stacjonarne serie nie mają tendencji, jej wahania wokół jej średniej mają stałą amplitudę i poruszają się w spójny sposób tzn. krótkoterminowe wzorce czasu losowego zawsze wyglądają identycznie w sensie statystycznym. Ten ostatni warunek oznacza, że jego korelacje autokorelacji z własnymi wcześniejszymi odchyleniami od średniej pozostają niezmienne w czasie lub równoważnie, że jego widmo mocy pozostaje stałe w czasie A losowo zmienna tego formularza może być postrzegana jako zwykła kombinacja sygnału i hałasu, a sygnał, jeśli jest widoczny, może być patt ern szybkiego lub powolnego przecięcia średniego lub oscylacji sinusoidalnej lub szybkiej zmiany na znaku, a także może mieć składnik sezonowy. Model ARIMA może być postrzegany jako filtr, który próbuje oddzielić sygnał od hałasu, a następnie sygnał ekstrapolowane w przyszłość w celu uzyskania prognoz. Równanie ARIMA dla serii czasów stacjonarnych jest liniowym równaniem regresji typu, w którym predykatory składają się z opóźnień zmiennej zależnej i opóźnień prognozowanych stała lub ważona suma jednej lub kilku ostatnich wartości Y i lub ważonej sumy jednej lub więcej wartości błędów. Jeśli predykatory składają się tylko z opóźnionych wartości Y, jest to czysty, autoregresywny samoregulowany model, która jest tylko specjalnym przypadkiem modelu regresji i może być wyposażona w standardowe oprogramowanie regresyjne Na przykład, autoregresywny model AR1 dla pierwszego rzędu jest prostym modelem regresji, w którym zmienna niezależna i s tylko Y z opóźnieniem o jeden okres LAG Y, 1 w Statgraphics lub YLAG1 w RegressIt Jeśli niektóre predykatory są błędami, model ARIMA nie jest modelem regresji liniowej, ponieważ nie ma sposobu na określenie błędu ostatniego okresu jako niezależna zmienna błędy muszą być obliczane okresowo, gdy model jest dopasowany do danych Z technicznego punktu widzenia, problem z wykorzystaniem opóźnionych błędów jako predykcyjnych jest taki, że przewidywania modelu nie są funkcjami liniowymi współczynniki, nawet jeśli są to liniowe funkcje poprzednich danych Więc współczynniki w modelach ARIMA, które zawierają opóźnione błędy, należy oszacować przez nieliniowe metody optymalizacyjne, a nie po prostu rozwiązać system równań. Akronim ARIMA oznacza automatyczną regresywną integrację Przenoszenie średnich opóźnień szeregów stacjonarnych w równaniu prognozowania nazywa się terminami autoregresywnymi, opóźnienia w błędach prognozują nazywane są średnie ruchome i serie czasowe, które muszą być rozróżniana stacjonarnie mówi się, że jest zintegrowaną wersją stacjonarnych modeli losowych i przypadkowych modeli, modeli autoregresji i wykładniczych modeli wygładzania są szczególnymi przypadkami modeli ARIMA. Niedemysłowy model ARIMA jest klasyfikowany jako ARIMA p, d, q model, gdzie. p jest liczbą terminów autoregresji. d jest liczbą nierównomiernych różnic potrzebnych do stacjonarności, a. q jest liczbą opóźnionych błędów prognozy w równaniu predykcyjnym. Równanie prognozowania jest skonstruowane w następujący sposób Po pierwsze, niech y oznacza dt różnicę Y, która oznacza. Zwróć uwagę, że druga różnica Y przypadku d2 nie różni się od 2 okresów temu Raczej, jest pierwszą różniczką pierwszej różnicy dyskretny analog drugiej pochodnej, tzn. lokalne przyspieszenie szeregu, a nie jego lokalny trend. Jeśli chodzi o y, to ogólne równanie prognozowania jest tutaj. Tutaj poruszają się średnie parametry s tak, że ich znaki są ujemne w eq po konwencji wprowadzonej przez Box i Jenkins Niektórzy autorzy i oprogramowanie, w tym język programowania R, definiują je tak, że mają znaki plus Gdy faktyczne liczby są podłączone do równania, nie ma niejasności, ale ważne jest, aby wiedzieć, która konwencja używanie oprogramowania podczas odczytywania danych wyjściowych Często parametry są oznaczone przez AR 1, AR 2, i MA 1, MA 2 itd. Aby zidentyfikować odpowiedni model ARIMA dla Y, rozpoczyna się od określenia kolejności różnicowania wymagających stacjonować serie i usunąć cechy brutto sezonowości, być może w połączeniu z transformacją stabilizującą wahania, taką jak rejestrowanie lub deflacja Jeśli zatrzymasz się w tym punkcie i przewidujesz, że zróżnicowane serie są stałe, masz tylko dopasowany losowy chód lub losowo model tendencji Jednak stacjonarne serie mogą wciąż mieć błędy autokorelacyjne, co sugeruje, że potrzebna jest pewna liczba terminów AR1 i / lub niektórych numerów macierzystych q1 w równaniu prognozowania. Proces wyznaczania wartości p, d i q najlepszych dla danej serii czasowej zostanie omówiony w dalszych sekcjach notatek, których łącza są u góry tej strony, ale podgląd niektórych typów niejednorodnych modeli ARIMA, które są powszechnie spotykane, jest podane poniżej. Model autouzstelacji o pierwszoplanowym poziomie 1,0,0 pierwszego rzędu, jeśli seria jest stacjonarna i autokorelowana, być może można ją przewidzieć jako wielokrotność swojej poprzedniej wartości, plus stała Równanie prognozowania w tym przypadku jest to, co jest regresowane przez siebie na pewien czas opóźnione przez jeden okres Jest to stały model ARIMA 1,0,0 Jeśli średnia Y jest równa zeru, wówczas nie będzie uwzględnione określenie stałe. Jeśli nachylenie współczynnik 1 jest dodatni i mniejszy niż 1 na wielkość musi być mniejszy niż 1 w skali, jeśli Y jest nieruchoma, model opisuje zachowanie średniego zwrotu, w którym wartość następnego okresu powinna być przewidziana 1 razy daleko od średniej ta wartość okresu Jeśli 1 jest ujemna, to przewiduje zachowanie średnie z odwróceniami oznaczeń, tzn. przewiduje również, że Y będzie poniżej średniego następnego okresu, jeśli jest powyżej średniej tego okresu. W modelu autoregresji drugiego rzędu ARIMA 2,0,0 będzie Y t-2 po prawej, a tak dalej W zależności od oznakowania i wielkości współczynników, model ARIMA 2,0,0 może opisywać system, którego średnie odwrócenie zachodzi w sinusoidalnie oscylujący sposób, podobnie jak ruch masy na sprężynie poddawanej przypadkowemu wstrząsowi. ARIMA 0,1,0 przypadkowy spacer Jeśli seria Y nie jest stacjonarna, najprostszym modelem jest model przypadkowego spaceru, który może być uważany za ograniczający przypadek model AR1, w którym współczynnik autoregresji jest równy 1, tj. seria z nieskończenie powolnym średnim odwróceniem Współczynnik predykcji dla tego modelu może być zapisany jako. gdzie stały termin to średnia zmiana między okresem, tj. długoterminowa dryft w Y Ten model może być zamontowany jako niekontrolowany model graniczny, w którym pierwsza różnica Y jest zmienną zależną Ponieważ uwzględnia ona jedynie różnicę pozaserwową i okres stały, jest on klasyfikowany jako model ARIMA 0,1,0 ze stałą Model przypadkowego chodu bez modelu model ARIMA 0,1,0 bez stałej. ARIMA 1,1,0 zróżnicowany model autoregresji pierwszego rzędu Jeśli błędy modelu losowego spaceru są autokorelowane, być może problem może zostać rozwiązany przez dodanie jednego opóźnienia zmiennej zależnej do równanie predykcji - tzn. przez regresję pierwszej różnicy Y na sobie opóźnionej przez jeden okres Spowodowałoby to poniższe równanie predykcji, które można przestawić na. Jest to model autoregresji pierwszego rzędu z jednym porządkiem nierównomiernego różnicowania i stałym określeniem - model ARIMA 1,1,0.ARIMA 0,1,1 bez stałego prostego wygładzania wykładniczego Inna strategia korygowania błędów autokorelacji w modelu losowego spaceru sugeruje prosty wykładniczy model wygładzania Przypomnijmy, że dla niektórych nieustannych szeregów czasowych np. tych, które wykazują hałaśliwą fluktuacje wokół średniej różniących się powoli, model losowego chodu nie wykonuje się, a także średnia ruchoma poprzednich wartości Innymi słowy, a nie biorąc pod uwagę najnowsze obserwacje jako prognozę następnej obserwacji , lepiej jest użyć średniej z ostatnich kilku obserwacji w celu odfiltrowania szumu i dokładniej oszacować lokalną średnią Prosty model wygładzania wykładniczego wykorzystuje wykładnikowaną ważoną średnią ruchową poprzednich wartości, aby osiągnąć ten efekt. Równanie predykcji dla prosty model wyrównywania wykładów można zapisać w formie matematycznie równoważnych, z których jedna jest tak zwana korekcją błędów, w której poprzednia prognoza jest dostosowywana w kierunku popełnionego błędu. Ponieważ e t-1 Y t - 1 - t-1 z definicji, może być przepisana jako., Co oznacza równanie ARIMA 0,1,1 - bez zachowania stałej prognozy równe 1 1 - Oznacza to, że można zmieścić prostą wykładniczą smoo rzecz biorąc, określając ją jako model ARIMA 0,1,1 bez stałej, a szacowany współczynnik MA1 odpowiada 1-minus-alfa w formule SES Przypomnijmy, że w modelu SES średni wiek danych w 1- prognozy na okres poprzedni 1 oznaczają, że będą one wykazywały tendencję do opóźnienia w trendach lub punktach zwrotnych o około 1 okresy. Wynika z tego, że średni wiek danych w prognozie 1-wyprzedzającej ARIMA 0,1,1 - stałym modelem jest 1 1 - 1 Na przykład, jeśli 1 0 8, średni wiek wynosi 5 Kiedy 1 zbliża się do 1, ARIMA 0,1,1 - bez modelu stałego staje się bardzo długoterminową średnią ruchoma, a jako że 1 podejście 0 staje się modelem losowo-chodnik bez drift. Jest to najlepszy sposób poprawienia autokorelacji dodawania terminów AR lub dodania terminów macierzystych W poprzednich dwóch omawianych modelach problem autokorelacji błędów w modelu przypadkowego spaceru został ustalony na dwa różne sposoby, dodając lagged wartości zróżnicowanych serii do równania lub dodając opóźnioną wartość foreca st error Jakie podejście jest najlepszym Zasadą w tej sytuacji, która zostanie omówiona bardziej szczegółowo później, jest pozytywna autokorelacja najlepiej jest traktowana przez dodanie terminu AR do modelu, a negatywna autokorelacja zwykle jest najlepiej traktowana przez dodając termin MA W serii czasów gospodarczych i gospodarczych, ujemna autokorelacja często pojawia się jako artefakt różnicowania Ogólnie rzecz biorąc, rozróżnienie zmniejsza dodatnią autokorelację, a nawet może powodować przejście z pozytywnej na ujemną autokorelację Więc model ARIMA 0,1,1 w które różni się terminem magisterskim, jest częściej stosowane niż model ARIMA 1,1,0.ARIMA 0,1,1 ze stałym prostym wyrównaniem wykładowym ze wzrostem Dzięki wdrożeniu modelu SES jako modelu ARIMA, rzeczywiście zyskujesz elastyczność Przede wszystkim szacowany współczynnik MA 1 może być ujemny, co odpowiada współczynnikowi wygładzania większym niż 1 w modelu SES, co zwykle nie jest dozwolone w procedurze dopasowania modelu SES Sec Jeśli masz ochotę, możesz oszacować przeciętny trend niezerowy Model ARIMA 0,1,1 ze stałą ma równanie predykcji. Jednorazowe przedłużenie prognozy z tego modelu są jakościowo podobne do modelu SES, z wyjątkiem tego, że trajektoria prognoz długoterminowych jest zazwyczaj linią ukośną, której nachylenie jest równe mu, a nie w linii poziomej. ARIMA 0,2,1 lub 0, 2,2 bez stałego liniowego wygładzania wykładniczego Liniowe modele wygładzania wykładniczego są modelami ARIMA, które wykorzystują dwie nierównomierne różnice w połączeniu z pojęciami drugorzędnymi Druga różnica serii Y to nie tylko różnica między Y i sobą opóźniona przez dwa okresy, ale raczej jest pierwsza różnica pierwszej różnicy - ie zmiana w Y w okresie t Tak więc druga różnica Y w okresie t jest równa Y t - Y t-1 - Y t-1 - Y t-2 Y t-2Y t-1 Y t-2 Drugą różnicą funkcji dyskretnych jest analogou s do drugiej pochodnej funkcji ciągłej mierzy przyspieszenie lub krzywiznę w funkcji w danym punkcie czasowym. Model ARIMA 0,2,2 bez stałej przewiduje, że druga różnica serii jest równa liniowej funkcji ostatniego dwa błędy prognozy, które mogą być przekształcone jako. w 1 i 2 są współczynnikami MA 1 i MA 2 Jest to ogólny linearny wykładniczy wykładnik wykładniczy model wygładzania zasadniczo taki sam jak model Holt, a model Brown's jest szczególnym przypadkiem Używa wykładniczej wagi średnie kroczące w celu oszacowania zarówno poziomu lokalnego, jak i lokalnego trendu Szereg długoterminowych prognoz tego modelu zbliża się do prostej, której nachylenie zależy od średniej tendencji obserwowanej pod koniec serii. ARIMA 1,1,2 bez ciągły trend tłumienia liniowego tłumienia wykładów. Ten model jest zilustrowany na załączonych slajdach w modelach ARIMA. Rozciąga tendencję lokalną na końcu serii, ale spłaszcza ją w dłuższych horyzontach prognoz, aby wprowadzić ote konserwatyzmu, praktyce, która ma empiryczne wsparcie Zobacz artykuł o tym, dlaczego Damped Trend działa przez Gardner i McKenzie oraz artykuł z Golden Rule autorstwa Armstronga i innych o szczegóły. Zazwyczaj zaleca się przyklejenie się do modeli, w których co najmniej jeden z p i q nie jest większa niż 1, tzn. nie próbuj dopasować modelu, takiego jak ARIMA 2,1,2, ponieważ prawdopodobnie doprowadzi to do nadmiernych i ogólnych problemów, które są omówione bardziej szczegółowo w uwagach dotyczących matematyki struktura modeli ARIMA. Implementacja arkuszy ARIMA, takie jak te opisane powyżej, są łatwe do wdrożenia w arkuszu kalkulacyjnym. Równanie predykcji jest po prostu równaniem liniowym, które odnosi się do poprzednich wartości oryginalnych serii czasowych i wartości przeszłych błędów. W ten sposób można skonfigurować arkusz kalkulacyjny ARIMA przez przechowywanie danych w kolumnie A, formuła prognozowania w kolumnie B oraz dane o błędach pomniejszone o prognozy w kolumnie C formuła prognozowania w typowej komórce w kolumnie B będzie po prostu linearnym wyrażeniem n odnosząc się do wartości w poprzednich wierszach kolumn A i C, pomnożonych przez odpowiednie współczynniki AR lub MA przechowywane w komórkach gdzie indziej w arkuszu kalkulacyjnym. Średnia ruch średnia ARMA p, q Modele do analizy serii czasowej - część 3. Jest to trzecia i trzecia ostatni post w mini-serii na autoregresywnych średnich ruchowych modelach ARMA do analizy serii czasowej Wprowadziliśmy modele autoregresji i modele Moving Average w dwóch poprzednich artykułach Teraz nadszedł czas na połączenie ich w celu stworzenia bardziej wyrafinowanego modelu. do modeli ARIMA i GARCH, które pozwolą nam przewidzieć powrót aktywów i przewidywaną zmienność Te modele będą podstawą dla sygnałów handlowych i technik zarządzania ryzykiem. Jeśli przeczytałeś części 1 i 2, zobaczysz, że mamy tendencję do przestrzegania wzorzec dla naszej analizy modelu serii czasowej Powtórzę to krótko tutaj. Uzasadnienie - dlaczego jesteśmy zainteresowani tym konkretnym modelem. Definicja - definicja matematyczna w celu zmniejszenia ambig uity. Correlogram - Plotowanie próbki w celu wizualizacji zachowań modelu. Simulation i Fitting - dopasowanie modelu do symulacji, aby prawidłowo zrozumieć model. Real Financial Data - zastosuj model do rzeczywistych historycznych cen aktywów. Prediction - Prognozuj kolejne wartości do budowania sygnałów handlowych lub filtrów. Aby śledzić ten artykuł, warto zapoznać się z wcześniejszymi artykułami analizy szeregów czasowych. Wszystkie te informacje można znaleźć tutaj. Kryterium informacji w serwisie Bayesian. W części 1 tego artykułu spojrzał na Akaike Information Criterion AIC jako środek pomagający nam wybrać między osobnymi modelami najlepszych serii czasowych. Jednym z ściśle związanych z tym narzędziem jest Bayesian Information Criterion BIC Zasadniczo ma podobne zachowanie wobec AIC, ponieważ karze się modele za zbyt wiele parametrów. może prowadzić do nadmiernego przecięcia Różnica między BIC a AIC polega na tym, że BIC jest bardziej rygorystyczny, a jego karanie dodatkowych parametrów. Bayesian Infor Kryterium. Jeśli bierzemy funkcję prawdopodobieństwa dla modelu statystycznego, który ma k parametry, a L zmaksymalizuje prawdopodobieństwo, wówczas podaje się kryterium informacji Bayesiego. Gdzie n jest liczbą punktów danych w serii czasowej. Będziemy używać AIC i BIC poniżej przy wyborze odpowiednich modeli ARMA p, q. Ljung-Box Test. W części 1 tego artykułu seria Rajan wspomina w komentarzu Disqus, że test Ljung-Box był bardziej odpowiedni niż użycie kryterium informacji Akaike Bayesian Informacje Kryterium przy podejmowaniu decyzji o tym, czy model ARMA był dobry do serii czasowej. Test Ljung-Box jest klasycznym testem hipotezowym, który ma na celu zbadanie, czy zestaw autokorelacji zamodelowanego modelu szeregowego różni się znacznie od zera. nie testuj każdego indywidualnego opóźnienia losowego, ale raczej testuje losowość nad grupą lags. Ljung-Box Test. We definiujemy hipotezę zerową, ponieważ dane z serii czasowej w każdym opóźnieniu to iid, czyli korelacje pomiędzy wartościami serii populacji są zero. Zestawimy alternatywną hipotezę, ponieważ dane z serii czasowej nie są iid i posiadają korelację szeregową. Na podstawie poniższej statystyki testowej Q. W n jest długością próbki serii czasowej, kapelusz k jest próbką autokorelacja w punkcie lag k i h to liczba opóźnień w teście. Reguła decyzyjna, czy odrzucić hipotezę zerową, jest sprawdzenie, czy Q chi 2, dla rozkładu chi-kwadratowego z h stopniami swobody w 100- alfa th percentile. W niektórych szczegółach badania mogą wydawać się nieco skomplikowane, możemy w rzeczywistości użyć R do obliczenia testu dla nas, upraszczając procedurę nieco. Regionalny średniej ruchome ARMA modeli porządku p, q. Now, że omówiliśmy BIC i test Ljung-Box, jesteśmy gotowi omówić nasz pierwszy model mieszany, a mianowicie Autorytarna Średnia Ruchowa P, q lub ARMA p, q. To uznaliśmy procesy autoregresji i przeciętne procesy. uważa własne pa zachowanie jako dane wejściowe modelu i jako takie próby przechwytywania efektów uczestnictwa w rynku, takich jak momentum i średnie odwrócenie obrotu giełdowego. Ten ostatni model wykorzystuje się do scharakteryzowania informacji o szoku w szeregach, takich jak ogłoszenie o zarabianiu niespodzianek lub nieoczekiwane zdarzenie takich jak wyciek ropy naftowej BP Deepwater Horizon. W związku z tym model ARiMR próbuje uchwycić oba te aspekty podczas modelowania serii czasowych finansowych. Zwróć uwagę, że model ARiMR nie uwzględnia klastrowania zmienności, kluczowego zjawiska empirycznego wielu finansowych serii czasowych nie jest warunkowo heteroskopowatym modelem Ponieważ musimy poczekać na modele ARCH i GARCH. Model ARMA p, q jest liniową kombinacją dwóch modeli liniowych, a więc jest ciągle liniowy. Średnia przemieszczająca się średnio modelowanie porządku p, qA model szeregów czasowych,, jest autoregresywnym średnim ruchem modelu rzędu p, q ARMA p, q, jeśli. rozpocznij xt alpha1 x alpha2 x ldots beta1 w beta2 w ldots betaq w end. Where jest biały hałas z E wt 0 i wariancja sigma 2.Jeśli rozważymy Operatora Przesuwania Wstecznego zobaczyć poprzedni artykuł, możemy następnie przepisać powyższe funkcje jako funkcję teta i phi. Możemy prosto zauważyć, że poprzez ustawienie p neq 0 i q 0 odzyskamy model AR p Podobnie, jeśli ustawimy p 0 i q neq 0 odzyskamy model MA q. Niektóre z kluczowych cech modelu ARMA jest to, że jest oszczędny i zbędny w swoich parametrach Oznacza to, że model ARMA często wymaga mniej parametrów niż model AR lub MA q sam Poza tym, jeśli przepisamy równanie w odniesieniu do BSO, to wielomiany teta i phi czasami mają wspólny czynnik, co prowadzi do prostszego modelu. Simulacji i korelogramów. Podobnie jak w modelach autoregresywnych i średnich ruchów, będziemy symulować różne serie ARMA, a następnie próbować dopasować modele ARMA do tych realizacji. Wykonujemy to, ponieważ chcemy upewnij się, że rozumiemy procedura dopasowania, w tym sposób obliczania przedziałów ufności dla modeli, a także zapewnić, że procedura rzeczywiście odzyskuje uzasadnione szacunki dla oryginalnych parametrów ARMA. W części 1 i 2 ręcznie skonstruowaliśmy serię AR i MA, narysując N próbek z normalnej dystrybucji, a następnie opracowanie konkretnego modelu serii czasowej przy użyciu opóźnień w tych próbkach. Jednak istnieje bardziej prosty sposób symulacji AR, MA, ARMA, a nawet danych ARIMA, po prostu przy użyciu metody w R. Let s początek najprostszym możliwym nietrywialnym modelem ARiMR, mianowicie modelem ARMA 1,1 To znaczy autoregresywny model kolejności połączony z ruchomym średnim modelem zamówienia jeden taki model ma tylko dwie współczynniki, alfa i beta, które reprezentują pierwszy opóźnienia w serii szeregu czasowego i szokowe szumy hałasu Ten model jest podawany przez. Musimy określić współczynniki przed symulacją Weźmy alfa 0 5 i beta -0 5. Wyjście jest w następujący sposób. Realisation o f a model ARMA 1,1 z alfa 0 5 i beta 0 5.Podstawiamy również koreklogogram. Correlogram modelu ARi 1,1, z alfa 0 5 i beta 0 5. Widzimy, że nie ma znaczących autokorelacji, którą należy spodziewać się z modelu ARMA 1,1. Na koniec spróbuj określić współczynniki i ich standardowe błędy za pomocą funkcji arima. Możemy obliczyć przedziały ufności dla każdego parametru za pomocą standardowych błędów. Zakresy ufności zawierają prawdziwe wartości parametrów dla obu przypadków, ale warto zauważyć, że 95 przedziałów ufności jest bardzo szerokie w wyniku rozsądnie dużych błędów standardowych. Teraz próbujemy modelu ARMA 2,2 Oznacza to model AR 2 połączony z model MA 2 Musimy podać cztery parametry dla tego modelu alpha1, alpha2, beta1 i beta2 Weźmy alpha1 0 5, alpha2 -0 25 beta1 0 5 i beta2 -0 3. Wyjście naszego modelu ARMA 2,2 jest w następujący sposób. Realizacja modelu ARMA 2,2 z alfa1,05, alfa2-0, 25, beta1, i beta2 - 0 3.And odpowiednia autokorelacja. Correlogram modelu ARMA 2,2 z alfa1,05, alfa2 -025, beta1,05 i beta2 -0 3. Możemy teraz spróbować dopasować model ARMA 2,2 do danych Możemy również obliczyć przedziały ufności dla każdego parametru. Notek, że przedziały ufności dla współczynników dla ruchomych składników średniej beta1 i beta2 w rzeczywistości nie zawierają oryginalnej wartości parametru To wskazuje na niebezpieczeństwo próby dopasowania modeli do danych, nawet jeśli wiemy prawdziwe wartości parametrów. Jednak w celach handlowych potrzebujemy tylko siły predykcyjnej, która przekracza szansę i wytworzy wystarczająco dużo zysków powyżej kosztów transakcji, aby były rentowne w długim okresie. Teraz widziałem kilka przykładów symulacji Modele ARMA potrzebujemy mechanizmu wyboru wartości p i q przy dopasowywaniu modeli do rzeczywistych danych finansowych. Wybór najlepszego modelu ARMA p, q. W celu określenia, która kolejność p, q modelu ARMA jest odpowiednia dla serii , musimy użyć AIC lub BIC w podzbiorze wartości dla p, q, a następnie zastosuj test Ljung-Box, aby ustalić, czy zostało osiągnięte dobre dopasowanie, dla konkretnych wartości p, q. To pokazano tę metodę najpierw symulujemy szczególny proces ARMA p, q Następnie przechodzimy do pętli wszystkich parowych wartości p in i q i obliczymy AIC Wybieramy model z najmniejszym AIC, a następnie wykonamy test Ljung-Box na resztkach, aby ustalić, czy osiągnęliśmy dobre dopasowanie. Zacznijmy od symulacji serii ARMA 3,2. Teraz utworzymy obiekt końcowy, aby zapisać najlepsze dopasowanie modelu i najniższą wartość AIC Pętlę nad różnymi kombinacjami p, q i używamy bieżącego obiektu do przechowywania dopasowanie modelu ARMA i i j dla zmiennych pętli i i j. Jeżeli obecna wartość AIC jest mniejsza niż jakakolwiek wcześniej wyliczona wartość AIC, ustawiamy końcowy AIC na tę bieżącą wartość i wybieramy tę kolejność Po zakończeniu pętli mamy kolejność modelu ARMA i ARIMA p, d, q dopasowują się do zestawu Integrated d składnika 0 przechowywanej jako. Nastawiamy współczynniki AIC, kolejności i ARIMA. Możemy zobaczyć, że pierwotny porządek symulowanego modelu ARMA został odzyskany, a mianowicie z p 3 i q 2 Możemy wykreślić korygogram pozostałości modelu, aby zobaczyć jeśli wyglądają jak realizacja dyskretnego białego szumu DWN. Correlogram pozostałości najlepszych modeli ARMA p, q Model, p 3 i q 2. Corelogram rzeczywiście wygląda jak realizacja DWN Wreszcie wykonujemy Ljung-Box sprawdzić, czy wartość 20 pauzy jest taka, aby potwierdzić to. Należy zauważyć, że wartość p jest większa niż 0, co oznacza, że reszty są niezależne na poziomie 95, a zatem model ARMA 3,2 zapewnia dobre dopasowanie modelu. skoro od samego początku symulujemy dane. Jednak właśnie ta procedura będzie używana, gdy przyjdzie dopasować modeli ARMA p, q do indeksu S P500 w poniższej sekcji. Dane finansowe. Teraz przedstawiliśmy procedurę wyboru optymalny model serii czasowej dla symulowanych serii, jest raczej strai aby zastosować je do danych finansowych W tym przykładzie po raz kolejny wybieramy S P500 US Equity Index. Let s pobierz dzienne ceny zamknięcia przy użyciu quantmod, a następnie utwórz strumień powrotów. symulowana seria ARMA 3,2 powyżej w serii powrót serii S P500 przy użyciu modelu AIC. Najlepszym modelem dopasowania jest zamówienie ARMA 3.3.Let s wylicza resztki dopasowanego modelu do dziennego strumienia danych dziennika S P500. Correlogram pozostałości najlepszych modeli ARMA p, q Model, p 3 i q 3, dziennik S P500 dziennie zwraca strumień. Wszystko, że istnieją znaczące piki, zwłaszcza przy wyższych opóźnieniach Oznacza to słabą kondycję Let s wykonaj test Ljung-Box, aby sprawdzić, czy mamy statystyczne dowody na to. Jak podejrzewaliśmy, wartość p jest mniejsza niż 0 05 i jako taka nie możemy powiedzieć, że resztki są realizacją dyskretnego białego szumu. Stąd dodatkowa autokorelacja w resztach, których nie wyjaśniono przez model ARMA 3,3. Jak omawialiśmy cały czas w tym artykule, dowiedzieliśmy się o warunkowej heterogeniczności heterogeniczności w seriach S P500, zwłaszcza w okresach 2007-2008. Kiedy w artykule użyto modelu GARCH serie dowiemy się, jak wyeliminować te autokorelacje. W praktyce modele ARMA nigdy nie są właściwie dopasowane do zwrotów akcji z indeksu Musimy wziąć pod uwagę warunkową heteroskompresję i używać kombinacji ARIMA i GARCH Następny artykuł będzie rozpatrywać ARIMA i pokazać, Zintegrowany składnik różni się od modelu ARMA, który rozważaliśmy w tym artykule. Wystarczy rozpocząć pracę z ilościowym obrotem. Przeciętna średnia ruchoma ARMA p, q Modele do analizy serii czasowej - część 2. W części 1 rozważaliśmy model autoregresji rzędu p , znany również jako model ARp Wprowadziliśmy go jako rozszerzenie modelu losowego spaceru w celu wyjaśnienia dodatkowej korelacji szeregowej w finansowym tempie e. Zdaliśmy sobie sprawę, że nie było wystarczająco elastyczne, aby w pełni uchwycić całą autokorelację w cenach zamknięcia Amazon Inc AMZN i S P500 US Equity Index Głównym powodem tego jest fakt, że oba te aktywa są warunkowo heteroskedastyczne, co oznacza że nie są stacjonarne i mają okresy odmiennej wariancji lub klasteryzowania zmienności, które nie jest brane pod uwagę w modelu AR p. W przyszłych artykułach będziemy ostatecznie tworzyć modele autoregresywnych ruchowych średnich ARIMA, jak również warunkowo modele heteroskedastyczne rodzin ARCH i GARCH Te modele dostarczą nam naszych pierwszych realistycznych prób prognozowania cen aktywów. W tym artykule jednakże przedstawimy średnią ruchową modelu q, znaną jako MA q Jest to składnik bardziej ogólny model ARMA i jako taki musimy go zrozumieć przed przejściem dalej. Gorąco polecam przeczytanie poprzednich artykułów w serii Anal kolekcja ysis, jeśli nie zostało to zrobione Można je znaleźć tutaj. Moving Average MA Modele porządku qA Moving Średnia model jest podobny do modelu autoregresji, z wyjątkiem tego, że zamiast być liniową kombinacją wartości przeszłych serii czasowych, jest to liniowy kombinacja dotychczasowych białych szumów. Intuicyjnie oznacza to, że model MA widzi takie przypadkowe szumy białego szumu bezpośrednio przy każdej aktualnej wartości modelu Jest to przeciwieństwo modelu AR p, gdzie białe szoki hałasu są widoczne tylko pośrednio przez regresja na poprzednich seriach. Najważniejszą różnicą jest to, że model MA będzie tylko widział ostatnie q wstrząsy dla każdego modelu MA q, podczas gdy model AR p uwzględnia wszystkie wcześniejsze wstrząsy, choć słabnie Matematycznie, MA q jest modelem regresji liniowej i jest podobna struktura do AR p. Moving Average Model modelu qA czasowego, jest ruchomym średnim modelem rzędu q MA q, jeśli. rozpocznij xt wt beta1 w ldots betaq w end. Where jest biały hałas z E 0 0 i wariancja sigma 2.Jeśli rozważymy Operatora Przesuwania Wstecznego zobaczyć poprzedni artykuł, możemy następnie przepisać powyższe jako funkcję phi z. Zacznij xt 1 beta1 beta2 2 ldoty betaq q wt ppq wt end. Użyjemy funkcji phi w późniejszych artykułach. Second Order Properties. As z AR p średnią procesu MA q jest zero Jest to łatwe do zobaczenia jako oznacza po prostu sumę środków o białych szumach, które same są zerowe. zacznij tekst ensape mux E suma sumy E wi 0 koniec rozpoczyna tekst enspace sigma 2w 1 beta 21 ldoty beta 2q koniec tekst enspace rhok left q end right. Where beta0 1.We teraz będzie generować niektóre symulowane dane i używać go do tworzenia correlograms Spowoduje to, że powyższa formuła dla rhok będzie nieco bardziej konkretna. Symulacje i korelogramy. Zacznijmy od procesu MA 1 Jeśli ustawimy beta1 0 6 otrzymamy następujący model. Jak z modelami AR p w poprzednim artykule możemy użyć R aby symulować taką serię, a następnie wypisać korlogramę Ponieważ od poprzedniego cyklu analizy serii czasowej przeprowadziliśmy wiele ćwiczeń, musieliśmy dużo praktykować, piszę kod R w całości, a nie podzielę go. Wydanie jest takie, jak następuje poniższe wyliczenie modelu MA 1 z beta 1 0 i powiązanym korelogramem. Jak widzieliśmy powyżej we wzorze rhok, dla kq, wszystkie autokorelacje powinny wynosić zero Ponieważ q 1, powinniśmy zobaczyć znaczny szczyt przy k1, a następnie nieistotny szczyt po tym, jednak ze względu na pobieranie próbek skłaniamy się spodziewać 5 marginalnie znaczących pików na próbce autokorelacji. Jest to dokładnie to, co pokazuje nam correlogram Mamy znaczny szczyt przy k 1, a następnie nieistotne piki dla k 1, z wyjątkiem k 4, gdzie mamy nieznacznie znaczący szczyt. W rzeczywistości jest to użyteczny sposób sprawdzenia, czy model MA q jest właściwy Poprzez przyjrzenie się krotografii określonej serii możemy zobaczyć, ile kolejnych sekwencji jest niezerowych, jeśli q takie opóźnienia istnieją możemy legalnie próbować dopasować model MA q do konkretnej serii. Ponieważ mamy dowody z naszych symulowanych danych procesu MA 1, teraz zamierzamy spróbować dopasować model MA 1 do naszych symulowanych danych Niestety nie ma t komendę ma równoważną ma komendy autoregressive model ar w R. Instead musimy zastosować bardziej ogólne polecenie arima i ustawić autoregresywne i zintegrowane składniki na zero Wykonujemy to poprzez utworzenie 3-wektorowego i ustawienie pierwszych dwóch elementów składowych autogressive a a następnie zerowe. Otrzymujemy użyteczne dane z polecenia arima Po pierwsze, możemy zauważyć, że parametr został oszacowany jako kapelusz 0 602, który jest bardzo zbliżony do prawdziwej wartości beta1 0 6 Po drugie błędy standardowe są już obliczone dla nas, co ułatwia obliczenie przedziałów ufności Po trzecie, otrzymujemy szacunkową wariancję, prawdopodobieństwo logowania i Kryterium informacyjne Akaike niezbędne do porównania modelu. Główną różnicą między arima a ar jest to, że arima szacuje termin przechwytywania, nie odejmujemy średniej wartości serii W związku z tym musimy być ostrożni podczas przeprowadzania przewidywań przy użyciu polecenia arima Powrócimy do tego punktu później. Jak szybkie sprawdzenie ponownie obliczymy przedziały ufności dla hat. We widzimy, że 95 przedział ufności zawiera prawdziwą wartość parametru beta1,06 i dlatego możemy ocenić model dobrym dopasowaniem Oczywiście należy to oczekiwać, ponieważ symulowaliśmy dane w pierwszym miejsce. Jak działają zmiany, jeśli zmienimy znak beta1 na -0 6 Let s wykonaj tę samą analizę. Przedstawienie modelu MA 1, z beta1-0 i powiązanym korelogramem. Widzimy, że na k 1 mamy znaczący szczyt korelacji, z wyjątkiem tego, że wykazuje ujemną korelację, jak się spodziewamy z modelu MA 1 z ujemnym współczynnikiem pierwszego Po raz kolejny wszystkie piki poza k 1 są nieznaczne Let s dopasuj model MA 1 i oszacuj parametr. kapelusz -0 730, który jest małym niedoszacowaniem beta1 -06 Wreszcie, niech s obliczy przedział ufności. Widzimy, że prawdziwa wartość parametru beta1-0 zawiera się w 95 przedziale ufności, dostarczając nam dowodów dobre dopasowanie modelu. Uruchom tę samą procedurę dla procesu MA 3 Tym razem powinniśmy spodziewać się znacznych pików przy k i małych szczytach dla k 3. Użyjemy następujących współczynników beta1 0 6, beta2 0 4 i beta3 0 2 Let s symuluj proces MA 3 z tego modelu Zwiększyłem liczbę losowych próbek do 1000 w tej symulacji, co ułatwia wyświetlanie prawdziwej struktury autokorelacji, kosztem trudniejszej interpretacji oryginalnych serii . Wydajność jest następująca. Wycięcie modelu MA 3 i powiązanego korelogramu. Oczekiwano, że pierwsze trzy piki są znaczące, ale jest to czwarte, ale możemy słusznie sugerować, że może to być spowodowane pobieżnością próbkowania, ponieważ spodziewamy się 5 szczyty są znakiem ificant beyond k q. Let teraz dopasowuje model MA 3 do danych, aby spróbować oszacować parametry. Szacunki kapelusz 0 544, kapelusz 0 345 i kapelusz 0 298 są bliskie prawdziwym wartościom beta1 0 6, beta2 0 4 i beta3 0 3 Możemy również wytworzyć przedziały ufności przy użyciu odpowiednich błędów standardowych. W każdym przypadku 95 przedziałów ufności zawiera rzeczywistą wartość parametru i możemy stwierdzić, że mamy dobre dopasowanie do naszego modelu MA 3, jak należy się spodziewać. Informacje finansowe. W części 1 uznaliśmy Amazon Inc AMZN i S P500 US Equity Index Dopasowaliśmy model AR p do obu i stwierdziliśmy, że model nie był w stanie skutecznie zbadać złożoności korelacji szeregowej, zwłaszcza w obsadzie S P500, gdzie efekty pamięciowe wydają się być obecne. Wygrałem t wykresy ponownie z powodu cen i autokorelacji, a ja będę odwoływać się do poprzedniego post. Amazon Inc AMZN. Let zaczyna się starając się dopasować wybór Modele MA q do AMZN, a mianowicie z q w tak jak w części 1, będziemy używać q uantmod, aby pobrać dzienne ceny AMZN, a następnie przekonwertować je na strumień zwrotu strumienia z kursów zamknięcia. Teraz, gdy mamy strumień zwracający log, możemy użyć komendy arima do dopasowania do modeli MA 1, MA 2 i MA 3, a następnie oszacować parametry dla każdego Dla MA 1. Możemy sprecyzować resztki dziennych zysków dziennych i zamontowanych modeli. Osiągnięcia modelu MA 1 są dopasowywane do dziennych cen dzienników AMZN. Notyczność, że mamy kilka znaczących pików przy opóźnieniach k 2, k 11, k 16 i k 18, wskazując, że model MA 1 prawdopodobnie nie pasuje do zachowania logów AMZN, ponieważ nie wygląda to na realizację białego szumu. Spróbujmy użyć modelu MA 2. Oba oszacowania współczynników beta są ujemne Pozwólmy raz jeszcze wyliczyć resztki. Pozostałości modelu MA 2 są dopasowane do dziennych cen dzienników AMZN. Zauważmy, że w pierwszych kilku przypadkach opóźnienie autokorelacji jest prawie zero, jednak mamy pięć marginalnie znaczące piki przy opóźnieniach k 12, k 16, k 19, k 25 i k 27 To jest su że model MA2 przechwytuje wiele autokorelacji, ale nie wszystkie efekty pamięci o długiej pamięci. Jak model MA 3. Po raz kolejny możemy sprecyzować resztki. Osobniki z modelu MA 3 są przystosowane do cen dziennych AMZN Wykres resztki MA 3 wygląda niemal identycznie jak w modelu MA 2 Nie jest to zaskakujące, ponieważ dodamy nowy parametr do modelu, który pozornie wyjaśnia wiele korelacji przy krótszych opóźnieniach, ale to nie miało wiele wpływ na długotrwałe opóźnienia. Wszystkie te dowody sugerują, że model MA q prawdopodobnie nie będzie użyteczny w wyjaśnieniu całej korelacji szeregowej w izolacji co najmniej w odniesieniu do AMZN. Jeśli pamiętasz, w części 1 że pierwszy porządek różni się dzienną strukturą logu powrotnego S P500 posiadał wiele znaczących pików przy różnym opóźnieniu, zarówno krótko jak i długi To dostarczyło dowodów zarówno na warunkową heteroskedastyczność, jak klasteryzacja zmienności i efekty pamięciowe prowadzące do wniosku, że AR p mo del było niewystarczające, aby uchwycić wszystkie obecne autokorelacje. Jak widzieliśmy powyżej modelu MA q nie wystarczyło, aby uchwycić dodatkową korelację szeregową w resztach modelu dopasowanego do pierwszego rzędu zróżnicowanych serii cen logarytetu dziennego Postaramy się dopasować MA q modelu do S P500.One może zapytać, dlaczego tak robimy, jeśli wiemy, że jest mało prawdopodobne, aby być dobrym dopasowaniem To jest dobre pytanie Odpowiedź brzmi, że musimy zobaczyć dokładnie, jak to jest dobre, ponieważ jest to ostateczny proces, który będziemy śledzić, gdy natrafimy na bardziej wyrafinowane modele, które są potencjalnie trudniejsze do interpretacji. Zacznijmy od pozyskania danych i przekształcenia ich w pierwszy porządek zróżnicowanych serii logarytmicznie transformowanych dziennych cen zamknięcia, jak w poprzedni artykuł. Teraz mamy zamiar dopasować modele MA 1, MA 2 i MA 3 do serii, jak to zrobiliśmy powyżej dla AMZN Let s zaczynają się od MA 1.Let s zrobić działkę resztek tego zamocowanego modelu. Resztki modelu MA 1 Fi do dziennych cen dzienników S P500. Pierwszy znaczący szczyt występuje w punkcie 2, ale jest dużo więcej w k. Jest to wyraźnie nie realizacja białego szumu i dlatego musimy odrzucić model MA 1 jako potencjalny dobry pomysł na S P500.Jest sytuacja polepszająca się wraz z MA 2. Po raz kolejny spróbujmy sprecyzować resztki tego dopasowanego modelu MA 2. Pozostałości modelu MA 2 są przystosowane do dziennych cen dziennych S P500.Chociaż zniknął szczyt w k 2 jak się spodziewamy, wciąż pozostajemy na znacznych szczytach w wielu długich opóźnieniach w resztach Po raz kolejny okazuje się, że model MA 2 nie jest dobrym dopasowaniem. Nie powinniśmy spodziewać się, że dla modelu MA 3, aby zobaczyć mniej korespondencji seryjnej w k 3 niż w przypadku modelu MA 2, ale po raz kolejny nie powinniśmy spodziewać się dalszej redukcji dalszych opóźnień. Na koniec wymyślę resztki tego modelu MA 3. Ceny są dokładnie to, co widzimy w korespondencji resztek W związku z tym, że MA 3, podobnie jak w przypadku innych pozostałych modeli, nie ma ta dobrze pasuje do modelu S P500. Dokładnie przeanalizowaliśmy dwa główne modele serii czasowych, a mianowicie model Autogressive porządku p, AR p, a następnie Moving Average z kolejności q, MA q Widzieliśmy, że oba są w stanie wyjaśnić a niektóre z autokorelacji w resztach pierwszego rzędu różniły się dziennymi cenami indeksów i indeksów, ale klasteryzacja zmienności i długotrwałe efekty utrzymują się. W końcu jest czas, aby zwrócić naszą uwagę na połączenie tych dwóch modeli, a mianowicie Przemieszczenie Autoregresywne Średnia dla p, q, ARMA p, q, czy poprawi sytuację jeszcze bardziej.
Comments
Post a Comment