Temat: Parametr integracji ułamkowej

Testy pierwiastka jednostkowego rozróżniają dwa typy zachowania szeregu czasowego: niestacjonarność spowodowaną występowaniem pierwiastka jednostkowego, y ~I(1), oraz stacjonarność, y ~I(0).  Wg Engle’a i Grangera, procesy I(1) oraz I(0) różnią się m.in. tempem wygasania skutków zakłóceń zewnętrznych, co można zaobserwować również na wykresie funkcji autokorelacji i autokorelacji cząstkowej z próby (dla szeregu I(1) współczynniki autokorelacji z próby, r(k), zmniejszają się wraz ze wzrostem opóźnienia k znacznie wolniej niż to jest dla procesu I(0).

 

Intuicja: Ponieważ współczynniki korelacji r(k) zmiennych  yt  i yt–k są statystycznie istotne dla znacznych opóźnień k,   proces zachowuje pamięć o zdarzeniach z przeszłości.

Dla procesu I(0) współczynniki  r(k) maleją przy wzroście liczby opóźnień, zatem proces „nie pamięta” o wartościach z odległej przeszłości.

Jednak w praktyce zachowanie szeregu czasowego może się różnić od tych dwu skrajnych przypadków. Dlatego stosuje się tzw. pierwiastki ułamkowe, umożliwiające bardziej precyzyjną klasyfikację, oraz wykładniki Hursta.


Przykładowy wykres funkcji autokorelacji

Pierwszy wykres ilustruje zachowanie przykładowego procesu błądzenia losowego. Drugi wykres przedstawia ciąg zmiennych losowych o jednakowym rozkładzie standaryzowanym.

Rys. 1. Przykładowy proces błądzenia losowego

Rys. 2. Przykładowy proces losowy stacjonarny.

 

Trzy przykłady: szeregi stacjonarne, ACF i PACF

Następujące szeregi zostały wygenerowane jako AR(1) na podstawie tego samego ciągu niezależnych liczb losowych, ale dla trzech współczynników: 0,9, 0,5 oraz 0,1: oznaczamy je a1, a2 i a3. Wykresy funkcji autokorelacji z próby i funkcji autokorelacji cząstkowej ilustrują różnice w zachowaniu tych zmiennych.

Dla porównania pokazano również wykres funkcji autokorelacji z próby i funkcji autokorelacji cząstkowej dla procesu błądzenia losowego.


Rys. 3. Funkcje ACF i PACF z próby dla szeregu AR(1) przy r = 0,5.

Rys. 4. Funkcje ACF i PACF z próby dla szeregu AR(1) przy r = 0,9.

 

 


Rys. 5. Funkcje ACF i PACF z próby dla szeregu AR(1) przy r = 0,1.


Rys. 6. Funkcje ACF i PACF z próby dla szeregu błądzenia losowego.

 


Wykładnik Hursta

Wykładnik Hursta (H) jest wskaźnikiem używanym między innymi do klasyfikacji szeregów czasowych. Na jego podstawie możliwe jest odróżnienie szeregów losowych od nielosowych. Stał się on popularny w zastosowaniach finansowych dzięki pracy Petersa (1989). Wymaga wykorzystania zbiorów danych o znacznej liczebności.  

Statystyka R/S

Statystyka R/S, przeskalowanego zakresu, jest obliczana jako rozstęp sum częściowych odchyleń szeregu czasowego od przeciętnej stopy wzrostu, przeskalowany odchyleniem standardowym. Niech  oznacza szereg zwrotów, wtedy średnia  i obciążony estymator odchylenia standardowego dla zwrotów z okresu od  do  są określone w następujący sposób

               

zaś sumy częściowe odchyleń  od średniej oraz rozstęp sum częściowych definiuje się jako

 dla 1£t£N,                                       (R1)

.                                    (R2)

Natomiast statystyka R/S dla okresu N jest równa proporcji przeciętnych wartości  oraz , czyli

.

Można przedstawić tę wielkość w postaci

,
gdzie
 – stała,    wykładnik Hursta.

       


TEST PRZESKALOWANEGO ZAKRESU – METODA ANDREW LO

Statystyka przeskalowanego zakresu może być zapisana w postaci:

gdzie Sn oznacza odchylenie standardowe


Statystyka ta jest wrażliwa na występowanie krótkookresowych zależności danych (por. Lo (1991)), dlatego Andrew Lo (1991) wprowadził zmodyfikowaną statystykę,

gdzie zgodny estymator wariancji

 

wykorzystuje wagi Bartletta: .

Parametr ucięcia q można wybrać według wzoru Andrewsa (1991): q jest największą liczbą całkowitą nie przekraczającą

gdzie  oznacza współczynnik autokorelacji pierwszego rzędu badanego szeregu.


Lo normalizuje obliczoną wartość statystyki, dzieląc ją przez pierwiastek kwadratowy liczby obserwacji.

Hipoteza zerowa zakłada krótką pamięć szeregu (tzn. brak długiej pamięci). Obliczoną wartość zmodyfikowanej statystyki Lo należy porównać z odpowiednimi wartościami krytycznymi (dla 95% mamy przedział [0,809; 1,862]). Hipotezę zerową o braku długiej pamięci należy odrzucić jeśli obliczona wartość  jest poza tym przedziałem.

Andrew Lo (1991) podał przykład zastosowania statystyki do dziennych i miesięcznych zwrotów dla indeksów, na podstawie danych Center for Research in Security Prices. Dane dzienne: od 3 lipca 1962 do 31 grudnia 1987, wskaźniki miesięczne: od 30 stycznia 1962 do końca grudnia 1987. Lo porównał wartości klasycznej statystyki przeskalowanego zakresu z proponowaną przez siebie statystyką zmodyfikowaną, która przyjmowała niższe wartości.

Brak istotności zmodyfikowanej statystyki oznaczała, że zwroty dzienne nie mają długiej pamięci. Natomiast klasyczna statystyka przeskalowanego zakresu w pierwszej połowie badanego okresu była statystycznie istotna, co oznacza występowanie długiej pamięci.


Klasyfikacja procesów według wartości wykładnika Hursta

=0,5 :

Proces błądzenia losowego,

Proces powracający do średniej (mean-reverting),

:

Proces odchylający się od średniej, z trendem (mean-averting).

 

Parametr integracji ułamkowej

Jest zdefiniowany jako liczba rzeczywista d, dla której przyrosty szeregu niestacjonarnego  są stacjonarne:  .

Przyrosty są zdefiniowane jako:

=,

gdzie L oznacza operator opóźnień, a parametry są zdefiniowane przy użyciu funkcji gamma.

Własności szeregu zależą od wartości d .  

Dla d =1, proces jest zintegrowany i ma nieskończoną wariancję.

Dla d >1 proces również ma nieskończoną wariancję, a skutki szoków wzmagają się w miarę upływu czasu.

Dla 0,5 , proces ma nieskończoną wariancję, więc jest niestacjonarny, ale w bardzo długim okresie powraca do średniej (zob. Hosking (1981)). Skutki szoków utrzymują się przez długi czas.

Dla 0 < d < 0,5 proces jest stacjonarny, powraca do średniej w długim okresie i ma skończoną wariancję.

Dla d = 0, proces powraca do średniej w krótkim okresie, ma skończoną wariancję, a skutki szoków wygasają w krótkim czasie.

 

 


ESTYMACJA PARAMETRU INTEGRACJI UŁAMKOWEJ METODĄ REGRESJI PERIODOGRAMU:

Część metod estymacji parametru integracji ułamkowej wykorzystuje regresję periodogramu – jest skonstruowana dzięki zależności funkcji gęstości spektralnej procesu badanego X i procesu białego szumu u:

Jest to dokładna zależność dla stacjonarnych X. Dla niestacjonarnych jest to granica wartości oczekiwanych periodogramu (Phillips (1999a)). Po logarytmowaniu

 

Zamiast gęstości spektralnej stosuje się przybliżenie, mianowicie rzędne periodogramu dla częstotliwości . Niech  – dyskretna transformata Fouriera,  – wartość sprzężona.

Rzędne: = , s = 1,2,…,m                             (1)

dla pewnego parametru ucięcia m.


 

Phillips oraz Geweke i Porter-Hudak stosują podobne wersje regresji MNK dla :

Geweke i Porter-Hudak (1983) stosują regresję postaci:

 

i wyznaczają rzędne periodogramu na podstawie dokładnej transformaty Fouriera.

Phillips (1999) proponuje skorygowaną postać równania

gdzie

Według Phillipsa, dla d <0,5 poprzednia wersja regresji periodogramu może być stosowana, jednak dla szeregów niestacjonarnych (0,5 < d < 1) lepsza jest wersja skorygowana. Dla wersja zmodyfikowana jest tym bardziej przydatna, gdyż zwykły periodogram  nie jest zgodny.

 


WARTOŚCI WYKŁADNIKA HURSTA I OCENY PARAMETRU INTEGRACJI UŁAMKOWEJ OTRZYMANE ZA POMOCĄ PAKIETU GRETL

W pakiecie gretl możliwe jest wyznaczenie zarówno wartości parametru integracji ułamkowej (metodą Geweke i Porter-Hudak), jak i wyznaczenie wykładnika Hursta dla danego szeregu. Wywołanie polecenia wyznaczania periodogramu w gretl jest pod hasłem Zmienna àSpektrum àperiodogram:

Wyniki estymacji parametru integracji ułamkowej oraz wyznaczania periodogramu w pakiecie gretl są następujące:

Periodogram dla zmiennej: a1

Liczba obserwacji = 998

 

Test GPH (Geweke'a, Portera-Hudaka) na ułamkowy rząd integracji (m = 62)

  Estymowany ułamkowy rząd integracji = 0,106789 (0,0718137)

  Statystyka testu: t(60) = 1,48703, z wartością p 0,1422

 

Estymator lokalny Whittle'a (m = 62)

  Estymowany ułamkowy rząd integracji = 0,0767968 (0,0635001)

  Statystyka testu: z = 1,2094, z wartością p 0,2265

 

 omega   liczba okresów  dł.okresu  gęstość spektralna

 

 0,0063        1          998,00         0,45624

 0,0126        2          499,00         1,14866

 0,0189        3          332,67         0,28963

 0,0252        4          249,50         0,06289

 0,0315        5          199,60         0,79569

 0,0378        6          166,33         0,63804

 0,0441        7          142,57         0,27133

 0,0504        8          124,75         0,50341

 0,0567        9          110,89         0,37229

 0,0630       10           99,80         0,60523

 0,0693       11           90,73         0,77241

 0,0755       12           83,17         0,45474

 0,0818       13           76,77         0,09330

 0,0881       14           71,29         0,12214

 0,0944       15           66,53         0,10301

 0,1007       16           62,38         0,70704

 ……………………………………………………………………………

 3,0912      491            2,03         0,01578

 3,0975      492            2,03         0,12791

 3,1038      493            2,02         0,12871

 3,1101      494            2,02         0,02246

 3,1164      495            2,02         0,01931

 3,1227      496            2,01         0,00571

 3,1290      497            2,01         0,11285

 3,1353      498            2,00         0,02681

 3,1416      499            2,00         0,11929

 

Wyznaczenie wykładnika Hursta polega na wykorzystaniu regresji logarytmu wartości dla kolejnych dzielników liczby obserwacji lub dla kolejnych potęg 2.

W gretlu wyznaczany jest wykres (nachylenie prostej odpowiada współczynnikowi Hursta) oraz podawana tabela z wynikami obliczeń:

 


 

Przeskalowane zakresy dla zmiennej 'a1'

(logarytm o podstawie 2)

 

 Size    RS(avg)  log(Size)    log(RS)

 998     72,762     9,9629     6,1851

 499     48,926     8,9629     5,6125

 249     26,708       7,96     4,7392

 124     20,302     6,9542     4,3435

  62     13,573     5,9542     3,7627

  31     8,2982     4,9542     3,0528

  15     4,7551     3,9069     2,2495

 

Wyniki regresji (n = 7)

 

          Współczynnik  błąd standardowy

Stała          -0,13715   0,154062

Nachylenie      0,63519   0,0212893

 

Oszacowany wykładnik Hursta = 0,63519


Bibliografia

Andrews, D. (1991), Heteroskedasticity and autocorrelation consistent covariance matrix estimation, Econometrica, 59, 817–858.

Daubechies, Ingrid (1998), Orthonormal Bases of Compactly Supported Wavelets, Communications in Pure and Applied Mathematics, 41, 909–996.

Geweke, John i Porter-Hudak, Susan (1983), The estimation and application of long-memory time series models, Journal of Time Series Analysis, 4, 221–228; reprint w: Robinson (2003a).

Hosking, J.R.M. (1981), Fractional differencing, Biometrika, 68(1), 165–176.

Hurst, H. (1951), Long term storage capacity of reservoirs, Transactions of the American Society of Civil Engineers, 116, 770–799.

Lo, Andrew H. (1991), Long-term memory in stock market prices, Econometrica, 59, 1279–1313, przedrukowane jako rozdział 5 w: Robinson (2003).

Mandelbrot, Benoit (1972), Statistical methodology of non-periodic cycles: from the covariance to the R/S analysis, Annals of Economic and Social Measurement, 1, 259–290.

Mandelbrot, Benoit (1975), Limit theorems on the self-normalized range for weakly and strongly dependent processes, Z. Wahrscheinlichkeitstheorie verw. Gebiete, 31, 271–285.

Oręziak, Leokadia (2002), Euro – nowy pieniądz, Wydawnictwo Naukowe PWN, Warszawa.

Robinson, Peter M. (1995), Log-periodogram regression of time series with long range dependence, Annals of Statistics, 23, 1048–1072.

Robinson, Peter M. (2003), Long-memory time series, przedrukowane jako rozdział 1 w: Robinson (2003a), 4–32.

Robinson, Peter M. (red.), (2003a), Time series with long memory, Oxford University Press, Oxford.

Syczewska, Ewa M. (2002), Analiza niestacjonarności kursu walutowego USD/PLN na podstawie danych dziennych i miesięcznych, Roczniki Kolegium Analiz Ekonomicznych Analiza decyzyjna w zastosowaniach ekonomicznych, red. nauk. T. Szapiro,  10/2002, 159–175.

Syczewska, Ewa M. (2004), Comparison of exchange rate behaviour for Hungary, Latvia and Poland, Macromodels’ 2003, Łódź 2004, 39–61.

Syczewska, E. M. (2004)  Aggregation of exchange rate data and long memory measures, 27th CIRET Conference.