Wyrównywanie sezonowe szeregów czasowych
Szereg czasowy to ciąg obserwacji pokazujący kształtowanie się badanego zjawiska w kolejnych okresach (dniach, miesiącach, kwartałach, latach, itp.). W szeregu czasowym można wyodrębnić kilka składowych będących wynikiem wpływu różnych czynników na dane zjawisko.
Wyróżnia się następujące składowe szeregów czasowych:
- Tendencja rozwojowa, zwana trendem, wyraża długookresową skłonność do jednokierunkowych zmian (wzrostu lub spadku) wartości badanej zmiennej. Jest rozpatrywana jako konsekwencja działania stałego zestawu czynników.
- Wahania cykliczne (składowa cykliczna) wyrażają się w postaci długookresowych, rytmicznych wahań wartości szeregu wokół tendencji rozwojowej. Wiąże się je zwykle z cyklem koniunkturalnym gospodarki.
- Wahania sezonowe (składowa sezonowa) są wahaniami wartości szeregu wokół jego tendencji rozwojowej o okresie nie przekraczającym jednego roku. Reprezentują efekty powtarzające się z pewną prawidłowością, co roku w tych samych okresach. Odzwierciedlają zwykle wpływ pogody (związany głównie z następstwem pór roku) lub kalendarza.
- Część resztowa, tj. nie podlegająca objaśnieniu (nie dająca się przypisać do wymienionych źródeł zmienności) nazywana jest składową przypadkową (niesystematyczną). Zawiera ona przypadkowe wahania szeregu wokół części systematycznej, które trudno jest zidentyfikować a priori.
Składowe wymienione w punktach od 1 do 3 określa się mianem systematycznych, tworzą bowiem systematyczną część szeregu, tzn. możliwą do objaśnienia.
Ponadto, w ramach systematycznej części szeregu, wyróżnić można efekty kalendarzowe nie mające charakteru czysto sezonowego. Efekty wynikające z wpływu kalendarza mogą odzwierciedlać: różnice pomiędzy długością (liczbą dni) poszczególnych okresów - 28, 29, 30, 31 dni dla miesięcy, 90, 91, 92, 93 dla kwartałów, różnice pomiędzy liczbą różnych dni tygodnia w okresie, strukturę dni wolnych uwzględniającą święta ruchome i święta narodowe itp. Mogą one mieć charakter powtarzalny z roku na rok (np. liczba dni w miesiącu – za wyjątkiem lutego, występowanie świąt stałych) lub specyficzny dla każdego roku (np. układ dni tygodnia, występowanie świąt ruchomych). Efekty o charakterze powtarzalnym stanowią integralną część składowej sezonowej. Pozostałe efekty kalendarzowe nie są zwykle zaliczane do składowej sezonowej, lecz w podobny sposób traktuje się je z punktu widzenia wyrównań sezonowych (tzn. usuwa z szeregu wyrównanego) i można je traktować jako odrębną, specyficzną składową części systematycznej szeregu. Ich analizie i eliminacji z szeregu wyrównanego służy odrębny etap stosowanych procedur wyrównania sezonowego, tzw. wyrównanie dniami roboczymi.
Składowe szeregu czasowego połączone mogą być związkiem
-
addytywnym,
-
multiplikatywnym,
-
addytywno-multiplikatywnym.
W przypadku sezonowości addytywnej mamy do czynienia z efektami sezonowymi polegającymi na zaniżeniu lub zawyżeniu wartości zjawiska w okresach tego samego typu, np. we wszystkich styczniach, czy np. w II kwartale każdego roku, o w przybliżeniu stałą wartość przez cały czas obserwacji. W przypadku sezonowości multiplikatywnej efekty sezonowe są w przybliżeniu stałe w ujęciu procentowym, tzn. gdy większe są wartości zjawiska, to większe i wahania sezonowe. Wskaźnik addytywny jest dodawany do wartości trendu, multiplikatywny mnożony.
Występowanie w szeregu czasowym składowej sezonowej prowadzi do problemów z interpretowaniem zmian zjawiska z okresu na okres. Aby właściwie analizować aktualne tendencje dotyczące wskaźników krótkookresowych, konieczne jest wyeliminowanie wpływów sezonowych, w przeciwnym razie uprawnione jest ich porównanie tylko dla okresów jednoimiennych (np. styczeń 2004 do stycznia 2003) i tylko wewnątrz danego kraju.
Wyrównanie sezonowe szeregu czasowego polega na usunięciu z szeregu składowej sezonowej (szereg wyrównany jest to złożenie wszystkich składowych, poza składową sezonową). Aby można było wykonać tę operację, należy, w przypadku większości metod wyrównania sezonowego, wyodrębnić wszystkie składowe, a więc dokonać dekompozycji.
Procedurę wyrównań sezonowych podzielić można na 2 etapy. Pierwszy jest określany jako wstępne wyrównanie (pre-adjustment), w drugim dokonuje się właściwa dekompozycja i eliminowanie wpływu efektów sezonowych.
Podczas procedury wstępnych wyrównań wykonywane są zwykle następujące czynności:
- określenie charakteru związku między składowymi (czy ma charakter addytywny czy multiplikatywny), np. poprzez testowanie potrzeby zastosowania wstępnej transformacji logarytmicznej,
- wykrywanie wartości odstających (nietypowych zaburzeń) występujących w szeregu,
- wyrównanie dniami roboczymi,
- wstępna identyfikacja modelu,
- wyznaczenie wartości prognozowanych szeregu poza okresem podlegającym obserwacji („przedłużenie” szeregu na jego końcach), jeżeli jest to konieczne z punktu widzenia stosowanej metody wyrównania.
Występowanie nietypowych zaburzeń w szeregu, będących efektem sporadycznych, nieregularnych zdarzeń, powoduje – jeśli nie zostaną one zidentyfikowane i odpowiednio potraktowane – zniekształcenia w analizie szeregów oraz utrudnia lub wręcz uniemożliwia ich modelowanie. Dlatego stosowane są specjalne algorytmy wykrywania takich zaburzeń, a następnie eliminowania ich wpływu poprzez odpowiednie uwzględnienie w modelu, korektę lub wykluczenie obserwacji z analizy.
Stosowane procedury wyrównania rozróżniają następujące typy zaburzeń, testując ich występowanie i odpowiednio je traktując:
- pojedyncze obserwacje odstające (AO), gdy zaburzenie dotyczy pojedynczej obserwacji, po czym szereg wraca do wcześniejszej trajektorii, np. strajk, anomalie pogodowe, błędy rejestracji,
- zmiana poziomu (LS), mająca miejsce, gdy zaburzenie powoduje zmianę wartości zjawiska, która utrzymuje się w następnych okresach, tj. zjawisko rozwija się dalej na zmienionym poziomie, następuje przesunięcie jego trajektorii – np. zmiany nomenklatury, zmiany w definicjach,
- zmiana przejściowa (TC), gdy efekt zaburzenia stopniowo wygasa i szereg wraca do wcześniejszej trajektorii, jednak zajmuje to kilka kolejnych okresów.
W celu realizacji wyrównania dniami roboczymi testowane są różne warianty regresorów: dla poszczególnych dni tygodnia, ich kombinacji, efektu roku przestępnego oraz efektu Wielkanocy. Dla układu regresorów uznanego za optymalny szacowane są efekty dni roboczych i eliminowane z szeregu.
Produktem wyjściowym wyrównań wstępnych jest szereg „wyczyszczony” z efektów analizowanych na tym etapie, pozbawiony „zaburzeń” utrudniających rzeczywistą analizę sezonowości. Jest ona realizowana w drugim etapie procedury wyrównania i obejmuje:
- dekompozycję szeregu na składowe,
- przyporządkowanie efektów regresji do poszczególnych składowych,
- właściwe wyrównanie sezonowe, polegające na usunięciu z szeregu składowej sezonowej,
- diagnostykę modelu, uzyskanej dekompozycji szeregu oraz wyrównania.
Wszystkie czynności realizowane podczas obydwu głównych etapów procedury są silnie sparametryzowane, tzn. zależą od wyboru metody wyrównania, jej wariantu i ustalenia wartości wielu parametrów. Wybory te mogą być wykonywane przez wbudowany algorytm w procedurze automatycznej (na podstawie kryteriów statystycznych) lub przez analityka realizującego proces wyrównania w trybie interaktywnym. Zupełne wyeliminowanie wpływu decyzji analityka na proces wyrównania nie jest możliwe, gdyż nawet w trybie automatycznym konieczne jest przynajmniej ustalenie wartości progowych dla kryteriów statystycznych, a często zastosowanie trybu interaktywnego jest korzystne dla jakości wyrównań.
Szczególne znaczenie dla przebiegu procedury wyrównania i jakości uzyskanych wyników ma identyfikacja modelu. Model powinien możliwie najlepiej opisywać badaną rzeczywistość i być uwiarygodniony przez odpowiednie testy statystyczne, dostępne dla analityka w procedurach wyrównań. Biorąc pod uwagę postulat stabilności wskazane jest również unikanie częstych zmian modelu.
W praktyce, dwiema powszechnie używanymi procedurami stosowanymi do wyrównań sezonowych są:
- X12-ARIMA jest rozwinięciem systemów X11-ARIMA i X11-ARIMA/88. Dekompozycja, czyli wyodrębnienie składowych (trend, składowa cykliczna, składowa sezonowa, składowa resztowa) odbywa się przez zastosowanie odpowiedniego algorytmu, opartego na wykorzystaniu filtrów średnich ruchomych, często nazywanych filtrami typu X-11. Chociaż w nazwie procedury występuje termin ARIMA (Autoregressive Integrated Moving Average), to model wykorzystywany jest jedynie do estymacji współczynników regresji i przedłużania szeregu po to, aby uzyskać wartości teoretyczne potrzebne do obliczenia średnich ruchomych na krańcach szeregu.
- Metoda Tramo/Seats (TRAMO - Time series Regression with ARIMA noise, Missing observations, and Outliers/ SEATS - Signal Extraction in ARIMA Time Series). Tramo/Seats jest metodą ściśle opartą na metodologii ARIMA wykorzystując ją nie tylko jako pomocnicze narzędzie prognozowania i wygładzania szeregu, lecz także jako podstawowe narzędzie właściwej dekompozycji (wydzielenia składowych).
Obydwie procedury wyrównań sezonowych szeregów czasowych są rekomendowane przez Eurostat. W Głównym Urzędzie Statystycznym do wyrównań sezonowych publikowanych szeregów czasowych wykorzystywana jest metoda Tramo/Seats.
Wybrane strony internetowe zawierające informacje nt. wyrównywania sezonowego szeregów czasowych:
Eurostat – http://www.forum.europa.eu.int/Public/irc/dsis/eurosam/home
OECD – http://stats.oecd.org/glossary/detail.asp?ID=2398
European Central Bank – http://www.ecb.int/pub/pdf/other/statseasonaladjustmenten.pdf
Bank of Spain – http://www.bde.es/servicio/software/econome.htm
US Census Bureau – http://www.census.gov/srd/www/x12a/
Statistics Denmark – http://www.dst.dk/upload/seasonal.pdf