Il problema della stagionalità
Dopo aver parlato di serie storiche, analizzando il problema di stagionalità, quella componente sistematica o periodica che va a colpire le nostre serie storiche e che dobbiamo cercare di eliminare. Un approccio che avevamo considerato era quello delle medie mobili. Su queste slide che vi caricherò oggi, avevamo detto che le medie mobili sono dei filtri per cercare di cogliere la componente di fondo, cioè il trend al netto di questo fenomeno di stagionalità. Le medie mobili hanno una formulazione di questo tipo. Una media mobile è una media ponderata delle unità dei valori osservati in una finestra di tempo di ampiezza fissa. Le medie mobili sono delle medie calcolate sui valori della serie storica in un periodo di tempo ben stabilito, per esempio una media mobile calcolata su sei mesi, è una media mobile che rappresenta e calcola il valore della serie storica su sei unità temporali consecutive: gennaio febbraio marzo aprile maggio giugno. Nell’unità successiva, febbraio marzo aprile maggio giugno luglio. È una somma ponderata dei valori della serie storica corrispondenti ad istanti temporali intorno a t, cioè dei dati tra t -q1 a t+q2, con opportuni valori dei coefficienti di ponderazione cj. Io posso dare la stessa importanza nel calcolo della media mobile a tutte le unità della finestra temporale. Se calcolo il valore medio di un titolo nel suo valore di chiusura, posso calcolare la media dei valori del primo secondo terzo quarto e quinto giorno, a cinque termini, o posso dire che i valori più recenti sono più importanti dei valori vecchi. Potrei pesare maggiormente i valori più prossimi ad istante t e pesare di meno i valori più vecchi. In generale, la media mobile viene calcolata con una finestra temporale che rispecchia il periodo del nostro fenomeno stagionale. Se ho per esempio un fenomeno con ciclo 12, per esempio la stagionalità tipica dell’anno solare, allora la media mobile da utilizzare è di periodo 12. Se i dati che ho sono di tipo trimestrale, e quindi abbiamo 4 trimestri, la media mobile da usare è in generale una media mobile di ordine quattro. Se c’è un mese, come avevamo nel caso della produzione industriale, che ha un valore particolarmente diverso dagli altri, particolarmente basso, se noi utilizziamo una media mobile di ampiezza 12, questo mese anomalo, è sempre incluso in qualsiasi media mobile. Se noi andiamo da gennaio a dicembre il valore è incluso, da febbraio a gennaio è incluso, da febbraio a marzo è incluso, se andiamo a luglio, da luglio ad agosto uno dei valori più bassi è all’interno di questa finestra, e quando trasliamo ancora di una unità esce dall’estremo sinistro ed entra dall’estremo destro. Uno dei picchi o anti picchi è sempre incluso all’interno della finestra mobile che utilizziamo per le medie mobili. Abbiamo visto brevemente un esempio di media mobile, che è uno strumento molto semplice. La media mobile è la media su unità consecutive della serie storica. L’ampiezza della finestra è fissa, per esempio ampiezza tre, vengono chiamate medie mobili perché i valori che vengono considerati per il calcolo della media mobile cambiano al variare del tempo, la media mobile si adegua piano piano all’andamento della serie storica, facendo una media locale dei valori che sono stati osservati. La media mobile si accompagna piano piano ai valori della serie storica originale. Il risultato è per esempio questo. Una serie storica che presenta una stagionalità di ordine tre, in linea di massima, riduce le oscillazioni che vedete qua passando in mezzo alla serie storica e avvicinandosi a quello che potrebbe essere un trend lineare. Se calcolassimo una retta di regressione su quei dati, il trend potrebbe essere molto vicino alla media mobile. La media mobile è in realtà molto più flessibile rispetto ad una retta di regressione. Una media mobile consente di seguire tutto l’andamento della serie anche se l’evoluzione non è strettamente lineare, anche se il trend non è strettamente o parabolico. Se noi avessimo una serie storica che fa così, questi sono i valori tipici dei mercati finanziari, la media mobile avrebbe un andamento di questo tipo, è una forma di lisciamento della serie storica. Segue in maniera dolce la serie storica,l’andamento globale e il trend, ma non ha la rigidità ne di una retta né di una parabola di regressione. Quale modello parametrico consentirebbe di spiegare questo trend di serie storica? Una retta probabilmente verrebbe così, inadeguato, parabola inadeguata. La media mobile viene utilizzata per andare ad effettuare dei lisciamenti della serie storica cogliendo la tendenza generale ed eliminando le oscillazioni più frequenti, intervalli più brevi, ed eliminando anche componente di stagionalità. La media mobile ha una azione spianante, detta anche di lisciamento, rende più liscia la descrizione della serie storica. La media mobile è uno strumento che guarda al passato. Per poter calcolare la media mobile devo avere già osservato tutti i valori. Non devo calcolare una media mobile quando ci mancano dei valori del futuro. La media mobile è calcolata sulle ultime k unità osservate. Non ha una grandissima capacità preditiva se non ragionandosi sopra anche con strumenti piuttosto sofisticati. Ha una caratteristica principalmente descrittiva. Non parliamo di mercati finanziari e così non facciamo. Ma qui si usa confrontare l’andamento delle medie mobili a breve e a lungo, a 7 giorni e medie mobili a 15 giorni. I dati finanziari dopo 15 giorni sono privi di qualsiasi senso. A seconda dell’andamento che hanno queste due medie mobili, per esempio la media mobile a lungo e a breve, se la breve interseca quella a lungo dal basso verso l’alto significa una certa cosa, se sono invertite significa altro: ci sono fasi alziste e ribassiste del titolo. La media mobile è utilizzata con degli strumenti di analisi tecnica. Qua volevamo vedere un esempio di destagionalizzazione su questa serie, PIL trimestrale italiano da 2001 a 2010. PIL italiano da 2001 a 2010 in milioni di euro. Consideriamo, molto spesso non interessa e l’avevamo già detto parlando di PIL, il valore assoluto del PIL quanto piuttosto la variazione percentuale, consideriamo qual è l’andamento delle sue variazioni percentuali anno per anno della serie precedente, dove per variazioni percentuali intendo valore PIL t meno valore PIL nel trimestre t meno uno, diviso il PIL del t-1. Il primo trimestre per il quale possiamo avere il risultato sarà per forza il secondo trimestre 2001, faremo PIL secondo trimestre 2001-PIL primo trimestre 2000 diviso pil primo semestre 2000 per 100. Ottengo la variazione percentuale PIL trimestre su trimestre. Il nostro obiettivo è cercare di costruire una media mobile che sia morbida e che cerchi di riprodurre la tendenza di fondo di questa serie. In questo modo cerchiamo di ricostruire il trend generale della serie storica. Per fare questo si usa una media mobile a tre periodi e si indica q = 1, perché è t più o meno q, quindi t è a tre periodi. La media mobile è data dalla somma di xt t+q per q che varia da meno k a k. Ho cambiato un po’ la notazione ma è la stessa cosa. È un modo difficile per scrivere quanto detto. Noi abbiamo t , t meno 1, t più uno, t meno due, t più due. Possiamo scrivere allora t più q e t meno q. avremo i corrispondenti valori xt meno q, xt meno due, xt meno due, xt, xt più 1, xt più due, xt più q. La media mobile è la media di questi valori. Quindi, in formule, vedi il foglio a quadretti a fianco. È più difficile a spiegarsi che a farsi. Sono medie ad ampiezza fissa che vanno avanti indietro, avanti indietro. Quello che vediamo li non sono altro che medie mobili calcolate per tre periodi, quindi di ordine uno, che sono state centrate all’interno dell’intervallo. Notate che le medie mobili possono essere rappresentati in due modi: posso disegnare la linea nell’ultimo istante temporale di cui si fa riferimento come dato nel semestre 2-3-4, posso decidere se mettere il segno nel trimestre tre o nel trimestre quattro. Anche se sarebbe più corretto mettere il trimestre 4, perché è l’ultimo anno a disposizione, è preferibile come effetto grafico di interpretazione del trend metterlo al centro, in modo tale che la serie risulti ben centrata sulla serie storica originale. Se posizionassi la serie storica nel periodo 4? Sarebbe tutto traslato a destra di una casella, di una unità. Cambia poco ma il risultato è più vicino alla serie storica originale. Notate ancora che la serie può essere calcolata solamente se i dati sono disponibili. Perdiamo due osservazioni: una qua, ci manca il dato della variazione percentuale del primo semestre, posso solo partire da qua, ho l’andamento e lo stesso problema si presenta alla fine, ci manca il dato della variazione percentuale del quarto trimestre. Le medie mobili hanno una finestra di possibili valori più ristretta rispetto alla serie storica originale. I residui tra la serie storica e il modello a medie mobili non mostra un trend apparente, ma sembra che la variabilità della distribuzione aumenti a partire dal 2005. Sino al 2005 la serie storica originaria, della variazione percentuale del PIL trimestrale è abbastanza tranquilla. Dopo il 2005 balzi in basso o in alto, dovuta a quella che si chiama volatilità della serie storica. Potrebbe essere ragionevole pensare di utilizzare una media mobile di un ordine superiore, per esempio una media mobile a cinque termini, cioè di ordine tre. Utilizzando una media mobile di cinque termini si ha una finestra temporale più ampia, e quindi la oscillazione locale va ad influire di meno sull’andamento della serie storica. Aumentare il numero di elementi che vengono utilizzati per calcolare la media mobile, stabilizza l’andamento, il profilo della media mobile. Se per assurdo utilizzassimo una media mobile di ampiezza massima, calcolassimo la media su tutti i valori, otterremmo la media di tutte le variazioni percentuali, avremmo un solo valore per tutti.. Quanto più la finestra della media mobile è ampia, tanto più la media mobile risulterà essere vischiosa nei movimenti. Una nuova unità pesa per un settimo, ho una media mobile di ordine tre, quindi ho sette elementi. Un nuovo elemento che entra pesa per 1/7. Per sei settimi la serie storica della media mobile sarà uguale ai valori che c’erano nell’unità temporale precedente. La media mobile di ordine superire risulta essere più lenta nel suo processo di adeguamento al trend, risulta anche meno sensibile alle fluttuazioni locali che possiamo avere nella serie storica. Qui ho la media mobile di ordine uno, e quindi di tre elementi. La media mobile di ordine zero non ha senso calcolarla, è la serie storica stessa, sarebbe xt. La media mobile di ordine due è a cinque elementi, la media mobile di ordine tre è a sette elementi, di ordine quattro è a nove elementi. Vedete come quanto più si aumenta il grado della media mobile, tanto più questo trend risulta essere meno sensibile alle oscillazioni locali dei dati. Se andiamo a vedere i residui che possiamo ottenere, troviamo che: le medie mobili di ordine minore vanno incontro a degli errori, degli scarti, che sono minori rispetto alle medie mobili di ordine superiore. Cosa sono i quattro grafici che vediamo? Gli errori. Qt meno la media mobile di ordine 1-2-3-4. Prendiamo il valore più basso: -1%. Se andiamo nella media mobile di ordine due arrivo al meno 2%, ordine tre lo supero e di ordine quattro è ancora più grande. Non deve stupire. Le medie mobili di ordine basso danno più importanza ai valori locali recenti, vicini, di quanto facciano le medie mobili di ordine superiore. La media mobile di ordine uno utilizza tre osservazioni vicine. Ogni nuova osservazione che entra nella media di ampiezza 3 pesa 1/3, mentre nella media mobile di ordine quattro, con un totale di nove osservazioni che entrano nel calcolo della media mobile di ciascuna casellina, ogni nuova unità pesa per un nono. Pesa poco, molto di meno. L’effetto memoria della serie storica rimane, viene trascinato e l’andamento della media mobile di ordine elevato è molto più lento. Se ci sono crescite rapide o decrescite rapide della serie storica, la media mobile di ordine basso tende a coglierlo subito, di ordine alto con più lentezza, ha questa memoria legata al passato. In questo grafico vedo la serie storica del PIL utilizzando le varie medie mobili: di ordine uno o utilizzando la media mobile di ordine quattro. Sembra cambiare poco, in realtà un po’ cambia. Mi serve per ragionare sugli ordini delle medie mobili. Ci sono alcuni problemi sulle medie mobili:
- Deformano le fluttuazioni di periodo diverso da k, modificando in particolare i punti di svolta (in genere, anticipandoli per le serie crescenti, posticipandoli per quelle decrescenti). Se voi avete dei dati trimestrali, dovete utilizzare come regola le medie mobili di numero di termini 4. Se avete dati annuali medie mobili di numero di termini 12, se i dati sono semestrali si usano medie mobili di numero di termini due.
- L’effetto Slutzky Yule,
- Fanno perdere le osservazioni all’inizio e alla fine della serie
- Se non è dispari è facilmente centrata, altrimenti sono necessari dei pesi particolari, se k è dispari i problemi di problemi di centralità della serie storica possono non essere banali.