Introduzione alla statistica economica
La statistica economica ha l’obiettivo di indirizzare gli studenti verso la comprensione, la conoscenza non superficiale dei comportamenti e dei soggetti economici. Ricorrendo alla definizione e misurazione degli aggregati economici e tracciando i metodi analitici sulla base di applicazioni concrete, fornisce le basi per l’analisi univariata e multivariata dei dati economici. Vengono inoltre approfonditi i concetti di inferenza statistica e vengono introdotte le tecniche di base del campionamento statistico. La statistica economica studia aspetti relativi alla misurazione di fenomeni economici e sociali: la ricchezza di un paese misurata attraverso il PIL, la produzione industriale, la disoccupazione, gli indici dei prezzi al consumo, alla produzione. Quali sono gli enti ufficiali produttori di dati e statistiche, dove voi potete trovare i dati relativi alle grandezze dell’Italia e di un paese. La statistica economica e la statistica sociale studiano l’analisi di fenomeni macroeconomici. È una statistica che ha l’obiettivo di aiutare il decisore pubblico, o comunque anche il cittadino, a capire quale sia la condizione economico e socio economica del paese.
Fonti statistiche ufficiali. Sono quelle fonti d’informazioni di dati che ufficialmente vengono utilizzate per conoscere la dimensione dei fenomeni economici e sociali. Che differenza c’è tra dati prodotti dall’Istat o dati prodotti dalla Caritas e università? Sono uguali oppure no? C’è una certificazione col quale il dato è stato raccolto e pubblicato o no? Questi gli aspetti principali che riguardano le fonti statistiche ufficiali.
L’Istat è l’Istituto nazionale di Statistica, principale fonte di dati statistici ufficiali, certificati secondo una serie di criteri e di logiche. L’Eurostat è un ufficio statistico che di per sé non produce dati, l’Ufficio statistico della Comunità Europea ha un ruolo di coordinamento sulla produzione di statistiche di paesi Europei o candidati ad entrare nella Comunità Europea. L’Eurostat non è un produttore di dati ma è un coordinatore di modalità di raccolta dati. Esempio, entriamo sulla tipologia di dati. Come possiamo definire un disoccupato? Una persona che non ha lavoro. Non è vero, ci sono persone che non hanno lavoro perché non sono interessate al momento ad andare al lavoro. Alcuni di voi lavoreranno altri no, preferiscono studiare a tempo pieno. Chi studia a tempo pieno non è un disoccupato, ha scelto di non avere un lavoro. È disoccupata una persona che non si trova bene nel suo posto o ha ricevuto molestie? No. È una persona che sta cambiando lavoro. È possibile aprire una finestra temporale tra la fine del primo contratto lavorativo e l’inizio del secondo oltre la quale definisco la persona disoccupata o meno. Se l’Italia va a definire i disoccupati come le persone che non hanno attività lavorativa e vorrebbero averla, o questa attività lavorativa non l’hanno trovata negli ultimi 6 mesi, un altro paese, definisse 9 mesi di senza lavoro, non avremmo la possibilità di confrontare i dati. Si aprono problemi e questioni di comparabilità dei dati, che è necessario risolvere. L’ente preposto è l’Eurostat. Pertanto possiamo dire che l’Eurostat è quell’ente che stabilisce con quali criteri i dati vadano raccolti e in che modo vadano definiti i vari fenomeni. Non è un ente dittatoriale che impone dall’alto le scelte. C’è un collegio, che include l’Istat e altri enti, che stabilisce quali siano questi problemi.
Dopo aver affrontato i primi temi riguardo le fonti statistiche ufficiali, e i principali aggregati, andremo a vedere che per la pubblica amministrazione, per il governo ed enti locali, è necessario utilizzare gli indici ed indicatori, delle misure di sintesi che permettano di capire questi aggregati di dati. Io posso darvi il numero dei disoccupati in Italia, ma spesso si preferisce lavorare col tasso di disoccupazione. Il tasso, può essere definito come un indicatore, che sintetizza la direzione, si dice indicatore anche perché indica una direzione, un verso attraverso il quale si tende nell’evoluzione dei fenomeni. In particolare gli indici di prezzi e produzioni.
L’evoluzione storica dei fenomeni economici. Guarderemo, cioè, le principali metodologie statistiche per analizzare il comportamento dei fenomeni economici nel tempo. Guardando l’andamento delle vendite nel tempo, parleremo di serie storica, fenomeni che vengono misurati nel tempo. Una serie storica, è una misurazione ripetuta nel tempo ad intervalli regolari (ogni anno, trimestre, mese, settimana, ora, secondo e millisecondo) di un certo fenomeno. Possiamo vedere la produzione industriale mensile, trimestrale, quadrimestrale, semestrale, annuale. La serie storica fa riferimento ad un medesimo fenomeno definito nello stesso modo, sennò si perde la confrontabilità, ad istanti regolari. Serie annuale o semestrali. All’interno di questo insieme parleremo di trend (tendenza generale di un fenomeno nel tempo) o cicli e stagionalità. Un ciclo economico è un andamento della serie storica, che alterna fasi espansive e restrittive senza avere una particolare regolarità. Periodi di grossa crescita economica. Ora siamo in fase di recessione, poi costrizione del fenomeno, PIL che si usa per misurare la ricchezza nel paese che va a ridursi, per poi crescere nuovamente. Questo è un ciclo. Si differenzia dalla stagionalità, perché è legata ad una ciclicità precisa. La successione delle stagioni è qualcosa che si compie ogni anno. C’è una periodicità, che si propone con regolarità: d’estate la produzione industriale cala perché le fabbriche chiudono, o a Natale le vendite aumentano perché ci sono le festività. D’inverno la produzione agricola diminuisce nell’emisfero boreale e aumenta nell’australe. Si parla di stagionalità e non di ciclicità per questa ragione. Questo perché la stagionalità è legata a componenti cicliche. La stagionalità sarà necessario eliminarla, è una componente di disturbo, parleremo di metodi di destagionalizzazione, eliminazione della componente stagionale periodica. I metodi più utilizzati per analizzare le serie storiche sono: i metodi delle medie mobili, i processi stocastici e i modelli lineari, parleremo di retta o parabola di regressione, trend lineari o trend parabolico, e la procedura di Box e Jekins.
L’analisi statistica multivariata. Quello che si studia nella statistica multivariata è la relazione tra tante variabili allo stesso tempo. Non si studia tanto la dipendenza di un fenomeno tra gli altri, quanto piuttosto la correlazione che esiste tra vari fenomeni. La produzione industriale dipende dal PIL? I consumi dipendono dalla ricchezza o è la ricchezza che determina i consumi? Ci sono situazioni in cui le triangolazioni tra variabili dipendenti e indipendenti sono tutt’altro che chiare. Tendenzialmente le persone più alte sono anche più pesanti. È vero che esiste una correlazione, e qui forse si potrebbe pensare che il peso è in funzione della statura, ma quando un ragazzo cresce aumenta anche il suo peso, è la crescita che determina l’incremento di peso, non è che una persona ingrassando aumenti anche di statura. È evidente la variabile dipendente dalla variabile indipendente In questi casi non è sempre ovvio. Riuscire a fare applicazioni di analisi multi variata. Allo stesso modo vedere la metodologia senza fare applicazioni pratiche è come leggere il regolamento del calcio e pensare di essere bravi come Ronaldo.
Quando parleremo di fonti statistiche ufficiali dell’Istat ed Eurostat parleremo delle modalità attraverso le quali questi enti producono dati. La produzione di dati ufficiali può avvenire in due forme: o attraverso un’attività censuaria o attraverso indagini campionarie. Anziché intervistare tutti gli italiani intervisto un sottoinsieme di italiani campionato secondo certi criteri. Campionamento su uso del tempo, c’è un’indagine dell’Istat che si chiama uso del tempo, come gli italiani passano il tempo, e andassi a prendere i quattordicenni romani probabilmente si penserebbe che gli italiani starassero solo davanti alla Play Station a giocare a Fifa o poco altro. È opportuno che un campione sia costruito in maniera tale da essere un’immagine della popolazione. Se in Italia abbiamo 55% di donne, il campione dovrebbe contenere 55% di donne e, l’altra parte, un 45% di uomini. Se la popolazione si ripartisce tra Nord Centro Sud con numerosità differenti, un po’ le prendo nel nord, centro e sud Italia. Se la popolazione vive un po’ in città e un po’ al di fuori dei centri urbani è opportuno che la proporzione all’interno delle unità campionate tra persone in città e fuori sia rispettata. Questa è una logica di campionamento stratificato. Vedrete le principali metodologie di campionamento. Il campionamento richiede una componente inferenziale. Nel momento in cui non ho l’intera popolazione ma un sottoinsieme di essa, siamo soggetti ad una forma di variabilità, detta variabilità campionaria. Posso prendere una qualsiasi tra le file dei banchi e vedere se siete bravi studenti. Vi faccio test di statistica 1 e guardo il risultato che ottengo. Posso seguire due strade. Do test a tutti voi, faccio censimento, o solo ad una fila tra queste. Se lo dessi solo alla prima o alla seconda otterrei risultati comunque differenti, magari simili, ma è difficile che le risposte siano identiche. Il fatto di rilevare un’informazione su campioni anziché su popolazione, determina una componente detta variabilità campionaria. Ogni campione fornirà risultati differenti. Se facessi il test su di voi più volte dovrei ottenere sempre lo stesso risultato. Stessa statura mille volte? Otterrei gli stessi risultati. Se prendessi 1000 campioni diversi? Tutte le unità sui campioni sono diverse, le stature diverse. Entra in gioco la variabilità campionaria, che è l’oggetto d’inferenza statistica. Tutti voi avete visto un minimo d’inferenza statistica a statistica 1.