Fonti statistiche e amministrative analogie e differenze
Adesso parliamo della differenza tra fonti statistiche e fonti amministrative. Abbiamo detto che le statistiche ufficiali si dividono in: fonti statistiche, fonti di dati che nascono proprio per finalità di tipo conoscitivo, statistico. Sono indagini fatte per finalità statistiche, come per esempio il censimento, indagine sulla popolazione e tutte le analisi dell’Istat. Diverse sono le fonti amministrative. Fonti di dati, d’informazioni, che scaturiscono da un processo di elaborazione, di attività, di un ente. I dati dell’Inps, Inail, i dati dell’ACI, del registro automobilistico, dell’anagrafe sono tutti dati che hanno origine amministrativa. Questi enti che ho nominato, non hanno come scopo prioritario quello della produzione statistica, ma hanno come finalità altri scopi rispetto a quello di pura produzione statistica. Tuttavia, raccolgono tutta una serie di dati che possono essere utili e importanti per successive lavorazioni. Un esempio classico di fonte amministrativa è l’anagrafe. Poi abbiamo anche il PRA oppure il registro delle imprese.
Quali sono le analogie e le differenze? È il caso in cui l’informazione è tratta da annuari statistiche e da banche dati statistiche, per esempio il sito dell’Istat, oppure raccolta mediante appositi questionari. In questo caso si parla di rilevazioni dirette. Sono eseguite dall’Istat, o da altri enti del Sistan mediante un’intervista diretta rivolta alle famiglie, istituzioni, enti, strutture alberghiere eccetera. Le fonti amministrative sono informazioni sulle unità statistiche raccolte dalle amministrazioni pubbliche per finalità proprie dell’ente: dell’Inps, del registro automobilistico, o derivanti da obblighi di legge. Esempio decessi, matrimoni, trasferimenti di residenza, denunce di reati, dati sulle strutture sanitarie, produzione scolastica. Queste lavorazioni sono indirette. Non fatte direttamente con finalità statistiche, ma l’informazione statistica è rilevata indirettamente da questi archivi amministrativi. Le rilevazioni statistiche possono essere caratterizzate da:
- Rilevazione completa, o universale, o totale: è estesa a tutte le unità dell’universo o popolazione statistica, è la classica rilevazione che abbiamo anche chiamato censuaria. Tutti questi termini vanno bene per identificare un’indagine esaustiva sull’indagine della popolazione. Non mi attacco troppo ai termini, vanno bene tutte come definizioni. Abbiamo censimenti, matrimoni, decessi, trasferimenti di residenza;
- Rilevazioni parziali. Riguardano una parte dell’unità dell’universo, definita specificamente da un ricercatore. Se stiamo facendo una indagine sui laureati, definisco come universo la popolazione degli italiani, ma come popolazione parziale, universo parziale quello dei laureati. Abbiamo il censimento intermedio dell’industria e dei servizi. È un censimento, una rilevazione parziale. Sembra quasi una contraddizione. No, non lo è nel momento in cui prendo un universo, per esempio tutte le aziende e vado a fare una partizione di queste aziende e vado a seguire uno studio censuario su questa partizione;
- Rilevazione campionaria. È una indagine che indaga una popolazione, totale, o partizionata nel modo precedente, ma non in maniera esaustiva, ma campionaria, basata su un campione.
Abbiamo discusso abbastanza lungamente sulla indagine campionaria e sulla indagine censuaria. Guardiamo un attimo il confronto tra le indagini totali e le indagini campionarie. L’indagine parziale può essere ricondotta, in linea di massima, ad una indagine campionaria anche se è un sottoinsieme dell’universo di origine. Se vogliamo fare uno studio di tipo censuario, vogliamo raggiungere tutte le unità della popolazione di nostro interesse, andiamo incontro ad evidenti vantaggi e grossi svantaggi.
Vantaggi. In primo luogo vediamo che con un censimento ho una ampia copertura del fenomeno di interesse, copriamo tutti i possibili valori. Se cerco di valutare le condizioni di vita degli italiani, con uno studio censuario, noi abbiamo una visione completa. Il risultato è una fotografia completa. Inoltre, se abbiamo un gran numero di unità statistiche, perché stiamo misurando su tutte le unità dell’universo, stiamo eseguendo uno studio censuario, noi avremo informazioni di dettaglio per tutta la nazione, per ciascuna regione, provincia, comune sino ad arrivare alla singola sezione di censimento, che è una zona con superficie più o meno ampia a seconda della popolazione residente. A Genova nell’ordine del 130. Le sezioni di censimento coincidono con pochi palazzi.
Quali sono gli svantaggi di un’indagine censuaria?
- Con un’indagine campionaria vedo tutte le unità statistiche. Ma a che prezzo? Devo raggiungere ciascuna unità statistica. Il costo di un’indagine campionaria è estremamente elevato;
- Tempi lunghi. Per raggiungere tante persone c’è bisogno di molto lavoro e c’è anche bisogno di tanto tempo per andare a convertire le risposte che sono state raccolte in forma cartacea, convertirle da forma cartacea a forma elettronica.
- È possibile che ci siano errori. Se ho tantissimi questionari somministrati e un numero di personale ridotto, è chiaro che vado incontro a errori di compilazione del questionario che possono essere notevoli: mancate risposte, risposte errate, risposte multiple dove dovrebbe essercene una sola, non ho tutto il tempo necessario per fare verifiche sul singolo questionario;
- Problemi di copertura. Possiamo avere unità statistiche che possono essere rilevate più volte o più frequentemente delle unità statistiche che non vengono rilevate affatto. Problemi di sotto copertura. Quando la lista non include alcune unità che effettivamente fanno parte della popolazione. Può accadere che ci siano movimenti di residenti che non vengono colti dagli archivi anagrafici, sui quali si basa inizialmente il censimento. Allora ci sono persone alle quali la scheda del censimento non viene consegnata. Questi sono i classici problemi di sottocopertura, corretti con una serie di tecniche che non andremo a vedere ma sono interessanti;
- Non si può pensare di avere quantità e qualità dell’informazione allo stesso tempo. Se eseguo uno studio su tutta la popolazione, il numero di domande che andrò a fare inevitabilmente sarà ridotto. Non posso dedicare troppo tempo a ciascuna unità statistica per vedere qual è l’informazione che mi può dare. Molto spesso, negli studi di tipo censuario, l’indagine è poco approfondita, le informazioni raccolte sono poco approfondite.
Diverso il discorso sulle indagini campionarie. Si può pensare che un’indagine censuaria sia migliore di un’indagine campionaria. Uno dice vado a prendere tutte le unità della popolazione, ho più unità rilevate rispetto a quelle che avrei utilizzando un campione. Questo non è in realtà vero. L’indagine campionaria, essendo basata su un numero di osservazioni molto minore di quelle che si utilizzano per un’indagine censuaria, consente all’intervistatore di dare maggior cura all’intervista. Dedico più tempo a ciascuna persona, la si può seguire meglio, con più accuratezza se ha capito il significato della domanda e, ad una seconda verifica dei questionari, si può ritornare facilmente dall’unità statistica intervistata per integrazione. C’è tanto lavoro nel censimento che la cura del dettaglio passa in secondo piano. Il censimento richiede tempi molto lunghi. L’informazione censuaria è un’informazione già vecchia quando viene diffusa. I dati del censimento, i primissimi sono usciti a marzo, i primi dati sul censimento usciranno nel marzo 2013, dopo un anno e mezzo dal giorno di riferimento del censimento del 2011. Da qui a un anno e mezzo cambieranno le cose e i dati censuari sono piuttosto vecchi, servono come grosso riferimento, come cartina torna sole di un certo fenomeno. Invece, un’indagine campionaria, è veloce snella. Consente di raccogliere le informazioni che interessano anche in maniera approfondita e, in poco tempo, avere un riscontro sulle informazioni raccolte. Sono delle informazioni che permettono aggiornamento dei dati in tempo breve. Il costo è più contenuto rispetto all’indagine campionaria. Un minor numero di unità statistiche da rilevare determina un minor costo complessivo dell’indagine.