Rilevazioni amministrative
Le rilevazioni amministrative non sono solamente dati prodotti dagli enti pubblici o privati. Anche il comune di Genova possiede dati di carattere amministrativo. Le due classificazioni, quella in base alla natura giuridica dell’ente (istituzionale pubblico privato e di ricerca) e tra le due tipologie di rilevazione (per finalità statistiche ed amministrative) non sono esclusive, non ci sono abbinamenti precisi, possono intralciarsi.
Le rilevazioni amministrative, nel caso del comune di Genova sono per esempio i dati di tipo anagrafico. Il comune deve tenere un’anagrafe dei residenti. Da qui capiamo quanti sono i residenti a Genova come numero, quanti sono per nazionalità, per fascia d’età, per genere. Possiamo anche conoscere il loro indirizzo, nel rispetto della normativa sulla privacy. Se lo conoscessimo è semplice sapere quanti sono i residenti per ciascun municipio, ex circoscrizione o per ciascun quartiere. Per ciascun quartiere posso sapere i residenti per nazionalità e fascia d’età. Quanti studenti ci sono in una scuola: quanti al liceo scientifico, classico, tecnico, eccetera. Questi dati esistono perché le scuole devono svolgere il loro compito di informazione. Il comune deve gestire l’anagrafe dei residenti.
Al tempo stesso ci sono altre attività che vengono svolte (registro delle imprese). Finito il corso di formazione volete aprire una azienda la iscrivete nel registro delle imprese attive, in cui ci sono una serie di dati: nome azienda, azionisti, capitale sociale, forma societaria, tutte le cose viste in diritto commerciale.
Il PRA. Se comprate una macchina, moto o motorino, o qualsiasi cosa di due o quattro ruote soggetta di immatricolazione è iscritto nel PRA. Noi possiamo sapere quanti sono i mezzi circolanti per cilindrata, per tipologia inquinante, euro zero, uno, due tre eccetera. Auto elettriche, ibride eccetera. Oppure sapere gli autoarticolati che sono immatricolati in Italia versus quelli in Francia, età media del parco vetture. Poi abbiamo le liste elettorali.
Esempi di dati amministrativi usati per finalità di tipo statistico. Ci sono aspetti molto rilevanti sulla privacy. Qualche anno fa, 5 o 6 anni fa, era venuta fuori una polemica perché l’agenzia delle entrate aveva pubblicato sul suo sito le dichiarazione dei redditi degli italiani. Tutto bloccato entro dieci minuti, tutto ritirato, evidentemente ci sono problemi di privacy non indifferenti: ognuno guardava il vicino quanto guadagnava eccetera. È evidente che sono dati sensibili. Non tutti i dati possono essere trattati allo stesso modo. Anche i dati sanitari non possono essere trattati allo stesso modo, magari un soggetto non ha piacere che si sappia che ha un tumore. Perché deve essere diffuso in internet?
Di altra natura problema aperto in Inghilterra tre quattro anni fa. Proposta del primo ministro o della giustizia, pubblicare su internet tutti coloro che sono stati accusati di pedofilia, così i genitori poterono vedere se c’erano pedofili vicino a casa, o vicino alla scuola dei figli. Questa proposta è caduta in nome della privacy. La pubblicità dei dati è soggetta ad aspetti di privacy.
Adesso vediamo i dati di origine statistica raccolti per finalità esplicitamente informative. Accenneremo ai censimenti e alle indagini campionarie. Cosa è un censimento? C’è stato l’anno scorso, 15esimo censimento della popolazione e delle abitazioni. È un’indagine esaustiva su tutte le unità che compongono la popolazione. Il censimento più famoso, non è l’unico esistente adesso, è il Censimento della Popolazione e delle Abitazioni. Ha come obiettivo il conteggio degli italiani presenti sul territorio a una certa data, anzi di tutti coloro che sono residenti in Italia, il conteggio di tutte le abitazioni. Sembrerà strano ma non è così sicuro che le abitazioni presenti sono quelle che sono al catasto, molte abitazioni non sono regolari. Il censimento delle popolazioni e abitazioni è così definito dall’Istat: è l’insieme delle operazioni di progettazione, raccolta, analisi e diffusione dei dati di carattere demografico, culturale economico e sociale di tutti gli abitanti del paese. Non quindi cittadini italiani. È una indagine esaustiva. L’obiettivo è cercare di raggiungere tutti gli italiani, tutte le unità statistiche del territorio. La cadenza è decennale, ogni dieci anni viene fatto questo lavoro, è un lavoro estremamente costoso, richiede molto tempo di analisi e vuole determinare non solo l’entità numerica ma anche la struttura della popolazione di un paese.
Avete aiutato i genitori a compilare il questionario? Compilazioni online. Ricordate le domande, c’erano due forme: una lunga e una breve. La forma breve aveva meno domande della forma lunga. La forma lunga, che aveva più domande, vedremo perché ce ne erano due, chiedeva che tipologia di riscaldamento hai, come è fatto il palazzo, domande sulle abitazioni, sull’origine, attività lavorativa, se la casa è utilizzata anche come luogo del lavoro eccetera. Non semplicemente il conteggio delle teste, ma qualcosa di più complesso. Esistono tanti altri censimenti. Nel 2010 è stato fatto censimento generale dell’agricoltura, attraverso il quale si vuol sapere quanti maiali ci sono in Italia: ovini bovini suini, caprini, quante aziende agricole operano, per quale superficie operano, in quale terreno, per capire qual è l’attività agricola, dove per agricola si intende anche l’attività pastorizia del paese. Questa è statistica macro economica, guarda i grossi aggregati, non il singolo soggetto, ma guarda all’insieme nazionale di un certo fenomeno.
Censimento generale dell’industria e dei servizi, dovevano farlo l’anno scorso ma non è ancora partito. Adesso è in corso il Censimento delle associazioni no profit, quante sono cosa fanno eccetera.
Diversa dal censimento è l’indagine campionaria. Il censimento (indagine censuaria) è estremamente costoso; indagine campionaria = campionamento. Col censimento bisogna raggiungere tutti i 60 milioni di italiani, tutti i nuclei familiari. Solamente a Genova per un anno hanno lavorato 350 persone, comune di Genova, non provincia, ha un costo non indifferente. Si parlava di saltare il censimento e non farlo. La multa dell’UE era talmente alta che conveniva fare il censimento. È un obbligo comunitario, è stato un censimento coordinato a livello europeo. Ci sono inoltre tantissime difficoltà nell’analizzare i dati: questionari, metterli in forma informatica, analizzarli. È un processo che richiede 3 – 5 anni per essere concluso. A Gennaio primi dati definitivi sul censimento, a Roma sono un po’ indietro. I primissimi risultati ad un anno dalla fine del censimento, e poi le analisi conclusive si avranno dopo due – tre anni la fine del censimento. C’è un calendario che dovrebbe essere rispettato. Ci sono situazioni in cui non vale la pena mettere su tutto il cinema. Se voglio sapere le abitudini degli italiani nelle vacanze, quanti andranno all’estero, quanti in albergo, quanti rimarranno a casa, non devo per forza fare un censimento e raggiungere tutti gli italiani uno per uno e chiedere a questi cosa intendono fare. È più semplice utilizzare un campione. Sono caratterizzate dal fatto che solo una parte delle unità componenti la popolazione viene selezionata ed indagata.
Esempio molto semplice. Vi voglio chiedere se il corso vi sta piacendo. Posso prendere ognuno di voi e chiedervi: ti piace questa lezione? Diventa snervante per voi. In fin dei conti su 50, se ho chiesto a 49 persone, quanto serve sapere l’informazione della 50esima persona. Se ne ho 49, non posso prenderne 48? Esiste una soglia al di sopra della quale il costo di rilevazione dell’opinione della persona o del dato è superiore al beneficio che ho nel raccogliere il dato. Su 50, 15 di voi sono il 30%. 15 su 50 mi danno informazione buona se il corso è bello brutto, se piaccia o meno, se sembro antipatico o simpatico. È una informazione che vale sul momento. Poi ci saranno altre lezioni, poi altre lezioni, poi viene un altro docente, l’informazione raccolta ha validità limitata.
Avrebbe senso condurre un’indagine campionaria per informazione che vale poco tempo? Un’indagine sulla forza lavoro, che cerca di capire quanti e perché sono occupati, non ha senso a livello censuario. Meglio fare indagine su poche unità, ben fatta, secondo alcuni criteri che vedremo, costa di meno. Condurre indagine campionaria ha un costo eccessivo rispetto al beneficio che trarrei dall’indagine pienamente censuaria, molto meglio la campionaria. Questo espediente, diminuendo l’onere della rilevazione, consente di destinare maggiore attenzione a tutte le attività connesse al miglioramento e al controllo della qualità dei dati raccolti.
Se voi avete 2000 questionari, avete tempo di contattare le persone con più calma, preparare meglio le domande, le risposte, e verificare meglio la correttezza e la qualità della risposta. Se avete centomila risposta il tempo che potete dedicare a ciascuna persona è di meno. Selezionare solo un campione implica una minore attendibilità delle misure osservate in quanto stime dei parametri di interesse. Vero. Se chiedessi solo ad alcuni di voi se il corso è bello, potrei avere una valutazione sbagliata. Sono sfortunato e potrei beccare persone che non mi sopportano, potrei beccare persone molto contente. O è realistico credere che se a un 50% non piace e l’altro 50% piace, il campione è frutto del caso se è ben fatto, se non è distorto, avrà il 50% di persone a cui piace e 50 a cui non piace. Il campione auspicalmente dovrebbe rispettare la composizione della popolazione. Anche se non ho la percezione assoluta dello studio censuario, lo studio campionario è comunque soddisfacente. Avrò l’errore dovuto al fatto di avere il campione anziché la popolazione, ma in linea di massima questo errore dovrebbe essere nullo.
È chiaro che a seconda di quali unità vengono inserite nel campione prescelto, i risultati riferiti alla popolazione complessiva varieranno. Cosa significa? Se prendo campioni di 5 da voi quanti ne posso prendere? Tanti: i primi 5 del primo banco, dell’ultimo banco, a caso e così via. Ogni campione è composto da unità differenti. Ogni unità da una valutazione diversa. Se il campione è ben fatto, le risposte saranno più o meno simili tra loro e ruoteranno attorno al vero valore della popolazione che a me interessa stimare, proprietà della correttezza dello stimatore.
Le indagini sui campioni della popolazione rientra nell’attività Istat da circa un ventennio. Quella sulle forze lavoro realizzata nel settembre del 1952 è stata l’unica ad indagine diretta con interviste personali.