Le diverse fonti
Pertinenza: è la capacità dell’informazione statistica di soddisfare le esigenze degli utenti, deve essere valutata all’interno del programma statistico. L’indagine che stai facendo, è pertinente? È qualcosa che realmente serve o è qualcosa di inutile? Ponetevela sempre come domanda. Se domani presentate un vostro prodotto al cliente, gli state presentando qualcosa che è pertinente o non gliene frega niente? Può essere bellissimo il prodotto, ma se non è pertinente al suo business non gli interessa. Dovete cercare di convincerlo che quello che gli state vendendo gli deve interessare perché ha una serie di finalità. L’informazione statistica è buona, è pertinente quando è utile. Potete al posto di pertinenza mettere utilità, ma dal punto di vista economico ha un altro significato. Di cosa ha bisogno l’utente finale? Ritorniamo alle statistiche dell’Eurostat. Vi ho detto che le statistiche sono di competenza della Commissione Europea. Sono pertinenti per la Commissione europea. Che l’Italia vada a fare delle indagini sul turismo degli Afghani in Pakistan, interessantissimo ma non è pertinente.
Accuratezza. Brevemente intendo la vicinanza tra la stima prodotta per un parametro e il vero valore ignoto dello stesso. L’abbiamo chiamata anche correttezza o non distorsione. Uno stimatore è corretto quando, mediamente, il suo valore atteso è uguale all’ignoto oggetto di stima. La stima differisce dal vero ignoto valore del parametro a causa di una serie di errori. Gli errori possono essere presenti in qualsiasi fase dell’indagine. Oltre agli errori di statistica, errori campionari, si introducono gli errori cosiddetti non campionari. Di questo ne parlerete anche con Persico. Vi faccio un esempio semplice di errore campionario. Tra le varie metodologie di campionamento che vengono utilizzate nelle indagini di mercato, c’è il campionamento per quote. C’è una indagine della Kraft, che vuole produrre un nuovo formaggio spalmabile. Vediamo se va bene per la clientela. Intervisto 1000 persone. A Genova devono esserne intervistate 20. La società di marketing individua la persona di Genova o che opera in Liguria e dice: devi intervistare 20 persone: 14 donne e 6 maschi di queste fasce di età. Devi intervistare queste persone e poi fai come vuoi. Cosa succede? Questa persona che è sul territorio, in genere è uno studente universitario, o post universitario che individua queste 20 persone come la madre, la zia, la zia e la madre del ragazzo, magari anche la nonna, poi anche se stesso, l’amica, il fratello del ragazzo eccetera. In linea di massima, le persone che rispondono fanno parte di un claster, di un gruppo di persone omogenee per caratteristiche sociali, economiche e demografiche. Si genera una distorsione: quelle persone non sono più rappresentative della popolazione ma di un particolare gruppo della popolazione. Questo è un classico esempio di errore non campionario, legato al fatto che il campione non è casuale.
Tempestività. Il fatto che i risultati del censimento arrivino con un anno e mezzo di ritardo ci indispongono un pochino. Evidentemente, per tempestività intendiamo il tempo che intercorre tra l’istante e il periodo in cui intercorre l’informazione statistica e il periodo in cui tale informazione è disponibile per l’utenza. C’è la necessità di dare un feedback rapido alle indagini che vengono fatte. Il mondo corre, è sempre più veloce. Anche l’informazione statistica ufficiale deve essere tempestiva. È per questo che Istat ed Eurostat fanno quelle pubblicazioni veloci, i flash. Bisogna cercare di essere sempre sulla palla, se non in contemporanea bisogna riuscire anche ad anticiparlo. Non a caso si danno le stime sull’andamento. Non solo si cerca di dire cosa è successo, ma dare una previsione su ciò che succederà per cercare di essere più che tempestivi con l’informazione statistica. È chiaro che quanto più vogliamo essere tempestivi tanto più difficile è essere appurati. Se poi le informazioni sono vecchie a quel punto non diventano interessanti e non sono pertinenti. Non è interessante dopo 5 anni pubblicare uno studio sul turismo. Ormai il mondo è cambiato. L’11/9 quando gli aerei hanno colpito le Torri Gemelle, li c’è stato un punto di svolta in cui l’informazione precedente potevi buttarla via, è cambiato tutto dopo quel momento.
Accessibilità. Si riferisce alla facilità con cui gli utenti possono apprendere l’esistenza dell’informazione ed è anche per questo che batto molto sul sito Istat ed Eurostat e su dove voi trovate le informazioni. I dati devono essere accessibili e le persone devono sapere dove andarle a prendere. Dove? Per esempio sul sito Istat. Essere in grado di trasferire le informazioni nel proprio contesto lavorativo. Bisogna sapere quando verrà rilasciata l’informazione. Ve l’ho fatto vedere: in fondo alla pagina, sul documento vi si dice quando verrà rilasciato il prossimo bollettino trimestrale sull’andamento dei prezzi della produzione industriale e così via. C’è un calendario preciso delle pubblicazioni dei dati, sistema di distribuzione dell’informazione: sito web, pubblicazioni cartacee, il costo dell’indagine e la disponibilità ad informazioni aggiuntive per una corretta interpretazione dell’informazione: glossario, note metodologiche, note integrative, cose viste la volta scorsa.
Comparabilità. Indica che l’informazione è confrontabile nello spazio e nel tempo. L’abbiamo già detto. È importante che l’informazione sia comparabile. Avere un dato che nel 2001 è diverso dal dato del 2002 e che è stato calcolato in maniera diversa nel 2003 non ci permette di costruire quella che viene definita serie storica. Allo stesso modo non ha senso geograficamente che ci sia differenza tra Genova e Mantova.
Coerenza. Le statistiche derivanti da fonti diverse sono coerenti se basate su definizioni, classificazioni e metodologie standard, cioè se sono integrabili. Si lega alla comparabilità. Oltre alla confrontabilità è se tutto rientra in un insieme unico.
Completezza. La capacità di fornire informazioni sugli aspetti indagati senza lacune od omissioni ingiustificate. Per esempio, fare una indagine sulla popolazione straniera, considerando solamente la popolazione regolare non soddisfa un elemento di completezza, va ad escludere tutta la componente irregolare.
In linea di massima, quando c’è da condurre una indagine statistica, ci troviamo di fronte ad una fase preliminare che richiede la specificazione degli scopi della ricerca. Abbiamo esigenze conoscitive: vogliamo conoscere qualcosa relativamente ad un fenomeno. Quanti sono gli italiani, quali sono i profili degli immigrati e sapere quali sono i bisogni della popolazione straniera a Genova. Questa è la pertinenza del nostro dato e dell’indagine che viene fatta. Qual è la coerenza del dato che otteniamo rispetto alle esigenze conoscitive che avevamo in origine. Non è facile. Ci sono situazioni in cui le esigenze conoscitive sono chiare, ma non è facile capire come individuarle. Come facciamo a misurare l’integrazione della popolazione straniera a Genova? Non è facile. Poi abbiamo tutta una serie di metodologie, tecniche, strutture e fasi che si sviluppano nelle indagini che mi identificano l’appuratezza della procedura: l’assenza di errori, l’utilizzo di una struttura di analisi corretta. Infine, tempestività accessibilità completezza coerenza compatibilità risultano relative alle conclusioni, all’informazione che si deriva al termine di tutta l’indagine.