Le diverse tecniche di rilevazione dei dati: la progettazione
Iniziamo ora ad avvicinarci un po’ di più al concetto di indagine dal punto di vista operativo. Questo tema lo approfondiremo di più e meglio con Persico. Iniziamo a guardare oggi le modalità attraverso cui si possono rilevare i dati usando delle indagini statistiche. Qua ci sono le sei fasi che descrivono l’indagine statistica. Le vedremo e approfondiremo uno per uno. Ci focalizzeremo in linea di massima, quasi esclusivamente sulla fase uno ed in particolare sulla modalità di rilevazione dei dati. Questo elenco non lo andremo ad esplorare punto per punto, ma solo il punto uno e un suo sottopunto. Come si compie una indagine statistica? Fase iniziale della progettazione. Uno dei primi errori classici che si fanno quando si conduce una indagine di tipo statistico è quello di partire a scrivere il questionario. Non funziona così. Bisogna definire bene quali sono gli obiettivi della ricerca. Ho una fase di progettazione, definisco bene gli aspetti del problema e si decide come operare. Successivamente avviene la fase di individuazione del campione da rilevare. Abbiamo messo un cappello all’argomento. Voglio rilevare i dati. Come facciamo? Anzitutto dobbiamo dire qual è la popolazione di riferimento, la lista dalla quale noi possiamo campionare, come raggiungere le persone di questa popolazione? Elenco del telefono, ma abbiamo già detto che non copre la popolazione italiana (persone non hanno il telefono o non vogliono esserci). Rilevazione. Attività che consistono nel predisporre l’attività effettiva di campionamento e le interviste. Dopodiché dobbiamo acquisire i dati, avremo una fase di preparazione dati. Dopo i dati devono essere analizzati e documento di pubblicazione dei dati col quale li diffondiamo.
Progettazione. Richiede innanzitutto di definire bene un problema. Che cosa vogliamo fare? È facile dire sarebbe bello fare indagine sulla condizione degli immigrati clandestini a Genova. Cosa significa? Sono vivi o morti? No, anche altre cose: chi sono, da dove sono arrivati, perché sono a Genova, vogliono andare via o si fermano. Questa è una finalità descrittiva, primo problema. Secondo problema capire le esigenze che loro hanno, riescono ad accedere ai servizi di prima accoglienza, hanno bisogno di servizi che non riusciamo a dare, o se hanno paura di accedere a servizi per paura di essere denunciati. Non è facile, bisogna specificare bene il problema. Definire a priori che cosa si vuole fare, a cosa mi serve questa informazione, qual è la finalità della mia indagine? Io voglio offrire nuovi servizi alla popolazione clandestina per andarle incontro, sono fasce deboli. Come faccio a raggiungere queste persone? Se è clandestina non li trovo nell’ elenco telefonico. Posso utilizzare una metodologia di campionamento, campionamento per ceto, vado a cercare i clandestini nei luoghi in cui si aggregano. Ci sono bar frequentati da clandestini, centri culturali, anche il clandestino ha una vita sociale. È chiaro che io non posso brutalmente fare una intervista al clandestino come la farei al regolare, quello ha paura di essere denunciato. Questa fase di progettazione identifico la domanda di ricerca, il problema, il punto al quale si vuole arrivare. Poi obiettivi da raggiungere e andare a rilevare le informazioni che ci servono.
Problema del campionamento. Molto collegato alla progettazione. Le liste di riferimento saranno a cascata derivanti dalla specificazione del problema e dalla definizione degli obiettivi. Poi abbiamo anche questioni di dimensione campionaria. Quante unità vado a campionare? 3500? 4000? 2000? Dipende da tante cose. Dipende se voglio fare una indagine ripetuta nel tempo, tante volte per vedere come si evolve, o una volta sola per capire come è una certa situazione. Scoppia una guerra nella penisola balcanica? Arrivano tanti immigrati che scappano dalla guerra. Situazione di emergenza. Mi interessa in quel momento sapere come è la situazione. Poi magari mi interessa non ripeterla subito. Posso dedicare un po’ di risorse economiche ad una indagine spot piuttosto che pensare di suddividere la spesa negli anni, poco alla volta. Non immaginate le fasi assolutamente separate, sono molto concatenate. Dopo avviene la fase di rilevazione. Selezione degli intervistatori, sembra molto semplice, ma non lo è. A seconda del problema servono intervistatori differenti. Per la popolazione straniera è bene avere intervistatori che parlino lingue straniere, si aiuta l’intervistato a rispondere. Poi organizzare bene il lavoro sul campo. Se penso di intervistare 100 persone alla Maddalena, 100 persone a Castelletto, 50 alla Foce, 80 ad Albaro, bisogna che ci sia una persona che pianifichi l’attività, che verifichi quali persone hanno risposto e quali no. Programmi il ritorno sul campo di persone non trovate, che gestiscano tutta l’indagine campionaria. Sono aspetti organizzativi piuttosto importanti. Dopodiché, una volta che gli intervistatori sono stati formati, è stato spiegato il questionario, difficoltà che possono emergere e ritornano coi questionari cartacei o informatici, dovranno andare a fare delle modifiche, registrazioni e correzioni, a seconda delle risposte date. È normale che su 4000 questionari ogni tanto qualcuno risulti incompleto. Perché c’è un errore materiale dell’intervistatore, magari mette due crocette dove ce ne è una e nessuna crocetta in altre domande, oppure può risultare che le risposte siano in contrasto tra di loro, le ragioni sono parecchie. Alla fine il risultato finale di una indagine campionaria è un foglio di Excel, ogni riga è un questionario ogni colonna è una risposta. Se intervistiamo 3500 persone e a ciascuna poniamo 10 domande, avremo un foglio di Excel con 3500 righe e 10 colonne, una per ogni domanda. Metteremo le risposte che sono state date. La prima persona intervistata a 35 anni. In corrispondenza della domanda: la tua età? La risposta è 35. Alla domanda: che titolo di studio hai tra questi dieci, A – B – C – D, dovrai mettere una lettera. Il risultato finale di una operazione di campionamento a livello di dati grezzi, e questi sono i micro dati, è un file di Excel. Se l’indagine è particolarmente grande, uso degli strumenti più sofisticati sennò Excel dà pienamente l’idea della struttura di un insieme di micro dati. Ci siamo posti delle domande inizialmente. Voglio sapere quanti stranieri irregolari presenti a Genova risultano essere discriminati oppure sono pentiti di essere da noi. Queste lavorazioni sono compiute solo nella parte finale. Facciamo le analisi, incrocio i dati, uso tabelle, grafici, posso anche pensare di fare studi più sofisticati: regressioni, modelli econometrici, modelli sociali, fare modelli multivariati. Se stiamo facendo una indagine di marketing, vogliamo cercare di dividere i consumatori in gruppi uso tecniche di analisi dei gruppi (Klaster analysis). Alla fine, i dati raccolti con un bel costo, una indagine campionaria è costosa, dobbiamo predisporre un documento riassuntivo che permetta di condividere con terzi le informazioni che sono state ottenute. Al di là della statistica ufficiale, prodotta da Istat o BDI, queste considerazioni che stiamo dicendo sono compatibili con indagini private, indagini di aziende che vogliono conoscere meglio i loro clienti. Se l’amministratore delegato ha deciso di fare una indagine, ha bisogno di prospetti che o documenti che permettano di acquisire l’informazione in poche pagine. Torniamo alla Statistica, statistica come forma di sintesi, statistica come sistema per prendere le 3500 righe e colonne e ridurle in cinque – dieci pagine. Focalizziamoci sulla fase 1, PROGETTAZIONE, in particolare il secondo punto. Si precisano gli obiettivi definizioni e classificazioni. Cosa si intende per obiettivi? Cosa vogliamo ottenere, qual è la finalità conoscitiva dell’indagine. Voglio sapere se il formaggino piace e venderà? Voglio sapere se se ha senso proporre un prodotto alternativo alla Nutella. La Plasmon aveva fatto la sua nutella, che molti chiamavano la nutella della Plasmon, fallimento commerciale. Ci sono comunque altre creme. La questione è capire la finalità del nostro studio. Dobbiamo dare delle definizioni, metterci d’accordo sul gergo. Se parlo di capo famiglia che cosa intendiamo? Se faccio una indagine sul consumo o scelte di acquisto, chi deve rispondere? Questa fase si deve già definire nella fase di progettazione. Nella indagine di marketing, la persona che risponde al questionario è delegata agli acquisti. Molto speso la madre, piuttosto che i figli o piuttosto che il padre. Non è detto che si debba cercare la madre per forza di cose, può essere delegato qualcun altro agli acquisti. Classificazioni, d’accordo sulla metodologia. Si scelgono le tecniche di indagine. Come si può intervistare una persona o una unità statistica di nostro interesse? Poi definisco il questionario, lo vedremo in un’altra lezione.