La statistica è sorta in tempi antichissimi, fin dai primi insediamenti umani aventi una semplice organizzazione sociale. Si trovano documenti di rilevazioni di persone e di terreni nei nuraghi sardi e nei monumenti egiziani più antichi. Esistono notizie relative a rilevazioni statistiche fatte eseguire dall'imperatore cinese Yu, più di 4000 anni fa, allo scopo di ottenere notizie precise sulla situazione dell'agricoltura in ogni provincia, e quindi di poter ripartire equamente le imposte. Presso i Romani, Servio Tullio istituì la prima forma di censimento, chiamato allora <<Census>>, che era effettuato ogni cinque anni e serviva a conoscere il numero dei cittadini, l'ammontare dei loro beni, l'andamento delle nascite e delle morti. Possiamo però affermare che solo nel secolo XVII, in seguito alle grandi scoperte matematiche, nacque la statistica come disciplina a sé stante e, inizialmente, finalizzata all'espressione di fenomeni riguardanti gli Stati. Nel XVIII e nel XIX secolo, grazie all'introduzione di metodi matematici e al <<Calcolo delle Probabilità>>, la statistica ebbe notevoli impulsi e il suo campo delle applicazioni andò ampliandosi in quanto si capì come utilizzare un insieme d'informazioni allo scopo di ricercare le cause del manifestarsi di molti fenomeni. Fra i numerosi studiosi che hanno contribuito allo sviluppo della statistica possiamo ricordare il belga Adolfo Quetelet (1796-1874) che ha sostenuto il principio secondo cui: <<le leggi che governano la Società sono fisse e immutabili, come quelle che governano i corpi celesti ed esistono fuori dal capriccio degli uomini>>. Numerose sono state, nel corso del tempo, le definizioni della statistica perché c'era chi si limitava a considerarla solo un metodo, chi invece una scienza. Attualmente si possono dare varie definizioni di statistica e fra esse ci pare interessante quella proposta da B. Giardina: <<La statistica, in senso moderno, è propriamente l'applicazione dei metodi scientifici alla programmazione della raccolta dei dati, alla loro classificazione, elaborazione, analisi e presentazione e all'inferenza di conclusioni attendibili da essi>>. Il campo dell'indagine statistica si è ampliato in modo eccezionale e i metodi statistici hanno trovato applicazione, oltre che in demografia, in moltissime discipline: economia, sociologia, fisica, biologia, genetica, psicologia. Nelle industrie dei paesi a tecnologia avanzata (Stati Uniti d'America e Giappone) si fa giornalmente uso di modelli statistici per rilevare, attraverso PC e durante i processi di trasformazione della materia, eventuali variazioni intervenute nel processo. Inoltre, il controllo statistico della qualità si avvale delle moderne tecniche di campionamento e dei risultati delle elaborazioni effettuate dal PC. È consuetudine suddividere la statistica in:
statistica descrittiva, che ha lo scopo di raccogliere e di elaborare i dati per descrivere fenomeni collettivi e di massa;
statistica induttiva (o inferenza statistica), che si occupa dei metodi che permettono di stimare le caratteristiche di un fenomeno collettivo partendo dall'analisi delle caratteristiche di un campione.
L'indagine statistica si basa sull osservazione dei fenomeni che possono manifestarsi in svariati modi. Prima d'iniziare l'esame del metodo statistico vediamo alcuni concetti generali.
Fenomeni tipici, atipici e collettivi
In generale, per fenomeno intendiamo tutto ciò che capita intorno a noi o che noi stessi provochiamo. Possiamo distinguere fra fenomeni naturali (come il clima, il tramonto del sole, le onde del mare) e fenomeni riprodotti in laboratorio. Infiniti sono i fenomeni a cui possiamo assistere, tuttavia possiamo affermare che esistono alcuni fenomeni che presentano uniformità nel loro comportamento e tali che poche osservazioni ci permettono d'individuarne tutte le caratteristiche. Ognuno di noi ha osservato che qualsiasi corpo, indipendentemente dalle sue dimensioni e dalla sua forma, abbandonato ad una certa altezza, cade verticalmente verso il basso a causa della forza di gravità terrestre. Tutti i fenomeni che si presentano costantemente con le stesse caratteristiche sono chiamati fenomeni tipici.
D'altra parte esistono dei fenomeni che si manifestano ogni volta con caratteristiche diverse e per i quali è difficile fare delle previsioni sul loro comportamento. Pensiamo, ad esempio, ai fenomeni meteorologici, che non sempre permettono di fare in anticipo delle previsioni sicure sulle condizioni del tempo nei giorni successivi, e che quindi possono essere definiti fenomeni atipici.
Se consideriamo, invece, i fenomeni sociali quali ad esempio le nascite, i matrimoni, le migrazioni, possiamo affermare che non è possibile stabilire delle leggi generali, se limitiamo il nostro studio ad un singolo caso, come invece avviene per i fenomeni tipici. Possiamo però affermare che se si effettuano delle osservazioni molto numerose su tali fenomeni, essi rivelano determinate caratteristiche uniformi, per cui si può concludere che, pur essendo singolarmente atipici, presentano, considerati collettivamente, una tipicità di comportamento che ci permette di studiare le leggi che li governano. I fenomeni di questo tipo sono chiamati fenomeni collettivi.
Natura del metodo statistico
I metodi di ricerca delle leggi scientifiche sono essenzialmente due:
metodo induttivo
metodo deduttivo.
Se si parte dall'osservazione di fatti singoli e, con successive generalizzazioni, si risale ai principi o alle leggi di carattere generale relativi ai fatti studiati, si adopera il metodo induttivo, si procede cioè per induzione. Se invece si stabiliscono a priori postulati (o assiomi) generali, che si pongono come premesse al processo logico, e in seguito, attraverso il ragionamento, se ne ricavano le possibili conseguenze, si adopera il metodo deduttivo, si procede cioè per deduzione. Nel primo caso si procede dal particolare al generale, nel secondo, invece, dal generale al particolare. Il metodo statistico costituisce il metodo induttivo per eccellenza perché è fondato sull'analisi di fenomeni collettivi allo scopo di ricavare, pur nella varietà delle singole manifestazioni, le leggi soggiacenti ai fenomeni stessi, o almeno di evidenziare eventuali regolarità, in modo da poter trarre previsioni relative al comportamento futuro. Tra i due metodi, induttivo e deduttivo, esistono in ogni modo delle relazioni strettissime e ciò perché attraverso l'osservazione dei fatti si possono perfezionare le teorie che permettono, d'altra parte, di osservare meglio i fatti stessi. Al recente sviluppo della scienza ha contribuito anche il perfezionamento della metodologia statistica e quindi la possibilità di mettere a disposizione degli studiosi un insieme di dati sempre più ricco. L'operazione più difficile e importante per l'interpretazione dei fenomeni studiati è proprio la ricerca delle cause che li hanno generati; operazione difficile e delicata perché l'esame del fenomeno deve condursi con estrema obiettività. Il Quetelet ha formulato alcuni canoni di logica statistica, allo scopo di poter interpretare correttamente i risultati di una ricerca, canoni che si dimostrano tuttora validi:
Non si devono avere idee preconcette sul risultato che si otterrà dalla ricerca.
Non si deve eliminare arbitrariamente alcun dato.
Non si devono comparare elementi che non siano tra loro comparabili.
Gran parte degli errori che si commettono nell'interpretazione dei fenomeni sono dovuti al mancato rispetto di questo terzo canone, anche se nella pratica è spesso difficile stabilire quali sono i dati fra loro omogenei e quindi, comparabili. Inoltre occorrerebbe fidarsi solo di osservazioni abbastanza numerose in quanto col crescere del numero delle osservazioni tende a diminuire la possibilità di commettere degli errori.
Dati statistici
Nella definizione data di statistica sono elencate genericamente le operazioni da effettuare sui cosiddetti dati statistici; per poterli definire meglio, occorre prima precisare che l'unità statistica è il più piccolo elemento sul quale si effettua un'osservazione. È, ad esempio, unità statistica ogni macchina prodotta da un fabbrica, ogni abitante di una data provincia, ogni alunno di una scuola. L'unità statistica può essere:
semplice, se corrisponde ad una singola persona o ad un oggetto (ad esempio, età della popolazione italiana, cilindrata delle automobili);
composta, se è formata da un insieme di elementi (ad esempio, nuclei familiari, lotti di produzione).
Si definisce dato statistico il risultato di un'operazione compiuta sulle unità statistiche (ad esempio, numero delle persone di sesso maschile nella popolazione italiana, prezzo medio di un certo bene). È, in definitiva, un'informazione sul fenomeno che si vuole studiare e rappresenta o il numero delle unità statistiche che hanno in comune una caratteristica fissata (ad esempio, il numero degli alunni di una scuola, il numero di matrimoni in una certa regione) oppure un numero ricavato da più unità statistiche e che serva a rappresentare un carattere del fenomeno studiato (ad esempio, il reddito globale degli abitanti di una provincia, il loro reddito pro capite, il volume delle importazioni di un dato bene). Per popolazione statistica s'intende: <<un insieme finito di dati statistici tra loro omogenei per quanto riguarda una o più caratteristiche>>. Rappresenta una popolazione statistica, ad esempio, l'insieme degli alunni di una scuola, o l'insieme delle stature degli alunni di una certa classe. Un universo è: <<una popolazione statistica composta da un numero infinito di elementi>>, mentre un campione è: <<un complesso di osservazioni effettive sugli elementi di una popolazione o universo>>. Ad esempio, è un universo l'insieme formato dai risultati di un numero illimitato di lanci di un dado, o l'insieme degli esperimenti. È da notare però che la distinzione fra popolazione statistica e universo statistico non è così netta, in quanto un insieme molto grande, anche se non infinito, può essere chiamato universo statistico. Costituisce un campione, ad esempio, l'insieme formato da un certo numero di studenti estratti dalla popolazione scolastica di una città, oppure l'insieme di un certo numero di unità di un bene economico, scelte dalla produzione in base a determinati criteri.
Frequenza ed intensità
I dati statistici possono rappresentare due specie di grandezze diverse: se esprimono il numero delle volte in cui il fenomeno si è verificato in relazione ad un determinato periodo di tempo, assumono la natura di frequenza; se invece rappresentano una media, o una somma di misure effettuate sulle unità statistiche, esprimono un'intensità. Rappresentano delle frequenze, ad esempio, il numero degli appartamenti di tre vani di un determinato quartiere, o il numero dei promossi a giugno di una certa scuola; rappresentano, invece, delle intensità: la statura media di un gruppo di giovani della stessa età, la quantità di frutta venduta in un certo periodo di tempo, le tasse pagate da una determinata categoria di lavoratori. In genere un'intensità è espressa mediante una misura di peso, di lunghezza, di superficie, di volume, di valore.
Carattere, modalità quantitative e qualitative
Le unità statistiche sono studiate secondo uno o più caratteri comuni che rappresentano gli aspetti che si vogliono mettere in evidenza e successivamente sono divisi rispetto alle varie modalità con cui tale carattere si manifesta. Esaminando ad esempio la distribuzione degli studenti di una data provincia secondo la specie delle scuole, in un determinato anno, diremo che il carattere è rappresentato dal <<tipo di scuola>>, mentre le varie modalità sono rappresentate da: <<scuole materne>>, <<scuole elementari>>, <<scuole medie>> e <<scuole superiori>>. Se di un gruppo di studenti prendiamo in esame il carattere <<altezza>>, le varie modalità sono rappresentate dalle diverse misure dell'altezza, in genere divise in scaglioni. Le modalità secondo cui sono classificate le unità statistiche possono essere qualitative o quantitative. Le modalità quantitative sono espresse da numeri risultanti da misurazioni o da enumerazioni, come, ad esempio, la rilevazione dei redditi di una popolazione, dalle altezze dei militari di leva, del numero dei vani degli alloggi di un comune e così via. Le modalità quantitative possono essere continue o discrete:
continue, se sono espresse da numeri reali e possono assumere tutti i valori di un intervallo (ad esempio, altezze, pesi);
discrete, in caso contrario (ad esempio, numero dei vani delle abitazioni, numero degli addetti in un settore industriale).
Le modalità qualitative sono espresse da attributi, espressioni verbali, come, ad esempio, la rilevazione della popolazione italiana secondo lo stato civile, la rilevazione delle automobili prodotte nei vari mesi di un anno, la rilevazione della produzione di cereali nelle diverse regioni italiane. Da un punto di vista matematico, si può dire che un carattere determina una partizione dell'insieme universo, poiché suddivide l'insieme universo in un certo numero di sottoinsiemi, ciascuno costituito dalle unità statistiche aventi la stessa modalità, e quindi i sottoinsiemi, non vuoti, sono disgiunti a due a due e la loro unione è l'insieme universo stesso.
Il lavoro necessario per effettuare un'indagine statistica si articola nelle fasi che seguono.
Pianificazione della rilevazione
Consiste essenzialmente nella stesura di un piano che definisce chiaramente gli obiettivi da raggiungere attraverso l'indagine, l'oggetto della rilevazione e il modo di raccolta dei dati. Questa fase è la più delicata perché, se non è preparata in modo accurato, può pregiudicare la riuscita dell'intera indagine.
Raccolta dei dati
Consiste nella raccolta effettiva dei dati individuali che costituiscono il fenomeno collettivo da esaminare e può avvenire attraverso dei moduli o delle schede preparati appositamente, dei questionari, o mediante registri (come nelle rilevazioni anagrafiche).
Spoglio dei dati raccolti
Consiste nell'enumerazione e classificazione dei dati raccolti, secondo il piano prestabilito e gli obiettivi da raggiungere. I dati sono raggruppati secondo le modalità di un carattere qualitativo, o secondo le intensità di un carattere quantitativo. Lo spoglio può essere fatto manualmente da personale opportunamente addestrato o con l'aiuto di PC.
Rappresentazione dei dati
Consiste nell'esposizione dei risultati ottenuti nella fase precedente in apposite tabelle o grafici, in modo da permettere una visione d'insieme dei dati raccolti.
Elaborazione dei dati
Consiste nell'applicazione di particolari procedimenti matematici che hanno la funzione di trasformare i dati raccolti, considerati <<grezzi>>, in dati <<elaborati>> che mettono in evidenza le caratteristiche del fenomeno collettivo da studiare. Prima di procedere all'elaborazione vera e propria, i dati vanno corretti per eliminare gli errori eventualmente commessi nella fase di rilevazione.
Interpretazione dei risultati
Consiste nel dare una spiegazione dei risultati dell'indagine e cioè nell'esaminare se l'obiettivo prefissato è stato raggiunto, se esistono relazioni con altri fenomeni, se è possibile fare una previsione sulla tendenza del fenomeno nel tempo. È bene precisare che molto spesso si tende a riassumere le prime tre fasi con l'espressione generica: <<rilevazione e spoglio di dati statistici>> e che non esistono, nella pratica, dei confini ben precisi fra le varie fasi, che si possono anche presentare in un ordine diverso da quello indicato.
Rilevazione e spoglio dei dati statistici
Nozioni generali
Definiamo, nei vari particolari, tutte le decisioni sui problemi che sorgono nel momento in cui s'inizia il complesso processo d'indagine per l'esame dei fenomeni collettivi. Come già osservato, l'operazione preliminare più importante consiste nello stabilire con molta precisione gli obiettivi che s'intendono raggiungere attraverso l'intera indagine statistica. Si possono fissare degli obiettivi generali, come ad esempio la conoscenza della composizione degli studenti di una certa scuola in base al sesso, al numero dei fratelli, al comune di residenza, o degli obiettivi più specifici, quali lo studio della relazione fra professione del padre e scelta del tipo di scuola da frequentare, e così via. La successiva preparazione dei mezzi o strumenti da usare deve essere tale da permettere il raggiungimento degli obiettivi fissati e quindi è fatta in funzione dei risultati che si vogliono ottenere.
Oggetto e limiti dell'indagine
Per oggetto della rilevazione s'intende il fenomeno preso in esame, determinato in via preliminare, definito con la massima cura e tale da permettere il raggiungimento degli obiettivi fissati. Se ad esempio si vuole svolgere una ricerca di mercato sul gradimento di una certa bevanda, l'oggetto sarà rappresentato dalle famiglie dei consumatori. Occorre però ben definire il significato che si vuol dare a questa parola e cioè stabilire se l'indagine dovrà comprendere anche ristoranti, bar, chioschi, e se i vari elementi dovranno essere considerati come famiglie singole o come facenti parte di un'unica famiglia. Per quanto riguarda i limiti di tempo, questi possono far riferimento ad un istante preciso (come avviene nei censimenti per i quali è necessario che tutte le informazioni forniscano la situazione esistente ad una certa ora di un dato giorno), o a un dato periodo di tempo (anno, stagione, mese, settimana o altro). La scelta deve essere fatta tenendo conto di numerosi fattori: in estate sono notevoli gli spostamenti delle famiglie per le ferie e quindi, per certe rilevazioni di carattere generale, si preferisce fissare l'epoca per la raccolta dei dati in un periodo compreso fra la fine del mese di aprile e i primi di giugno. Riguardo ai limiti di spazio, la rilevazione può essere fatta su un territorio più o meno vasto. Ci sono indagini condotte su numerose nazioni contemporaneamente, altre eseguite a livello regionale, provinciale o comunale. La scelta dipende, come affermato più volte, dagli obiettivi che si vogliono raggiungere. Limiti di spazio sono anche quelli riferiti a particolari categorie dell'oggetto dell'indagine; per esempio, volendo esaminare le variazioni relative al numero degli iscritti nelle scuole italiane nei vari anni, ci si può limitare agli istituti tecnici, oppure alle scuole pubbliche. Tali statistiche saranno valide limitatamente al territorio per cui sono state fatte; un'indagine nelle scuole pubbliche del Lazio non sarà valida per le altre regioni italiane a causa dei numerosi fattori, diversi in ogni regione, che possono influire sull'andamento delle iscrizioni.
Modalità della rilevazione
La raccolta dei dati si può distinguere, riguardo al modo, in:
automatica se sono gli stessi interessati che forniscono spontaneamente, spesso in virtù di precise disposizioni di legge, le informazioni sui fenomeni che li riguardano. È quanto accade giornalmente negli uffici anagrafici dove sono denunciate le nascite, le morti, i trasferimenti;
riflessa se è fatta direttamente da organi preposti a tale scopo, come avviene per esempio nei censimenti e nelle ricerche di mercato.
Rispetto alla durata le rilevazioni si distinguono in:
continue, se sono fatte senza interruzione (ad esempio, rilevazione anagrafiche dei nati, dei morti, dei matrimoni);
periodiche, se sono fatte ad intervalli regolari di tempo (come i censimenti con periodicità decennale, le rilevazioni delle forze di lavoro con periodicità trimestrale);
occasionali, se sono fatte una volta tanto per indagini su fenomeni particolari (ad esempio, le rilevazioni dei danni di un terremoto, le indagini di mercato per il lancio di un prodotto).
Organi per la rilevazione statistica
Gli organi che eseguono le rilevazioni possono essere:
privati se la raccolta dei dati è eseguita da un privato o da un ente privato (il più famoso è lIstituto italiano Doxa, organismo esperto e specializzato in sondaggi);
pubblici quando il fenomeno collettivo oggetto dellindagine è di grande interesse pubblico (ad esempio i fenomeni demografici, economici) e richiede una gran quantità di mezzi a disposizione e una notevole organizzazione.
In Italia, come in tutti i paesi sviluppati esiste un organismo dedito agli studi di statistica: lIstituto Centrale di Statistica (ISTAT) che ha sede in Roma e dipende direttamente dal Consiglio dei Ministri. LISTAT ha il compito di redigere le statistiche sui numerosi aspetti dellamministrazione dello Stato e di eseguire i censimenti. Inoltre cura alcune pubblicazioni periodiche tra cui :
il Bollettino Mensile di Statistica che consiste in una raccolta completa di dati riguardanti levoluzione dei fenomeni demografici, sociali, economici e finanziari;
lAnnuario Statistico Italiano che presenta in modo sintetico i risultati delle rilevazioni e le elaborazioni statistiche di maggiore interesse;
il Compendio Statistico Italiano, diviso in vari capitoli (territorio, popolazione, sanità, istruzione), ciascuno dei quali contiene delle spiegazioni per la comprensione dei dati rappresentati su tabelle di facile lettura. Inoltre mette a confronto la situazione italiana con quella dei principali paesi del mondo.
In quanto al mezzo di raccolta, distinguiamo fra:
registri nei quali la raccolta dei dati avviene secondo un ordine alfabetico o cronologico (sono usati nelle rilevazioni automatiche);
questionari: moduli prestampati che pongono una serie di domande a cui linteressato dovrà rispondere, in genere, segnando una crocetta in corrispondenza del tipo di risposta scelta (sono usati nelle rilevazioni riflesse);
schede: moduli particolari che contengono tutte le informazioni necessarie relative ad un'unità statistica. Ad esempio nelle biblioteche scolastiche si usano schede che contengono: il nome dellautore, il titolo del libro, la materia trattata, la casa editrice, lanno di pubblicazione, il prezzo, il numero delle pagine.
I registri e le schede sono generalmente compilati dai cosiddetti rilevatori.
Rilevazioni totali e rilevazioni per campioni
Una rilevazione si dice:
totale se è estesa a tutti gli elementi di una popolazione statistica;
per campione se è fatta solo su alcuni elementi della popolazione, scelti con criteri opportuni.
La più importante rilevazione totale è costituita dal Censimento attraverso cui si può conoscere la consistenza numerica della popolazione, la sua distribuzione per sesso, età, stato civile, titolo di studio, professione e così via. Il censimento è una rilevazione simultanea perché è eseguito su tutto il territorio in riferimento allo stesso istante; esso è anche una rilevazione periodica perché è fatto ad intervalli di tempo che in genere sono di dieci o quindici anni. In Italia il primo censimento generale della popolazione fu eseguito il 31 dicembre 1861, cioè nell'anno della proclamazione del regno. Altri censimenti furono fatti a intervalli di tempo più o meno regolari, e dal 1951 la periodicità è decennale; l'ultimo censimento in ordine di tempo è stato eseguito nel 1991. Per quanto riguarda la scelta del mese, in genere si preferiscono i mesi invernali, perché in questo periodo gli spostamenti della popolazione, sia per villeggiatura sia per lavori agricoli a carattere stagionale, sono meno intensi. Nei mesi invernali, però, non sempre la raccolta dei dati risulta agevole a causa delle avverse condizioni climatiche (si pensi ad alcuni paesi di montagna che spesso rimangono isolati per la neve). Gli ultimi censimenti sono stati fatti nei mesi di ottobre. La direzione di censimento è affidata all'ISTAT che emana delle istruzioni per preparare il piano topografico del comune il cui territorio sarà diviso in frazioni geografiche e ogni frazione geografica in sezioni di censimento. Ogni sezione è assegnata ad un ufficiale di censimento cui sono consegnati i fogli, i quali contengono le indicazioni fatte dall'ufficio di censimento relative alla località abitata di cui l'abitazione fa parte. Nel foglio di famiglia, che deve essere compilato dalla famiglia censita, sono contenuti quesiti riguardanti:
l'indicazione nominativa delle persone facenti parte della famiglia;
la relazione di parentela col capofamiglia;
l'indicazione del sesso;
l'indicazione dello stato civile;
la data di nascita;
l'indicazione del comune di nascita;
il grado d'istruzione.
Seguono poi i quesiti riguardanti:
le assenze temporanee dalla famiglia che sono di vario genere; lo scopo del quesito è quello di determinare il luogo dove l'assente si trova alla data del censimento, il motivo dell'assenza e da quanto tempo la persona risulta assente.
Altri quesiti riguardano:
la professione;
la posizione nella professione;
la specie dell'attività economica dell'azienda in cui la professione è esercitata.
Alcune volte al censimento sono abbinate delle rilevazioni speciali come ad esempio il censimento delle abitazioni (numero di stanze, eventuale tipo di riscaldamento). La tavola seguente riporta il 12° censimento generale della popolazione, 25 ottobre 1981, popolazione residente per sesso e popolazione presente ai censimenti dal 1861 al 1981 (dati in migliaia).

Indubbiamente una rilevazione totale ha il pregio di fornire risultati completi e precisi sul fenomeno indagato; tuttavia se la popolazione è molto numerosa, comporta costi elevati e tempi di realizzazione molto lunghi. Nella realtà si ricorre molto spesso a indagini parziali, dette rivelazioni campionarie, quando:
occorre contenere i costi (il costo di un'indagine campionaria è minore di quello di un'indagine totale);
occorre ottenere più tempestivamente i risultati (le indagini campionarie limitate a poche migliaia di unità si completano, con lausilio di PC, nel giro di alcune settimane);
non è possibile procedere diversamente (ad esempio gli studi sulla durata dei prodotti industriali comportano inevitabilmente la distruzione delle unità esaminate).
La scelta del campione deve essere fatta in modo che esso sia:
rappresentativo: deve cioè possedere le stesse caratteristiche della popolazione da esaminare. Ad esempio, se un lotto di 2000 pezzi fosse formato da 300 pezzi difettosi e da 1700 pezzi non difettosi, un campione ideale di 100 pezzi dovrebbe contenere 15 pezzi difettosi e 85 pezzi non difettosi, ma difficilmente un campione estratto da quel lotto ha questa composizione;
sufficientemente ampio: più il campione è numeroso, più i risultati che fornisce sono significativi.
Spoglio dei dati: tabelle di spoglio
Una volta effettuata la rilevazione delle unità statistiche si può procedere alla formazione dei dati statistici, attraverso loperazione di spoglio delle unità stesse. Lo spoglio comprende:
lenumerazione con la quale le schede, i moduli, i questionari sono contati e, nello stesso tempo, controllati, al fine di fornire i primi dati sullestensione della rilevazione. Questa fase acquista molta importanza nelle indagini effettuate su questionari compilati volontariamente dagli interessati, perché permette di conoscere immediatamente lentità delle "evasioni" che, in numero elevato, possono anche influenzare l'attendibilità dei risultati;
la classificazione che consiste nel raggruppare i dati ottenuti in categorie, classi, a seconda delle intensità o delle qualità dei caratteri rilevati. Ad esempio, in un'indagine relativa ad un certo istituto tecnico potranno in un primo momento formarsi classi diverse comprendenti gli alunni del triennio e quelli del biennio; si potranno ancora distinguere altre due categorie: maschi e femmine; ancora: alunni residenti nel comune e alunni viaggiatori e così via;
lo spoglio materiale che si effettua riportando i dati, già enumerati e classificati, in prospetti chiamati tabelle di spoglio.
Lintera operazione di spoglio può essere effettuata in due modi:
manualmente (spoglio manuale);
attraverso il PC (spoglio automatico);
Nello spoglio manuale si riportano i dati nelle tabelle di spoglio, preparate in base al fenomeno osservato. Le tabelle sono costituite da tre colonne; la prima contiene, nelle diverse righe, le varie modalità del carattere considerato; la seconda, un po più larga contiene le "tacche" che si riferiscono a ciascun'unità esaminata; la terza contiene la frequenze delle varie modalità, che si ottengono contando le tacche per ogni riga. Questo tipo di spoglio è chiamato singolo (limitato a un solo carattere: anno di nascita) per distinguerlo dallo spoglio incrociato (effettuato per coppie di caratteri). Lo scopo di uno spoglio incrociato è quello di mettere in evidenza l'esistenza di relazioni fra i due caratteri. Se di un gruppo di persone si rilevano i caratteri: sesso , anno di nascita, statura, peso, professione del padre e altri, gli incroci possibili sono molti, ma fra questi saranno scelti quelli utili per raggiungere gli obiettivi fissati nel piano della rilevazione. Il metodo dello spoglio manuale è applicato nel caso di piccole indagini, mentre quando i caratteri sono molti e il numero di unità è grande, si ricorre allo spoglio automatico mediante un PC. In questo caso occorre:
codificare i dati assegnando un numero a ogni modalità di ciascun carattere qualitativo (per esempio ai maschi si assegna il numero uno, alle femmine il numero due);
procedere alla registrazione dei dati codificati su dischi magnetici (data entry);
predisporre il PC caricando un programma di spoglio;
inserire i dati già registrati;
fornire le informazioni sugli spogli singoli e incrociati che bisogna effettuare;
Una volta completata lintera procedura, lo spoglio automatico sarà eseguito in modo velocissimo e con la massima precisione.
Sistemazione dei dati: serie e seriazioni
a) Tabelle a semplice entrata
Una tabella a semplice entrata è costituita da due colonne, la prima riporta le varie modalità del carattere qualitativo, o le varie intensità del carattere quantitativo in esame, la seconda riporta le frequenze o i valori rilevati. Se il carattere è qualitativo la successione dei dati rilevati è detta serie statistica, se invece il carattere è quantitativo la successione dei dati è detta seriazione statistica. Diamo alcuni esempi di serie e seriazioni statistiche.
Distribuzione degli studenti italiani secondo la specie delle scuole, anno scolastico '84-'85.
| Specie delle scuole | N. alunni iscritti |
| Scuole materne | 1.639.377 |
| Scuole elementari | 3.909.365 |
| Scuole medie | 2.797.766 |
| Scuole sec. Super. | 2.546.772 |
| Totale | 10.893.280 |
Si tratta di una serie statistica. A ogni modalità del carattere qualitativo è associata una frequenza assoluta, dove per frequenza assoluta s'intende il numero delle unità statistiche che godono di una certa proprietà. Nel nostro esempio le frequenze assolute sono i numeri che indicano quanti allievi appartengono a ogni specie di scuola.
Rilevazione delle auto prodotte in alcuni Stati C.E.E. nel 1981.
| Stati | N. autovetture |
| Belgio | 216.068 |
| Francia | 2.611.864 |
| Germania | 3.577.807 |
| Italia | 1.257.340 |
| Paesi Bassi | 77.922 |
| Regno Unito | 954.650 |
| Totale | 8.695.651 |
Si tratta di una serie territoriale o geografica.
Depositi a risparmio delle aziende di credito (dati assoluti in miliardi di lire).
| Anni | Depositi a risparmio |
| 1979 1980 1981 1982 1983 |
101.630 112.939 124.817 148.403 169.554 |
È una serie storica o temporale in quanto i dati rilevati sono riferiti a intervalli di tempo (anni, mesi). Le serie storiche sono serie di notevole importanza per lo studio di un fenomeno nel suo evolversi nel tempo.
Rilevazione delle abitazioni occupate in Italia secondo il numero di stanze nel 1981.
| N. stanze | N. abitazioni |
| 1 2 3 4 5 6 e più |
300.364 1.790.887 3.761.695 5.616.939 3.520.498 2.550.369 |
| Totale | 17.541.752 |
È una seriazione rispetto a un carattere quantitativo discreto.
Distribuzione dei Comuni dellItalia per classi di superficie al 31/12/1981.
| Classi di superficie (in migliaia di ha) | N. Comuni |
| Fino a 1 1 ----------| 2 2 ----------| 4 4 ----------| 6 6 ----------| 10 10 --------| 25 oltre 25 |
1.737 2.058 2.085 885 735 518 68 |
| Totale | 8.086 |
È una seriazione rispetto a un carattere quantitativo continuo. Se il carattere quantitativo è continuo non si considerano tutte le possibili determinazioni del suo insieme universo, ma i valori si raggruppano in classi; cioè in intervalli contigui che possono essere di ampiezza eguale o diversa. Nella tabella precedente ad ogni intervallo appartiene lestremo destro e non il sinistro. Si potrebbe, però, effettuare laltra scelta, ossia chiudere lestremo sinistro e lasciare aperto il destro. La prima e lultima classe possono non contenere un estremo, poiché i valori possono essere molto diradati e in questo caso sono dette classi aperte; è consigliabile evitare di eseguire elaborazioni con classi aperte, occorre chiuderle mediante valori scelti in modo opportuno. Quando si fa una rilevazione è molto importante stabilire lampiezza (o modulo), se possibile costante, delle classi, perché se le classi sono troppo ampie la classificazione e le successive elaborazioni potrebbero essere distorte, mentre se le classi sono troppo ristrette la distribuzione sarebbe dispersa e poco regolare. Talvolta si raggruppano in classi anche i caratteri quantitativi discreti, soprattutto se le modalità del carattere sono molto numerose. In generale il numero delle classi varia fra un minimo di cinque e un massimo di venti. Per scegliere lampiezza di ogni modulo si considera il campo di variazione del fenomeno osservato, cioè la differenza fra il più grande e il più piccolo dei dati. Per la determinazione della prima classe, si cerca di non fare coincidere lestremo sinistro con un'osservazione effettiva. Definiamo ora:
Limite inferiore della classe lestremo sinistro dellintervallo.
Limite superiore della classe lestremo destro dellintervallo.
Intervallo di classe linsieme dei valori contenuti fra i due limiti.
Ampiezza della classe (o modulo) la differenza fra limite superiore e limite inferiore.
Valore centrale della classe la semi somma dei due limiti.
Rivestono particolare importanza le distribuzioni statistiche nelle quali i dati sono frequenze assolute; tali distribuzioni sono dette distribuzioni di frequenza. Tutte le tabelle viste finora riguardano un solo carattere e sono dette tabelle a semplice entrata, ma si eseguono anche rilevazioni statistiche su due o più caratteri.
b) Tabelle a doppia entrata
Si possono eseguire delle rilevazioni su un insieme universo classificando le unità statistiche contemporaneamente rispetto a due o più caratteri. Il caso più importante è la classificazione rispetto a due caratteri, ad esempio, peso e altezza dei militari di leva, spese per lalimentazione e spese per i beni voluttuari; tali rilevazioni si rappresentano con tabelle a doppia entrata. Le tabelle a doppia entrata rappresentanti distribuzioni di frequenza possono essere:
di contingenza, se i due caratteri sono entrambi qualitativi (si parla di mutabile statistica doppia);
di correlazione, se i due caratteri sono entrambi quantitativi (si parla di variabile statistica doppia);
miste, se uno dei due caratteri è qualitativo e laltro quantitativo.
Un esempio di tabella di contingenza è la seguente distribuzione della popolazione del Piemonte secondo il sesso e le province di residenza

Un esempio di tabella di correlazione è la seguente distribuzione di 100 abitazioni secondo il numero dei vani e i componenti della famiglia

Un esempio di tabella mista è la seguente distribuzione dei suicidi per sesso ed età nellanno 1980

Nelle tavole ISTAT che riportano distribuzioni di frequenze per classi, generalmente i limiti inferiori di ciascuna classe sintendono esclusi (tranne quello della prima classe), mentre i limiti superiori s'intendono inclusi nella classe. Questa regola vale, ad esempio, nella tabella seguente che riporta la distribuzione dei detenuti condannati secondo la pena inflitta (situazione a fine anno 1987).
| Anni | Frequenze |
| 1 ----| 2 2 ----| 5 5 ----| 10 10 --| 15 15 --| 30 Ergastolo |
1.718 2.975 1.340 926 1.459 220 |
Nel caso di distribuzione per età, si usa una regola diversa, in quanto ogni età è considerata in anni compiuti. Ad esempio le classi: fino a 13 anni, da 14 a 17, oltre 65 anni includono, rispettivamente, gli individui dalla nascita al giorno precedente il 14° compleanno, dal giorno del 14° compleanno al giorno precedente il 18°, dal 65° compleanno in poi.
c) Tabelle composte
Sono tabelle formate da più colonne che si riferiscono a varie caratteristiche di uno stesso fenomeno, anche senza legame fra esse. Alcune di queste sono utilizzate per confrontare due serie storiche e hanno particolare importanza.
Reddito medio mensile e spesa familiare secondo alcune modalità (dati in migliaia di lire).

Queste tabelle permettono , come indicato nellultima colonna, di confrontare modalità diverse riferentesi però alla stessa popolazione statistica.
Variabili e mutabili statistiche
Prendiamo in considerazione le distribuzioni di frequenza, cioè le distribuzioni in cui a ogni modalità del carattere, sia esso qualitativo o quantitativo, è associata una frequenza e introduciamo le nozioni di mutabile statistica e di variabile statistica. Precisamente: una variabile statistica è definita dallinsieme dei valori osservati di un carattere quantitativo e dalle frequenze a essi associate; una mutabile statistica è definita dallinsieme delle modalità osservate di un carattere qualitativo e dalle frequenze a esse associate. Finora si è parlato di frequenze assolute, ma si possono associare ai valori della variabile, invece delle frequenze assolute, le frequenze relative che si ottengono dividendo ogni frequenza per la loro somma. Nel caso della variabile statistica, se il carattere è discreto e i valori sono indicati con x1,x2, ,xn, si hanno le seguenti distribuzioni:
| Valori | Frequenze assolute |
| x1 x2 . xn |
y1 y2 . yn |
| Valori | Frequenze relative |
Se la variabile è continua e le determinazioni sono raggruppate in classi, si possono avere le distribuzioni con frequenze assolute o relative:
| Valori | Frequenze assolute |
| x0|---- x1 x1|---- x2 . xn-1|---- xn |
y1 y2 . yn |
|
|
| Valori | Frequenze relative |
![]() |
|
Si definiscono frequenze relative cumulate le frequenze che associano a ogni valore della variabile discreta (o a ogni classe della variabile continua) la somma della rispettiva frequenza relativa con le frequenze dei valori precedenti. Linsieme delle modalità del carattere con le corrispondenti frequenze relative cumulate, si definisce distribuzione di frequenze relative cumulate. Molto spesso le frequenze relative (o le frequenze relative cumulate) sono moltiplicate per cento ottenendo così la distribuzione di frequenze percentuali (o di frequenze cumulate percentuali). Le frequenze relative che si ottengono dividendo le frequenze assolute per la loro somma e che indicano quale parte dellinsieme è presente in ognuna delle varie intensità, sono anche dette rapporti di composizione. Possiamo riassumere, nel seguente schema, i tipi di frequenze:
1) Assolute
2) Relative
3) Percentuali
| 4) Cumulate | ![]() |
I dati raccolti in tabelle si possono rappresentare graficamente; le rappresentazioni grafiche offrono numerosi vantaggi perché descrivono il fenomeno in forma visiva e permettono di esaminare landamento in modo globale e di confrontare caratteri diversi dello stesso fenomeno e le sue variazioni nel tempo e nello spazio. La rappresentazione grafica è molto più espressiva di una tabella di valori, anche se necessita di approssimazioni. I grafici, essendo di facile lettura, permettono a tutti di capire landamento di un fenomeno; sono utilizzati non solo a scopo descrittivo, ma anche scientifico se si ricerca il modello matematico del fenomeno (ossia una funzione che esprima landamento del fenomeno). Si utilizzano diversi tipi di rappresentazioni grafiche.
a) Rappresentazione grafica mediante diagrammi cartesiani
I diagrammi cartesiani sono usati soprattutto per rappresentare serie storiche e seriazioni discrete. Le unità di misura sui due assi cartesiani sono generalmente diverse. La scelta delle unità di misura è molto importante per una corretta rappresentazione. Per le serie storiche si riportano sullasse delle ascisse gli anni (o i mesi) e sulle ordinate le intensità corrispondenti.
Importazioni ed esportazioni dallItalia negli anni dal 1972 al 1984.
| Anni | Importazioni (in miliardi di lire) |
Esportazioni (in miliardi di lire) |
| 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 |
11.265 16.343 26.715 25.200 36.731 42.429 47.868 64.597 85.564 103.674 116.216 121.978 148.178 |
10.849 12.989 19.826 22.866 31.167 39.968 47.505 59.926 66.719 86.040 99.231 110.530 129.015 |
Si può rappresentare graficamente così:

Nei diagrammi cartesiani si è soliti collegare con una spezzata i punti rappresentativi delle coppie di valori, soprattutto nel caso di grafici di serie storiche; tale spezzata mette in evidenza levoluzione del fenomeno nel tempo. Nel caso di rappresentazione di seriazioni si segnano con un tratto marcato le ordinate dei punti (diagramma a segmenti). Ad esempio, una seriazione si può rappresentare nel modo seguente:
Nel grafico, lultimo valore è stato posto in corrispondenza del sei anche se, in realtà, lultimo valore comprende le abitazioni di sei e più stanze. In questo caso collegare i punti estremi dei segmenti non avrebbe alcun significato in quanto il numero delle stanze delle abitazioni è un numero intero; talvolta, tuttavia, si traccia egualmente una spezzata, per rendere più facile la lettura. Se il campo di variazione del fenomeno considerato è molto grande, risulta difficile rappresentare i valori effettivi nel diagramma cartesiano; usando una scala logaritmica, su uno solo o su entrambi gli assi, si possono ridurre le proporzioni del grafico. Se si usa una scala logaritmica semplice, sullasse delle ordinate saranno rappresentati i logaritmi decimali delle quantità considerate; se si usa una scala logaritmica doppia, su entrambi gli assi saranno indicati i logaritmi decimali dei valori effettivi.
b) Istogrammi
Si usano gli istogrammi per rappresentare seriazioni continue con i dati raggruppati in classi. Fissato un sistema di assi cartesiani ortogonali, sullasse delle ascisse si riportano tanti intervalli consecutivi quante sono le classi; su questi intervalli si costruiscono dei rettangoli le cui aree sono proporzionali alle frequenze. Si noti che se le classi hanno la stessa ampiezza, o modulo, basterà riportare altezze proporzionali alle frequenze; in caso contrario le altezze si ottengono dividendo la relativa frequenza per lampiezza della classe, in modo che larea rappresenti la frequenza. Con gli istogrammi la somma delle aree di tutti i rettangoli è proporzionale alla somma delle frequenze.
Si consideri la seguente tabella: ripartizione delle autovetture italiane prodotte nellanno 1981 secondo la cilindrata.
| Cilindrata (in cm3) | N. autovetture |
| 500 --------| 1.000 1.000 ------| 1.500 1.500------| 2.000 oltre 2.000 |
433.963 491.798 281.239 50.340 |
| Totale | 1.257.340 |
Le classi hanno tutte la stessa ampiezza, eccetto lultima che è aperta. In caso di classi aperte (la prima o lultima), o si chiudono indicando un valore estremo logico, oppure si trascurano, quando il rapporto espresso in percentuale fra la frequenza di tale classe e il valore totale delle frequenze è relativamente piccolo. La precedente dà origine al seguente grafico.

Lultima classe, che è aperta, si può chiudere alla cilindrata di 3000 cm3 e allora laltezza del rettangolo risulta:
50.340:2 = 25.170
perché la base di tale rettangolo è doppia delle basi dei rettangoli precedenti.
Nellambito della rappresentazione grafica con diagrammi cartesiani vediamo ancora la rappresentazione di distribuzioni di frequenze relative cumulate. Nel caso di seriazioni con valori discreti, riportando i dati della tabella si ottiene il seguente grafico:

Se invece si ha una seriazione a valori continui suddivisi in classi, si collegano i valori delle frequenze cumulate mediante una spezzata, supponendo che nellintervallo di ciascuna classe vi sia una distribuzione uniforme delle frequenze. Si ottiene la cosiddetta poligonale delle frequenze cumulate.
c) Ortogrammi (o diagrammi a canne dorgano)
Per rappresentare serie storiche e serie territoriali (ma anche altre serie), si possono usare gli ortogrammi, costituiti da rettangoli di basi eguali e di altezze proporzionali alle intensità del fenomeno. Si possono anche accostare rettangoli riferiti a sessi, o ad anni, o a paesi diversi allo scopo di effettuare confronti. La rappresentazione mediante rettangoli è la più frequente; si utilizzano anche altre figure come quadrati e cerchi, ma più raramente perché, dovendo rappresentare le frequenze come aree, occorre calcolare la radice quadrata di ciascuna frequenza per avere i lati dei quadrati corrispondenti, o la radice quadrata della frequenza, divisa per p, per avere i raggi dei cerchi corrispondenti. Diamo un esempio di ortogramma a partire dalla seguente tabella popolazione per condizione, settore di attività economica degli occupati e sesso in Italia nel 1981.
| Maschi (in migliaia) |
Femmine (in migliaia) |
|
| Agricoltura Industria Altre attività In cerca di Occupazione |
1.786 5.901 6.520 808 |
973 1.826 3.745 1.104 |

Gli ortogrammi si utilizzano anche per rappresentare contemporaneamente dati di segno opposto come entrate e uscite, importazioni ed esportazioni. Un esempio di ortogramma per la rappresentazione contemporanea di dati positivi e negativi è quello riportato sotto.

d) Altre rappresentazioni grafiche
Fra le altre rappresentazioni grafiche usate, ricordiamo:
i cartogrammi, che servono per rappresentare serie territoriali, si realizzano riportando su una carta geografica, mediante simboli convenzionali o colorazioni diverse, le intensità osservate nelle varie parti nelle quali è diviso un territorio;
gli ideogrammi, che consistono nel rappresentare figure più o meno grandi in relazione allintensità del fenomeno;
i settori circolari di un cerchio o di un semicerchio, che si usano per rappresentare certe distribuzioni di frequenza nelle quali la totalità del fenomeno è ripartita in modalità rappresentate da settori i cui angoli al centro sono proporzionali alle intensità del fenomeno;
Le rilevazioni mediante questionario
Rappresentano, attualmente, uno dei metodi più diffusi nelle ricerche di mercato, nei sondaggi di opinione e negli studi di particolari aspetti della vita dei cittadini.
La predisposizione del modello
La costruzione del questionario è essenziale per la riuscita dellintera indagine e quindi dev'essere predisposta tenendo sempre presenti gli obiettivi che s'intendono raggiungere. Non esiste uno schema fisso a cui fare riferimento ogni volta che s'intende usare questo strumento, perché molti e vari sono gli scopi di un'indagine; si possono però indicare alcune linee generali per la costruzione di un buon questionario. Occorre, prima di tutto, precisare che un questionario è uno stampato che contiene un certo numero di domande alle quali linteressato deve rispondere o scegliendo una fra le risposte già indicate (domande a risposta chiusa) oppure in modo del tutto personale (domande a risposta aperta). È sempre preferibile usare domande a risposta chiusa perché risulta più semplice procedere poi alla codifica dei dati raccolti e alla successiva elaborazione. Domande che prevedono, fra le risposte chiuse, anche una risposta aperta del tipo: <<altro...>> rendono più lenta la fase di spoglio. Nelle domande per le quali linteressato deve esprimere un giudizio, fra le risposte chiuse del tipo SÌ o NO, è consigliabile prevedere una risposta del tipo: NON SO per poter considerare gli indecisi, che altrimenti sarebbero forzati a scegliere il SÌ o il NO. Le domande devono essere compilate con linguaggio semplice e comprensibile, e lelenco delle risposte chiuse deve essere quanto più esauriente possibile. Nella predisposizione di un questionario occorre tenere presente che è necessario, prima di tutto, acquisire una serie di dati di base che servono alla descrizione del campione o della popolazione su cui è fatta la rilevazione. Per questo motivo, in genere, il questionario è diviso in due parti: una prima parte contiene le domande necessarie a ottenere i dati di base, una seconda contiene le domande più specifiche, utili allacquisizione dei dati che permettono di ottenere le informazioni necessarie al tipo di indagine che si vuole fare. In particolare, i dati di base necessari a fornire un profilo socio culturale della popolazione o del campione esaminati si distinguono in dati inerenti le:
1. Caratteristiche anagrafiche che prevedono domande su:
1.1. Sesso
1.2. Età
1.3. Stato civile
2. Caratteristiche socio economiche della famiglia di origine, che prevedono domande su:
2.1. Numero delle persone in famiglia
2.2. Titolo di studio del padre
2.3. Professione del padre
2.4. Titolo di studio della madre
2.5. Professione della madre
2.6. Titolo di studio dellinteressato
2.7. Attuale professione dellinteressato
A seconda degli scopi specifici dellindagine, il numero delle domande relative ai dati di base può essere aumentato o ridotto, ma comunque non può prescindere da:
1 - Sesso
2 - Età
3 - Titolo di studio posseduto
4 - Professione esercitata
Nel caso d'indagine su un gruppo di studenti delle scuole medie inferiori o superiori, si elimina il punto tre e, per il punto quattro, si chiede la professione esercitata dal padre. Prima di somministrare il questionario, occorre preparare il personale incaricato affinché fornisca agli interessati la spiegazione per la compilazione. Nel caso di questionari inviati per posta, cosa molto frequente nei sondaggi su consumi di particolari prodotti, prima della serie di domande ci sono le avvertenze, nelle quali è esplicitamente scritto che le informazioni fornite sono strettamente riservate e serviranno esclusivamente alla preparazione di tabelle statistiche del tutto anonime.
La codifica dei dati
La fase successiva è quella della somministrazione del questionario, cioè della distribuzione delle copie agli interessati, che le devono compilare e consegnare al personale incaricato. Si passa poi allenumerazione dei questionari pervenuti, che avviene materialmente scrivendo un numero progressivo su ogni questionario (001, 002,); quest'operazione è indispensabile al fine di un successivo controllo per la correzione di errori nella fase di spoglio. Per la codifica dei dati, occorre predisporre un tabulato che riprenda, in forma sintetica, le domande del questionario: ogni riga del tabulato conterrà le risposte di un questionario.
| Numero dordine | Sesso | Età | Titolo di studio | Professione | Domanda n° 5 | Domanda n° 6 | Domanda n° 7 |
| 001 002 003 ... |
1 2 1 ... |
4 3 5 ... |
3 2 4 ... |
3 6 5 ... |
2 1 3 ... |
1 3 1 ... |
2 3 1 ... |
In ogni riga troviamo una serie di numeri che indicano le risposte scelte dallinteressato. In caso di mancata risposta o di risposta multipla a una domanda, si segna zero nella casella corrispondente. Se la mancata risposta riguarda uno dei dati di base, si può decidere di annullare il questionario. Per le eventuali risposte <<altro...>> occorre prendere nota, su un foglio a parte, delle risposte man mano che si presentano, per poi poterle classificare e contare.
Lo spoglio e la tabulazione dei dati
Quando tutti i questionari sono stati riportati, in codice, sul tabulato, si potrà procedere allo spoglio e alla tabulazione dei dati. Nel caso di uno spoglio semplice, basterà contare, colonna per colonna, come sono distribuite le risposte alle varie domande.