2.2 Il rilevamento dei dati

2.2 • Il rilevamento dei dati


L’ analisi statistica parte dal rilevamento dei dati che consiste nella raccolta delle informazioni (precedentemente individuate) necessarie al raggiungimento delle finalità che si vogliono ottenere e che possono essere semplici (quando riguardano operazioni elementari quali la misurazione dell’accrescimento di una pianta nel tempo) o complesse (quando riguardano il rilevamento di più dati fra loro dipendenti, come, ad esempio, la misurazione dell’accrescimento di una pianta in rapporto al numero di ore di luce durante la stagione vegetativa).


In entrambi i casi l’insieme di fatti individuali rappresenta la popolazione (o universo) su cui rilevare il carattere, che forma l’oggetto dell’indagine, ma per ottenerne una misurazione è sufficiente analizzare un suo sotto-insieme, cioè un campione rappresentativo della popolazione in analisi, dal quale raccogliere i dati. Si opera cioè con campioni casuali, la cui logica poggia sul comportamento del caso che si manifesta con modalità in media uniformi e ben note, indipendenti da condizioni di spazio e di tempo e anche dalla natura del fenomeno da indagare.
Il campione si può avvalere di una razionale omogeneità, con opportune classificazioni ed è svincolato anche da preconcetti degli operatori, assumendo così una obiettività non altrimenti raggiungibile.
La condizione necessaria a determinare un intervallo entro il quale i risultati siano attendibili, risiede nel procedimento di formazione dei campioni, le cui unità devono essere scelte rigorosamente a caso, senza accordare preferenze all’una piuttosto che all’altra unità.
La scelta casuale, infatti, è quella che consente i successivi sviluppi teorici dell’analisi, basati sulle caratteristiche costanti della variabilità casuale. Un campione così formato permette di associare ai risultati che esso fornisce i limiti dello scarto.
Questo è possibile perché il campione contiene soltanto errori accidentali, di solito di piccola entità, che in genere si compensano, ineliminabili in quanto dovuti al caso, ma suscettibili di una stima soddisfacente.
Tutti gli altri criteri di preparazione dei campioni contengono, oltre a errori accidentali, anche errori sistematici, la cui portata sfugge a qualsiasi valutazione e dunque non offrono i pregi del campione casuale.
Sul campione vengono poi effettuate una serie di misure che presentano valori diversi. Ciò rappresenta una variabile e ognuno dei dati che costituisce la serie è una variante. Dunque ci si troverà sempre in presenza di due o più serie di dati che riguardano i campioni posti a confronto.
I dati sono sempre così numerosi che è difficile, e talvolta impossibile, confrontarli tra loro, così come sono.
Quindi è necessario elaborarli statisticamente e ridurli in una forma semplice.
Per ottenere i risultati desiderati dovrà essere utilizzata la statistica descrittiva che ha il compito di descrivere il fenomeno e sintetizzare in valore un ampio numero di misure rilevate.
I risultati di una rilevazione devono essere, poi, presentati in forma chiara e sintetica. Per questo si ricorre all’uso della forma grafica, rappresentata da tabulati e grafici.
I tabulati sono la prima sintesi e il punto di partenza per la rappresentazione, la lettura, l’interpretazione e la successiva elaborazione dei dati. Un tabulato deve essere corredato da un titolo che indichi l’insieme degli elementi su cui è stata eseguita la rilevazione (popolazione), il carattere preso in considerazione e il riferimento temporale e spaziale della rilevazione.
La tabella va organizzata in colonne, ognuna delle quali deve essere dotata di una intestazione; l’insieme delle intestazioni va a costituire la testata. La colonna di partenza è detta colonna madre e riporta le modalità del carattere della rilevazione.
Al di sotto del filo di chiusura del tabulato si riportano eventuali note e fonti di provenienza, ben allineate a sinistra.
I grafici consentono di trasformare visivamente le informazioni numeriche.
La scelta del tipo di grafico è subordinata al tipo di informazione che si vuole rappresentare e agli aspetti che si vogliono evidenziare. Un grafico, come è noto, è costituito da due segmenti perpendicolari fra loro (gli assi verticale Y e orizzontale X) che si incontrano in un punto detto origine.
Gli assi sono graduati e vanno a costituire il piano cartesiano dove vengono inseriti gli elementi grafici che rappresentano le quantità numeriche. I grafici più comunemente usati sono quelli a settori circolari (grafici a torta), gli istogrammi e quelli a punti.
I grafici a settori circolari, detti anche grafici a torta (Fig. 3a), sono calcolati sui valori percentuali di una distribuzione. Ogni settore (la fetta della torta) rappresenta, in frequenza, il peso assunto da ciascuna modalità e mette in evidenza la ripartizione di un insieme. Si basa sulla proporzionalità tra l’area dei settori circolari e le frequenze rappresentate.
Gli istogrammi (Fig. 3b) sono utilizzati per rappresentare la frequenza con cui si presentano le modalità di un carattere. L’asse verticale (Y) indica la frequenza delle modalità del carattere e quello orizzontale (X) serve come base di appoggio per le unità grafiche, le barre che possono essere rappresentate anche orizzontalmente.
I grafici a punti (Fig. 3c) si usano per rappresentare il valore di due variabili su una stessa unita (età e altezza) e permettono la verifica della loro connessione e cioè se l’una influisce sull’altra. Le unità statistiche sono riportate sul piano cartesiano con un punto individuato dalle rispettive coordinate.
A titolo di informazione esistono molti altri tipi di grafici, fra cui ricordiamo: grafico a bolle, radar, ad anello e ad area.

APPROFONDIMENTO - Piccolo glossario di base

Popolazione (o universo) è un qualsiasi insieme di elementi che forma l’oggetto di studio di un’analisi statistica.
Campione. È un sotto-insieme ottenuto da una particolare popolazione e finalizzato ad un’analisi statistica. Unità statistica. Rappresenta l’elemento base della popolazione, che può quindi essere intesa come l’insieme delle unità statistiche ad essa relative. Un’unità statistica può consistere in un individuo, un oggetto, un animale, una pianta, un appezzamento di terreno.
Variabile. È il fenomeno oggetto di studio, rilevato sulle unità statistiche della popolazione di riferimento e codificato secondo le esigenze dell’analisi statistica.
Modalità. È l’espressione concreta con la quale la variabile si manifesta nelle unità statistiche. La modalità può consistere in un numero (ad esempio l’età di un particolare individuo) così come in una qualità (ad esempio il genere di un individuo).
Frequenza. È il numero di volte in cui una particolare modalità si presenta nel collettivo di riferimento.

STOP E SINTESI
Il rilevamento dei dati
In che cosa consiste il rilevamento dei dati?
Consiste nella raccolta di informazioni individuate precedentemente, necessarie al raggiungimento delle finalità che si vogliono ottenere.
Che cosa si intende per campione statistico?
Un campione è un sotto-insieme rappresentativo della popolazione in analisi, dal quale si raccolgono i dati da analizzare.
Che cos’è una variabile da analizzare?
In statistica per variabile o carattere si intende generalmente un insieme di caratteristiche rilevate su una o più unità statistiche appartenenti a una popolazione da indagare.
STOP AND SUMMARY
Data collection
What is ‘data collection’?
It is the collection of previously identified information, necessary to achieve the fixed goals.
What is meant by ‘statistical sample’?
A sample is a subset representative of the population under analysis, from which the data to be analyzed are collected.
What is a variable to be analyzed?
In statistics with variable or character it is meant a set of characteristics found on one or more statistical units belonging to the investigated population.

ECONOMIA E AGROSISTEMI
ECONOMIA E AGROSISTEMI
VOLUME 1