2.4 Gli indici di variabilità



2.4 • Gli indici di variabilità


I valori medi, appena descritti, hanno il limite di non fornire informazioni sulla dispersione dei dati della serie in esame. È quindi necessario affiancarli a numeri detti indici di dispersione (detti anche indici di variabilità) che servono a facilitare la comprensione delle variazioni dei fenomeni oggetto di analisi.



Range

Il range (o campo di variazione) è dato dalla differenza fra gli estremi e rappresenta l’ampiezza dell’intervallo dei dati. Se ad esempio avessimo -1, 0, 1, 2, 3, 5, 8 l’estremo inferiore è dato da -1, quello superiore da 8. Quindi avremo: 8 - (-1) = 8 + 1 = 9.
Il range fornisce informazioni sulla distribuzione dei dati. Più il valore del range è piccolo più i valori sono concentrati, ma sono più dispersi con valori elevati di range.


È bene precisare che il range risulta dai dati estremi della serie, tuttavia non di tutti i dati; quindi serie molto diverse, ma con estremi uguali, hanno lo stesso range.

Scarto medio

È un metodo che tiene conto di tutti i dati della serie e consiste nel calcolare la distanza, in valore assoluto, di tutti i dati della media ed eseguire la media aritmetica di tali distanze. Se lo scarto risulta piccolo i dati della serie sono concentrati, viceversa se lo scarto è grande sono dispersi o molto dispersi.


Riportiamo un semplice esempio, nel quale si deve analizzare una serie di 5 dati:
1 7 9 14 19
la cui media è: = 50/5 = 10
Si calcola ora la distanza, in valore assoluto, dalla media:
10 - 1; 10 - 7; 10 - 9; 14 - 10; 19 - 10
e cioè: 9 3 1 4 9
Si esegue ora la media dei valori ottenuti ottenendo lo scarto medio:
26/5 = 5,2

Varianza

Rappresenta la media aritmetica dei quadrati delle distanze dei dati dalla media e anch’essa tiene conto della distribuzione di tutti i dati. In sintesi:

Dove:
x rappresenta le singole osservazioni.
M rappresenta la media delle osservazioni.
N rappresenta il numero delle osservazioni.


Gli (x 2 M) sono le differenze (scarti o errori) delle singole osservazioni dalla loro media; esse sono in parte positive e in parte negative, la loro somma è, in tutti i casi, uguale a zero e quindi nulla può dirci sul loro comportamento. Invece, sommando gli scarti elevati al quadrato ( scarti quadratici), si ha una quantità positiva. Tale somma [S (x 2 M)2] divisa per il numero delle osservazioni fornisce la varianza, che rappresenta una media quadratica. Se volessimo utilizzare l’esempio dei prezzi di vendita del cereale prima proposto avremo i prezzi di vendita del cereale (in €) e cioè:
33, 32, 33, 34, 30, 36, 32, 34, 34, 31
la media sarà data da:
133, 32, 33, 34, 30, 36, 32, 34, 34, 312 / 10 = 32,9€

Troviamo, ora, gli scarti rispetto alla media, effettuando la differenza fra valore del prezzo medio e i prezzi del periodo:
32,9 2 33; 32,9 2 32; 32,9 2 33; 32,9 2 34; 32,9 2 30
32,9 2 36; 32,9 2 32; 32,9 2 34; 32,9 2 34; 32,9 2 31

Si esegue la sommatoria dei quadrati degli scarti:
2 0,12 1 0,9212 0,1212 1,12 1 2,9212 3,12 1 0,9212 1,1212 1,12 1 1,92 5
5 0,01 1 0,81 1 0,01 1 1,21 1 8,41 1 9,61 1 0,81 1 1,21 1 1,21 1 3,61 5
= 26,90 : 10 5 2,69

Ciò significa che nei 10 giorni passati la variazione è stata di 2,69 €. A questo punto l’imprenditore, considerando il suo costo di produzione, può decidere la vendita.

Deviazione standard

La deviazione standard, detta anche scarto quadratico medio, fornisce un’indicazione numerica di quanto i dati siano vicini o lontani dalla media. È indicata con la lettera s (sigma) ed è ottenuta dalla radice quadrata della varianza:


Sempre utilizzando l’esempio precedente, dove è stata ricercata la varianza avremo:

È il caso di ricordare che nel calcolo della varianza e della deviazione standard, la divisione della somma dei quadrati degli scarti è spesso divisa per (N 2 1), anziché per N.
(N 2 1) prende, in statistica, il nome di gradi di libertà. La ragione di ciò può essere spiegata ricordando che il calcolo della deviazione standard si basa sul numero dei paragoni indipendenti delle varianti con la media, cioè sul numero delle deviazioni indipendenti. Ora se la media è esattamente calcolata, la somma delle deviazioni da essa, positive o negative, deve risultare uguale a zero. Da ciò deriva che se le varianti sono N, quando sono state calcolate (N 2 1) deviazioni, l’ultima presenta un valore fisso. Dunque il numero delle deviazioni indipendenti, o gradi di libertà, è (N 2 1) che diventa il denominatore. L’assunzione di N o di (N 2 1) non dà luogo a differenze significative quando N è molto grande, cioè nel caso di grandi campioni.
Invece incide notevolmente sul valore della deviazione standard quando N è piccolo, cioè in quasi tutti i casi relativi alle sperimentazioni agricole.
Quindi le sintesi precedentemente riportate per il calcolo della varianza e della deviazione standard potrebbero trovarsi anche nella seguente forma:

La varianza e la deviazione standard forniscono informazioni sulla distribuzione dei dati. Se il valore della varianza e della deviazione standard risultano piccoli, significa che i valori della serie sono concentrati, più il valore aumenta, più i dati sono dispersi. La varianza è espressa con il quadrato dell’unità di misura dei dati, mentre la deviazione standard con la stessa unità di misura dei dati. La relazione di carattere generale che lega il s (sigma) del campione a quello dell’universo è detta errore medio della media o errore di campionamento oppure, semplicemente errore standard.
Il termine errore non deve ingannare, allude solo all’erronea nozione che la media del campione può dare della media dell’universo a causa della variabilità. L’errore standard è quindi una stima della dispersione della ipotetica popolazione originaria, cioè dell’universo. In altre parole ci dice di quanto la media del campione si avvicini alla media della popolazione. Più il campione è grande, minore sarà l’errore standard, e più la media del campione si avvicinerà alla media della popolazione.
Si ottiene dal rapporto tra la deviazione standard e la radice del numero dei dati:

La deviazione standard rappresenta uno strumento utile per misurare la variabilità di una distribuzione simmetrica con pochi valori anomali. I confronti tra deviazioni standard di diverse distribuzioni hanno senso solo quando i caratteri sono della stessa natura, sono espressi nella stessa unità di misura e quando le medie aritmetiche hanno una grandezza simile. Bisogna inoltre aggiungere che se dovessimo confrontare la variabilità di un carattere in popolazioni diverse per grandezza media o di più caratteri espressi in diverse unità di misura (kg, m, cm, €, ecc.) la deviazione standard non sarebbe un buon indicatore perché è espresso nell’unità di misura del carattere rilevato e non avrebbe senso confrontare una variabilità espressa in cm con una variabilità espressa in kg o in €. In questi casi si ricorre al coefficiente di variabilità dato dal rapporto fra la deviazione standard (s) e la media (M):

In questo modo la variabilità è relativa alla media aritmetica e non è espressa nell’unità di misura del carattere, ma da un numero puro. Il coefficiente di variazione è espresso percentualmente. Gli indici di forma vengono utilizzati per identificare la forma della distribuzione di una variabile. Possono essere: la simmetria, la asimmetria e la curtosi.

Simmetria

Una distribuzione si presenta simmetrica quando, riportando su un grafico i risultati dei rilievi eseguiti e inserendo sulle ordinate le frequenze con cui si ripete un certo risultato e sulle ascisse il risultato stesso, si ottiene una tipica curva (curva di frequenza) a forma di campana (curva di Gauss) simmetrica, dove la media, la mediana e la moda sono coincidenti.


Sostanzialmente si tratta di una linea mediana che divide in due parti uguali l’area circoscritta dalla curva stessa. La deviazione di qualsiasi variante è pari alla distanza che tale valore ha dalla media, misurata sull’asse delle ascisse. Dalla somma dei quadrati di tali deviazioni deriva, appunto, la deviazione standard e, di conseguenza, l’errore standard o errore di campionamento.

Figura 5 • Esempio di distribuzione simmetrica.

Risulta evidente, quindi, che la forma della curva indica la quantità di variabilità della popolazione. Analizzando la curva simmetrica di figura 5 si evidenzia che è completamente determinata dalla media (M) e dallo scarto quadratico medio (s sigma). Conosciuti pertanto M e s, siamo in grado di calcolare le frequenze (numero delle osservazioni) che ricadono in un qualsiasi intervallo del campo di oscillazione della variabile e più precisamente entro intervalli di ampiezza pari a s, 2 s, 3 s, misurati in senso negativo e positivo dalla media M, rispettivamente il 68%, il 95% e il 99,7% delle osservazioni.
In base a queste osservazioni si può costruire una tavola di probabilità detta tavola della probabilità integrale o tavola del “t”.

Asimmetria

Una distribuzione è asimmetrica quando non presenta nessun asse di simmetria. Si può avere una asimmetria destra o positiva (Fig. 6), quando il ramo destro della curva è più lungo del sinistro e una asimmetria sinistra o negativa quando si ha l’andamento opposto (Fig. 7).



Figura 6 • Distribuzione asimmetrica positiva.


Figura 7 • Distribuzione asimmetrica negativa.

Curtosi

Se la distribuzione è simmetrica o quasi simmetrica, la curva può essere più o meno appuntita (curva leptocurtica) o più o meno appiattita (curva platicurtica) rispetto ad una distribuzione normale (o di Gauss), siamo cioè in presenza della curtosi.


Più la curva è stretta e alta minore è la variabilità (Fig. 8).

Figura 8 • Curtosi.

A chiarimento di quanto detto riportiamo in tabella 1 un esempio di lavoro per il calcolo degli indici.
Ammettiamo che un imprenditore abbia seminato 5 appezzamenti di 1 ettaro di ampiezza, con la stessa specie e varietà. Al raccolto si nota che i dati produttivi sono tra loro diversi. Queste variazioni sono dovute all’interferire e all’intrecciarsi di tutte le cause perturbatrici dovute alle caratteristiche agronomiche degli appezzamenti:

Tabella 1 • Esempi di curtosi.

STOP E SINTESI
Gli indici di variabilità
Come si definisce la deviazione standard?
È anche detta scarto quadratico medio e indica quanto i dati siano vicini o lontani dalla media. Si indica con la lettera s (sigma).
STOP AND SUMMARY
Variability Indexes
How do you define Standard deviation?
It is also known as square deviation and indicates how far from the average the data are. It is indicated by the letter s (sigma).

ECONOMIA E AGROSISTEMI
ECONOMIA E AGROSISTEMI
VOLUME 1