I valori medi

 

Concetto e tipi di medie
Media aritmetica
Proprietà della media aritmetica
Media geometrica e sue proprietà
Media quadratica
Media armonica
Moda o valore normale
Mediana e quartili
Come scegliere una media

 

Concetto e tipi di medie

Fatta la rilevazione dei dati di un certo fenomeno, si sente la necessità di sintetizzare la distribuzione mediante valori che la caratterizzino e permettano di confrontarla con distribuzioni di fenomeni analoghi osservati in tempi o in luoghi diversi. Un primo di questi valori è dato da un valore medio che esprime una tendenza centrale. La media di un insieme è un qualsiasi valore compreso tra il minimo e il massimo; è chiaro che si possono avere molti tipi di medie. La media è un'invariante, precisamente:

 

Si può chiamare media di una distribuzione x1, … , xn , rispetto ad una funzione f(x1, … , xn), quella quantità m che sostituita alle xi nella funzione lascia invariato il risultato.

 

In statistica si distinguono solitamente due tipi di medie:

Medie di calcolo (o ferme); sono quelle che soddisfano ad una condizione d'invarianza e che si calcolano tenendo conto di tutti i valori della distribuzione.

Medie di posizione (o lasche); sono quelle che si calcolano tenendo conto solo di alcuni valori.

Naturalmente la scelta del tipo di media da utilizzare dipende dal problema che si sta esaminando. Studiamo quattro tipi di medie di calcolo (aritmetica, geometrica, quadratica, armonica) e due tipi di medie di posizione (mediana, moda o valore normale).

arrowsu.gif (371 byte)

Media aritmetica

È la media più conosciuta e applicata. Si assume come funzione la somma dei dati. Precisamente:

 

Si definisce media aritmetica di più numeri quel valore che, sostituito ai dati, lascia invariata la loro somma.

 

Indicati con x1, x2,… , xn i numeri dati, per la definizione si ha:

da cui si ricava:

si ha così la media aritmetica semplice che s'indica anche con . Se i valori di xi hanno frequenze diverse, ossia compaiono più volte nelle osservazioni, per esempio il valore x1 ha frequenza y1, x2 ha frequenza y2, la condizione d'invarianza della somma diventa:

da cui si ricava:

che si chiama media aritmetica ponderata perché le frequenze sono anche dette pesi. Se si prendono in considerazione le frequenze relative:

e si sostituiscono tali valori la formula diventa:

Si può affermare che la media aritmetica ponderata è la somma dei prodotti dei valori xi per le corrispondenti frequenze relative. Vogliamo dimostrare che la media aritmetica è un valore compreso fra il più piccolo e il più grande di un insieme di osservazioni. Ordiniamo i valori delle xi in modo crescente:

e nella formula

sostituiamo il valore x1 ai valori x2, x3, …, xn:

Possiamo affermare che:

In modo analogo, sostituendo il valore maggiore xn ai valori x1, x2, …,xn-1 si ottiene:

Possiamo affermare che:

e quindi:

Nel caso di una serie statistica, se ha senso il calcolo dell’ammontare complessivo, si applica la media aritmetica semplice; nel caso di una seriazione si applica la media aritmetica ponderata. Per quanto si riferisce alle seriazioni con i valori raggruppati in classi, occorre, per ogni classe, calcolare il valore centrale come semi somma dei valori estremi dell’intervallo, salvo che, per ogni classe, l’ammontare sia già stato rilevato insieme alla frequenza. Assumendo il valore centrale, si commette un errore di approssimazione che si dimostra essere non rilevante se le classi hanno piccola ampiezza, ma che è più o meno grave nel caso di classi ampie o di classi con frequenze grandi. Osserviamo che spesso il risultato di una media è un numero non intero; in caso di grandezze misurate da numeri naturali (come persone, stanze) è più coerente arrotondare la media al numero intero più prossimo. Fra le medie di calcolo la media aritmetica (semplice o ponderata) è quella più utilizzata ed è un valore medio significativo se si vuole determinare un valore che esprima l'equidistribuzione del fenomeno quale, ad esempio, il reddito medio di una popolazione, la spesa media per l’alimentazione, l’altezza media di un gruppo di giovani della stessa età. La media aritmetica si applica correttamente per determinare il valore centrale di una serie con andamento lineare e anche per avere una misura attendibile di una serie di misure di una grandezza geometrica, fisica.

arrowsu.gif (371 byte)

Proprietà della media aritmetica

Il frequente uso della media aritmetica, sia semplice sia ponderata, deriva anche dal fatto che essa gode di alcune proprietà fondamentali.

 

1° Proprietà

La somma degli scarti positivi dalla media aritmetica è uguale, in valore assoluto, a quella degli scarti negativi, e quindi la somma algebrica di tutti gli scarti (positivi e negativi) è uguale a zero.

Essendo x1, x2, …, xn, un insieme di dati la cui media aritmetica è M, definiamo lo scarto lineare come la differenza tra ogni valore xi e la media M:

Scarto = xi-M..... i=1, 2, …, n

La somma di tutti gli scarti sarà:

La proprietà si può dimostrare in modo analogo per la media aritmetica ponderata. Dalla 1° proprietà deriva anche che: la media aritmetica degli scarti (xi - M) è uguale a zero. Infatti, sia M la media aritmetica ponderata, calcoliamo la media degli scarti:

La proprietà ora dimostrata per la media aritmetica ponderata vale anche per la media aritmetica semplice.

 

2° Proprietà

La somma dei quadrati degli scarti dei valori della distribuzione dalla media aritmetica è minore della somma dei quadrati degli scarti da qualsiasi numero.

Consideriamo sempre l’insieme dei dati x1, x2, …, xn la cui media aritmetica semplice è M; i quadrati degli scarti lineari sono:

Indicando con A un qualunque numero diverso da M, definiamo gli scarti da tale numero:

scarto = xi-A.... i=1, 2, …, n

La somma dei quadrati di tali scarti è:

Essendo A diverso dalla media aritmetica M, differirà da essa di una certa quantità d, in altre parole:

e anche:

Sostituendo tal espressione nella somma dei quadrati degli scarti dal numero A si ha:

Resta così provato che:

e possiamo quindi affermare che:

 

La somma dei quadrati degli scarti dalla media aritmetica è un valore minimo rispetto alla somma dei quadrati degli scarti da un qualsiasi altro numero.

 

La proprietà che è stata dimostrata per la media aritmetica semplice si estende con analoga dimostrazione alla media aritmetica ponderata.

 

3° Proprietà

Aggiungendo (o sottraendo) a tutti i valori xi, la stessa quantità k, la media aritmetica è incrementata (o ridotta) di tale quantità (proprietà traslativa):

 

4° Proprietà

Moltiplicando (o dividendo) tutti i valori xi per una stessa quantità h, diversa da zero, la media aritmetica risulta moltiplicata (o divisa) per tale quantità:

arrowsu.gif (371 byte)

Media geometrica e sue proprietà

Se i valori sono tutti positivi e non nulli si può calcolare la media geometrica.

 

Si definisce media geometrica dei valori x1, x2, …, xn, quel numero G che sostituito ai valori xi lascia invariato il loro prodotto:

da cui si ricava:

che è la media geometrica semplice.

 

Nel caso di valori xi con frequenze o pesi yi, si ha:

e quindi:

dove:

che è la media geometrica ponderata. Ovviamente non si può calcolare la media geometrica se uno dei valori è zero perché il prodotto sarebbe nullo per qualunque valore assunto dagli altri. Inoltre le xi non possono essere negative. Per il calcolo della media geometrica si utilizzano formule ottenute dalle due definizioni precedenti mediante i logaritmi (in una qualunque base) che le trasformano in una media aritmetica, rispettivamente, semplice o ponderata. Prendendo i logaritmi si ottiene:

e:

quindi:

Il logaritmo della media geometrica (semplice o ponderata) è la media aritmetica (semplice o ponderata) dei logaritmi dei valori della variabile statistica.

 

Si utilizza la media geometrica quando ha senso moltiplicare fra loro i dati statistici. Si deve calcolare la media geometrica, e non la media aritmetica, ad esempio, per determinare il tasso d'incremento medio o di decremento di prezzi, o il tasso di accrescimento di una popolazione. Si utilizza la media geometrica quando i dati variano in progressione geometrica. Anche la media geometrica (semplice o ponderata), gode di alcune proprietà fra cui.

 

1° Proprietà

Moltiplicando (o dividendo) tutti i valori xi per una stessa quantità h, maggiore di zero, la media geometrica risulta moltiplicata (o divisa) per tale quantità:

Questa proprietà risulta molto utile per semplificare i calcoli.

 

2° Proprietà

Il reciproco della media geometrica è uguale alla media geometrica del reciproco dei valori xi.

arrowsu.gif (371 byte)

Media quadratica

Se assumiamo come funzione la somma dei quadrati dei valori, indicando con Q la media quadratica, si ha, per la consueta definizione:

in pratica:

che è la media quadratica semplice (indicata anche con M2). Se i valori hanno frequenze diverse yi si ha:

da cui:

che è la media quadratica ponderata. La media quadratica (semplice o ponderata) è eguale alla radice quadrata della media aritmetica (semplice o ponderata) dei quadrati dei valori dei dati. Fra le medie considerate, la media quadratica è quella che ha valore maggiore ed è la più influenzata dai valori molto piccoli o molto grandi della distribuzione; la media quadratica è perciò utilizzata per mettere in evidenza l’esistenza di valori che si scostano molto dai valori centrali. Si usa inoltre la media quadratica quando si ha interesse a calcolare un valore medio di superficie disponibile.

arrowsu.gif (371 byte)

Media armonica

Siano assegnati dei valori non nulli e si assuma come funzione invariante la somma dei reciproci. La media armonica A è quel valore che sostituito ai dati mantiene invariata la somma dei reciproci, in altre parole:

da cui si ricava:

che è la media armonica semplice. Se i valori hanno frequenze yi diverse, con procedimento analogo si perviene alla formula:

che esprime la media armonica ponderata. La media armonica, semplice o ponderata, è eguale al reciproco della media aritmetica, semplice o ponderata, dei reciproci. La media armonica si applica quando ha senso calcolare il reciproco dei dati; ad esempio, per determinare il potere di acquisto medio della moneta si calcola il reciproco della media armonica dei prezzi (ricordando che si definisce potere di acquisto la quantità di merce che si può acquistare con una data unità di moneta e che il potere di acquisto è il reciproco del prezzo della merce). La media armonica si applica anche per conoscere la velocità media come media armonica della velocità, poiché il reciproco di una velocità rappresenta il tempo necessario a percorrere l ’unità di spazio. Fra le quattro medie di calcolo esaminate, sussiste la seguente relazione:

A£ G£ M£ Q

Vale il segno di eguale solo nel caso in cui i dati siano tutti eguali fra loro e quindi eguali a qualsiasi media. Le medie aritmetica, quadratica e armonica sono casi particolari della formula generale della media di potenza r-esima data da:

Se r = 1: media aritmetica

Se r = 2: media quadratica

Se r= -1: media armonica

(Per quanto riguarda la media geometrica indicata con M0, rientra nelle medie di potenza se r tende a zero.).

arrowsu.gif (371 byte)

Moda o valore normale

La moda o valore normale (detta anche valore modale o norma ) è un valore caratteristico di una distribuzione di frequenze la cui determinazione non richiede alcun calcolo.

 

Si dice moda o valore normale di una distribuzione di frequenze la modalità o il valore della variabile al quale corrisponde la massima frequenza.

 

Se si ha una serie o una seriazione con valori discreti, la moda è il valore che ha la massima frequenza. Se i dati sono raggruppati in classi, il calcolo della moda presenta maggiori difficoltà. Se l’ampiezza della classe è costante si dirà classe modale quella che ha la frequenza maggiore. Se le classi hanno ampiezza diversa, come si è già fatto per la rappresentazione grafica, si divide ogni frequenza per l’ampiezza della rispettiva classe e la classe modale è la classe alla quale corrisponde il rapporto maggiore. Talvolta per individuare la classe modale è sufficiente esaminare l’istogramma della distribuzione: la classe modale è quella che è base del rettangolo di altezza massima. Il valore modale è, fra tutti i valori medi, il più significativo in quanto è un dato che esprime il valore di una concreta osservazione sul fenomeno, mentre le medie di calcolo possono o meno coincidere con un valore della distribuzione. Considerando le retribuzioni di un certo insieme di lavoratori, il valore normale è senz’altro il più significativo, in quanto corrisponde alla retribuzione più frequente e non è influenzato dalle retribuzioni limite (o molto basse o molto alte). Esistono delle variabili statistiche che presentano più di un valore modale (distribuzioni plurimodali ), in altri casi la moda può essere agli estremi della distribuzione (distribuzioni zeromodali). La moda è molto utilizzata nelle scienze applicate, sia per il suo significato, sia per la facilità di calcolo.

arrowsu.gif (371 byte)

Mediana e quartili

La mediana è una media di posizione e rappresenta il valore centrale della distribuzione quando i dati sono ordinati. Precisamente:

 

Siano x1, x2, …, xn i valori ordinati in senso non decrescente, si dice mediana Me il valore che bipartisce la successione, ossia il valore non inferiore a metà dei valori e non superiore all’altra metà.

 

Ordinati i valori, se il numero n dei termini è dispari, la mediana è proprio il valore centrale; se n è pari, si assume come mediana la semi somma dei due valori centrali. Il procedimento sopra esposto si applica per le serie. Per le distribuzioni di frequenze con valori discreti, i dati sono generalmente già ordinati; occorre allora calcolare le frequenze assolute cumulate, che si ottengono associando a ogni valore la somma della rispettiva frequenza con tutte quelle che la precedono, e determinare quale valore corrisponde:

alla frequenza cumulata , se la somma è pari;

alla frequenza cumulata , se la somma è dispari;

 

tale valore è la mediana. Se i dati sono raggruppati in classi, si determina la classe mediana mediante le frequenze assolute cumulate. Per ottenere esattamente il valore mediano, si applica un'interpolazione lineare fra i due valori estremi della classe in cui cade la mediana, supponendo che le frequenze siano distribuite nella classe a intervalli regolari. Per il calcolo approssimato in questo caso è utile servirsi del grafico della poligonale delle frequenze relative cumulate. È sufficiente trovare l’ascissa del punto di ordinata , come si può rilevare dal grafico seguente:

La mediana non è influenzata dai valori estremi della distribuzione, quindi anche se le classi estreme, in caso di distribuzione continua, sono aperte, non occorre chiuderle. Inoltre, se la distribuzione è molto asimmetrica, il valore mediano è più appropriato della media aritmetica per esprimere un valore sintetico della distribuzione. Una proprietà caratteristica della mediana è la seguente: la mediana rende minima la somma dei valori assoluti degli scarti, in altre parole la somma dei valori assoluti degli scarti dalla mediana e non è superiore (ossia minore o eguale) alla somma dei valori degli scarti da qualunque altro valore. Accanto al valore mediano si considerano il primo e il terzo quartile.

Il primo quartile Q1 è il valore che supera un quarto dei termini ed è superato da tre quarti dei termini.

Il terzo quartile Q3 è il valore che supera tre quarti dei termini ed è superato da un quarto dei termini.

(Il secondo quartile coincide con la mediana). Nel caso di una variabile continua con valori raggruppati in classi, per il calcolo approssimato della mediana e dei quartili è molto utile servirsi del grafico della poligonale delle frequenze relative cumulative. È infatti sufficiente trovare le ascisse dei punti corrispondenti alle ordinate ½, ¼, ¾.

arrowsu.gif (371 byte)

Come scegliere una media

Un valore sintetico si può calcolare in vari modi. Alcuni valori medi soddisfano a una condizione d'invarianza di un valore globale e precisamente: la media aritmetica lascia invariata la somma dei termini, la media geometrica lascia invariato il prodotto, la media quadratica lascia invariata la somma dei quadrati dei termini e la media armonica la somma dei reciproci dei termini. Altri valori medi non considerano tutti i valori della distribuzione, ma solo alcuni di essi, come la moda, che dà importanza al valore che presenta la maggior frequenza, o come la mediana, che occupa la posizione centrale della distribuzione. Si usa la media aritmetica per determinare un valore che esprima un concetto di equi distribuzione quando, per esempio, si vuole determinare una media delle spese, dei consumi, dei redditi, delle temperature. Si applica pure la media aritmetica, per le proprietà dei suoi scarti, per determinare il valore più preciso di una serie di misure, purché gli errori di misurazione siano accidentali e non sistematici (in pratica dovuti agli strumenti); inoltre si applica la media aritmetica se i dati si succedono circa in progressione aritmetica. La media geometrica è utilizzata per determinare il tasso medio di accrescimento (o di decremento) di un fenomeno, i tasso d'interesse medio di più tassi nella capitalizzazione composta, oppure per determinare una media nei cambi monetari. La media geometrica si utilizza pure quando i dati si susseguono in progressione geometrica. La media quadratica è applicata quando si deve eliminare l’influenza dei segni e quando si deve evidenziare l’esistenza nella distribuzione di valori molto grandi o molto piccoli. La media armonica è applicata quando si vuole conoscere un valore medio utilizzando i valori reciproci di un altro carattere, come nel caso del potere di acquisto della moneta. Ha interesse determinare la moda o il valore normale di una distribuzione di frequenze, quando è importante conoscere il valore che ha la maggiore probabilità di presentarsi. Ad esempio, l’altezza normale dei giovani di leva è quella che ha maggior frequenza, la composizione normale di una famiglia, ossia il numero di componenti di una famiglia, è quella che si presenta con maggior frequenza e la conoscenza di tale valore è più significativo della media aritmetica. Il valore mediano è il valore centrale della distribuzione e risulta indipendente da forti differenze fra i dati. Non si può dare una regola generale di scelta del tipo di media, ma si deve calcolare più di un valore medio e scegliere quello più interessante per il problema in esame. Le medie cui si ricorre più frequentemente in pratica sono la media aritmetica, la mediana e, nel caso di distribuzioni di frequenze, il valore modale.

arrowsu.gif (371 byte)