Site icon Vincenzo Asaro

La mediana (statistica) – Proprietà, caratteristiche ed esercizi svolti

La mediana copertina

La mediana è un indice di sintesi statistico, proprio come lo è la media aritmetica.

In questo post, parliamo di cosa sia la mediana (o valore mediano), di come si calcoli, e delle sue proprietà.

Potete trovare anche un video dedicato a questo argomento in fondo al post.

Cos’è la mediana?

La mediana è un indice di sintesi di una distribuzione di caratteri quantitativi o qualitativi ordinali, ed è rappresentata dal valore della modalità che si trova esattamente nel mezzo della distribuzione.

Sebbene la definizione possa sembrare complicata, non c’è niente di più semplice.

La mediana è quel valore che divide una distribuzione esattamente a metà.

A “sinistra” e a “destra” della mediana si trova lo stesso numero di osservazioni.

Facciamo un esempio, che renderà tutto più chiaro.

Ipotizziamo di osservare il fatturato annuo (in migliaia di euro) di undici aziende, e di avere i seguenti valori:

9009801.0201.0801.1001.2001.3001.5001.8002.1002300

Come potete vedere, i valori sono già ordinati dal più basso al più alto (e vedremo tra poco che è necessario ordinare i valori per calcolare la mediana).

Osservate per un attimo il fatturato annuo delle undici aziende.

Qual è il valore, tra quelli osservati, che divide esattamente in due parti la distribuzione?

Prendetevi qualche secondo per pensarci prima di continuare a leggere.


Spero che abbiate indovinato. Il valore mediano (quello che divide esattamente in due la distribuzione)è:

1.200

Vediamo che “a sinistra” di 1.200 ci sono cinque osservazioni (ovvero cinque valori sono inferiori a 1.200), e “a destra” di 1.200 ci sono altre cinque osservazioni (cinque valori sono superiori a 1.200).

La mediana (che indicheremo d’ora in poi con Me)è quindi 1.200:

Me = 1.200

Come abbiamo visto in questo esempio, il concetto di mediana (o valore mediano)è estremamente semplice.

Andiamo a vedere adesso le regole di calcolo e i vari passaggi da prendere in considerazione.

Come si calcola la mediana?

Il calcolo della mediana è differente a seconda che i valori osservati (i valori della distribuzione)siano pari oppure dispari. Vediamo qual è il ragionamento e quali sono i passaggi da svolgere per il calcolo, e dopo facciamo un paio di esempi pratici.

Successivamente vedremo in che modo si calcola la mediana quando siamo di fronte ad una distribuzione per classi.

In sintesi, i passaggi per il calcolo della mediana sono i seguenti:

  1. Anzitutto ordinare i dati in ordine crescente (dal più piccolo al più grande)
  2. Vedere se il numero di osservazioni (n)è pari o dispari
    • Se n è pari, ci saranno due valori centrali. Allora bisogna calcolare i due valori centrali e fare la media di essi. Quella sarà la mediana.
    • Se n è dispari, allora basta calcolare il valore centrale (perché ce ne sarà uno soltanto).

Perché c’è questa distinzione tra n pari ed n dispari?

Perché se il numero di caratteri osservati è dispari, ci sarà un carattere esattamente al centro, e quello sarà il nostro valore mediano.
Mentre, se il numero di caratteri osservati è pari, non ci sarà un valore che divide la distribuzione esattamente in due.

Come vediamo nell’immagine seguente, la prima distribuzione ha 7 valori (n=7), quindi dispari. Il quarto valore, quindi, è quello mediano. A sinistra del quarto valore ci sono 3 numeri, e a destra ci sono altri 3 numeri.

Osserviamo invece la seconda distribuzione, in cui il numero di osservazioni è pari (n=8). Vediamo che non c’è un valore che divide esattamente in due la distribuzione. Se scegliessimo il valore 9, avremmo tre numeri alla sua sinistra (1, 3, 4), e quattro numeri alla sua destra (11, 15, 18, 20).

Allo stesso modo, se scegliessimo il valore 11, avremmo 4 numeri alla sua sinistra, e tre alla sua destra.

In casi come questo, la mediana si calcola facendo la media tra i due valori centrali (9 ed 11), quindi sarà 10 in questo caso specifico.

Vedremo diversi esempi tra pochissimo, per chiarire ulteriormente il concetto.

Prima di passare agli esempi, però, date un’occhiata qui di seguito allo schema per il calcolo della mediana, in cui vengono riassunti per grandi linee i passaggi da effettuare.

Schema per il calcolo della mediana

Robustezza della mediana

Si dice che la mediana sia un indice “robusto”. Per capire cosa si intende, potete guardare il video qui sotto:

Calcolare la mediana di una distribuzione per classi

Come vediamo nell’infografica qui sopra, il metodo per calcolare la mediana in una distribuzione per classi è differente.

Bisogna prima calcolare la classe mediana, e una volta identificata la classe mediana, è necessario calcolare il valore mediano con il metodo dell’interpolazione.

C’è anche un esercizio svolto sul calcolo della mediana in una distribuzione per classi più in basso.

Per evitare di appesantire ulteriormente questo articolo, ce n’è uno dedicato proprio al calcolo della mediana di una distribuzione per classi, che potete trovare a questo link:

Post sul calcolo della mediana di una distribuzione in classi

Esercizi svolti sul calcolo della mediana

Vediamo adesso alcuni esercizi didattici, senza alcuna pretesa di completezza.
Questi esercizi svolti che ci servono soltanto come una sorta di “mappa” per capire come risolvere gli esercizi sul calcolo della mediana.

Esercizio 1 – Calcolo semplice

Abbiamo pesato 25 confezioni di pasta di semola di grano duro da 500 grammi, per verificarne i pesi effettivi, e si sono ottenuti i seguenti dati:

PESO EFFETTIVO (in grammi)
499
498
503
502
496
499
503
500
498
499
500
496
499
498
503
496
499
499
496
499
498
498
496
498
498

Determinare la mediana.

Come abbiamo visto, anzitutto dobbiamo ordinare i nostri valori in modo crescente, ottenendo:

PESO EFFETTIVO (in grammi)
496
496
496
496
496
498
498
498
498
498
498
498
499
499
499
499
499
499
499
500
500
502
503
503
503
Osservazioni ordinate in modo crescente

Una volta ordinati i valori in modo crescente, dobbiamo vedere se il numero di osservazioni è pari o dispari.

Abbiamo effettuato 25 osservazioni (n=25).

n è DISPARI!

Quando n è dispari, la mediana è esattamente il valore che sta nel mezzo (che divide in due le osservazioni)ed è il valore in posizione (n+1) / 2.

n = 25, significa che la mediana è il valore in posizione: (25+1)/2.

Ovvero 26/2 = 13

La mediana è il valore che si trova in posizione 13.

Andiamo a vedere qual è questo valore:

POSIZIONE PESO EFFETTIVO (in grammi)
1496
2496
3496
4496
5496
6498
7498
8498
9498
10498
11498
12498
13499
14499
15499
16499
17499
18499
19499
20500
21500
22502
23503
24503
25503
Osservazioni ordinate in modo crescente

Vediamo il valore in posizione 13 evidenziato in grassetto, ed è 499.

Me = 499

Esercizio 2 – Calcolo della mediana di una distribuzione di frequenze

Prendiamo i dati dell’esercizio precedente (Esercizio 1)e organizziamo la distribuzione unitaria semplice in una distribuzione di frequenze, ottenendo la seguente distribuzione:

X (peso)Frequenza assoluta
4965
4987
4997
5002
5021
5033
TOTALE (n)25

I dati in questa distribuzione di frequenze sono già ordinati in modo crescente, quindi non dobbiamo preoccuparci di ordinare i dati.

Sappiamo già, se abbiamo visto l’esercizio 1, quale sarà il valore della mediana. Lo scopo è quello di mostrare come si calcola la mediana quando anziché avere una distribuzione unitaria semplice (una lista)abbiamo di fronte una distribuzione di frequenza.

Verifichiamo subito qual è il numero di osservazioni (n), e sappiamo che è 25.

n dispari

Ripetiamo ancora una volta che quando n è dispari, la mediana è esattamente il valore che sta nel mezzo (che divide in due le osservazioni)ed è il valore in posizione (n+1) / 2.

Come nell’esercizio precedente, n = 25, significa che la mediana è il valore in posizione: (25+1)/2.

Ovvero 26/2 = 13

La mediana è il valore che si trova in posizione 13.

Per sapere qual è il valore che si trova in posizione 13, può essere utile aggiungere alle frequenze assolute, anche le frequenze cumulate:

X (peso)Frequenza assolutaFrequenza cumulata
49655
498712
499719
500221
502122
503325
TOTALE (n)25

Vediamo che nella terza riga il valore della frequenza cumulata è 19, mentre nella seconda riga è 11. Significa che il valore in posizione 13, è 499 (in corrispondenza della frequenza cumulata 19).

Come ci aspettavamo, la mediana è 499.

Me = 499

Esercizio 3 – Calcolo della mediana con n pari

Abbiamo pesato 26 confezioni di pasta di semola di grano duro da 500 grammi, per verificarne i pesi effettivi, e si sono ottenuti i seguenti dati:

PESO EFFETTIVO (in grammi)
499
498
503
502
496
499
503
500
498
499
500
496
499
498
503
496
499
499
496
499
498
498
496
498
498
504

Anche qui, riordiniamo i valori in modo crescente, e otteniamo la seguente lista:

POSIZIONE PESO EFFETTIVO (in grammi)
1496
2496
3496
4496
5496
6498
7498
8498
9498
10498
11498
12498
13499
14499
15499
16499
17499
18499
19499
20500
21500
22502
23503
24503
25503
26504
Osservazioni ordinate in modo crescente

Una volta riordinati i valori, ci chiediamo se n (il numero di osservazioni) è pari o dispari, e sappiamo essere pari (n=26).

Quando il numero di osservazioni (n) è pari, la mediana è data dal valore medio dei due valori centrali.

Quali sono i due valori centrali? Sono il valore in posizione n/2, ed il valore in posizione (n/2)+1.

Dal momento che n=26, i due valori centrali saranno:

n/2 = 26/2 = 13

(n/2)+1 = (26/2)+1 = 13 + 1 = 14

I due valori centrali sono quelli in posizione 13 e 14.

Andiamo ad evidenziarli nella nostra distribuzione:

POSIZIONE PESO EFFETTIVO (in grammi)
1496
2496
3496
4496
5496
6498
7498
8498
9498
10498
11498
12498
13499
14499
15499
16499
17499
18499
19499
20500
21500
22502
23503
24503
25503
26504
Osservazioni ordinate in modo crescente

Il valore in posizione 13 è 499. Anche il valore in posizione 14 è 499.

La media aritmetica dei due valori è data da:

(499+499)/2 = 499

Dunque la mediana è 499.

Me = 499

In questo caso è stato semplce calcolarla, perché i due valori centrali erano uguali (entrambi 499), ma anche quando sono diversi, il principio è lo stesso: si sommano i due valori, e si dividono per due (ottenendo così la media aritmentica dei due valori).

Esercizio 4 – Calcolo della mediana di una distribuzione per classi

La seguente tabella riassume il consumo in kw di un piccolo comune rilevato per 300 giorni:

Consumo giornaliero (in kw)Giorni (frequenza assoluta)
0 – 9950
100 – 19985
200 – 39965
400 – 59955
600 – 100045
TOTALE(n)300

Calcolare la mediana.

Anche in questo caso, i dati sono già ordinati in modo crescente, quindi non dobbiamo preoccuparci di ordinarli.

La distribuzione ci dice che per 50 giorni, si sono consumati tra gli 0 e i 99 kw nel comune. Per 85 giorni si sono consumati tra i 100 e i 199 kw, e così via.

Dal momento che abbiamo davanti una distribuzione di frequenze, è utile calcolare le frequenze cumulate, perché questo ci aiuterà a identificare la classe mediana.

Consumo giornaliero (in kw)Giorni (frequenza assoluta)Frequenza cumulata
0 – 995050
100 – 19985135
200 – 39965200
400 – 59955255
600 – 100045300
TOTALE(n)300

Adesso che abbiamo ordinato i dati e calcolato le frequenze cumulate, dobbiamo dividere n per due.

Sappiamo che n=300.

n/2 = 300/2 = 150

La classe mediana è quella in posizione 150

Come vediamo dalle frequenze cumulate, la classe in posizione 150 è la classe 200-399.

Adesso che abbiamo trovato la classe mediana, come facciamo a trovare la mediana?

Con un semplice metodo (detto metodo dell’interpolazione), che consiste nell’applicare questa formula:

Dove:

Linf è il limite inferiore della classe mediana.

fm è la frequenza assoluta della classe mediana.

n è il numero di osservazioni totali.

Finf è la frequenza cumulata della classe precedente a quella mediana (ovvero la somma delle frequenze assolute delle classi precedenti a quella mediana).

w è l’ampiezza della classe mediana.

Nel nostro esempio, il limite inferiore della classe mediana è 200 (ricordiamo che la classe mediana è 200-399). La frequenza assoluta della classe mediana è 65. Il numero di osservazioni totali (n)è 300, e la frequenza cumulata della classe precedente a quella mediana è 135.

L’ampiezza della classe mediana (w)è 199 (399 – 200 = 199).

Applicando la formula con questi dati, otteniamo:

La mediana, quindi, è uguale a 245,92.

Domande e risposte

Cos’è la mediana?

La mediana è un indice statistico che ci permette di sintetizzare il valore centrale di un carattere osservato. È quel valore che divide esattamente in due una distribuzione di frequenze.

Su quali tipi di caratteri si può calcolare la mediana?

La mediana può essere calcolata per caratteri quantitativi e anche per caratteri qualitativi ordinali (al contrario della media aritmetica, che può essere calcolata esclusivamente per caratteri quantitativi).

Video sulla mediana

Questo post ti è stato utile?

0 / 5 5 Voti: 7

Your page rank:

Exit mobile version