Social

Tech

Non avete mai capito cos’è la media

Pubblicato

il

statistica media

DISCLAMER: questo articolo parla a persone che non sanno cosa sia la statistica, pertanto i concetti vengono semplificati al massimo per essere digeriti da tutti, non vi arrabbiate se troverete alcune imprecisioni. Purtroppo la precisione assoluta ogni tanto deve essere sacrificata sull’altare della divulgazione.

Negli ultimi tempi mi è capitato di parlare con persone più o meno dotte in quanto a dati, statistiche, grafi… Insomma, tutta roba interessante per occupare un sabato sera, però mi sono accorto di una cosa: nessuno sa esattamente cosa sia una media. Quindi vi faccio questa semplice domanda: Che cos’è la media?
Beh, abbiamo una domanda, chiediamo a Wikipedia!

In statistica, la media è un singolo valore numerico che descrive sinteticamente un insieme di dati.

Questa frase non ci dice cos’è la media, bensì come viene usata. Questo è un problema perchè la gente la sa calcolare, la sa interpretare ma non sa cos’è. Bene, per capire tutto quanto facciamo un esempio: siete degli amanti dei cani e avete venti Labrador retriever della stessa età. Ora, siete curiosi e volete scoprire qual è il peso e l’altezza media di un Labrador, quindi prendete il vostro metro, la vostra bilancia per cani e misurate le vostre bestiole. Otterrete quindi venti valori per le altezze e venti per i pesi:

  • Altezze: 55.93, 72.23, 52.50, 56.08, 56.21, 64.05, 67.41, 59.93, 64.22, 60.16, 55.91, 69.97, 63.50, 46.24, 59.25, 65.49, 56.09, 55.4, 65.14, 57.99
  • Peso: 35.28, 31.46, 32.12, 31.57, 25.82, 37.34, 41.86, 34.65, 29.98, 36.69, 28.59, 37.42, 27.38, 33.36, 46.42, 38.27, 29.65, 37.41, 30.71, 43.50

Ora avte le vostre misure, potete calcolare la media, come si calcola? \(( \mu = \frac{1}{N}\sum_{i=1}^N x_i \) ok, non spavntatevi se non avete mai visto una sommatoria. Questa formula non vuol dire altro che: la media \(\mu\) è uguale alla somma di tutti i valori da 1 a N (dove N è il numero di cani, ovvero venti) diviso per N, ovvero il numero di cani. Se ci pensate un attimo è la media che tutti conosciamo. Perfetto, se fate questo calcolo con la calcolatrice vedrete che l’altezza media dei vostri cani è circa 60.12cm mentre il peso medio è di 34.47Kg. Ora siete contenti, sapete le misure medie dei vosri cani!

Passano i giorni e una vostra amica, anche lei patita di Labrador non si fida delle vostre misure, perchè i suoi venti labrador sembrano avere altezze e pesi diversi dai vostri. Arriva da voi, usa il vostro metro e la vostra bilancia, pesa i suoi cani e fa la media. La vostra amica torna sconcertata, l’altezza media dei suoi cani è di 60.01cm, mentre il peso medio è 34.01Kg, i valori non sono molto diversi dai vostri, eppure i vostri cani sembrano diversi. Proviamo a fare un grafico dove sull’asse delle x metteremo il peso dei cani e sull’asse delle y l’altezza.

Non avete mai capito cos'è la media 1

I vostri cani sono color miele, quelli della vostra amica sono neri. Riuscite ad avere qualche idea di cosa succede?

Sembra che i cani della vostra amica siano più “concentrati” in un punto rispetto ai vostri. Questo fa sorgere qualche domanda, ad esempio: è giusto dire che le i vostri cani e quelli della vostra amica sono uguali visto che hanno medie uguali? È quindi giusto usare la media come unico valore descrittivo di un insieme di dati? Esiste un modo per descrivere la dispersione dei dati?

La varianza e la deviazione standard

Medie uguali ma i cani sembrano diversi

Per capire cos’è efettivamente la media mettiamo in ordine i valori dell’altzza dei nostri cani: 58.63, 58.90, 58.96, 59.10, 59.24, 59.45, 59.48, 59.71, 59.81, 59.83, 59.84, 59.92, 59.93, 60.12, 60.65, 60.72, 61.14, 61.42, 61.53, 61.58, 61.72; il valore in grassetto è la media, notate qualcosa? La media è circa a metà della lista. Ecco, la media ci dà un’idea del “centro” dei valori. Ovviamente le cose non sono così semplici, quando si inizia ad andare a fondo con la statistica la media inizia a non essere sufficiente per descrivere certi fenomeni e vengono usate altre misure come mediana e moda. Però teniamoci sul semplice e consideriamo solo lla media.

La media ci dà un’iea sul punto centrale dei nostri dati, però perdiamo l’informazione relativa al quanto i nostri dati sono dispersi intorno ad essa. Ritornando all’esempio precedente sui labrador, i nostri labrador color miele sono molto più dispersi rispetto a quelli neri della nostra amica. La deviazione standard ci dice quanto i nostri valori sono dispersi intorno alla media (la varianza è semplicemente la deviazione standard al quadrato). Come si calcola la deviazione standard? \(\sigma = \sqrt{\frac{\sum_{i=1}^N(x_i + \mu)^2}{N}} \) ecco, calmi, la formula sembra difficile ma non lo è. In parole povere calcolate la vostra media \(\mu\), dopodichè sottraete ad ongi misura la vostra media, fate il quadrato di questi valori, li sommate, dividete per il numero di valori e fate la radice quadrata. Ok, sembra difficile, ma rileggete il passaggio un paio di volte e capirete. La deviaizone standard ci dice in media quanto i nostri valori sono dispersi intorno alla media. Tutto chiaro?

Bene, ora sapete calcolare la deviazione standard e la varianza! Calcolate la varianza per i valori dei vostri cani e di quelli della vostra amica (per la varianza bata non fare la radice quadrata nella formula della deviazione standard) e cosa viene fuori?

  • Varianza dell’altezza dei labrador miele: 13.66
  • Varianza dell’altezza dei labrador neri: 0.96
  • Varianza del peso dei labrador miele: 42.38
  • Varianza del peso dei labrador neri: 3.26

Come si poteva intuire dal grafico i nostri labrador miele hanno una varianza maggiore rispetto a quelli neri, quindi sono più dispersi intorno alla media, mentre quelli neri sono più concentrati intorno alla media.

Medie diverse, ma i cani sembrano simili

Facciamo finta voi abbiate un altro amico appassionato di labrador, gli raccontate l’esperienza con la vostra amica e il vostro amico decide di misurare anche i propri cani. I vostri cani sembrano quindi vi aspettate che la sua media non sia diversa dalla vostra. Il vostro amico misura i suoi cani, fa le meie ma scopre che i suoi risultati sono abbastanza diversi dai vostri. La media del peso dei suoi cani è 21.93Kg mentre la media dell’altezza è 50.77, eppure i vostri labrador sembrano simili.

Non avete mai capito cos'è la media 2

Qui pensavate che le media dei vostri cani siamo simili vinsto che molti di loro si somigliano, eppure i numeri vi dano torto. Avete una mezza idea del perchè?

Calcolate la varianza dei cani del vostro amico e scoprite che la varianza del peso è 78.75 mentre quella dell’altezza è 71.92, quindi? Quindi la varianza dei labrador del vostro amico è talmente alta che, nonostante le medie siano diverse, molti dei vostri cani si somigliano.

Riassumiamo

La media è un valore che ci dà un’idea del valore “centrale dei nostri dati” mentre la varianza (o analogamente la deviazione standard) ci dice quanto i nostri valori sono dispersi intono alla media. Che cosa bisogna portare a casa da tutto questo ragionamento? Beh, innanzitutto che la media non ci dice tutto. Ci dà un andamento generale dei dati, ma usare solo quella rischia di portarci in grossi errori di valutazione. Poi è quasi scontato che qualsiasi media non rispetta la popolazione globale. Se per esempio volete scoprire l’altezza media di un italiano, cosa fate? Riuscirete mai a raccogliere i dati di tutti i 60 milioni di italiani? Ovvio che no. Ne raccoglierete il maggior numero possibile, ne farete la media e ne calcolerete l’intervallo di confidenza (ovvero un range di valori nel quale siete sicuri al 80,90,95,99% di trovare la vera media della popolazione). Pertanto bisogna stare attenti a come vengono raccolti e analizzati i dati.

Bene, in questo articolo abbiamo capito cos’è una media, come si calcola e quali sono gli errori di interpretazione in cui potete incappare e che qualcuno può usare per cambiare la vostra opinione su qualcosa. D’ora in poi miraccomando: chiedete sempre la varianza!

Seguici sulla nostra Pagina Facebook, sul profilo Instagram ed entra nel nostro gruppo su Telegram.

Una triennale in Biotecnologie e una Magistrale in Biologia Computazionale a Trento. Un'amore per la chitarra, il fai da te, la procrastinazione e tutto ciò che può essere analizzato in python o R con un grafico.

Advertisement
Clicca per commentare

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Popolari