Una distribuzione bimodale è una distribuzione di probabilità con due modalità.
Usiamo spesso il termine “modalità” nelle statistiche descrittive per fare riferimento al valore più comune in un insieme di dati , ma in questo caso il termine “modalità” si riferisce a un massimo locale in un grafico.
Quando visualizzi una distribuzione bimodale, noterai due “picchi” distinti che rappresentano queste due modalità.
Questo è diverso da una distribuzione unimodale che ha un solo picco:
Puoi ricordare la differenza tra i due ricordando:
- “bi” = due
- “uni” = uno
Sebbene la maggior parte dei corsi di statistica utilizzi distribuzioni unimodali come la distribuzione normale per spiegare diversi argomenti, le distribuzioni bimodali in realtà compaiono abbastanza spesso nella pratica, quindi è utile sapere come riconoscerle e interpretarle.
Esempi di distribuzioni bimodali
Ecco alcuni esempi di distribuzione bimodale distribuzioni:
Esempio n. 1: ore di punta del ristorante
Se hai creato un grafico per visualizzare la distribuzione oraria dei clienti in un determinato ristorante, probabilmente scoprirai che segue un distribuzione bimodale con un picco durante lora di pranzo e un altro picco durante lorario di cena:
Esempio n. 2: altezza media di due piante specie
Supponi di aver girato intorno a un campo e misurato laltezza di diverse piante. Senza rendertene conto, misuri laltezza di due specie diverse: una piuttosto alta e unaltra piuttosto corta. Se hai creato un grafico per visualizzare la distribuzione delle altezze, seguirebbe una distribuzione bimodale:
Esempio n. 3: esame punteggi
Supponiamo che un insegnante dia un esame alla sua classe di studenti. Alcuni studenti hanno studiato per lesame, mentre altri no. Quando linsegnante crea un grafico dei punteggi degli esami, segue una distribuzione bimodale con un picco intorno ai punteggi bassi per gli studenti che non hanno studiato e un altro picco intorno ai punteggi alti per gli studenti che hanno studiato:
Che cosa causa le distribuzioni bimodali?
Di solito sono due le cose che causano le distribuzioni bimodali:
1. Alcuni fenomeni sottostanti.
Spesso le distribuzioni bimodali si verificano a causa di alcuni fenomeni sottostanti.
Ad esempio, il numero di clienti che visitano un ristorante ogni ora segue una distribuzione bimodale poiché le persone tendono a mangiare in due momenti distinti: pranzo e cena. Questo comportamento umano sottostante è ciò che causa la distribuzione bimodale.
2. Due diversi gruppi vengono raggruppati insieme.
Le distribuzioni bimodali possono anche verificarsi quando stai semplicemente analizzando due diversi gruppi di cose senza rendertene conto.
Ad esempio, se misuri laltezza di piante in un determinato campo senza rendersi conto che due specie diverse stanno crescendo nello stesso campo, vedrai una distribuzione bimodale quando crei un grafico.
Come analizzare le distribuzioni bimodali
Descriviamo spesso le distribuzioni utilizzando la media o la mediana poiché questo ci dà unidea di dove si trova il “centro” della distribuzione.
Sfortunatamente, la media e la mediana non sono utili da conoscere per una distribuzione bimodale . Ad esempio, il punteggio medio dellesame per gli studenti nellesempio sopra è 81:
Tuttavia, pochissimi studenti hanno effettivamente ottenuto vicino a 81. In questo caso, la media è fuorviante. La maggior parte degli studenti ha effettivamente ottenuto un punteggio compreso tra 74 o 88.
Un modo migliore per analizzare e interpretare le distribuzioni bimodali è è sufficiente suddividere i dati in due gruppi separati, quindi analizzare il centro e lo spread per ciascun gruppo.
Ad esempio, possiamo suddividere i punteggi degli esami in “punteggi bassi” e “punteggi migliori” e poi trovare la media e la deviazione standard per ogni gruppo.
Se condividi i risultati di alcune analisi e i tuoi dati seguono una distribuzione bimodale, è utile creare un istogramma come quelli mostrati sopra in modo che il tuo pubblico può vedere chiaramente che la distribuzione ha due “picchi” distinti e che ha senso analizzare ogni picco separatamente piuttosto che come un grande insieme di dati.