En bimodal distribution er en sandsynlighedsfordeling med to tilstande.
Vi bruger ofte udtrykket “mode” i beskrivende statistikker for at henvise til den mest almindelige værdi i et datasæt , men i dette tilfælde refererer udtrykket “mode” til et lokalt maksimum i et diagram.
Når du visualiserer en bimodal fordeling, vil du bemærke to forskellige “toppe”, der repræsenterer disse to tilstande.
Dette er anderledes end en unimodal fordeling, der kun har en top:
Du kan huske forskellen mellem de to ved at huske:
- “bi” = to
- “uni” = en
Selvom de fleste statistikkurser bruger unimodale distributioner som normalfordelingen til at forklare forskellige emner, vises bimodale distributioner faktisk ret ofte i praksis, så det er nyttigt at vide, hvordan man genkender og fortolker dem.
Eksempler på bimodale fordelinger
Her er nogle eksempler på bimodal di fordelinger:
Eksempel nr. 1: Højeste restauranttimer
Hvis du oprettede en graf for at visualisere fordelingen af kunder på en bestemt restaurant i timen, ville du sandsynligvis finde ud af, at den følger en bimodal fordeling med et spidsbelastning i frokosttidene og et andet spidsbeløb i løbet af aftensmaden:
Eksempel # 2: Gennemsnitlig højde af to planter art
Antag at du gik omkring et felt og målte højden på forskellige planter. Uden at vide det måler du højden på to forskellige arter – en, der er ret høj og en anden, der er ret kort. Hvis du oprettede en graf for at visualisere højdefordelingen, ville den følge en bimodal fordeling:
Eksempel # 3: Eksamen score
Antag at en lærer aflægger en eksamen til sin klasse af studerende. Nogle af de studerende studerede til eksamen, mens andre ikke gjorde det. Når læreren opretter en graf over eksamensresultaterne, følger den en bimodal fordeling med en top omkring lave scores for studerende, der ikke studerede, og en anden top omkring høje score for studerende, der studerede:
Hvad forårsager bimodale fordelinger?
Der er typisk to ting, der forårsager bimodale fordelinger:
1. Nogle underliggende fænomener.
Ofte forekommer bimodale fordelinger på grund af nogle underliggende fænomener.
For eksempel følger antallet af kunder, der besøger en restaurant hver time, en bimodal fordeling, da folk har tendens til at spise ud i to forskellige tidspunkter: frokost og middag. Denne underliggende menneskelige adfærd er, hvad der forårsager den bimodale fordeling.
2. To forskellige grupper klumpes sammen.
Bimodale fordelinger kan også forekomme, når du simpelthen analyserer to forskellige grupper af ting uden at indse det.
Hvis du f.eks. Måler højden på planter i et bestemt felt uden at indse, at to forskellige arter vokser i samme felt, vil du se en bimodal fordeling, når du opretter et diagram.
Sådan analyseres bimodale fordelinger
Vi beskriver ofte fordelinger ved hjælp af middelværdien eller medianen, da dette giver os en idé om, hvor “centrum” for distributionen er placeret.
Desværre er middelværdien og medianen ikke nyttige at kende til en bimodal fordeling. F.eks. Er den gennemsnitlige eksamensscore for studerende i eksemplet ovenfor 81:
Imidlertid scorede meget få studerende faktisk tæt på 81. I dette tilfælde er gennemsnittet vildledende. De fleste studerende scorede faktisk omkring 74 eller omkring 88.
En bedre måde at analysere og fortolke bimodale fordelinger på er opdele blot dataene i to separate grupper, analyser derefter centrum og spredningen for hver gruppe.
For eksempel kan vi opdele eksamensresultaterne i “lave score” og “høje point” og derefter finde middel- og standardafvigelsen for hver gruppe.
Hvis du deler resultaterne af nogle analyser, og dine data følger en bimodal fordeling, er det nyttigt at oprette et histogram som dem, der er vist ovenfor, så dit publikum kan tydeligt se, at fordelingen har to forskellige “toppe”, og at det kun giver mening at analysere hver top separat i stedet for som et stort datasæt.