En bimodal fordeling er en sannsynlighetsfordeling med to modi.
Vi bruker ofte begrepet «modus» i beskrivende statistikk for å referere til den mest forekommende verdien i et datasett , men i dette tilfellet refererer begrepet «modus» til et lokalt maksimum i et diagram.
Når du visualiserer en bimodal fordeling, vil du legge merke til to forskjellige «topper» som representerer disse to modusene.
Dette er annerledes enn en unimodal fordeling som bare har en topp:
Du kan huske forskjellen mellom de to ved å huske:
- «bi» = to
- «uni» = en
Selv om de fleste statistikkurs bruker unimodale distribusjoner som normalfordeling for å forklare forskjellige emner, vises bimodale distribusjoner faktisk ganske ofte i praksis, så det er nyttig å vite hvordan man gjenkjenner og tolker dem.
Eksempler på bimodale distribusjoner
Her er noen eksempler på bimodal di distribusjoner:
Eksempel nr. 1: Topp restauranttimer
Hvis du opprettet en graf for å visualisere fordeling av kunder på en bestemt restaurant etter time, vil du sannsynligvis oppdage at den følger en bimodal fordeling med en topp i lunsjtiden og en annen topp i løpet av middagstiden:
Eksempel # 2: Gjennomsnittlig høyde på to planter arter
Anta at du gikk rundt et felt og målte høyden på forskjellige planter. Uten å vite det måler du høyden på to forskjellige arter – en som er ganske høy og en annen som er ganske kort. Hvis du opprettet en graf for å visualisere høydefordelingen, vil den følge en bimodal fordeling:
Eksempel # 3: Eksamen skårer
Anta at en lærer gir eksamen til elevklassen sin. Noen av studentene studerte til eksamen, mens andre ikke gjorde det. Når læreren lager en graf over eksamenspoengene, følger den en bimodal fordeling med en topp rundt lave score for studenter som ikke studerte og en annen topp rundt høye poeng for studenter som studerte:
Hva forårsaker bimodale distribusjoner?
Det er vanligvis to ting som forårsaker bimodale distribusjoner:
1. Noen underliggende fenomener.
Ofte oppstår bimodale fordelinger på grunn av noen underliggende fenomener.
For eksempel følger antall kunder som besøker en restaurant hver time en bimodal fordeling siden folk har en tendens til å spise ute i løpet av to forskjellige tider: lunsj og middag. Denne underliggende menneskelige atferden er det som forårsaker bimodal fordeling.
2. To forskjellige grupper blir klumpet sammen.
Bimodale distribusjoner kan også oppstå når du bare analyserer to forskjellige grupper av ting uten å innse det.
Hvis du for eksempel måler høyden på planter i et bestemt felt uten å innse at to forskjellige arter vokser i samme felt, vil du se en bimodal fordeling når du lager et diagram.
Hvordan analysere bimodale fordelinger
Vi beskriver ofte fordelinger ved hjelp av gjennomsnittet eller medianen, siden dette gir oss en ide om hvor «sentrum» av fordelingen ligger.
Dessverre er middelverdien og medianen ikke nyttig å vite for en bimodal fordeling. For eksempel er gjennomsnittlig eksamenspoeng for studenter i eksemplet ovenfor 81:
Imidlertid er det svært få studenter som faktisk scorer nær 81. I dette tilfellet er gjennomsnittet misvisende. De fleste studenter scoret faktisk rundt 74 eller rundt 88.
En bedre måte å analysere og tolke bimodale distribusjoner på er å bare del dataene i to separate grupper, analyser deretter senteret og spredningen for hver gruppe.
For eksempel kan vi dele opp eksamenspoengene i «lave poeng» og «høye poeng» og deretter finne gjennomsnittet og standardavviket for hver gruppe.
Hvis du deler resultatene av noen analyser og dataene dine følger en bimodal fordeling, er det nyttig å lage et histogram som de som er vist ovenfor, slik at publikum kan tydelig se at fordelingen har to forskjellige «topper», og at det bare er fornuftig å analysere hver topp separat i stedet for som et stort datasett.