Bimodální distribuce je distribuce pravděpodobnosti se dvěma režimy.
Termín „režim“ často používáme v popisné statistice k označení nejčastěji se vyskytující hodnoty v datové sadě , ale v tomto případě termín „režim“ označuje místní maximum v grafu.
Když si vizualizujete bimodální distribuci, všimnete si dvou odlišných „vrcholů“, které představují tyto dva režimy.
Toto se liší od unimodální distribuce, která má pouze jeden vrchol:
Rozdíl mezi těmito dvěma si můžete zapamatovat zapamatováním:
- „bi“ = dva
- „uni“ = jeden
Ačkoli většina kurzů statistiky používá k vysvětlení různých témat unimodální distribuce, jako je normální distribuce, bimodální distribuce se v praxi ve skutečnosti ukazují poměrně často, takže je užitečné vědět, jak je rozpoznat a interpretovat.
Příklady bimodálních distribucí
Zde je několik příkladů bimodálních di rozdělení:
Příklad č. 1: Špičková otevírací doba restaurace
Pokud jste vytvořili graf pro vizualizaci rozdělení zákazníků v určité restauraci podle hodin, pravděpodobně byste zjistili, že následuje bimodální distribuce s vrcholem v době oběda a dalším vrcholem v době večeře:
Příklad č. 2: Průměrná výška dvou rostlin druh
Předpokládejme, že jste obcházeli pole a měřili výšku různých rostlin. Aniž byste si to uvědomili, změříte výšku dvou různých druhů – jednoho, který je poměrně vysoký a druhého, který je poměrně krátký. Pokud jste vytvořili graf pro vizualizaci rozdělení výšek, následovalo by to bimodální rozdělení:
Příklad č. 3: Zkouška skóre
Předpokládejme, že učitel udělá zkoušku své třídě studentů. Někteří studenti studovali na zkoušku, zatímco jiní ne. Když učitel vytvoří graf skóre zkoušky, následuje bimodální rozdělení s jedním vrcholem kolem nízkého skóre pro studenty, kteří nestudovali, a druhým vrcholem s vysokým skóre u studentů, kteří studovali:
Co způsobuje bimodální distribuce?
Existují obvykle dvě věci, které způsobují bimodální distribuce:
1. Některé základní jevy.
Často dochází k bimodálním distribucím kvůli některým základním jevům.
Například počet zákazníků, kteří každou hodinu navštíví restauraci, sleduje bimodální distribuci, protože lidé mají tendenci jíst během dvou odlišných časů: oběd a večeře. Toto základní lidské chování je příčinou bimodální distribuce.
2. Dvě různé skupiny jsou spojeny dohromady.
Bimodální distribuce mohou také nastat, když jednoduše analyzujete dvě různé skupiny věcí, aniž byste si to uvědomili.
Například pokud změříte výšku rostliny v určitém poli, aniž byste si uvědomili, že ve stejném poli rostou dva různé druhy, uvidíte při vytváření grafu bimodální distribuci.
Jak analyzovat bimodální distribuce
Distribuce často popisujeme pomocí střední hodnoty nebo mediánu, protože nám to dává představu o tom, kde se nachází „střed“ distribuce.
Bohužel, střední hodnota a medián nejsou u bimodální distribuce užitečné. . Například průměrné skóre zkoušky u studentů ve výše uvedeném příkladu je 81:
Ve skutečnosti však velmi málo studentů skórovalo téměř 81. V tomto případě je průměr zavádějící. Většina studentů ve skutečnosti zaznamenala kolem 74 nebo kolem 88.
Lepším způsobem, jak analyzovat a interpretovat bimodální distribuce, je jednoduše rozdělte data do dvou samostatných skupin, poté analyzujte střed a rozpětí pro každou skupinu.
Například můžeme rozdělit skóre zkoušky na „nízké skóre“ a „vysoké skóre“ a pak najít průměr a směrodatná odchylka pro každou skupinu.
Pokud sdílíte výsledky nějaké analýzy a vaše data sledují bimodální distribuci, je užitečné vytvořit histogram podobný těm, které jsou uvedeny výše, aby vaše publikum jasně vidí, že distribuce má dva odlišné „vrcholy“ a že má smysl analyzovat každý vrchol zvlášť, nikoli jako jednu velkou datovou sadu.