Rozkład bimodalny to rozkład prawdopodobieństwa z dwoma trybami.
W statystykach opisowych często używamy terminu „tryb” w odniesieniu do najczęściej występującej wartości w zbiorze danych , ale w tym przypadku termin „tryb” odnosi się do lokalnego maksimum na wykresie.
Kiedy wizualizujesz rozkład bimodalny, zauważysz dwa odrębne „piki”, które reprezentują te dwa mody.
Różni się to od dystrybucji unimodalnej, która ma tylko jeden szczyt:
Możesz zapamiętać różnicę między tymi dwoma, pamiętając:
- „bi” = dwa
- „uni” = jeden
Chociaż większość kursów statystyki używa rozkładów unimodalnych, takich jak rozkład normalny, do wyjaśniania różnych tematów, rozkłady bimodalne w rzeczywistości pojawiają się dość często w praktyce, więc warto wiedzieć, jak je rozpoznać i zinterpretować.
Przykłady rozkładów bimodalnych
Oto kilka przykładów bimodalnych di rozwiązania:
Przykład 1: Szczytowe godziny otwarcia restauracji
Jeśli utworzyłeś wykres przedstawiający rozkład klientów w określonej restauracji według godziny, prawdopodobnie stwierdzisz, że jest to rozkład bimodalny ze szczytem w godzinach lunchu i kolejnym szczytem w godzinach obiadowych:
Przykład 2: Średnia wysokość dwóch roślin gatunek
Załóżmy, że obchodzisz pole i mierzysz wysokość różnych roślin. Nie zdając sobie z tego sprawy, mierzysz wysokość dwóch różnych gatunków – jednego dość wysokiego i drugiego dość niskiego. Jeśli utworzyłeś wykres do wizualizacji rozkładu wysokości, byłby on zgodny z rozkładem bimodalnym:
Przykład 3: Egzamin wyniki
Załóżmy, że nauczyciel zdaje egzamin dla swojej klasy uczniów. Niektórzy uczniowie przygotowywali się do egzaminu, inni nie. Kiedy nauczyciel tworzy wykres wyników egzaminów, jest on oparty na rozkładzie bimodalnym z jednym szczytem wokół niskich wyników dla uczniów, którzy nie uczyli się, a drugim wokół wysokich wyników dla uczniów, którzy się uczyli:
Co powoduje dystrybucje bimodalne?
Zazwyczaj są dwie rzeczy, które powodują dystrybucje bimodalne:
1. Niektóre podstawowe zjawiska.
Rozkłady bimodalne często występują z powodu pewnych ukrytych zjawisk.
Na przykład liczba klientów, którzy odwiedzają restaurację w ciągu godziny, jest rozkładem bimodalnym, ponieważ ludzie zwykle jedzą w dwóch różnych porach: obiad i kolacja. To podstawowe ludzkie zachowanie jest przyczyną dwumodalnej dystrybucji.
2. Dwie różne grupy są łączone razem.
Rozkłady bimodalne mogą również wystąpić, gdy po prostu analizujesz dwie różne grupy rzeczy, nie zdając sobie z tego sprawy.
Na przykład, jeśli mierzysz wysokość roślin na określonym polu, nie zdając sobie sprawy, że dwa różne gatunki rosną na tym samym polu, podczas tworzenia wykresu zobaczysz rozkład bimodalny.
Jak analizować rozkłady bimodalne
Często opisujemy rozkłady przy użyciu średniej lub mediany, ponieważ daje nam to wyobrażenie o tym, gdzie znajduje się „środek” rozkładu.
Niestety, średnia i mediana nie są przydatne w przypadku rozkładu bimodalnego . Na przykład średni wynik egzaminu dla uczniów w powyższym przykładzie to 81:
Jednak bardzo niewielu uczniów faktycznie uzyskało blisko 81. W tym przypadku średnia jest myląca. Większość uczniów w rzeczywistości uzyskała wynik około 74 lub około 88.
Lepszym sposobem analizy i interpretacji rozkładów bimodalnych jest po prostu podziel dane na dwie oddzielne grupy, a następnie przeanalizuj środek i rozrzut dla każdej grupy.
Na przykład możemy podzielić wyniki egzaminów na „niskie wyniki” i „wysokie wyniki”, a następnie znaleźć średnią i odchylenie standardowe dla każdej grupy.
Jeśli udostępniasz wyniki jakiejś analizy, a Twoje dane mają rozkład bimodalny, pomocne jest utworzenie histogramu takiego jak ten pokazany powyżej, aby odbiorcy wyraźnie widać, że rozkład ma dwa odrębne „piki” i że ma sens tylko analizowanie każdego piku oddzielnie, a nie jako jednego dużego zbioru danych.