Eine bimodale Verteilung ist eine Wahrscheinlichkeitsverteilung mit zwei Modi.
In beschreibenden Statistiken wird häufig der Begriff „Modus“ verwendet, um auf den am häufigsten vorkommenden Wert in einem Datensatz zu verweisen In diesem Fall bezieht sich der Begriff „Modus“ jedoch auf ein lokales Maximum in einem Diagramm.
Wenn Sie eine bimodale Verteilung visualisieren, werden Sie zwei unterschiedliche „Peaks“ bemerken, die diese beiden Modi darstellen.
Dies unterscheidet sich von einer unimodalen Verteilung mit nur einem Peak:
Sie können sich an den Unterschied zwischen den beiden erinnern, indem Sie sich an Folgendes erinnern:
- „bi“ = zwei
- „uni“ = eins
Obwohl die meisten Statistikkurse unimodale Verteilungen wie die Normalverteilung verwenden, um verschiedene Themen zu erklären, werden bimodale Verteilungen in der Praxis tatsächlich ziemlich häufig angezeigt. Daher ist es hilfreich zu wissen, wie man sie erkennt und interpretiert.
Beispiele für bimodale Verteilungen
Hier einige Beispiele für bimodale di stributions:
Beispiel 1: Spitzenzeiten im Restaurant
Wenn Sie ein Diagramm erstellt haben, um die Verteilung der Kunden in einem bestimmten Restaurant nach Stunden zu visualisieren, werden Sie wahrscheinlich feststellen, dass es a folgt bimodale Verteilung mit einem Peak während der Mittagspause und einem weiteren Peak während der Abendstunden:
Beispiel 2: Durchschnittliche Höhe von zwei Pflanzen Spezies
Angenommen, Sie haben ein Feld umrundet und die Höhe verschiedener Pflanzen gemessen. Ohne es zu merken, messen Sie die Höhe von zwei verschiedenen Arten – eine ziemlich groß und eine ziemlich kurz. Wenn Sie ein Diagramm erstellen, um die Höhenverteilung zu visualisieren, folgt es einer bimodalen Verteilung:
Beispiel 3: Prüfung Punktzahl
Angenommen, ein Lehrer gibt seiner Schülerklasse eine Prüfung. Einige der Studenten haben für die Prüfung studiert, andere nicht. Wenn der Lehrer ein Diagramm der Prüfungsergebnisse erstellt, folgt eine bimodale Verteilung mit einem Peak um niedrige Ergebnisse für Schüler, die nicht studiert haben, und einem weiteren Peak um hohe Ergebnisse für Schüler, die studiert haben:
Was verursacht bimodale Verteilungen?
Es gibt normalerweise zwei Dinge, die bimodale Verteilungen verursachen:
1. Einige zugrunde liegende Phänomene.
Oft treten bimodale Verteilungen aufgrund einiger zugrunde liegender Phänomene auf.
Beispielsweise folgt die Anzahl der Kunden, die stündlich ein Restaurant besuchen, einer bimodalen Verteilung, da die Menschen zum Essen neigen zu zwei verschiedenen Zeiten unterwegs: Mittag- und Abendessen. Dieses zugrunde liegende menschliche Verhalten verursacht die bimodale Verteilung.
2. Zwei verschiedene Gruppen werden zusammengefasst.
Bimodale Verteilungen können auch auftreten, wenn Sie einfach zwei verschiedene Gruppen von Dingen analysieren, ohne es zu merken.
Wenn Sie beispielsweise die Höhe von messen Pflanzen in einem bestimmten Feld, ohne zu bemerken, dass zwei verschiedene Arten auf demselben Feld wachsen, wird beim Erstellen eines Diagramms eine bimodale Verteilung angezeigt.
So analysieren Sie bimodale Verteilungen
Wir beschreiben Verteilungen häufig mit dem Mittelwert oder Median, da dies uns eine Vorstellung davon gibt, wo sich das „Zentrum“ der Verteilung befindet.
Leider sind Mittelwert und Median für eine bimodale Verteilung nicht nützlich Die durchschnittliche Prüfungspunktzahl für Schüler im obigen Beispiel beträgt beispielsweise 81:
Allerdings haben nur sehr wenige Schüler tatsächlich Punkte erzielt In diesem Fall ist der Mittelwert irreführend. Die meisten Schüler erzielten tatsächlich 74 oder 88.
Eine bessere Methode zur Analyse und Interpretation bimodaler Verteilungen ist: Teilen Sie die Daten einfach in zwei separate Gruppen auf, analysieren Sie dann das Zentrum und die Streuung für jede Gruppe.
Beispielsweise können wir die Prüfungsergebnisse in „niedrige Ergebnisse“ und „hohe Ergebnisse“ aufteilen und dann finden Mittelwert und Standardabweichung für jede Gruppe.
Wenn Sie die Ergebnisse einer Analyse teilen und Ihre Daten einer bimodalen Verteilung folgen, ist es hilfreich, ein Histogramm wie das oben gezeigte zu erstellen, damit Ihre Zielgruppe kann deutlich erkennen, dass die Verteilung zwei unterschiedliche „Peaks“ aufweist und dass es nur sinnvoll ist, jeden Peak separat zu analysieren und nicht als einen großen Datensatz.