Une distribution bimodale est une distribution de probabilité à deux modes.
Nous utilisons souvent le terme «mode» dans les statistiques descriptives pour désigner la valeur la plus courante dans un ensemble de données , mais dans ce cas, le terme «mode» fait référence à un maximum local dans un graphique.
Lorsque vous visualisez une distribution bimodale, vous remarquerez deux «pics» distincts qui représentent ces deux modes.
Ceci est différent dune distribution unimodale qui na quun seul pic:
Vous pouvez vous souvenir de la différence entre les deux en vous rappelant:
- « bi » = deux
- « uni » = un
Bien que la plupart des cours de statistiques utilisent des distributions unimodales comme la distribution normale pour expliquer différents sujets, les distributions bimodales apparaissent en fait assez souvent dans la pratique, il est donc utile de savoir comment les reconnaître et les interpréter.
Exemples de distributions bimodales
Voici quelques exemples de di stributions:
Exemple # 1: Heures de pointe du restaurant
Si vous avez créé un graphique pour visualiser la répartition des clients dans un certain restaurant par heure, vous constaterez probablement quil suit un Distribution bimodale avec un pic pendant les heures du déjeuner et un autre pic pendant les heures du dîner:
Exemple # 2: Hauteur moyenne de deux plantes espèces
Supposons que vous ayez fait le tour dun champ et mesuré la hauteur de différentes plantes. Sans vous en rendre compte, vous mesurez la hauteur de deux espèces différentes – une assez grande et une autre assez courte. Si vous créiez un graphique pour visualiser la distribution des hauteurs, il suivrait une distribution bimodale:
Exemple # 3: Examen scores
Supposons quun enseignant donne un examen à sa classe délèves. Certains des étudiants ont étudié pour lexamen, dautres pas. Lorsque lenseignant crée un graphique des scores aux examens, il suit une distribution bimodale avec un pic autour des scores faibles pour les élèves qui nont pas étudié et un autre pic autour des scores élevés pour les élèves qui ont étudié:
Quelles sont les causes des distributions bimodales?
Il y a généralement deux choses qui causent des distributions bimodales:
1. Certains phénomènes sous-jacents.
Les distributions bimodales se produisent souvent en raison de certains phénomènes sous-jacents.
Par exemple, le nombre de clients qui visitent un restaurant chaque heure suit une distribution bimodale puisque les gens ont tendance à manger à deux heures distinctes: déjeuner et dîner. Ce comportement humain sous-jacent est ce qui cause la distribution bimodale.
2. Deux groupes différents sont regroupés.
Des distributions bimodales peuvent également se produire lorsque vous analysez simplement deux groupes différents de choses sans vous en rendre compte.
Par exemple, si vous mesurez la hauteur de plantes dans un certain champ sans vous rendre compte que deux espèces différentes poussent dans le même champ, vous verrez une distribution bimodale lorsque vous créez un graphique.
Comment analyser les distributions bimodales
Nous décrivons souvent les distributions en utilisant la moyenne ou la médiane car cela nous donne une idée de lendroit où se trouve le «centre» de la distribution.
Malheureusement, la moyenne et la médiane ne sont pas utiles à connaître pour une distribution bimodale . Par exemple, la note moyenne à lexamen des élèves de lexemple ci-dessus est de 81:
Cependant, très peu délèves ont effectivement obtenu proche de 81. Dans ce cas, la moyenne est trompeuse. La plupart des élèves ont en fait obtenu un score autour de 74 ou autour de 88.
Une meilleure façon danalyser et dinterpréter les distributions bimodales est de divisez simplement les données en deux groupes distincts, puis analysez le centre et la répartition de chaque groupe.
Par exemple, nous pouvons diviser les résultats des examens en « scores faibles » et « scores élevés », puis trouver la moyenne et lécart type de chaque groupe.
Si vous partagez les résultats dune analyse et que vos données suivent une distribution bimodale, il est utile de créer un histogramme comme ceux indiqués ci-dessus afin que votre public peut clairement voir que la distribution a deux « pics » distincts et quil est logique danalyser chaque pic séparément plutôt que comme un grand ensemble de données.