바이 모달 분포는 두 가지 모드가있는 확률 분포입니다.
데이터 세트에서 가장 일반적으로 발생하는 값을 나타 내기 위해 기술 통계에서 “모드”라는 용어를 자주 사용합니다. 하지만이 경우 “모드”라는 용어는 차트에서 로컬 최대 값을 나타냅니다.
바이 모달 분포를 시각화하면이 두 모드를 나타내는 두 개의 뚜렷한 “피크”를 볼 수 있습니다.
이것은 피크가 하나 뿐인 단봉 분포와 다릅니다.
다음을 기억하면 둘의 차이점을 기억할 수 있습니다.
- “bi”= 2
- “uni”= 1
대부분의 통계 과정은 정규 분포와 같은 단봉 분포를 사용하여 다양한 주제를 설명하지만 실제로는 쌍봉 분포가 실제로 상당히 자주 나타나므로이를 인식하고 해석하는 방법을 아는 것이 유용합니다.
p>
바이 모달 분포의 예
다음은 바이 모달 디의 몇 가지 예입니다. 분포 :
예제 # 1 : 음식점 피크 시간
특정 음식점의 고객 분포를 시간별로 시각화하는 그래프를 만들었다면 다음과 같은 결과를 얻을 수 있습니다. 점심 시간에 피크가 있고 저녁 시간에 또 다른 피크가있는 이봉 분포 :
예제 # 2 : 두 식물의 평균 키 종
당신이 들판을 돌아 다니면서 다른 식물의 높이를 측정했다고 가정 해 봅시다. 그것을 깨닫지 못한 채, 당신은 두 가지 다른 종의 키를 측정합니다. 하나는 키가 상당히 크고 다른 하나는 아주 짧습니다. 높이 분포를 시각화하기 위해 그래프를 만든 경우 이봉 분포를 따릅니다.
예제 # 3 : 시험 점수
선생님이 자신의 반 학생들에게 시험을 치른다 고 가정 해보십시오. 일부 학생들은 시험을 위해 공부했지만 다른 학생들은 그렇지 않았습니다. 교사가 시험 점수 그래프를 만들 때, 공부하지 않은 학생의 경우 낮은 점수를 중심으로 한 피크와 공부 한 학생의 경우 높은 점수를 중심으로 한 피크가있는 바이 모달 분포를 따릅니다.
바이 모달 분포의 원인은 무엇입니까?
일반적으로 바이 모달 분포의 원인은 두 가지입니다.
1. 일부 기본 현상.
몇 가지 기본 현상으로 인해 종종 바이 모달 분포가 발생합니다.
예를 들어, 사람들이 식사를하는 경향이 있기 때문에 매 시간 레스토랑을 방문하는 고객의 수는 바이 모달 분포를 따릅니다. 두 개의 다른 시간에 외출 : 점심과 저녁. 이 근본적인 인간 행동이 바이 모달 분포의 원인입니다.
2. 두 개의 서로 다른 그룹이 함께 모여 있습니다.
두 개의 서로 다른 그룹을 깨닫지 못한 채 단순히 분석 할 때도 바이 모달 분포가 발생할 수 있습니다.
예를 들어 높이를 측정하는 경우 두 개의 다른 종이 같은 밭에서 자라는 것을 알지 못한 채 특정 밭에서 식물을 재배하는 경우 차트를 만들 때 이봉 분포를 볼 수 있습니다.
양봉 분포 분석 방법
분포의 “중심”이 어디에 있는지 알 수 있으므로 평균 또는 중앙값을 사용하여 분포를 설명하는 경우가 많습니다.
안타깝게도 평균과 중앙값은 바이 모달 분포에 대해 아는 데 유용하지 않습니다. . 예를 들어 위 예에서 학생의 평균 시험 점수는 81 점입니다.
그러나 실제로 점수를 얻은 학생은 거의 없습니다. 81에 가깝습니다.이 경우 평균은 잘못된 것입니다. 대부분의 학생들은 실제로 약 74 점 또는 약 88 점을 받았습니다.
바이 모달 분포를 분석하고 해석하는 더 좋은 방법은 다음과 같습니다. 데이터를 두 개의 개별 그룹으로 나눈 다음 각 그룹의 중심과 스프레드를 분석합니다.
예를 들어 시험 점수를 “낮은 점수”와 “높은 점수”로 나눈 다음 찾을 수 있습니다. 각 그룹의 평균 및 표준 편차입니다.
일부 분석 결과를 공유하고 데이터가 바이 모달 분포를 따르는 경우 위와 같은 히스토그램을 생성하여 청중이 분포에 두 개의 서로 다른 “피크”가 있으며 하나의 큰 데이터 세트가 아닌 각 피크를 개별적으로 분석하는 것이 합리적이라는 것을 분명히 알 수 있습니다.