표준 참조 테스트의 가장 큰 장점은 테스트에서 개인의 성능이 참조 그룹의 다른 사람과 비교되는 방식에 대한 정보를 제공 할 수 있다는 것입니다.
규범 참조 테스트의 심각한 한계는 참조 그룹이 현재 관심 인구를 나타내지 않을 수 있다는 것입니다. Oregon Research Institute의 International Personality Item Pool 웹 사이트에서 언급 한 바와 같이 “통조림 사용에 대해 매우주의해야합니다.” 왜냐하면 현재 표본이 대표적 부분 집합 인 모집단을 찾을 수 있다는 것이 분명하지 않기 때문입니다. 대부분의 “규범”은 오해의 소지가 있으므로 사용해서는 안됩니다. 훨씬 더 방어 할 수있는 것은 지역 규범입니다. 예를 들어, 한 학급의 구성원에게 피드백을주고 싶다면 각 개인의 점수를 학급 자체에서 도출 된 평균 및 표준 편차와 연관시켜야합니다. 정보 성을 극대화하기 위해 학생들에게 제공 할 수 있습니다. 주파수와 함께 이러한 지역 규범을 기반으로 각 척도에 대한 cy 분포를 사용하면 개인이 이러한 관련 분포에서 자신의 점수를 찾고 동그라미를 칠 수 있습니다. ”
표준 참조는 테스트가 유효한지 확인하지 않습니다 (즉, 측정하려는 구조를 측정 함).
표준 참조 테스트의 또 다른 단점은 테스트가 유효하지 않다는 것입니다. 개인이 전체에 속하는 경우에만 전체 인구의 진행 상황을 측정합니다. 오히려 모든 학생의 성취도를 높이기위한 교육 개혁 프로그램의 성공 여부를 측정하기 위해 고정 된 목표에 대해 측정해야합니다.
표준 참조 시험에서 학년 수준은 전통적으로 점수의 중간 50 %가 설정 한 수준으로 설정합니다. 대조적으로, National Children s Reading Foundation은 사실상 모든 어린이가 3 학년까지 학년 수준 이상의 읽기를 보장하는 것이 필수적이라고 믿습니다. 이는 표준 참조 학년 수준 정의로는 달성 할 수없는 목표입니다.
규범은 자동으로 표준을 의미하지 않습니다. 규범 참조 시험은 응시자가 알아야하거나 할 수 있어야 할 일에 대한 기대를 강요하지 않습니다. 응시자를 비교하여 응시자의 현재 수준을 측정합니다. 그들의 동료. 순위 기반 시스템은 어떤 학생이 평균 수준에서 성과를 냈는지, 어떤 학생이 더 잘하고, 어떤 학생이 더 나쁜지를 알려주는 데이터 만 생성합니다. 어떤 응시자가 취업 또는 추가 교육에 적합한 수준에서 작업을 올바르게 수행 할 수 있는지 식별하지 않습니다.
채점 곡선의 궁극적 인 목적은 다음과 같은 차이의 영향을 최소화하거나 제거하는 것입니다. 동일한 과정의 다른 강사를 통해 특정 수업의 학생들이 동료와 비교하여 평가되도록합니다. 이것은 또한 특정 시험의 여러 버전을 사용하는 것과 관련된 문제를 피할 수 있습니다. 시험 시행 날짜는 학급 섹션마다 다를 때 자주 사용되는 방법입니다. 실제 또는인지 된 난이도의 차이에 관계없이 채점 곡선은 학업 결과의 균형 잡힌 분포를 보장합니다.
그러나 곡선 채점은 학생 간의 경쟁력을 높이고 교수진의 공정성에 영향을 줄 수 있습니다. 수업. 학생들은 일반적으로 곡선이 사용되지 않았을 때받은 점수에 비해 점수가 낮아지는 경우에 가장 화가납니다. 이러한 일이 발생하지 않도록하기 위해 교사는 일반적으로 채점 곡선을 사용할 때 시험 자체가 충분히 어려운지 확인하기 위해 노력하여 평균 학생이 의도 한 점수보다 낮은 원점을받을 것으로 기대합니다. 곡선의 평균으로 사용되므로 모든 학생들이 곡선의 혜택을 누릴 수 있습니다. 따라서 곡선 등급은 맹목적으로 사용할 수 없으며 기준 참조 등급과 같은 대안에 비해 신중하게 고려하고 숙고해야합니다. 또한 곡선 채점을 지속적으로 오용하면 잘못 설계된 시험에서 성적이 조정될 수 있지만, 평가는 강사가 설정 한 학습 목표를 정확하게 반영하도록 설계되어야합니다.