Het belangrijkste voordeel van normreferentietests is dat ze informatie kunnen verschaffen over hoe de prestatie van een individu op de test zich verhoudt tot die van anderen in de referentiegroep.
Een ernstige beperking van normreferentietests is dat de referentiegroep mogelijk niet de huidige populatie van interesse vertegenwoordigt. Zoals opgemerkt door de website van de International Personality Item Pool van het Oregon Research Institute: “Men moet zeer voorzichtig zijn met het gebruik van conserven” normen omdat het niet voor de hand ligt dat men ooit een populatie zou kunnen vinden waarvan de huidige steekproef een representatieve deelverzameling is. De meeste normen zijn misleidend, en daarom mogen ze niet worden gebruikt. Veel verdedigbaarder zijn lokale normen, die ontwikkelt men zich. Als men bijvoorbeeld feedback wil geven aan leden van een klas leerlingen, moet men de score van elk individu relateren aan de middelen en standaarddeviaties die van de klas zelf zijn afgeleid. Om de informativiteit te maximaliseren, kan men de leerlingen met de frequen cy-verdeling voor elke schaal, gebaseerd op deze lokale normen, en de individuen kunnen dan hun eigen scores op deze relevante verdelingen vinden (en omcirkelen). ”
Normverwijzing garandeert niet dat een test geldig is (dat wil zeggen dat het het construct meet dat het bedoeld is om te meten).
Een ander nadeel van normgerelateerde tests is dat ze niet meet de voortgang van de bevolking als geheel, alleen daar waar individuen binnen het geheel vallen. Men moet eerder meten aan de hand van een vast doel, bijvoorbeeld om het succes te meten van een onderwijshervormingsprogramma dat ernaar streeft de prestaties van alle studenten te verhogen.
Met een normgerelateerde toets was het cijferniveau traditioneel ingesteld op het niveau van de middelste 50 procent van de scores. Daarentegen is de National Children s Reading Foundation van mening dat het essentieel is om ervoor te zorgen dat vrijwel alle kinderen lezen op of boven het niveau van de derde klas, een doel dat niet kan worden bereikt met een normgerelateerde definitie van leerjaar.
Normen impliceren niet automatisch een norm. Een test met een norm waarnaar wordt verwezen, is niet bedoeld om de verwachting af te dwingen van wat testpersonen zouden moeten weten of kunnen. Het meet het huidige niveau van de testpersonen door de testpersonen te vergelijken met hun leeftijdsgroep. Een op rang gebaseerd systeem produceert alleen gegevens die vertellen welke studenten gemiddeld presteren, welke studenten het beter doen en welke studenten het slechter doen. Het identificeert niet welke testpersonen in staat zijn om de taken correct uit te voeren op een niveau dat acceptabel zou zijn voor werk of vervolgopleiding.
Het uiteindelijke doel van het beoordelen van curven is het minimaliseren of elimineren van de invloed van variatie tussen verschillende instructeurs van dezelfde cursus, zodat de studenten in een bepaalde klas worden beoordeeld ten opzichte van hun leeftijdsgenoten. Dit omzeilt ook problemen die samenhangen met het gebruik van meerdere versies van een bepaald onderzoek, een methode die vaak wordt gebruikt wanneer de data van de testafname variëren tussen de klassen. Ongeacht enig verschil in moeilijkheidsgraad, reëel of waargenomen, zorgt de beoordelingscurve voor een evenwichtige verdeling van academische resultaten.
Gebogen beoordeling kan echter het concurrentievermogen tussen studenten vergroten en hun gevoel van facultaire rechtvaardigheid in een klasse. Studenten zijn over het algemeen het meest van streek in het geval dat de curve hun cijfer verlaagt in vergelijking met wat ze zouden hebben gekregen als er geen curve was gebruikt. Om ervoor te zorgen dat dit niet gebeurt, doen docenten meestal moeite om ervoor te zorgen dat de toets zelf al moeilijk genoeg is wanneer ze van plan zijn een beoordelingscurve te gebruiken, zodat ze verwachten dat de gemiddelde student een lagere ruwe score krijgt dan de beoogde score. worden gebruikt bij het gemiddelde in de curve, zodat alle studenten profiteren van de curve. Gebogen kwaliteiten kunnen dus niet blindelings worden gebruikt en moeten zorgvuldig worden overwogen en overwogen in vergelijking met alternatieven zoals criteriumgerelateerde sortering. Bovendien kan constant misbruik van curved grading de cijfers van slecht ontworpen toetsen aanpassen, terwijl assessments zo moeten zijn ontworpen dat ze de leerdoelen die door de docent zijn vastgesteld nauwkeurig weergeven.