Den primære fordel ved normreferenstest er, at de kan give information om, hvordan en persons præstation på testen sammenlignes med andre i referencegruppen.
En alvorlig begrænsning af normreferenstest er, at referencegruppen muligvis ikke repræsenterer den nuværende befolkning af interesse. Som bemærket af Oregon Research Institute “International Personality Item Pool-websted,” Man skal være meget forsigtig med at bruge dåse ” normer “fordi det ikke er indlysende, at man nogensinde kunne finde en population, hvoraf den nuværende prøve er en repræsentativ delmængde. De fleste” normer “er vildledende, og derfor bør de ikke bruges. Langt mere forsvarlige er lokale normer, som man udvikler sig selv. For eksempel, hvis man ønsker at give feedback til medlemmer af en klasse af studerende, skal man relatere den enkelte persons score til de midler og standardafvigelser, der stammer fra selve klassen. For at maksimere informativitet kan man give de studerende med frekvensen cy-distribution for hver skala, baseret på disse lokale normer, og individerne kan derefter finde (og cirkulere) deres egne scores på disse relevante distributioner. ”
Normreferencer sikrer ikke, at en test er gyldig (dvs. at den måler konstruktionen, den er beregnet til at måle).
En anden ulempe ved normhenviste tests er, at de ikke kan måle fremskridt for befolkningen som helhed, kun hvor enkeltpersoner falder inden for helheden. Man skal snarere måle sig mod et fast mål, for eksempel at måle succesen med et uddannelsesreformprogram, der søger at øge præstationen for alle studerende.
Med en norm-refereret test var klassetrin traditionelt indstillet til det niveau, der er angivet af de midterste 50 procent af scoringerne. Derimod mener National Childrens Reading Foundation, at det er vigtigt at sikre, at stort set alle børn læser på eller over klassetrin efter tredje klasse, et mål, der ikke kan opnås med en normeret refereret definition af klassetrin.
Normer indebærer ikke automatisk en standard. En norm-henvist test søger ikke at håndhæve nogen forventning om, hvad testtagere skal vide eller være i stand til at gøre. Den måler testpersonens nuværende niveau ved at sammenligne testtagerne med deres jævnaldrende. Et rangbaseret system producerer kun data, der fortæller, hvilke studerende der presterer på et gennemsnitligt niveau, hvilke studerende der gør det bedre, og hvilke studerende der gør dårligere. Det identificerer ikke, hvilke testtagere, der er i stand til korrekt at udføre opgaverne på et niveau, der er acceptabelt for beskæftigelse eller videreuddannelse.
Det endelige mål med graderingskurver er at minimere eller eliminere indflydelsen af variation mellem forskellige instruktører på samme kursus, hvilket sikrer, at eleverne i en given klasse vurderes i forhold til deres jævnaldrende. Dette omgår også problemer forbundet med brugen af flere versioner af en bestemt undersøgelse, en metode, der ofte anvendes, hvor testadministrationsdatoer varierer mellem klasseafsnittene. Uanset forskelle i sværhedsgraden, ægte eller opfattet, giver karakterkurven en afbalanceret fordeling af akademiske resultater.
Bøjet gradering kan dog øge konkurrenceevnen mellem studerende og påvirke deres følelse af fakultetets retfærdighed i en klasse. Studerende er generelt mest ked af det tilfælde, at kurven sænkede deres karakter sammenlignet med hvad de ville have modtaget, hvis en kurve ikke blev brugt. For at sikre, at dette ikke sker, lægger lærere normalt anstrengelser for at sikre, at selve testen er hård nok, når de har til hensigt at bruge en karakterkurve, således at de forventer, at den gennemsnitlige elev får en lavere rå score end den score, der er beregnet til bruges til gennemsnittet i kurven, hvilket sikrer, at alle studerende drager fordel af kurven. Således kan buede karakterer ikke bruges blindt og skal overvejes nøje og overvejes sammenlignet med alternativer såsom kriterier-henvist klassificering. Desuden kan konstant misbrug af buet klassificering justere karakterer på dårligt designede prøver, mens vurderinger skal designes til nøjagtigt at afspejle de læringsmål, som instruktøren har sat.