Podstawową zaletą testów z odniesieniem do norm jest to, że mogą one dostarczyć informacji o tym, jak wyniki danej osoby w teście wypadają w porównaniu z innymi w grupie odniesienia.
Poważnym ograniczeniem testów odniesienia do norm jest to, że grupa odniesienia może nie reprezentować aktualnie interesującej nas populacji. Jak zauważył w witrynie internetowej Oregon Research Institute „International Personality Item Pool”: „Należy bardzo uważać na używanie konserw” norm „ponieważ nie jest” oczywiste, że kiedykolwiek można było znaleźć populację, której obecna próbka jest reprezentatywnym podzbiorem. Większość „norm” wprowadza w błąd i dlatego nie należy ich stosować. O wiele łatwiejsze do obrony są normy lokalne, które ktoś się rozwija. Na przykład, jeśli chce się przekazać informacje zwrotne członkom klasy uczniów, należy odnieść wynik każdej osoby do średnich i odchyleń standardowych pochodzących z samej klasy. Aby zmaksymalizować informatywność, można zapewnić uczniom z częstotliwością cy rozkład dla każdej skali, w oparciu o te lokalne normy, a osoby mogą następnie znaleźć (i zakreślić) swoje własne wyniki na tych odpowiednich rozkładach. ”
Odwoływanie się do norm nie gwarantuje, że test jest prawidłowy (tj. mierzy konstrukcję, którą ma mierzyć).
Kolejną wadą testów odwołujących się do norm jest to, że nie mogą mierzyć postęp populacji jako całości, tylko wtedy, gdy jednostki należą do całości. Należy raczej mierzyć względem ustalonego celu, na przykład mierzyć sukces programu reform edukacyjnych, który ma na celu poprawę osiągnięć wszystkich uczniów.
W przypadku testu opartego na normach poziom klas był tradycyjnie ustawić na poziomie wyznaczonym przez środkowe 50 procent wyników. Z kolei National Children s Reading Foundation uważa, że zasadnicze znaczenie ma upewnienie się, że praktycznie wszystkie dzieci do trzeciej klasy czytają na poziomie lub powyżej klasy, co jest celem, którego nie można osiągnąć za pomocą odwołującej się do normy definicji poziomu.
Normy nie implikują automatycznie standardu. Test odwołujący się do normy nie ma na celu narzucenia jakichkolwiek oczekiwań co do tego, co osoby badane powinny wiedzieć lub być w stanie zrobić. Mierzy obecny poziom osób badanych poprzez porównanie osób badanych z ich rówieśnicy. System oparty na rangach generuje tylko dane, które mówią, którzy uczniowie radzą sobie na średnim poziomie, którzy uczniowie radzą sobie lepiej, a którzy gorzej. Nie określa, którzy zdający są w stanie poprawnie wykonać zadania na poziomie, który byłby akceptowalny dla zatrudnienia lub dalszej edukacji.
Ostatecznym celem krzywych ocen jest zminimalizowanie lub wyeliminowanie wpływu zróżnicowania między różni instruktorzy tego samego kursu, zapewniając, że studenci w danej klasie są oceniani w stosunku do rówieśników. Pozwala to również uniknąć problemów związanych z wykorzystywaniem wielu wersji danego egzaminu, metody często stosowanej, gdy daty wykonania testu różnią się w poszczególnych sekcjach klasy. Bez względu na różnice w poziomie trudności, rzeczywistym lub postrzeganym, krzywa ocen zapewnia zrównoważony rozkład wyników w nauce.
Jednak zakrzywione ocenianie może zwiększyć konkurencyjność między studentami i wpłynąć na ich poczucie sprawiedliwości wydziałowej w klasa. Studenci są na ogół najbardziej zdenerwowani, gdy krzywa obniżyła ich ocenę w porównaniu do tego, co otrzymaliby, gdyby nie zastosowano krzywej. Aby upewnić się, że tak się nie stanie, nauczyciele zwykle dokładają starań, aby sam test był wystarczająco trudny, gdy zamierzają zastosować krzywą ocen, tak że spodziewaliby się, że przeciętny uczeń uzyska niższy wynik pierwotny niż wynik zamierzony być używane na średniej krzywej, dzięki czemu wszyscy uczniowie skorzystają z krzywej. W związku z tym gatunków zakrzywionych nie można stosować na ślepo i należy je dokładnie rozważyć i przemyśleć w porównaniu z alternatywami, takimi jak klasyfikacja oparta na kryteriach. Co więcej, ciągłe nadużywanie zakrzywionych ocen może skorygować oceny w źle zaprojektowanych testach, podczas gdy oceny powinny być zaprojektowane tak, aby dokładnie odzwierciedlały cele nauczania wyznaczone przez instruktora.