Som fysikkfakultet har jeg to jobber. Den første er trener. Jeg hjelper studentene å kjempe med konsepter og ideer. Det gjør meg til noe som Gregg Popovich fra San Antonio Spurs, men med flere ligninger. Jeg er også en evaluator. Jeg bestemmer hvor godt studentene forstår materialet jeg har lært dem. Ja, jeg synes det er rart at jeg gjør begge disse tingene. Det er som å få Popovich til å trene laget og dømme spillet. Men slik er det i utdanningen.
Vanligvis bruker jeg dette rommet til å snakke om hvordan jeg hjelper studentene til å forstå fysikk. (Eller jeg tenker på viktige spørsmål som om Spider-Man kan hoppe på en ferge eller Han Solo kan overleve lyshastighet.) I dag vil jeg snakke litt om evaluering — eller hva du kan kalle «gradering». Hvis du tenker på det, er det tre metoder du kan bruke her. Hvilken metode du bruker, avhenger av hvordan du ser på begrepet «karakterer» og hva du synes om studentpopulasjoner.
Tradisjonelle karakterer
Jeg er ikke sikker på at dette virkelig er «tradisjonelt», men jeg forestiller meg at dette er standardmetoden og den du kjenner best. Den fungerer slik: En student tar en test. Instruktøren vurderer den og bruker den numeriske poengsummen (si 78 av 100) for å bestemme en prosentandel og tildele en bokstavkarakter. Vanligvis representerer en A en poengsum på 90 til 100 prosent, a B representerer en poengsum på 80 til 89, og så videre, med noe mindre enn 60 prosent som en F. Førsteklasses skoler som tar ting på alvor, kan øke det litt slik at A er 93 til 100 prosent, en B er 85 til 92 prosent og så videre. Det vil vise deg at du mener virksomhet. Strengere skalaer virker spesielt populære blant videregående skoler. Jeg er ikke sikker på hvorfor.
Men tradisjonelle karakterer forutsetter at instrumentet brukes til å evaluere elevene (usua en test) er nøyaktig. Hvis hver elev scorer bra, tjener de alle A. Hvis alle bomber testen, feiler alle. Dette betyr at klassesnittet kan være hvilken som helst verdi, ikke bare en C. En slik test er som en linjal: Den måler elevene uten hensyn til noen annen faktor.
Gradering på en kurve
Ah, men hva om testen ikke er nøyaktig. Hva om du «har gjort det litt for vanskelig eller enkelt? Du kan» kurve «karakterene. Denne metoden forutsetter at studentpopulasjonen er en normal, eller i det minste stabil, fordeling. Gitt en normal (statistisk og atferdsmessig) klasse av elevene, forventer du at bare noen få tjener A og bare noen få mislykkes. Klassens gjennomsnitt bør være C.
Med denne metoden administrerer du testen og vurderer den. Etter å ha bestemt råpoengene, justerer du individuelt resultat slik at resultatene følger en normalfordeling med noen få studenter som får A og noen få F «s. Med andre ord, du lager en bjellekurve, etter hvilken beregning som trengs for å bruke rå score for å produsere den rapporterte graven. Med andre ord, den høyeste karakteren kan være en 93, så du kan gjøre en score på 83- 93 representerer en A.
Gradering på en kurve er mindre som en linjal enn et løp. Siden den antar at fordelingen bare inneholder noen få A-karakterer, må hver elev løpe til s. Fortsetter denne metaforen, spiller det ingen rolle hva løpetiden din er, bare at du kommer først (eller kanskje andre). Jeg antyder ikke at denne metoden er feil, bare at den har konsekvenser.
Studentene mine spør ofte: «Skal du gi karakter på en kurve?» Jeg mistenker at de virkelig spør: «Vil du legge til poeng i alles karakter?» Gradering på kurven betyr ikke å legge til poeng. Det betyr å justere karakterene slik at de samlede resultatene følger en normalfordeling. Selv om jeg ikke gir karakter på en kurve, har jeg alltid tenkt at det ville være morsomt å gjøre det med enkel test . Jeg tror elevene ville freak ut hvis de scoret 91 av 100 og tjente en C.
Ved andre tanker er det kanskje ikke en god idé.
Standardbasert gradering
Den tredje metoden, kalt standardbasert gradering, ser litt ut som tradisjonell gradering, men antar ikke testmetoden er pålitelig. I stedet antar det at det er aksepterte læringsstandarder. For mitt innledende fysikkurs kan disse standardene omfatte:
- Studentene kan utføre grunnleggende vektoroperasjoner: legge til, trekke fra, finne størrelse.
- Studentene kan bruke Momentum-prinsippet til å løse et interessant problem.
- Studentene kan bruke Work-Energy Principle til å løse et interessant problem.
- Etc .
Standardbasert vurdering handler ikke om score, men om ferdigheter. Noen lærere foretrekker detaljerte standarder, men jeg pleier å like mer generelle referanser. I begge tilfeller definerer standarder en ferdighet eller ferdighet du forventer at studentene skal ha. Å fullføre en test kan representere bare ett estimat av studentens forståelsesnivå.Kanskje du har dem til å komme tilbake til konseptet senere i semesteret med en annen måte å vise at de virkelig forstår det.
Jeg gjør dette på kursene mine. Jeg starter vanligvis hvert semester med et sett med standarder jeg deler med studentene mine. I løpet av semesteret quiz jeg dem med jevne mellomrom. Studenter som ikke presterer godt på quizen, kan lage en kort video der de løser et problem for å demonstrere sin forståelse. Jeg oppfordrer alle til å fortsette å lage problemløsende videoer gjennom hele semesteret for å forbedre standardpoengene.
Denne tilnærmingen fungerer bra etter min erfaring. Det legger vekt på hva elevene forstår, ikke hvordan de presterer på en test Og jeg synes det er overraskende hvor raskt videoene avslører hva en student forstår, og hvor de kan trenge hjelp. Du trenger ikke å bruke videoer, selvfølgelig. Det er mange måter å implementere standardbasert klassifisering på. Shawn Cornally, Frank Noschese og Andy Rundquist er tre personer med gode ideer. Hvis du leter etter litt hjelp, foreslår jeg at du begynner med disse tre.