Sluttord om klagesensur
Her er førsteamanuensis på NTNU, Arve Hjelseths, avsluttende ord i debatten om blind klagesensur.
OBS! Denne artikkelen er mer enn tre år gammel, og kan inneholde utdatert informasjon.
Det er vel snart på tide å avslutte ordskiftet i denne omgang, men siden Sindre Dueland har skrevet et nytt svar på mine innvendinger mot såkalt blind klagesensur, vil jeg knytte noen avsluttende kommentarer til hans siste innlegg.
Først: Dueland kommenterer nesten ikke den andre figuren han presenterer, men sier at den gir et mer nyansert bilde enn hovedinntrykket i figur 1 (at flere studenter taper enn tjener på blind klagesensur). Rent visuelt fremstår nok figur 2 som om han har et poeng, men den viser egentlig samme sak: Mens det skjer en femdobling av andelen som går fra bestått til stryk ved overgang fra åpen til blind klagesensur, er det bare en drøy tredobling av andelen som går fra stryk til bestått. Hovedbildet er altså det samme: Det er flere enn før som går både opp og ned, men veksten er størst til studenters ugunst. Jeg skal imidlertid la dette ligge.
Noe forenklet argumenterer Dueland på følgende måte: Ja, studenter som klager løper nå en betydelig større risiko enn før for å komme dårligere ut, men det er ikke et argument mot blind klagesensur. I stedet viser det at «det er for stor variasjon i skjønnet til sensorene». Blind klagesensur har hatt en positiv bieffekt gjennom å synliggjøre denne variasjonen, og institusjonene må prøve å redusere den. Det kan blant annet skje gjennom mer omhyggelig utvelging og skolering av sensorene, får vi vite.
Jeg har argumentert for at variasjonen i skjønn ofte skyldes at klagesensorene har dårligere forutsetninger for å gjøre en kompetent vurdering, fordi de bare har noen få besvarelser – av og til bare én – å lese. Dueland hevder at dette er en misforståelse: karakterene skal ikke normalfordeles eller måles opp mot hverandre.
Nå dokumenterte jeg i mitt første innlegg at det finnes elementer i karakterbeskrivelsene som nettopp forutsetter at en besvarelse leses opp mot andre. Men merk at å vurdere besvarelser relativt ikke er det samme som å normalfordele karakterene. Er en bunke på 50 besvarelser gjennomgående meget god, har jeg ingen motforestillinger mot å sette flere B enn C. Men jeg leser likevel besvarelsene i lys av helheten.
Hvem skal kontrollere
kontrollørene?
Arve Hjelseth
Typisk kan slik lesning arte seg omtrent som følger: etter å ha lest oppgavetekst og sensorveiledning, begynner sensor på de første besvarelsene. Rett som det er viser det seg at mange studenter drøfter eller vektlegger ting annerledes enn det som er forventet i sensorveiledningen. Ikke nødvendigvis feil, men litt på siden av saken. Hvis mønsteret gjentas i de fleste besvarelsene, kan konklusjonen likevel bli at sensorveiledningen har bommet på forventningene like mye som studentene har bommet på spørsmålet. Inntrykket av disse besvarelsene blir i så fall bedre enn det var i utgangspunktet (i andre tilfeller kan dette naturligvis gå motsatt vei).
En klagesensor som får 1-2 besvarelser får ikke mulighet til å gjøre en slik omvurdering. Jeg er trygg på at dette er en viktig årsak til at så mange flere får endret karakter ved blind klagesensur. Selvsagt kunne man ønske seg mindre variasjon mellom sensorer, men denne variasjonen er ganske sikkert betydelig større mellom en ordinær kommisjon og en klagekommisjon, enn mellom to sensorer som leser mange oppgaver fra samme bunke.
Når jeg sensurerer en større bunke sammen med en medsensor, forekommer det nesten aldri at det er to hele karakterer sprik mellom våre forslag. I hvert fall er andelen slike sprik godt under én prosent. Ved blind klagesensur derimot, viser tallene Dueland presenterer at denne andelen er sju prosent. Konklusjonen jeg trekker av dette, er at det (som regel) ikke er sensorenes skjønn det er noe galt med (i så fall ville jo jeg og min medsensor også hatt to karakterer sprik i sju prosent av tilfellene), men at klagekommisjonen leser oppgavene under andre og dårligere forutsetninger.
Som skrivebordsteori kan nok ønsket om å forbedre sensorenes skjønn virke fornuftig, men jeg har sensurert tusenvis av besvarelser gjennom nesten 25 år, og ser det nok litt mer fra et praktisk ståsted, det vil si fra virkeligheten.
Men la oss si at det settes inn en storstilt innsats på skolering og kvalitetssikring av sensur: Hvem skal kontrollere kontrollørene? Hvem skal stå for skoleringen? Hvordan skal det kvalitetssikres? Kan man vedta seg til bedre skjønn? Hva vil det koste?
Logg inn med en Google-konto, eller ved å opprette en Commento-konto gjennom å trykke på Login under. (Det kan være behov for å oppdatere siden når man logger inn første gang)
Vi modererer debatten i etterkant og alle innlegg må signeres med fullt navn. Se Khronos debattregler her. God debatt!