For efterhånden lang tid siden sendte jeg et brev til Bertel Haarder, hvor jeg kommenterede hans holdning om tests i Folkeskolen. Mit brev er efterfulgt af hans svar, som kom kort tid efter. Hans svar efterlader mig desværre ikke med nogen opfattelse af, at han forstod min besked, men ingen vil efterfølgende kunne sige, at han ikke er blevet gjort opmærksom på de pointer, jeg trækker frem.
Til Undervisningsministeriet vedrørende brug af tests i Folkeskolen
Kære Bertel Haarder,
I forbindelse med den svage faglighed i det danske skolesystem, som bl.a. PISA-undersøgelsen har antydet, har vi gennem medierne flere gange hørt din forgænger i Undervisningsministeriet komme med udtalelser om, at der er brug for flere prøver i skolerne.
Gennem mit arbejde har jeg et godt kendskab til brugen af målinger (dvs. prøver) udarbejdet med henblik på forbedringer af arbejdsproces og -effektivitet, idet jeg som ingeniør og projektleder i en succesfuld virksomhed har været ansvarlig for udarbejdelse af den del af den interne procesforbedring, der beskæftiger sig med målinger og analyser.
Måling og analyse er stærke værktøjer i en procesforbedring, og det er således ganske sikkert, at gode målinger og efterfølgende analyser kan bidrage væsentligt til forbedring af en proces - herunder også indlæringsprocessen blandt danske elever. Alligevel er jeg på baggrund af mine erfaringer med måling og analyse noget skeptisk overfor Undervisningsministeriets ønsker om flere prøver i skolerne. Der er to primære svagheder i ønsket, som jeg vil komme ind på i det følgende.
1. Valg af målinger
Det er yderst vigtigt, at prøver og målinger udvælges omhyggeligt og korrekt, og det er ikke helt så nemt, som det måske lyder. Industriens anbefalede metode til udvælgelse af prøver foregår efter "goals-questions-metrics"-modellen, der i korte træk er opbygget som følger:
- Mål. Først sætter man sig nogle mål. I det danske skolesystems faglighed kunne et oplagt mål f.eks. være: "Eleverne skal være bedre til at læse".
- Spørgsmål. Her skal man identificere spørgsmål, hvis svar vil lede til det mål, man har sat sig. Hvis målet er forbedring af elevernes læseevner, vil et relevant spørgsmål f.eks. være: "Hvad er det, der forhindrer eleverne i at lære at læse?"
- Metrikker. Her etableres målemetoder, der helst skulle give svar på de ovenfor stillede spørgsmål. Hvis spørgsmålet er, hvad der forhindrer eleverne i at lære at læse, vil relevante målinger f.eks. bestå af måling af afsat tid til hver enkelt elev, de enkelte elevers niveau, kvaliteten af undervisningsmaterialet og undervisningen, muligheden og motivationen for at læse biblioteksbøger i fritiden, osv.
Det er min opfattelse, at Undervisningsministeriet fokuserer på målingen af de enkelte elevers niveau. Denne måling er relevant (jeg har f.eks. medtaget den ovenfor), men den giver ikke i sig selv anledning til svar, idet måling af elevernes niveau alene giver ikke svar på spørgsmålet om, hvad der forhindrer eleverne i at lære at læse. Hvis målet er at øge elevernes læseevner, siger en måling af deres læsefærdigheder mindre om elevernes evner end om, hvor godt procesforbedringen - dvs. forbedringen af elevernes læseevne - virker. Målingen er kort sagt ikke selv en løsning, men et mål for, hvor godt den valgte løsning virker. At tro, at flere prøver vil gøre eleverne fagligt stærkere svarer til at tro, at en overvægtig person vil tabe sig, hvis blot han køber nogle flere badevægte.
Undervisningsministeriet har forklaret, at tests af færdighederne skal benyttes til at vurdere, hvilke elever, der skal sættes ind overfor. Men årsagen til elevens manglende færdigheder kan ofte skyldes helt andre forhold end eleven selv (støjniveau, lærerens metode, m.m.), hvilket betyder, at en højnet indsats overfor de enkelte elever vil betyde spildte ressourcer i alle de tilfælde, hvor det ikke er eleverne selv, der er begrænsningen.
Jeg er ikke overbevist om, at Undervisningsministeriets forudsætning for, og brug af, målinger bygger på en model, hvor målingerne udspringer af spørgsmål, hvis svar vil give klarhed om opnåelsen af det ønskede mål. Jeg vil anbefale Undervisningsministeriet at overveje hvilke spørgsmål, der skal søges svar på, for at nå de ønskede mål om forbedring af elevernes faglighed, og først derpå overveje målinger. Det er desværre mit indtryk, at den tidligere undervisningsminister med sit stærke fokus på målinger har angrebet problemet fra den helt forkerte side, hvor målet i praksis er ignoreret til fordel for midlet. Og hvis målingen er forkert valgt, kan der kun forventes udgifter, ikke positive resultater.
2. Konkurrence
Jeg gætter på, at ønsket om flere prøver til eleverne er stærkt motiveret af en ideologi om, at prøverne vil skabe konkurrence, som vil motivere eleverne til at forbedre sig. Umiddelbart kan denne tanke måske virke rimelig, men i den pågældende implementation vil den have nogle alvorlige, uønskede bivirkninger:
- For det første skaber konkurrence ofte differentiation. Dette konkurrenceaspekt kan have positive følger i nogle sammenhænge, men i en skoleklasse er undervisningen mest effektiv i en fagligt forholdsvis homogen gruppe. Det er uheldigt, hvis der i en skoleklasse findes en lille gruppe særligt stærke elever i en klasse, der ikke bliver stimuleret nok, og det er uheldigt, hvis der findes en lille gruppe svage elever, der trækker niveauet ned. I begge tilfælde kan det samlede faglige niveau forventes at blive lavere end i en klasse, hvor undervisningen passer til alle.
- For det andet advares der i industrien stærkt mod brugen af procesforbedringsmålinger til evaluering af de enkelte ansatte. Det er ganske vist fristende at fastlægge en persons løn - eller personens karakterer og status i forhold til andre elever, hvis det er en skoleelev - ud fra det, målingerne siger om personens effektivitet. Uanset om det måtte ske for at rationalisere lønudgifterne eller motivere/true til personlig udvikling, så viser erfaringerne i industrien dog, at når de ansatte får fornemmelsen af, at de bliver målt og vejet, går det ud over deres motivation og dermed produktivitet. I et industriprojekt er udvikling og effektivitet et team-arbejde, der afhænger af, at alle er motiverede og følger med i projektet. I en sådan kontekst er det direkte skadeligt at demotivere dele af et team. Oversat til en skoleklasse vil det f.eks. kunne optræde sådan, at nogle elever vil føle sig "målt, vejet og fundet for lette", og vil ikke være motiverede til at deltage i klassens undervisning. De vil i stedet forstyrre de stærkere elever, så klassens samlede niveau falder. En succesfuld forbedring af læsefærdigheder skal måle elevernes generelle niveau og undervisningens effektivitet, ikke de enkelte elever.
Det er et velkendt fænomen inden for procesforbedring, at man optimerer det, som man måler på. Derfor kan det umiddelbart lyde som en særdeles god idé at vælge at måle elevernes faglige evner, idet det automatisk vil anspore til et større fokus på at få gode karakterer. Nogle elever vil sandsynligvis også få bedre karakterer, hvis der sættes ind med oftere målinger af deres faglige niveau. Men hvis det er enkeltpersoner, man måler, er det ikke det samlede niveau, der således bliver bedre.
Konkurrence motiverer ikke til samarbejde; tværtimod vil dygtige elever undgå at hjælpe de mindre dygtige, ikke blot på grund af ønsket om elimination af konkurrenter, men også fordi børn normalt satser på kortsigtede belønninger, idet børnene endnu ikke har opnået den nødvendige perspektivering, der får dem til at forstå, at de på længere sigt selv får noget ud af at løfte klassens samlede niveau. Nok vil konkurrence kunne skabe enkelte faglige spidskandidater i en klasse, men det vil ske på bekostning af klassens samlede niveau. Modsvarende vil fagligt svage elever hurtigt glide ind i en rolle som mennesker, der "alligevel ikke kan lære noget", og som derfor i endnu mindre grad end før bidrager positivt til klassens faglige niveau.
Bottom line for de to ovennævnte bivirkninger er, at det er en alvorlig fejl at benytte tests til at vurdere de enkelte elever, også selv om man har til hensigt at give tilbud til de enkelte elever, som klarer sig dårligt i prøverne, eller har til hensigt at give læreren et værktøj til at se, hvilke elever, læreren skal sætte ind overfor.
Det er ikke væsentligt for denne diskussion at tage moralsk stilling til, om det er uheldigt for de enkelte elever, at der skabes fagligt svage eller stærke elever, for det må i en vis udstrækning opfattes som et politisk/ideologisk spørgsmål. Jeg vil også undlade at komme nærmere ind på, om ensidig fokus på faglighed er fordelagtigt, eller om det er problematisk at opfatte Folkeskolen som en virksomhed, der har til formål at producere arbejdskraft til den danske industri i stedet for mennesker til det danske samfund.
Baggrunden for hele diskussionen er derimod, at der målt over hele landet er en lav faglighed i forhold til vore omkringliggende lande, uanset hvordan man så måtte vælge at tolke resultatets værdi for samfundet. Det er meget vigtigt at konstatere, at hvis de aktuelle undersøgelser af danske elevers faglighed viser, at det samlede faglige niveau er for lavt over hele landet, så kan det ikke være de enkelte elever, der er noget galt med, men derimod undervisningen generelt, eller en tredje faktor, som der ikke er fokus på.
Valget af en model, der ser (flere) tests af de enkelte elevers færdigheder som løsningen på problemet, er desværre netop et udtryk for, at man mener, det er eleverne, der er noget galt med. Det vil være groft uansvarligt af Undervisningsministeriet at lægge ansvaret for løsningen af problemet over på elevernes skuldre, som om børnene ville være i stand til at løse et problem, som de voksne har skabt. Det vil være en alvorlig fejl at gøre eleverne til syndebukke, når det ikke er elevernes skyld. (Og hvis det ikke er eleverne, den er gal med, så er det som tidligere nævnt også spild af ressourcer at sætte ind overfor eleverne.)
Undervisningsministeriet går således i en meget uheldig retning, hvis Undervisningsministeriet vælger at bruge flere færdighedsprøver som en metode til forbedring af danske elevers faglige niveau. Jeg vil i stedet kraftigt anbefale Undervisningsministeriet at følge den velafprøvede metode, som succesfulde virksomheder har gjort brug af, og som jeg har skitseret i begyndelsen af dette brev.
Oplagte alternative målinger, der har relevans for elevernes færdigheder, men som ikke måler de enkelte elevers færdigheder, kan bl.a. være:
- Hvor mange lærere underviser i deres hovedfag?
- Hvad er lærernes kvalifikationer?
- Hvor megen tid har lærerne til hver elev?
- Hvor højt er støjniveauet i klasserne?
- Hvad er effekten af at give tosprogede elever modersmålsundervisning?
- Hvad er kvaliteten af undervisningsmaterialet?
- Hvordan benytter eleverne skole- og folkebibliotekerne?
Jeg er opmærksom på, at ønsket om flere tests i Folkeskolen kun er ét blandt flere tiltag, som Undervisningsministeriet ønsker at gennemføre. De andre tiltag har jeg bevidst undladt at forholde mig til i denne henvendelse, idet jeg alene ønsker at advare mod følgerne af at fokusere på elev-tests, samt opfordre til, at tests i stedet bør udformes på en sådan måde, at de vurderer den del af undervisningen, der ikke udgøres af eleverne selv, når nu et faldende landsgennemsnit indikerer, at problemet ikke er eleverne. Sådanne korrekt udvalgte tests kan identificere svagheder i den samlede undervisning og komme med fingerpeg om, hvor undervisningen kan forbedres, så landets samlede faglige niveau kan øges.
Med venlig hilsen,
Ole Wolf
Svar fra Bertel Haarder
Kære Ole Wolf
Mange tak for dit interessante og oplysende brev. Din grundige gennemgang af fordele og ulemper ved testning af elever i folkeskolen holdt mig under læsningen lidt på pinebænken, indtil jeg ved slutningen af brevet kan konstatere, at de farer, der kan være forbundet med testning, ikke vil blive aktuelle med den styrkelse af evalueringskulturen, som er fremlagt i det nye regeringsgrundlag.
De test, som regeringen vil indføre i folkeskolen, skal ses i sammenhæng med en række andre initiativer, herunder dokumentation af folkeskolens resultater, oprettelse af et nyt råd for evaluering og kvalitetsudvikling i folkeskolen samt et styrket kommunalt tilsyn med skoler. Det er i denne sammenhæng, at de mange relevante spørgsmål, som du anbefaler, at vi bør stille, vil blive behandlet.
De nationale obligatoriske test i læsning, matematik, engelsk og naturfag vil indgå i en samlet evalueringsværktøjskasse, som blandt andet indeholder en vejledning om løbende evaluering og fagspecifikke værktøjer.
Testene skal være et værktøj til at sikre faglige fremskridt for den enkelte elev og understøtte, at undervisningen målrettes den enkelte elev. Testene skal hverken bruges til offentliggørelse af resultater eller til at rangordne skoler og elever. Testene skal anvendes fremadrettet i forbindelse med vejledning af den enkelte elev, undervisningens videre planlægning og underretning af forældrene.
Der vil blive tale om test baseret på forskning og de nyeste internationale erfaringer, såkaldte profiltest. Karakteristisk for profiltestene er, at de er diagnostiske - det vil i skolesammenhæng sige, at de anvendes fremadrettet - og it-baserede og adaptive. Vurderingen af elevens præstation udtrykkes i en profilbeskrivelse af elevens standpunkt og udviklingsmuligheder.
Jeg er opmærksom på, at medierne i forbindelse med omtale af de nationale, obligatoriske test, kan have givet lyttere og seere det indtryk, at der er tale om, at eleverne nu skal testes, fordi internationale undersøgelser som PISA-undersøgelserne har vist, at danske elever klarer sig ringe inden for grundlæggende færdigheder som læsning og naturfag.
Jeg er endvidere opmærksom på, at test ikke er et middel til at opnå bedre resultater, men et værktøj, der kan være med til at skabe opmærksomhed om den enkelte elevs faglige udvikling. Testene skal være med til at sikre, at det i tide opdages, hvis en elev tilegner sig fagene langsommere - eller hurtigere - end forventet.
Det er den samlede brede vifte af initiativer, som er fremlagt i det nye regeringsgrundlag, som skal rette op på de utilfredsstillende faglige resultater.
Med venlig hilsen
Bertel Haarder