Onderwerpen

maandag 19 januari 2009

Over testen voor het LVS


Voor groepsonderzoek in het kader van een LVS vindt de Cotan dat er per groep ten minste 100 leerlingen in de steekproef moeten zitten.
Voor beslissingen op individueel niveau (bijvoorbeeld verwijzing naar het SBO) moeten dat tenminste 300 zijn. In de Schoolvaardigheidstoetsen van Boom test uitgevers is de kleinste groepsgrootte 423 (bij zinnen lezen A en B) en de grootste 948 (bij hoofdrekenen), gemiddeld zitten er circa 650 leerlingen per groep in de steekproef. Dat is in vergelijking met andere testen erg veel…


Ondanks dat kunnen er zeker op individueel, maar ook op groepsniveau ‘gekke dingen’ gebeuren. De gebruiker moet daar rekening mee houden. Een test is geen meetlat! Het is altijd een schatting en dan ook nog op een bepaald moment. In de handleiding bij de testen wordt daarvoor uitvoerig gewaarschuwd. En let op: de omstandigheden per school kunnen erg verschillen. Een praktijkvoorbeeld van de NTS (woorden): in de steekproef zaten twee scholen (openbaar en protestants-christelijk) in dezelfde wijk (zelfde ouderpopulatie). Het gemiddelde groepsniveau (dus de hele groep!) van groep 6 op de ene school lag een vol leerjaar boven de achteraf berekende norm, op de andere school lag dat gemiddelde groepsniveau van groep 6 een leerjaar lager dan de achteraf berekende norm. Dus, het verschil in niveau op de beide scholen bedroeg in groep 6 maar liefst twee leerjaren! Toch waren de omstandigheden ongeveer gelijk. Er was één verschil: de spellingmethode en de tijd die werd besteed aan het spellingonderwijs.
Toch mooi dat je dan tenminste nog íets (min of meer objectiefs) hebt, om je mee te vergelijken.
Let wel, we praten hier over signaleringstoetsen.

‘Vreemde voorvallen’ en ‘gekke afwijkingen’ horen er gewoon bij.
Zeker als het individuele gevallen betreft. Dat geldt ook voor de vergelijking van een resultaat op een eerder afgenomen versie van de test met de huidige. Met name wanneer je een leerling test met een spellingtest (waarbij dit verschijnsel in het bijzonder voorkomt) van systeem A en vervolgens met een spellingtest van systeem B, kan het voorkomen dat er grote verschillen ontstaan. In sommige gevallen gaat een leerling (ogenschijnlijk) ‘achteruit’. Dat is natuurlijk zelden of nooit het geval. Het ligt in die gevallen dan ook niet aan de leerling, maar aan de test. Bij het IPMON (de voorganger van DLE-LVS) hebben we dan ook afgesproken dat een eens behaalde DLE blijft staan. Dat geldt nog steeds!

Hoe kan zoiets nu worden voorkomen?
Het maken van een test is altijd een compromis. Om ‘uitschieters’ te voorkomen, zouden de leerlingen bij een te testen onderdeel ruim tweehonderd antwoorden moeten geven. Voor een dictee zou dat dus betekenen dat er ruim tweehonderd woorden in zouden moeten zitten. En dan ook nog woorden die er toe doen! Dus ‘de’, ‘het, en ‘een’ zouden we buiten beschouwing moeten laten. Dat is voor de praktijk niet haalbaar: het moet ook nog eens een keer worden nagekeken! Bovendien zou de testlast voor de leerling veel te groot worden. De dictees van de DLE-TEST spellen zinnen A en B zijn dan ook beperkt tot circa 60 woorden, waarvan circa 30 er toe doen. Bovendien is de test gefractioneerd: voor elke groep een stukje, hetgeen wil zeggen dat in het dictee maar een deel van de (in het algemeen in die groep aangeboden/behandelde) spellingproblemen aan de orde komt. Dan drukken we de scores ook nog eens uit in DLE’s, hetgeen veel ‘griezeliger’ is dan bijvoorbeeld de Cito-indeling (A = de 25% beste leerlingen). In het eerste geval zit je er sneller naast… Bij een indeling in de groep van de 25% beste leerlingen schiet je vaak raak. De 99-ste en de 76-ste van de honderd zijn beide A. Een afwijking valt daar dus minder snel op (lekker veilig voor de maker van de test…). Ook de Cotan vindt dat trouwens beter. Je uitspraak is meer ‘waar’ als je zegt dat de leerling tot het beste kwart van de groep behoort. De praktijk vraagt echter om meer. Dat een leerling tot het beste kwart behoort, hebben ze zelf meestal al vastgesteld… Natuurlijk is het belangrijk te weten of de leerling ‘bij’ is, maar men wil met name weten: ‘Hoeveel is de leerling vooruitgegaan sinds de vorige keer?’

Boom test uitgevers streeft daarom naar het maken van cumulatietesten (zoals hoofdrekenen en lezen zinnen A en B). Die hebben het voordeel dat ze


  • van gemakkelijk naar moeilijk zijn opgebouwd
  • de (zwakke) leerling daarom niet frustreren (scoren kan altijd)
  • de betere leerling de kans geven méér te laten zien
  • laten zien wat de leerling wél kan en niet wat de leerling niet kan
  • in één testbeurt meteen het eindniveau in beeld brengen
  • bij een volgende afname een vooruitgang (kunnen) laten zien
  • de leerling dus (ook) met zichzelf kunnen vergelijken
  • herhaald afneembaar zijn in meerdere groepen
  • daardoor weinig organisatie/administratie met zich mee brengen

Cito maakt domeintoetsen (een stukje uit de leerlijn dat aan de orde hoort te zijn in bijvoorbeeld de tweede helft van groep 6 [E6] wordt getoetst). Wanneer je daar als leerling nét niet aan toe bent, maak je heel veel fout. De volgende keer weet je de inhoud van E6 wel, maar helaas… M7 is aan de beurt en maak je weer heel veel fout… Bovendien, als de leerling ‘een E-tje’ blijkt te zijn (behoort tot de zwakste 10%), wat zegt dat dan nog? De vraag zou dan nog moeten zijn ’Hoe erg E ?’ De beste E-leerling kan in DLE’s wel drie jaar vóór liggen op de zwakste E-leerling. Anderzijds, ook tussen A-leerlingen kan er wel twee jaar niveauverschil bestaan … (!).

Boom test uitgevers wil de leerling ook en vooral vergelijken met zichzelf en minder met de groep.

Om praktische redenen kunnen er helaas niet voor alle onderdelen cumulatietesten worden gemaakt. Een tussenoplossing is de gefractioneerde cumulatietest (bijvoorbeeld rekenen/wiskunde). Ze hebben wel één lange DLE-schaal, maar kunnen in delen worden afgenomen.

Voor spellen en begrijpend lezen is het heel moeilijk om onze wensen te realiseren. We moeten daar helaas voor elke groep een apart (genormeerd) onderdeel maken. Je kunt kinderen uit groep 3 toch niet confronteren met woorden als accountant? Juist bij die testen zien we veel ‘afwijkingen’ en ‘merkwaardige verschijnselen’. Zo kan een leerling op een dictee voor groep 5 ‘alles’ fout maken en op het dictee voor groep 4 (omdat 5 te moeilijk was) ‘alles’ goed. Dat heeft wellicht te maken met het wél volledig begrijpen van de stof voor groep 4 en het nog niet begrijpen van de stof voor groep 5. Met een DLE-schaal kom je dan in de problemen: waar zit de leerling nu? Met een deviatieschaal was je in een keer uit de brand geweest: E (de zwakste 10%).
Een uitzondering wordt overigens het 150-woorden dictee (onveranderlijke woorden), dat qua constructie op reken/wiskunde lijkt en één lange DLE-schaal krijgt.