Publikujeme text z Akademie Lidových noviny, který přehledně vysvětluje, jaké testy a k jakému účelu lze použít při plošném testování. Uděláte si v něm jasno, co znamenají pojmy srovnávací a ověřovací testy, percentil a jakým způsobem, a jestli vůbec lze měřit přidanou hodnotu školy.
Dnes a zítra si více než stovka základních škol vyzkouší centrální testování znalostí a dovedností žáků. Zatím půjde hlavně o ověřování technické stránky věci, i když se žáci přirozeně dozvědí, kterou otázku odpověděli správně a kterou špatně.
Za půl roku má proběhnout zkušební testování žáků pátých a devátých tříd na všech školách. Z něj už má být zřejmé, co a jakým způsobem budou testy, jež mají za další dva roky startovat naostro, vlastně měřit.
Zatím jsme slyšeli, že ověří, jestli si žáci osvojili alespoň ty nejzákladnější znalosti a dovednosti. Bylo ale taky řečeno, že se možná dozvíme, která škola je lepší a která horší, a dokonce že by testy mohly ukázat, jestli se dítě s přispěním školy zlepšuje, nebo jestli stagnuje.
Něco takového by mnozí nejspíš vítali, jenže zatím je ve veřejnosti, alespoň té, která je slyšet, patrná i skepse. Je to proto, že je systém testování nedořešený? Nebo jen nemáme dost informací, případně se pletou pojmy?
Když Honzík získá, Ivánek nutně ztratí
Když ministr školství Josef Dobeš řekl, že testové otázky dodají učitelé a z výsledků testů bude možné zjistit takzvanou přidanou hodnotu, protože se třeba ukáže, že škola dokázala Honzíka vytáhnout z percentilu sedmadvacet v páté třídě na percentil 83 v deváté třídě, psycholog Václav Mertin ho uzemnil: „Percentil vyjadřuje pořadí a nikoliv absolutní míru. Takže co Honzík získá, Ivánek musí nutně ztratit. I když dojde k posunu v percentilech, tak to ještě nemusí znamenat reálný posun.“
Ví ale každý, o čem je řeč? Nejspíš nikoliv. Zkusme si tedy některé pojmy ujasnit.
Není test jako test
V zásadě existují dva základní druhy testů: srovnávací a ověřovací. Čím se liší? Docela srozumitelné vysvětlení poskytuje soukromá společnost Scio, která má u nás s testováním nejdelší zkušenosti: „Úkolem srovnávacích testů je rozdělit testované na základě jejich vědomostí na škálu od nejlepších k nejhorším.“ K tomu účelu není zpravidla důležité, aby test pokryl vyčerpávajícím způsobem celý předem probraný předmět. Je však vhodné vybrat takové úlohy, které pomohou rozlišit lepší žáky od slabších. Tedy ne úplně nejsnazší úlohy. „V ideálním srovnávacím testu činí průměrná úspěšnost testovaných mezi 50 a 60 procenty správně zodpovězených úloh.“
Výsledné hodnocení pomocí percentilů však neříká, jaké procento úloh vyřešil účastník správně, ale jak se umístil. „Jinak vyjádřeno, kolik procent ostatních účastníků dosáhlo horšího výsledku než on. Například umístil-li se účastník na 93. percentilu, znamená to, že předstihl 93 procent ostatních a jen sedm procent ze všech testovaných bylo lepších,“ vysvětlují experti.
Úkolem ověřovacích testů je něco jiného. Mají ukázat, do jaké míry testovaný splňuje předem stanovená a známá kritéria (v daném případě takzvané standardy). Slovy odborníků ze Scia – testovaný není srovnáván s ostatními, ale s jakýmsi ideálním žákem, který učivo dokonale ovládá. Nejlepším možným výsledkem ověřovacího testu by byla situace, kdy by všichni testovaní dosáhli sta procent správných odpovědí. Přitom test by měl pokrývat všechny významné partie učiva.
Z řečeného je zřejmé, že pro testování, o jaké ministr Dobeš usiluje, jsou vhodnější testy ověřovací. A to přesto, že se o nich všeobecně (a dokonce i oficiálně) mluví jako o testech srovnávacích. Ostatně potvrdil nám to i Libor Vacek z České školní inspekce, která je garantem celého projektu státního testování páťáků a deváťáků. Na otázku, zda půjde o testy srovnávací, nebo ověřovací, řekl jasně – ověřovací. Mají ověřit, zda žáci zvládli standard, nebo ne a o kolik se mu vzdálili. Počítá se však s tím, že testy poskytnou i srovnání mezi školami, které zatím k dispozici nemáme. Snad jen potud by bylo označení „srovnávací“ vysvětlitelné. Problém je, že takové srovnání nemůže dost dobře postihnout skutečnou kvalitu školy. Všichni totiž víme, že škola je v podstatě tak „dobrá“, jak dobré nabere žáky, nebo jinak, z jakého prostředí tito žáci pocházejí a jak se jim rodiče věnují. Proto by nebylo fér říkat: tato škola je nejlepší, protože její žáci vyřešili správně nejvíce testových úloh, a tato je špatná, protože tam testy dopadly hůř. Je totiž docela možné, že takzvaně horší škola ve skutečnosti posunula své žáky o větší kus dopředu než ta nejlepší.
Lze ale zjistit, kterak se zásluhou školy změnily dovednosti žáka mezi dvěma sledovanými obdobími, například mezi 5. a 9. ročníkem základní školy?
Pomoci mohou kategorie
Podle metodika společnosti Scio Jana Hučína je zjištění takové přidané hodnoty školy ověřovacími testy v zásadě možné. „S jejich pomocí zjistíme, do které kategorie žák patří, neboli zda splnil požadavky pro určitou kategorii. Že se například v anglickém jazyce za minulý rok o dvě kategorie zlepšil. Je ovšem nutné mít testy, které umějí sledovat žáka po celou dobu na jedné škále,“ vysvětluje Jan Hučín.
Ani dětský psycholog Václav Mertin nevylučuje, že lze z testů vyvodit určité závěry o kvalitě a úspěšnosti školy. „Abyste mohli konstatovat, že něco přibylo a že někde přibylo víc a jinde méně, potřebujete mít nějaké pevné body. Výsledek konkrétního Fandy nebo třídy potřebujete vztáhnout k nějakým kritériím, tedy například k určité sumě znalostí a určité míře dovedností. Pak se stane, že škola (dítě) začne na splněných dvaceti procentech a ve srovnatelném testu po roce, dvou, pěti zjistíme, jak se posunulo naplňování kritérií, která byla stanovena pro daný ročník. Jedna škola se z dvaceti procent vytáhne na šedesát, zatímco druhá jen na čtyřicet. Výsledek Fandy není závislý na výsledcích ostatních.“
Třeba měl ministr na mysli něco jiného, než řekl
Mertin připouští, že ministr Dobeš, mohl mít na mysli něco takového, když mluvil o přidané hodnotě, ale z jeho vyjádření to, jak říká, jasné nebylo. „Vzhledem k tomu, že zmínil percentily, já jsem mu rozuměl tak, že z výsledků každého roku se vytvoří pořadí, a to se využije k zjištění efektu výuky.“
Václav Mertin také vysvětluje, že děti, které začínají vysoko, už pak nemají moc kam stoupat. „Vystoupají třeba z 93 procent na 98, což je vlastně vzhledem k jiné škole, která vytáhne děti třeba z původních dvaceti procent, málo.
A teď rozhodujme, co vlastně měřit a která škola je lepší? Ta, jejíž žáci vyřešili úspěšně nejvíc testových úloh, anebo ta, jejíž deváťáci jich vyřešili třeba jen necelou polovinu, ale od páté třídy to znamená významný pokrok?
Je zřejmé, že plošné testování je složitější záležitost, než se na první pohled zdá. Aby testy o něčem vypovídaly, bude třeba je ověřovat, pilovat a vyvažovat. Mají na to být dva roky. Za tu dobu se o nich, doufejme, dozvíme víc, než že je připravují učitelé.
Když se řekne:
Srovnávací testy – porovnávají testovaného s ostatními testovanými. Hodí se například k přijímacím zkouškám.
Ověřovací testy – neporovnávají testovaného s ostatními, ale s cílem, tedy s úplným a bezchybným zvládnutím učiva. Používají se hlavně pro účely klasifikace.
Percentil – vyjadřuje, kolik procent ostatních účastníků dosáhlo horšího výsledku než daný žák. Umístění na osmdesátém percentilu znamená, že předstihl 80 procent účastníků téhož testování.
Přidaná hodnota školy – vyjadřuje, jak se změnily znalosti a dovednosti žáka mezi dvěma testováními zásluhou školy.