为什么要考试?什么是考试?——我们该怎么理解考试
中国一直以来被称为是“考试的故乡”,隋朝开始的科举考试可以说是世界上最古老的大规模考试。考试的传统似乎一直延续至今,中高考始终牵动着众多家长的心,学生们在学校里也始终面对着周考、月考、单元考、期中考、期末考、等级考形形色色的考试。
家长们回到家,见到孩子的第一句话便是:“今天考试了吗?考得怎么样?”;学校里老师找学生谈心,也少不了用数据说话:“你上次考试成绩退步了,下次要加油”;老师在微信群、家长会上发布考试成绩的时候,家长的心情也会随着自家孩子的成绩或升或降。
对于学生、家长甚至教师来说,他们每天与考试的交往是如此密切,甚至都没时间思考关于考试的一些基本问题。今天,就先从“为什么要考试”、“考试是什么”这两个问题入手,帮助读者更好地理解考试、日后更理性地对待考试。

为什么要考试:考试与教育评价
要想理解考试,首先要明白教育评价。简单来说,评价是一种衡定人或事物价值的行为,而教育评价则是在教育领域内发生的评价活动。教育评价的核心在于收集信息,基于或关于学生个人或关于学生集体的信息做出价值判断。老师对学生的观察、与学生的谈话、学生的作业情况、甚至家长分享的学生信息都可以是收集得来的信息。
在这种情况下,考试只是教育评价中收集信息的一种方式。那么为什么这种方式在学校内外都得到了重点关注呢?
原因之一在于考试是基于设计的。任何一次考试都是经过设计的,体现在考试的时间、题目的数量、题目的难度、题型的种类、分数的分配等各个方面。对于以上这些环节与元素的设计能够更加系统地反映考察的内容,同时也减少了信息收集中可能存在的随意性。比如,一名数学老师想要知道学生对于加法知识的掌握,当然可以通过在课堂中的个别抽问、分析学生作业等方式评价,但通过考试的方法,加法知识中数学老师认为必须掌握的知识点、题型全都能够呈现在考卷上(加法运算规律、应用题等等),考试收集到的信息的全面性非常明显。
更重要的原因在于考试成绩的可比较性。第一,所有学生都在同一时间段、同一地点、同样的条件下完成考试,保证了考试条件的公平。第二,考试提出了“分数”的统一单位,在平时的观察中,老师难以将关于1名同学“3次答对;1次开小差;2次作业全对”等消息汇总。但在考试中,所有参加考试的同学使用了同样的单位——分数。当信息具有同样的单位(分),老师能够比较学生自己的成绩变化、也可以比较同学之间的成绩差异,为进一步的判断打下基础。
看到这里,您可能认为我是考试的辩护人,想要论证考试的必要性与一切合理性,但时则刚好相反,我想说明的是考试并不完美、也没有那么神圣。
考试:它不过是一次抽样调查
考试只不过是一次抽样调查(sampling)。抽样调查指的是:在无法或不希望考察全体对象时,选出其中一个具有代表性的部分对象进行分析,并对总体情况进行估计。
不妨来想一想,我们要如何比较哪家水果店的水果更好吃?

水果店里的水果琳琅满目,我们首先不可能根据几家水果店的苹果的好吃程度来判断,这样过于狭隘。其次,如果我们派调查员把水果店的水果全都吃完分享“吃后感”,一是不确定调查员有没有这么大的胃口,二是好吃的标准因人而异,三(也是最重要的原因)是水果店老板肯定不会答应。在这种情况下,只能采取一种折中的方法——抽样,规定几种水果品种,让几名调查员根据某一标准进行打分,将最后的分数理解为这几家水果店的最后评分。
例子中的调查方法免不了受到你们的质疑,但考试的逻辑其实别无二致。
继续用数学考试举例,即便是小学数学中包含的数学知识内容,也足够充实到一张试卷无法囊括全部,并且同一个知识点有多种考察的题型、方式。与水果店的难题类似的是,我们既不想要只出关于基本四则运算的考题,又无法把想要测量的所有内容加入一张考卷上。迫于无奈,只能列出想要考察的模块:计算、图形、应用等,再在这些模块内设计、筛选出最具代表性的题目。一张试卷就这样拼凑出来了,就像是水果店测评中挑出来的2个火龙果、4个车厘子、3个丑柑、1根香蕉、半个西瓜。
测评过后,猜猜水果店店主会说什么?(尤其是在考试中得分较低的水果店的)
“明明我家的苹果和西瓜最好吃,真是不走运。”
在考试中,学生们的反应何尝不是这样呢?考试的目标也许是测评学生的数学能力,而实际上只是挑选出一些被认为具有代表性的数学题目,以估计/猜测学生的数学能力。在这个过程中,对考试分数的解读看似回应了考试的目标,但与实际考试的内容是存在错位、断层的。考试设计中是面临取舍的,尽管并非刻意为之,但最后的试卷可能是对一些学生更有利,对另外一些更不利的。

明白了考试这样的本质之后,我们应该怎样思考?首先,我们应当避免在没有分析考试内容的情况下全盘接受考试分数。如果一次数学考试重点考察图形部分,而这又是一些学生的“弱项”,我们在指责、批评这些在考试中表现不佳的学生前,应当下质疑这次考试作为考试的合理性——“这次考试与其说是数学考试,还不说是图形考试”的观点之后。另外,仍然要保证学生、孩子“吃到各种各样的水果”。不能因为数学考试只考计算或图形,就让他们只准备、巩固这方面内容,失去了领略其他知识的可能性。这一现象存在于所有学科,更存在于整体的学校教育。考试无法考察的要比能考察的多得多,道德发展、创造力、好奇心都无法被考试覆盖,如果只重视考试,更重要的成长可能就这么被忽视了。

总结:
考试是基于设计的、具有可比较性的教育评价的一种,能够全面系统地考察学生。考试类似“抽样调查”。在根据考试结果下判断前,应当分析考试内容本身。