刘昕素质教育提倡的是提高学生素质,使学生能生动、活泼、主动地学习,全面发展成为有用人才,从而为社会发展做出贡献。与此目标相悖的是学生死记硬背,负担过重,高分低能,身体素质下降,缺乏基本的政治素养和道德修养。要想真正实现素质教育的目标,考试改革无疑是一个重要的方面。由于素质教育不能没有考试,因此,如何考,考什么,认清考试的基本规律和已往改革的经验教训尤为必要。 教育考试可分为两类,一类是在校内随教学过程进行的诊断性的考试,目的是了解学习效果,用以督促和改进教学;另一类是在一个学习阶段之后进行的大规模的、超出了一个学校或班级范围的考试,这类考试的成绩往往用于评价学生与学校,安置学生升学或就业。我们应区别和认识这两类不同性质的考试,恰当地利用这两类考试。 目前的高考就是典型的大规模考试。除此以外,我国的会考,古代的科举考试,美国的托福、SAT、ACT,英国的GCSE,日本的共通一次试,台湾的大学联考等都是大规模的校外考试。综合分析,大规模考试有以下普遍规律和特点: 首先,从古今中外的考试实例可以看出,大规模的校外考试的举办都是社会的需要。考试是人类的一个社会活动。1300多年前的中国科举考试,被世界公认为考试的始祖。科举是中国封建社会选官的考试,是统治阶级治理社会的有效工具之一。在西方国家,因为考试尊重知识与人才并且打破了世袭的阶级地位,考试的引入和建立被看成是科学与民主的象征。 我国在文化大革命期间取消了高考,其带来的恶果,人们记忆犹新。在以邓小平同志为首的党中央拨乱反正、进行一系列改革的时候,其重要举措是恢复高考。恢复高考使民心大振,其意义也绝不止于教育本身。 对于教育内部,统一的大规模的考试是教育评价的有力工具。我国30年代的会考,其初衷就是为整顿中学办学而设立的。在西方国家,近年来为评估和监督教育也开发了一些联合考试和全国范围的测评项目。 其二,对于考试分数的竞争来自于考试的用途,它赋予了考试的“指挥棒”作用。以科举为例,通过考试可以“朝为田舍郎,暮登天子堂”,地位的改变,是巨大的吸引力。以高考为例,目前,高校录取率以应届高中毕业生为基数不到1/3,以同龄人为基数不到10%,其引起的竞争一直影响到初等教育。以高中毕业会考为例,当其成绩与高校招生“挂钩”时,则每个学生和学校都不敢怠慢;当不“挂钩”时,又不够重视。以体育考试为例,当其计入升学总分时,学生拼命练“达标”,不计入的项目则不重视。来自考试背后的竞争可能会因为经济与教育的发展、升学率的提高,有所缓和,但是不会消除。例如日本、美国,对将来就业前途好的学校和专业,竞争十分激烈。因此考试不是竞争的根源,而是人们目前认为比推荐、比其他手段更公平的一个竞争手段。 其三,考试通过其内容及难度对教学发生直接的影响。科举考试在盛唐时期开设诗经、算学、武术等几十科,广开才路,对学术和社会发展起到了促进作用;到了清末,只限四书五经,连“辅导材料”也限于“朱批”,限制了言路和科技发展,使自身走向了灭亡,也使国力受到极大削弱。目前,高考的范围、难度、内容也在影响着中学的教学。这几年对考查能力的强调,如史料分析、图表分析、应用题等,在中学起到了一些好作用。但也存在一些需进一步改革的方面,尤其是难度,较高的难度使不少学生和学校感到吃力,不能自如地学习。但是,这不是一个简单问题,应在考试改革方案中综合考虑。 其四,考试客观、公正与考试效果的对立统一。大规模的考试是人类的重要社会活动,对参加考试和使用考试的人来说,考试是一把尺子,人们希望它能客观、公正、准确地衡量出人的知识与能力水平。虽然人们也知道考试分数会有误差,但是在以1分之差落榜的时候,谁都毫无怨言,因为知道那不是因为什么“特权”,或人为故意造成的。只有客观、公正,考试才有权威、才有信用,否则劳民伤财,失去了考试的意义。 在目前教育测量的理论与技术条件下,客观题和机器阅卷是一个可行和有效的减少考试误差的手段,但是对于创造性思维等能力的考查是不够的。我们传统的纸笔考试对于口头表达、实验操作等考查也是做不到的。由于人力、物力写测量理论技术的局限,我们不可能在大规模考试中全面地、有效地考查学生的认识与情感及其他使一个人全面发展而必备的素质。为了对这一问题作出改进,考试工作者作了不懈的努力,例如我国科举中的八股文,最初就是为了克服主观性题目在出题和审阅时的不客观而创造的一个题型。时代进步了几百年,目前,美国ETS考试机构推出了在计算机上实现的考试,力图改进和克服上述的不足,并有了较好的效果。 虽然我们认识到了考试客观性和全面考查效果之间的矛盾,如果我们不放弃考试在激烈竞争中的作用,就不应因此而否定考试。大规模教育自身的这个不足只能是随科技发展而改善。对于大规模考试不能考查的内容,如果认为有必要,可再用其他办法来补充,如二次考试、面试、推荐、保送等。没有一个十全十美的考试,一次考试不能承担所有的功能。 目前,国外的考试改革呈现出如下趋势: 1.英、美等多元化考试的国家有联合和统一考试的趋势。英国在80年代末有13家考试机构,到了90年代合并为5家,现在最大的牛津与剑桥考试机构合为一体。美国的SAT和ACT是两大高校入学的参考考试。90年代,为了评价美国的教育,美教育部又委托ETS开发了一项用于全国的考试评估项目。日本、韩国等都有全国范围的大规模考试,其近期的改革也都保留有全国统一考试。 2.西方及近期韩国、日本、我国台湾地区的考试改革都强调了在考试以外的辅助录取手段,如参考学科竞赛成绩、中学成绩、社会活动和特长,以及建立学生、中学学校档案,大学一年级分班或淘汰等方法减少一考定终身的作法。 3.考试前沿的研究领域为认知心理学和考试手段的现代化,即更深入地了解人的认识过程,改革考试的原理和方法,采用多媒体及各种现代化手段改革考试的方法和手段,以增加对真实环境的模拟和防舞弊的措施。 4.由强调“常模参照性考试”而转为倾向于“标准参照性考试”和其他评估方法。常模参照性考试是将一个考生的成绩放在参加考试的考生团体的成绩之中比较,以挑选其中的优秀者;标准参照性考试是将考生的成绩与特定的标准相比较而看其达到的程度。这两类考试在理论与技术上既有区别又互相关联。现在,随着教育的发展,教育机会的增多,人们认为后者更应重视。另外,原来认为是属于校内考试即形成性或诊断性考试的技术也在研究和发展,并使之逐渐在大范围内应用。 5.普遍强调不仅考查知识而更要注重能力,特别是高层次能力的考查。在纸笔考试以外开发了其他考试形式,同时认为能力与知识不能分割。美国ETS对其学术潜能测验SAT加以改革,改变了尽量脱离学校教学的作法,增加了相关学科的内容。 有专家认为,考试改革不要像睡觉翻身一样,没有考虑周全而改过去改过来。 也有专家认为改革就像走路。一左一右,不能双脚齐进,或说“翻身”是必要的,只能不断地“翻身”。从改革成功的经验看,矫枉过正和对某一利益的暂时牺牲是可行的,比如英国在GCSE中加试实验操作,因为是由任课教师协助在各个教室中进行,客观性与分数的准确性是降低了,但推进中学对实验课的开设,其效果是好的。同时还应看到这种对某一原则的让步应是从全局出发,有目的而不是盲目的,否则无效的劳动就不会受到人们欢迎。这就是要求避免无谓的“翻身”。
|