PISA利用现代教育测量理论,在时间短、样本量小、试题量大、覆盖面广、成本低、误差小、减轻学生负担、减少考试焦虑的同时,确保了评价的科学性,拓宽了评价的内容与形式,使教育评价更具实用价值,取得了广大教育研究者和师生、家长、学校的一致认可。2000年,PISA共收集了近26万有效的学生样本,实现了阅读素养的提取信息、解释说明、反思并评估,还有数学素养和科学素养5个维度的测量与评价;2003年,PISA共收集了27万多个有效学生样本,实现了数学素养的变化和关系、数量、空间,以及形状、不确定性、问题解决、阅读素养和科学素养7个维度的测量与评价;2006年,PISA共收集了39万多个有效学生样本,实现了对科学素养的识别科学问题、科学地解释现象和使用科学证据等三个科学能力,以及科学兴趣、支持科学探究等两个对待科学的态度和阅读素养、数学素养等7个维度的测量与评价。2009年,PISA有68个国家和经济体参加,其内容除了在2006年设计的阅读素养内涵基础上有所发展之外,还开发了电子阅读技能的评估。总之,每次PISA测试的结果都会引起广泛的关注,如“芬兰模式”等。另外,在2009年的测试中,上海作为我国大陆唯一参加的地区还获得了三项测试均位居首位的好成绩。
在取得成绩的同时,这两种评价法也存在一些问题,其中较为突出的有:各个参与主体(教师、学生、学校及家长)对评价方法的认识不够充分,使评价方法的施行受到阻碍甚至无法顺利实施;以应试教育为主、高考为指向标的教育目标仍对一部分人的教育观念具有导向作用,导致“偏离正轨”的档案袋评价法难以施行;时间和精力的投入对已经极为忙碌的中小学教师来说是极大的挑战和困难;档案袋内容不明确且缺少客观的评价标准;在实施过程中容易流于形式,且会因为缺乏交流和反馈导致同一区域的评价内容和标准不同;PISA实施的不连续性对学生的测评无法持续;繁重的准备工作消耗大量的人力、物力和财力;整个测评对教师和参与研究者的素质要求较高等。
研究者们也发现,要有效开展这两种评价法就必须强化评价主体的理解与互动。另外,科学选择评价内容与评定标准对提高评价的质量和发挥其教学价值有着极为重要的意义。
四、对我国基础教育评价的思考
我国的基础教育在实现了对既定的义务教育任务的完成之后,已进入全面提高教育质量的阶段。如何进行科学、合理和有效的教育评价,使教育评价成为提高教育质量的有效手段、成为实现教育管理和教育决策科学化的重要保障,以及促进学生健康发展的必要环节,是摆在教育研究者面前的一项重要任务。上述所提及的档案袋评价法和PISA评价法则可以为我们提供一些这方面的启示。
我国新一轮的基础教育改革更加关注学生的主动性和参与性,倡导学习环境和内容的生活化和情境性。PISA评价法与档案袋评价法中关注的——学生是否准备好去应对未来的挑战、注重学习过程等与基础教育改革所要求的也有相同之处。