PISA对我国基础教育评价制度改革的启示
【字体:
PISA对我国基础教育评价制度改革的启示
作者:杨希洁    教学科研来源:全国教育科学规划办    点击数:1098    更新时间:2009-4-11

PISA是经济合作与发展组织(简称OECD)举办的大型国际性教育成果比较、监控项目,评价对象是处于义务教育阶段末期的15岁学生。它以纸笔测验的形式测量学生的阅读能力、数学能力和科学能力,从而了解学生是否具备未来生活所需的知识和技能。PISA2000年首次举行,而后每3年评价一次,但每一次评估的侧重点有所不同。2000PISA重点考察阅读能力,2003年的重点是数学能力,2006年则为科学能力。另外PISA2003年还增加了问题解决能力的测试。2000年有43个国家参加了PISA测试,2003年为41个国家,2006年有58个国家。每个国家参与的学生人数在4500人到10000人之间。

PISA的测试结果,在很多国家引起高度重视。比如,2001PISA公布结果,在参与测试的国家中,德国学生在三个方面的测试分数都落后于OECD的平均分之下,与芬兰、挪威、英国等欧洲国家相距甚远。这一结果在德国引起轩然大波,德国政府开始实施教育改革,比如统一教育标准、建立最低要求,加强学前教育、提早入学年龄,增加教育投入、调整优先投资项等。芬兰在20002003年的测试中,均取得了最佳的总成绩,这在国际上掀起“芬兰教育研究热”,各国教育专家纷纷探索芬兰取得高质量教育的原因。

PISA是当前最主要的国际教育评价项目之一,它的影响还在日益扩大中。之所以受到如此的青睐,与其评价理念、评价内容、评价方法、评价结果的独到性有直接的关系。分析PISA的特点,对我国当前基础教育评价制度的改革具有重要启示意义。

 

一、PISA的特点分析

(一)评价理念:为终身学习能力的发展而建构的评价

OECD以经济为主要关注点,因此长期以来,它公布大量的教育评价信息,为其成员国提供有关对教育人力和物力的投资回报方面的资料。但OECD困于缺乏适合对各国进行比较的测量指标,于是,在上世纪90年代后期,OECD成员国着手开发自己的评价工具。经各国专家研究,决定OECD测试的重点应当是学生生活中所必需应用的能力,它要回答政府关心的问题,即:我们的教育是否为孩子将来全面参与社会做好了准备?因此,OECD明确指出:PISA评价的目的不是了解学生掌握了多少学科知识,而是他们是否掌握与将来生活相关的基础知识和技能,要考察的是学生在实际生活中创造性地运用这些知识和技能的能力。学生除了要具备生活中必须用到的阅读、数学、科学的基本知识和相关技能外,更重要的是能够对自己的学习过程、学习策略进行反思,能够在独立和集体的情境中进行学习。为此,PISA不仅测查学生的基础知识和技能,还用问卷的形式测查学生的学习动机和学习态度,以此形成对学生学习能力的总评估。

出于考察学生是否具有问题解决能力的目的,PISA对阅读、数学和科学能力的界定着眼于社会生活的实际应用方面。阅读能力的定义是:学生为了达到个人目标,发挥个人知识与潜力,以及有效参与社会所需的理解、应用和反思书面材料的能力。数学能力的定义是:能确定和理解数学在社会中所起的作用,辨认、理解并参与数学运算的能力。科学能力的定义是:使用科学知识的能力、辨认问题的能力和应用科学观点的能力。秉承这样的宗旨,PISA的测试内容紧扣生活实际,强调问题情境的真实性。比如,根据美国数学和科学教育专家组的研究,2000PISA的科学能力测试题目中,与实际情景相关联的题目占66%,数学则高达97%

(二)评价内容:与社会生活需要密切关联的测试

基于评估终身学习能力以及问题解决能力的评价理念,PISA认为三个领域的能力,即阅读、数学和科学能力是生活中必须掌握的。测验的内容均来自于社会生活的各个方面(包括学生在校的学习内容),以真实的生活情境问题呈现。PISA还认为问题情境有不同层次,离学生最近的是个人生活情境,然后是学校生活、工作以及闲暇时的生活情境,最后是科学情境,即抽象的证明、数字的概括和空间模型的建构。PISA的题目很多取自学生的实际生活经验。以下是对三个领域测验的概括介绍:

阅读能力测验:目的在于评价学生处理信息的能力。它的内容包括短篇故事、网络信件、杂志报道、统计图表等各种材料,考察学生根据材料提供的线索和情境要求获取、分析和理解信息,并结合新获得的信息与自己原有知识和经验进行综合判断后重新表达信息的能力。PISA认为学生的阅读兴趣和阅读态度会导致阅读能力产生很大的差异,因此它还通过问卷调查学生在校内和校外的阅读情况,包括家庭、学校以及公共图书馆的藏书情况,学生阅读图书的时间和种类等,借以了解学生从事的阅读活动以及在不同阅读活动中的表现出来的兴趣和态度。

数学能力测验:PISA从数学技能(如数学思考能力、进行数学论证能力、建立数学模型的能力、提出问题并解决问题的能力等)、数学概念(如空间与形式、数量推理、从属性)、数学课程因素(从学校数学课程中选择部分内容考察学生)、数学情境(不同情境中运用数学知识解决问题)四个领域来考察学生数学能力。评价分为三个层次:基本事实再现以及基本运算与技巧的应用;建立不同领域知识的关联;从现实问题中提取数学模型以及对数学问题本质进行思考。PISA力求使测验题目与学生的生活经验联系起来,让学生切身体验到数学在实际生活的有用性。

科学能力测验:PISA从三个角度考察科学能力,即科学概念(有助于人们联系新旧知识、理解新经验的知识)、科学方法(确定可研究问题、确定科学论据、得出评价结论、宣传有效结论、论证对科学概念的理解)和科学情境(在现实生活中用科学知识解决问题)。题目须达到两个标准,一是尽量反映现实生活的复杂性,二是尽可能在一个情境中提出几个相关的问题。它通过让学生解决与个人、家庭、社会生活相关的问题,考察学生获得的科学知识和应用科学知识的能力。

除测试以上三个领域的能力外,PISA还通过学生学习态度问卷调查以及校长问卷调查,从学生个人学习兴趣、家庭背景、学校以及社会因素等方面全面考察学生的综合学习能力。

(三)评价方法:设计严谨的评价方法

要考察不同国家的学生的能力是颇具难度的事,因为各国教育体制不同,学生们接受教育的年龄不同,因此,选择同一年级的学生进行考察是不现实的。但是,大部分国家的学生都在153个月到162个月年龄段之间完成义务教育阶段,因此,PISA从这部分的学生中进行抽样考察。各成员国根据OECD要求确定好抽样框后,再由PISA总部按计划实施抽样,从而避免抽样的随意性。

PISA所有领域的评价项目是由将近7个小时的等值的评价内容组成,但每个学生只需要完成两个小时的由不同素材组合而成的测试内容,这样既保证了每个学生不需要花太长的时间进行考试,又可以保证测试尽可能广泛地囊括各个评价领域的主要内容。学生完成两小时的测试后,还要用半小时左右完成调查问卷。所有的调查都是在学校中进行的。

PISA除了精心研制考察对象的样本以及考察内容的组合,在评分标准上也力求充分体现学生的实际能力,每道题都有详细的评分说明。例如一道数学测试题要求学生用图中的比例尺估计南极洲的面积。如果学生能够说出自己是如何估计并且得出正确的答案,那么可以得2分。如果学生只是说出自己如何估计但答案不正确,就只能得1分。学生可以用不同的方法来做这个题目,题目的“正确答案”,也不是一个精确的数字,而是一个估计的数值范围,只要学生的答案落在这个范围内,就意味着是“正确答案”。这样的评分标准是“开放”的,它没有规定什么是标准的解决方式,能够鼓励学生积极地开动脑筋,既考察了学生的解题过程,又强调了结果的重要。

PISA总部根据学生的测试成绩,以及学生、校长问卷的调查情况,统一处理数据,并将结果反馈给各成员国。

(四)评价结果:具有政策导向作用的结果反馈

PISA提供的评价结果,不只是简单的成绩排序,它还向各国提供详尽的分析报告,内容涉及学生成绩与性别、学习态度和兴趣、家庭背景、学校人力物力投入的关系。

2000年和2003年的分析结果看:影响学生基本技能产生差异的因素中,国别因素只占十分之一,而国内的因素,比如教育体制、课程设置、学校和学生的个体因素占了十分之九,这引起各国重新审视自己的教育政策,而不是将精力放在与其他国家进行比较上。

PISA分析显示,学生平均成绩比较高的国家,也是成绩分化小的国家(芬兰就是典型的例子),过早对学生进行分流会加大两极分化,而不是带来平均水平的提高(这一结果,使得德国重新审视自己的分流教育体制)。这促使各国致力于研究如何提高学生基本技能的平均水平,尤其是提高差生的成绩上。

PISA分析显示,教育经济投入与教育最终成效并不完全成正比。学生是否有兴趣学习,是否能充分运用学习资源是导致学生成绩产生差异的重要影响因素。这引起各国考察自己的课程设置是否能够激发学生的兴趣,是否能引导学生充分利用家庭和学校的各种学习资源。

PISA其他各类报告,也为参与国提供了丰富的教育信息。比如PISA显示出女生的阅读能力和阅读兴趣高于男生,这促使英国政府关注男生的阅读教学和学习。可以说,PISA所提供的分析报告,为各国提供了了一个良好的教育质量检测平台,为各国及时调整自己的教育政策提供了非常有用的信息。

 

二、PISA对我国基础教育评价改革制度的启示

(一)从PISA视角看我国基础教育评价制度的不足

我国基础教育改革提倡评价要促进学生发展,近几年也确实取得不小的成绩,但是仍存在一些值得思考的问题。如果从PISA的特点来审视这些问题,对于更好地推进我国基础教育评价改革可以起到一定启发作用。

1、评价理念是否明确

20021218日教育部发布了建国以来第一个较为全面的中小学评价与考试改革的指导性文件——《中小学评价与考试制度改革的指导意见》。在这个指导意见中指出:促进学生发展的评价体系应包括评价的内容和标准,评价方法和促进学生发展的改进计划。为了便于使用,评价标准应该用清楚、简练、可测量的目标术语表述,应包括一般性发展目标和学科学习目标两个方面,一般性发展目标又包括道德品质、学习能力、交流与合作。

这个文件提出的关于学生发展评价体系构想是全面的,但是只有宏观的《指导意见》不足以支撑整个中国基础教育评价的改革,还需要确定具体的评价体系以及其中的各项评价指标和标准,需要说明到底应评价学生的哪些方面的能力。此外,在《指导意见》中,很多术语都采用了模糊界定,比如在“学习能力”的概念中提到学生要“具有初步的探索与创新精神”。什么是“初步”?如果没有一个明确的评价基准,就很难去考察学生的探索与创新能力。因此,更有必要尽快研制出各类配套的、表述清晰的评价体系。

2、评价内容是否体现了评价理念

近几年的评价改革,都在强调评价要根据学生的实际生活来评估他们的能力。但事实是,现有的评价内容仍以考察学生掌握课本知识的程度为主,并没有很好地反映生活的实际问题,也就无从考察学生解决真实问题的能力。另外,尽管也强调要考察学生多方面的能力、学习态度和兴趣,但迄今为止,并没有出现一个成熟的评价体系,能够将学生的态度、兴趣等背景资料囊括到考察内容中。

3、评价是否可以用于区域比较

在基础教育阶段,我国并没有统一的测试对各地区学生学习情况进行跨区域比较。尽管我们也采用了很多手段进行教育质量的评价和监测,但是,由于缺乏统一的评价标准,很难论断某个地区的基础教育质量就一定高于另一个地区,也很难从全局角度对义务教育阶段的教育质量进行横向和纵向的监测。

4、评价产生的结果如何

目前的评价只能单纯考察学生的学习情况,无法将个性特征、家庭状况、学校背景、社会因素联系起来综合探究是什么原因造成学生的学习产生差异,这样的结果也就无法为教育政策制订和教育实践改革提供更详细的参考信息。

(二)PISA对于我国基础教育评价制度改革的借鉴意义

通过对PISA及其主要特点的分析,进一步考察我国基础教育评价制度很有必要,尤其是PISA对我国评价制度改革所带来的借鉴意义,更值得深入研究和有效运用。几点建议如下:

第一,“发展”应当确实成为教育评价的核心理念。PISA认为,由于学生不可能在学校学到将来生活所需要的每一种知识和技能,因此学校的功能不在于使学生学会事实(learn to know),而是学会如何学习(learn to learn);测试的目的,不在于考察学生现时掌握了多少,而在于了解学生的学习潜力。这个理念,应当成为我国基础教育评价的核心思想。

第二,将多种评价形式有机地纳入评价体系中。PISA的“问卷调查”与三个测验是密切相关的。通过问卷调查的内容,评价者能够详细地分析造成学生成绩产生差异的原因。我国的教育评价体制,也应当借鉴这一方式,将各种评价形式与考试有效地整合起来,使评价结果更有参考价值。

第三,建立可用于区域比较的教育评价和监测体系。OECD举办PISA的目的是要监测各国的学生学习质量,从而对各国的教育政策和投资产生影响。我国尽管各地文化差异大,但总不至于大过国家之间的差异。在强调教育资源配置公平的今天,更有必要建立大范围的区域性教育评价和监督体系。

值得一提的是,PISA测验题目的呈现形式、题目类型分布、题目难度以及评分标准,这些具体的内容和形式中都蕴含着值得我们思索和借鉴的因素。

 

参考资料:

① 孔凡哲、李清、史宁中。PISA对我国中小学考试评价与质量监控的启示,外国教育研究,20055)。

② 许小红,PISA调查与德国教育现状问题,外国中小学教育,20067)。

③ 张景斌、彭刚,PISA对我国数学教育评价改革的启示,数学通报,20048)。

④ 王唏、黄慧娟、许明,PISA科学素养的界定与测评,上海教育科研,20044)。

⑤ 李广,为生存而学习:PISA评价思想价值取向研究,外国教育研究,20057)。

What PISA Assesses. http://www.pisa.oecd.org/.  (略)

教学科研录入:admin    责任编辑:wzzoujiang 
相关教学科研
没有相关教学科研
发表评论
用户名
*
Emaill
评价等级
Reset
新余教育城域网
新万博manbetx1.0下载校园网 版权所有,未经授权禁止复制或镜像
新余市第五中学主办 新万博manbetx1.0下载信息处承办 网站备案编号:赣ICP备02007529号
建议使用IE6.0及以上版本 在1024*768及以上分辨率下浏览
回到顶部