PISA研究的政策导向探析
陆璟
上海市教育科学研究院普通教育研究所
国际学生评估项目上海研究中心
摘要:PISA是一项在各参与国政府共同利益驱动下开展的政策导向研究,其政策导向主要包括效能/竞争力导向、终身学习导向、社会公平导向和成本效益导向。我国开展教育质量监测和评价的目的也是为了改进教育政策,因此PISA研究的政策导向能够为我国教育质量监测和评价带来启示。
关键词:PISA,教育政策,教育质量监测
一、PISA研究设计具有明确的政策导向
PISA测评的目的是改进教育政策而不是筛选学生。它将学生测评成绩数据与学生个人特征以及学校内外影响学习的关键因素联系起来分析,发现不同背景的学生、学校之间,以及不同类型的教育体系之间的成绩差异,并找出那些取得好成绩并且教育机会分配公平的学校和教育体系的特点。指出什么政策起作用,为什么起作用,以及哪些类型的政策改革可能是最有效的。
PISA的决策机构是PISA理事会,是由各参与国的政府代表构成。理事会每年召开两次会议,讨论并确定政策研究的优先领域(policy priorities)和PISA的发展方向。每一轮PISA的研究框架都是围绕理事会提出的政策优先领域来设计的,主要步骤包括:首先以先前研究的理论模型作为研究框架设计的基础,主要运用了国际教育成就评价协会(IEA)的国际数学与科学教育成就趋势调查(TIMSS)理论模型和经合组织(OECD)教育指标系统分析框架;接着根据PISA理事会提出的政策优先领域确定研究的重点;然后根据经合组织的指导原则对与政策研究有关的主题(theme)进行界定和操作化;再由专家组确定这些主题的结构和概念(construct),撰写这些主题的研究方案(proposal),确定主要研究变量(variable),然后再修订框架,经PISA理事会审定通过以后,研究框架才可以在后续的研究实施中采纳。
由于PISA在研究方向上考虑各国政府代表所提出的政策优先领域,在研究设计中调动全球的专家资源,在研究实施中保证数据采集的严格可比性,所以PISA发展为一项具有权威性的研究。经合组织依据PISA等研究结果所提出的政策建议对各国政府很有影响力,起到了“软政府”的作用。
纵览经合组织历年发表的PISA研究报告,笔者认为,PISA所引导的政策方向主要体现为效能/竞争力导向、终身学习导向、社会公平导向、成本效益导向等几个方面。
二、效能(竞争力)导向
PISA给出各个国家或经济体在阅读、数学、科学等领域的成绩排名,以及达到各个能力等级水平(proficiency level,又称精熟度水平)的学生比例,使各国从别国的成绩中反思自己的教育,寻找更有效能的教育政策。墨西哥、美国、法国、德国、爱尔兰、意大利、澳大利亚和波兰都把PISA研究作为推动课程改革、加强评价和问责的依据,从PISA中汲取其他国家好的做法的就更多了。
PISA最广为人知的结果是各国平均成绩排名,而实际上经合组织更为关注不同能力水平学生的分布,关注对技能分布顶端学生的测评。全球产业竞争结果表明,具备高层次能力对新技术和创新的产生才是关键的。相对于“一般”的个体,具备高层次技能的个体在知识的创造和应用中会产生相对大的外溢性,这反过来也表明,投资于优秀生可以使所有人都受益(Minne et al., 2007)1。经合组织把各国达到能力量表顶端的学生比例看作这些国家未来竞争能力的基础。反过来说,几乎没有学生处于顶端水平上的国家则可能会因此面临未来的挑战。
OECD国家平均而言,有1.3%的学生达到PISA科学量表的最高水平——6级,芬兰和新西兰有超过3.9%的学生达到6级水平。芬兰政府认为,芬兰拥有如此高比例高水平成绩的学生,部分地要归功于1996-2002年间实施的一项培养优秀生的科学教育重大发展项目(Luma)。该项目产生了多方面的积极影响:理工科高等教育在校生增加、教师间的合作增加,更强调实验性学习和建立专门侧重理工科的班级,或在学校中进行专门侧重数学和科学的分流。英国、澳大利亚、日本、加拿大,以及伙伴国(经济体)列支敦士登、斯洛文尼亚和中国香港,学生科学成绩达到最高水平的学生占2.1%到2.9%2。
值得注意的是,根据一个国家的平均成绩是无法预测该国达到最高水平的学生比例的。例如,韩国的PISA科学平均成绩为522分,是成绩最好的国家之一,美国的科学平均成绩为489分,在OECD平均分以下。然而,达到6级水平的学生比例,美国有1.5%,韩国只有1.1%3。同理,平均分还会掩盖低水平学生的比例和各个国家内部的地区差异。
PISA的强项之一还在于它能比较各国学生在不同学习领域的优势和薄弱环节。PISA 2006研究了学生在不同科学能力上的相对优势,分为识别科学议题、运用科学证据、科学地解释现象三个方面,从而分析各国科学教育哪些方面需要加强。解决科学问题首先要指出问题,然后运用科学现象的知识,最后解释并运用结果。传统的科学教学可能经常强调中间的过程,即科学地解释现象,该过程要求熟悉关键的科学知识和理论。然而,如果学生没有能力先意识到一个科学问题,然后再用与现实世界相关联的方式解释发现,那么学生仍未完全具备科学素养。所以,学生在识别科学议题或运用科学证据上相对弱势的国家就需要考虑培养更广泛的科学技能,而那些在科学地解释现象上处于弱势的国家则需要更多地强调学生对科学知识的掌握。PISA 2006研究结果发现“运用科学证据”的能力尤为重要,学生总体科学成绩最高的十个国家(经济体)在“运用科学证据”上尤其占优势,没有一个国家(经济体)在这方面呈现较弱状况4。法国、韩国、日本等国家在“运用科学证据”方面做得比较好。法国政府将法国取得的成绩归功于其课程对科学推理能力、数据分析能力和实践的重视;韩国也是类似的情况,他们也尤其强调表格、图表和实验结果的重要性;日本政府则把这方面的相对优势归功于课程、教科书、观察和实验的教学方法。但是日本学生在识别科学议题和科学地解释现象方面比较薄弱,日本政府将之归因于学生缺乏开展与科学相关的活动。
PISA 2006还研究学生在不同科学知识领域的相对优势,科学知识领域分为:“物质系统”、“生命系统”、“地球和宇宙系统”。从这一角度来分析各国存在成绩差异,是了解各国课程模式的重要视角,例如,韩国在“物质系统”和“地球和宇宙系统”量表上的得分分别为530分和533分,但在“生命系统”量表上只得498分,说明了课程内容分布不均衡5。
三、终身学习导向
PISA要回答的核心问题是,学生们准备好迎接未来的挑战了吗?PISA从两方面来回答这个问题,一是学生能不能有效地分析、推理并交流自己的想法? PISA提出了独特的“素养”概念,重在评价应用知识和技能的能力,关注学生运用他们在学校里学到的内容能做什么,而不单单看他们能否重现所学的内容;二是他们是否找到了能够终生追求的兴趣?PISA要求学生报告他们的学习参与度/投入度(engagement)和学习策略,认为这些因素是学生适应未来社会生活必须拥有的重要品质。日本、韩国等国家在参加PISA测评后,对培养学生的应用能力和学习兴趣给予了高度重视。
PISA与TIMSS等国际比较研究不同的是,TIMSS基于对各国共同课程的评价,PISA则不基于课程,而是直接面向劳动力市场的需要。经合组织从1997年开始,进行了大规模的“关键能力定义与选择”(DeSeCo)的跨国研究计划。这项研究提出了革新的素养(literacy)概念:“在不同学科领域中提出、解决和解释问题时有效地分析、推理和有效交流的能力”6。素养不是知识,不是技能,而是个人获取或应用知识与技能的能力,以及兴趣、动机、学习策略等。素养可以在合适的学习环境中学习而来,而且是终身学习。这是PISA研究一个非常重要的基础。
PISA测评的主要特点就是考查应用能力。阅读素养重在为了学习而阅读,而不是为了阅读而学习,因此并没有对学生最基本的阅读技能进行测评。换言之,阅读素养重在评价学生运用所掌握的阅读技能来学习各种领域的新知识、以及理解实际生活中可能遇到的各种文本内容的能力,而不是考查学生是否掌握基本的读写能力。数学素养要求学生从各种现实情境中识别出数学问题,用数学方法表述解题过程和结果、并解释应用。科学素养要求能够理解科学概念,应用科学观点来解释现象,并且对证据进行科学思考来得出结论。这种应用能力是体现在各种实际生活情境中的,因此评价框架包括了学生实际生活中可能遇到的各类情境,通俗地说,也就是环境或背景,包括了个人、社会、教育、工作等各种环境,这是其他测评所未能充分体现的。
PISA还开展了对学习参与度/投入度的评价。PISA“参与度/投入度”包括心理和行为两个层面的含义,心理层面指的是对某种活动的积极态度(attitude),主要是兴趣和动机,后来内涵逐渐扩大,包括兴趣、动机、信念、情感因素等;行为层面指的是积极投入学习活动或学习实践(learning practice)的程度,可以用投入活动的时间、频度、广度来衡量。
PISA参与度评价分为学校参与、学业参与、学科参与三个层面。学校参与(engagement with school)指的是学生在多大程度上对学校有积极的看法并参与学校活动;学业参与(academic engagement)指的是对学习的一般情感和他们对学习活动的参与或投入程度;学科参与(engagement in a subject)指的是学生投入到阅读、数学、科学等具体学科领域学习活动中的程度,不同学科领域参与度的内涵是不同的7。
从PISA测评的发展过程可以看出,PISA对学习参与度/投入度的重视程度越来越高,最初是作为影响能力的因素来考虑,现在已经作为素养的重要组成部分,并且把培养参与度作为与培养能力同样重要的教育目标:
2000年的首轮PISA研究就包括了学生对学校学习的情感和态度评价,把阅读参与度作为学生阅读能力的重要影响因素。在制定了PISA 2000框架以后,研究者对于阅读素养概念的理解有了扩展,认识到阅读素养不仅包含认知特征,也包括动机和行为特征8。于是在制定PISA 2003数学测评框架时,把“运用数学并投入数学活动”写到了数学素养定义中。
PISA 2006在科学素养的定义、测评框架、结果报告等多方面都强调了对科学的态度和参与度:科学素养定义中包括了“作为一名反思性公民,乐于参与科学相关的议题并运用科学观念”,在对素养的解释中强调兴趣和动机等非认知因素本身也被认为是素养;在科学素养测评框架中,首次明确地把科学态度作为素养测评的重要组成部分纳入测评框架;在PISA 2006结果报告中强调,学生对科学学习的态度和参与度非常重要,不仅因为对成绩有影响,而且它本身就是重要的教育目标。
PISA 2009测评主要领域又回到阅读,这次修改了PISA 2000对阅读素养的定义,增加了“参与/投入书面文本阅读”,把阅读参与度作为阅读素养评价中不可分割的一部分。PISA 2009阅读测评框架指出:“一个具备阅读素养的人不仅有良好的阅读技能和知识,而且重视阅读并多方面运用阅读。因此教育的目的不仅是培养阅读的能力,还要培养阅读的参与度。……参与度是由一组情感和行为特征构成的,包括对阅读的兴趣和喜爱,对自己阅读内容的控制感,参与阅读的社交互动,以及多样化、经常性的阅读实践活动。”9
概言之,学校不仅要培养学生获取或应用知识与技能的能力,还要保持和发展孩子积极的学习态度,帮助他们获得管理自己学习的技能,培养对所学学科的兴趣,并且使学生更加广泛地参与到学校生活和学习活动中去,才能并确保他们在离开学校时都带着终身学习的动机和能力。
四、社会公平导向
经合组织特别重视研究不同社会经济背景的学生能否获得同样的学习机会、达到同样的能力水平。以学校差异分析为例,PISA把学校层面的学生总体家庭社会经济地位对学生成绩的影响作为判断学校差异以及公平最主要的指标。换句话说,学校成绩可以有差异,但如果成绩好的学校集中了家庭社会经济地位高的学生,就说明教育机会分配不公。PISA发现许多教育不公平问题是由于过早分流造成的,从而有效改变了早期分流的做法。
PISA借鉴以往的各项研究,认为父母教育程度、职业地位和家庭财富是决定家庭社会经济地位的重要因素。因此各轮PISA研究中,都用“PISA经济社会文化地位指数”(PISA Index of Economic Social and Cultural Status, 简称ESCS指数,早期称为SES指数)作为家庭社会经济地位的测量指标,包括三个方面:父母亲的最高教育程度(即选择父母中教育程度更高者为指标)、父母亲的最高职业地位(即选择父母中职业地位更高者为指标)、家庭拥有物。用家庭拥有物来衡量家庭财富的原因是,由于家庭收入的隐私性,父母收入信息不容易获得,因此,一般用具有代表性的家庭特定物件拥有来间接地测量家庭的财富状况10。PISA研究学校成绩与ESCS指数之间的关系,这一公平视角不同于简单地比较学校成绩差异的做法,说明教育公平不是要把学校都办得一样没有差距,而是要办更多的好学校,让不同社会阶层的学生都平等地得到上好学校的机会;同时还能更全面地分析造成学校成绩差异的原因,分析有多少成绩差异是受学校管理和教师因素影响,有多少成绩差异仅仅是生源背景差异造成的。
PISA将成绩高低与不同社会阶层教育机会分配的公平性高低结合起来,把国家分为四种类型:成绩高且公平、成绩高但不公平、成绩低且不公平、成绩低但公平(都一样差,也不好)。结果表明,芬兰、加拿大、爱尔兰、韩国、日本等国家在达到高水平成绩的同时又实现了教育机会公平,为各国确立了标杆,而美国、德国的成绩并不高,教育机会分配也不公平,这一结果极大地改变了人们以往对教育质量看法。

图1.部分OECD成员2003年PISA数学成绩与教育公平性分布状况
五、成本效益导向
经合组织是一个综合性的经济组织,把教育视为社会最重要的投资11。实施PISA测评的初衷是想构建一套教育质量指标,从而评价教育投入产生的效益,并研究人力资本投资对经济发展的贡献。PISA数据发现,高收入国家学生成绩确实相对较好,但是很难说其中有因果联系。在比较了生均经费与PISA 2006科学成绩的关系后发现,芬兰、韩国、日本等国家只有中等水平的投入,但是却取得了显著高于平均水平的成绩,使得其他国家更多地注意教育经费的分配和使用效益,而不是单纯地增加投入。
总支出(美元,经购买力平价调整)
图2.部分OECD成员2006年PISA科学成绩与生均支出分布状况
资料来源:OECD 2007 PISA 2006: Science Competencies for Tomorrow’s World, Vol. 1,p.60.
进一步分析学校层面的影响因素后发现,虽然人力和物质资源投入高的学校总的来说成绩较好,但是控制了学生家庭社会经济背景影响后,成绩差异就不显著了,PISA 2006报告指出这可能是因为学校投入水平与生源背景之间有密切的关系。笔者认为这也可能是因为投入达到一定水平后,投入没有与其他要素同步增长,所以边际效用递减了。PISA 2006还发现,通过更好地管理资源以增加校内学习时间,鼓励学生自学,提供能推动科学学习的课外学习活动(包括科学社团、科学展、科学竞赛、课外科学项目、远足和实地考察),则会带来科学成绩的提高,并且在控制了学生家庭社会经济背景影响后,作用仍然存在12。
六、PISA对我国教育质量监测与评价的启示
PISA是一项以证据为本的政策研究,它以改进教育政策为评价目的。PISA对教育结果的评价是多维的,使我们能够以全球视野来审视教育的质量、公平、态度和效率,从而改进我们的教育决策。
1.大规模教育考试与教育质量监测要与教育政策研究相结合。我们现有的教育考试多以评价学校教育质量和学生学习质量为目的,虽然有不少政策为导向的调查研究,但又缺少与学习成绩相结合的分析。PISA把学生学习结果的数据与学生个人特征数据以及学校内外影响他们学习的关键因素联系起来,目的是使人们注意到成绩类型的差异,并识别出那些成绩达到高标准的学校和教育体系的特点,从而提高学校和整个教育系统的竞争力。而且它每三年一次,数据之间可以跨年度比较,这种长期性和定期性使国家(经济体)能够监测它们在达到关键学习目标上的进步。
2. PISA是第一个在终身学习能力的评价方面有重大突破的研究项目。它提出了独创的“素养”概念,并且在学生学习参与度方面做了前所未有的深入研究。我们在实施素质教育的过程中,学生创新能力和实践能力的评价是难点,可以借鉴PISA对情境的分析以及结合各种情境评价学生应用能力的做法,并加强对知识应用情境的分析和研究。在新课程三维目标的评价中,“过程与方法”、“情感态度与价值观”的评价是难点,可以借鉴PISA对学习策略和学习参与度的研究方法,特别是要深入研究不同学科领域的学习参与度评价。
3. PISA从社会公平的视角剖析教育公平,不仅可以避免仅仅从学校表面的成绩差异来评价教育公平而造成的误解,还可以更科学地分析造成学校成绩差异的来源。这一视角在国内已有的教育质量监测和评价中尚未涉及,需要开展相关研究。特别需要研究不同职业在国际上的地位与国内地位的差异,以及ESCS指数评价在中国的适用性问题。
4.取得好成绩需要中等以上投入水平作为保障,但并非投入越高成绩就越好。在教育资源配置达到中等以上水平后,关键是把更多的资源用于学生的学习活动上,为学生提供更丰富的学习内容。
注释
1.OECD. PISA 2006: Science Competencies for Tomorrow’s World, Vol. 1[M]. OECD, Paris, 2007.49.
2.同上, .50.
3.同上,.50.
4.同上, .64.
5.同上, .72-73.
6.OECD. The Definition and Selection of Key Competencies,Executive Summary[M]. OECD, Paris, 2005.3.
7.陆璟. PISA学习参与度评价[J]. 上海教育科研, 2009, (12).
8.OECD. PISA 2009 Assessment Framework [M]. OECD, Paris, 2009.20.
9.同上,.23.
10.占盛丽. 从个人和学校视角看家庭社会经济地位对学生学业成绩的影响[J].上海教育科研, 2009, (12).
11.张民选.国际组织与教育发展[M].上海:上海教育出版社,2010.241.
12.OECD. PISA 2006: Science Competencies for Tomorrow’s World, Vol. 1[M]. OECD, Paris, 2007.261-267.
(文见《教育发展研究》2010年第8期,正式发表时略有修改和调整。)