推荐阅读

大规模评估为全球教育扬长揭短

发布者:上海市教育科学研究院 来源:中国教育报 日期:2013-2-7 19:23:00 人气:

近日,波士顿学院发布第三届国际小学生读写素养发展评估项目(PIRLS2011)与第五届国际中小学生数学与科学素养发展评估项目(TIMSS2011)的评估报告。国际大规模教育评估可以诊断教育教学中的有关病状,由此向教育政策制定者和学校发展研究者提供反思、干预和完善的线索与视角以及切入点。

大规模评估为全球教育扬长揭短
俞可 余倩 陈丹

经济全球化时代,单个教育体系迫切寻求全球定位。读写、数学与科学被视作义务教育阶段学生的必备素养。对其进行测试并在地球村邻里之间互为对照,以敦促各个经济体在跨文化比较的棱镜中审视各自的教育体系,进而制定学生发展基准与教育政策,可谓势在必行,而国际大规模教育评估正好应运而生。国际中学生评估项目(PISA)因上海学子独占鳌头而广为人知。其实,与其并驾齐驱的还有国际教育成就评价学会(IEA)发起的国际小学生读写素养发展评估项目(PIRLS)与国际中小学生数学与科学素养发展评估项目(TIMSS)。2012年12月10日,统筹两者的波士顿学院发布第三届国际小学生读写素养发展评估项目(PIRLS2011)与第五届国际中小学生数学与科学素养发展评估项目(TIMSS2011)的评估报告。

读写素养香港夺冠

国际小学生读写素养发展评估项目自2001年起每5年循环一次,测试对象为小学4年级学生,所评估的是5个理解过程,即锁定并获取特定信息、简单推论、复杂推论、解释并整合观点与信息、检测并评估内容与语言的使用。2011年,全球共有49个教育体系的近万所学校约32.5万名学生接受测试。测试时,学生须基于给定的阅读文本(包括不连续文本)完成总共135个问题,选择题与建构反应题(即问答题)各半。

结果显示,中国香港、俄罗斯、芬兰、新加坡和北爱尔兰领跑排行榜;从2006年开始参与国际小学生读写素养发展评估项目的中国台北此次进步18分,排位第九,提升13个名次,并首次跻身前十位;欧洲则显现衰退迹象,连续两届倒退的教育体系几乎一概来自欧洲,如保加利亚、立陶宛、荷兰和瑞典。小学生的读写素养,香港比欧盟和世界经济合作与发展组织(OECD)至少超前半个学年。然而,毕竟根基雄厚,欧洲仍能停留在高均值水平。此外,读写素养的性别差异乃全球问题,女孩的阅读成就平均比男孩高16分,这个距离相当于半个学期。第三届国际小学生读写素养发展评估项目总结出与阅读成就相关的三个关键性家庭资源:父母的受教育程度、父母的职业和家中藏书量。当然,拥有完备的教学资源以及安全而有序的环境以及教师的激励与家长的教育期望亦不可或缺。

数学科学东亚雄起

国际中小学生数学与科学素养发展评估项目自1995年起每4年循环一次,测试对象为4年级与8年级学生。2011年,全球共有63个教育体系参与,涉及近万所学校的60多万名学生、16万余名家长和约13500名教师。中国香港从1995年起同时参加4年级与8年级的国际中小学生数学与科学素养发展评估项目,中国台北则于2003年和1999年分别加盟4年级与8年级的国际中小学生数学与科学素养发展评估项目。国际中小学生数学与科学素养发展评估项目围绕两方面展开,即内容与认知。内容指的是可以用数学进行测量的特定领域或者科目,数学评估包括三大块,即计算、测量与数据处理;科学评估内涵3项,即生物、物理/化学、地理;认知即学生在处理数学问题的思维过程,由习得、使用和推理组成。对于4年级与8年级学生,尽管内容不一,但认知相同。在测试题目中,多项选择题与主观问答题各半。

第五届国际中小学生数学与科学素养发展评估项目结果显示,东亚国家傲立榜首。4年级数学评估三甲为新加坡、韩国与中国香港,中国台北与日本紧随其后;韩国、新加坡、中国台北、中国香港与日本在8年级数学评估中位居前五。4年级科学评估冠亚军是韩国与新加坡,排位其后的是芬兰、日本、俄罗斯与中国台北,中国香港第九;8年级科学评估中,新加坡、韩国、中国台北与日本分享四强,中国香港第八。可见,中国香港、台湾的学生表现不凡。可喜的是,性别差异问题在第五届国际中小学生数学与科学素养发展评估项目中并不凸显,甚至除4年级数学评估,女生国际平均分比男生仅低1分,其余各项评估,女生均胜出。

同步测试共时问卷

为调查测试内容与相关课程的匹配程度并作出决策,各个教育体系须设置首席专家席位。测试内容须涵盖50%的官方课程,以保障评估公正和数据客观,也由此可判断本土课程在多大程度上满足国际社会对学生胜任力的要求。国际小学生读写素养发展评估项目与国际中小学生数学与科学素养发展评估项目把学生的胜任力分为5个等级,由高到低分别是五到一等。

值得一提的是,4年一届的国际中小学生数学与科学素养发展评估项目与5年一轮的国际小学生读写素养发展评估项目恰好在2011年相遇,这无疑为同时采集4年级学生的读写、数学与科学素养提供绝佳机遇。而且,这也便于专家联合开发学生问卷、教师问卷、学校问卷和课程问卷,以及近20个针对阅读、数学和科学的教与学的问卷量表。

作为此次亮点,第三届国际小学生读写素养发展评估项目开发一种新的评估——预国际小学生读写素养发展评估项目(prePIRLS)。通过针对个别教育体系的需求与特性为其特别设置基准,国际能源机构(IEA)推动参与预国际小学生读写素养发展评估项目的教育体系今后正式加盟此项全球评估。预国际小学生读写素养发展评估项目可视作缩减版,也是对正式参与国际小学生读写素养发展评估项目的一场预演。

实证转向诊断病状

通过标准化手段评估学生必备素养,以国际中学生评估项目、国际小学生读写素养发展评估项目和国际中小学生数学与科学素养发展评估项目为代表的国际大规模教育评估,能够为教育政策制定者与执行者以及教育研究者提供可靠的判断与可信的预测,由此在教育政策与教育科学引发所谓的实证转向。譬如,在德国,国际大规模教育评估于2004年至2006年间推动教育标准与核心课程以及教育监测全局战略的问世。又例如,针对欧洲各国文盲率高企以及青少年读写困难现象加剧,欧盟委员会召集学者组成欧盟读写素养专家高层小组探究问题并提出建议。该报告于2012年世界扫盲日出台,所建言的政策性举措很大程度上基于历届国际中学生评估项目与国际小学生读写素养发展评估项目结果。

另外一则鲜活案例是2012年11月27日英国知名媒体《经济学人》发布的一份题为《学习曲线——国家教育成就的教训》的报告。其数据一方面源自国际中学生评估项目、国际小学生读写素养发展评估项目和国际中小学生数学与科学素养发展评估项目,另一方面基于各个经济体的官方统计数据。通过展示40个经济体在两大指数上的教育表现,以及教育投入、教育产出和社会经济环境三大向度共65个指标之间的相关性,报告有助于各界专家确定劳动力所需知识和技能与经济体可持续的全球竞争力之间的关联因素,并旨在构建一个教育绩效的国际比较基准——“认知能力和教育程度全球指数”。基于该指数加以排名,东亚与西欧瓜分七强席位,他们分别是芬兰、韩国、中国香港、日本、新加坡、英国、荷兰。报告坦诚,教育投入与教育产出之间的关联高度复杂,甚至可以说是一个黑箱;教育体系成功之途绝非一条,须基于国情;成功之道亦非取决于资金与资源,而在于如何配置与运用有限的资金与资源。报告进而强调,信息的收集与处理,技能的测评以及教育制度的国际比较,这些研究工作相对容易,更高难度的则是评估文化对教育的影响以及评估不同方式去改变文化所引发的价值波动,确定那些创造最大价值的教师所具备的特征,以及通过细节来理解问责和选择之间如何以积极方式互为影响。

排行榜固然可以引得利益攸关方的眼球,各类评估之利弊亦昭然若揭,国际大规模教育评估更无以包治百病。至少,国际大规模教育评估可以诊断教育教学中的有关病状,由此向教育政策制定者和学校发展研究者提供反思、干预和完善的线索与视角以及切入点。

(作者单位:上海师范大学教育部国际教育研究基地;上海师范大学现代校长研修中心)

《中国教育报》 2013 年 2 月 3 日 3 版