美国中小学考试评价解析
中国教育先锋网 2007-03-01
教育部考试中心 王蕾
北京师范大学 余娜
1 美国基础教育考试评价的新规则
“不让一个孩子落伍”(No Child Left Behind,NCLB)教育改革法案是美国基础教育领域近些年来最热门的话题。布什总统于2001年提出的“不让一个孩子落伍”的教育改革议案于2002年1月8日正式通过审核成为法律。这是白1965年以来最大规模的教育改革立法。这一法案极大地增强了联邦政府在保障所有儿童公共教育质量中所发挥的作用。法案要求3年级到8年级的学生每年都要参加阅读与数学测验。
议案中最关键的部分是要求每个州在数学和阅读科目上制定并实施有挑战性的学术标准,设定每年的进步目标以保证所有群体的学生在12年内达到精熟水平。然后每年对3年级到8年级学生的阅读和数学科目进行测验以测量他们的进步。这个议案尤其对“全国考试”或“联邦控制的课程”有利。由各个州自己选择和设计测验,必须保证测验与州课程标准一致。各州将会受到联邦资金的资助来发展测验。“激励机制”指的是如果联邦政府不能提供必要的资金资助,那么各州可以不编制3—8年级的阅读与数学测验。
测验结果将以“报告卡片”的形式每年向公众报告。内容将会涉及学校的成绩表现及各州朝精熟目标的进步情况。为了保证所有群体的学生适度的进步速度,测验的结果将会按照贫困情况、种族、残疾情况与英语精熟程度分开报告。这就是众所周知的“数据的解体”。这样做也是为了防止学校将多个测验的结果混合而只提供学校的平均水平以掩盖不同学生群体之间的成绩差距。
议案要求各州与学区提供每年精熟目标进展的情况。他们必须证明所有群体的学生在12年之内部达到了100%的精熟程度。各州自己确定精熟标准,每个群体的学生适当的年进步率。表现不佳的学校要参加州所实施的各种各样的学校提高和改革计划。
每个州的测验结果将与美国国家教育进展评估(National Assessment of Educational Progress,NAEP)的指标进行比较,NAEP每两年在全国范围内取样,对各州4年级和8年级的学生实施阅读与数学测试。这个规定称为“NAEP可比性”,是为了防止各州将自己的考试和标准定得过低。也就是,如果一个在自己州的测验上显示出进步,但是在NAEP上却没有显示相应的进步,那么就说明州测验和州标准的挑战性不够。最后的立法中并没有说明如果州测验分数相比于NAEP落后时的处罚,只是要求将对比的结果公开。
2 美国中小学考试评价
2.1 联邦考试
美国国家教育进展评估NAEP,又称为国家教育报告卡(The Nation’s Report Card),是目前美国国内唯一连续、长期的中小学生学业成绩测量体系,首要目标是向美国公众报告学生的教育状况。
为达到这两个目标,NAEP设计了两种类型的评估:主要(main)NAEP全国评估(NAEP-National)和长期趋势评估(Long-term trend assessment)。主要的NAEP全国评估考察美国学生知道什么,能在关键的学科领域做些什么。NAEP的长期趋势评估是通过比较几十年以来成绩的变化,测量在一段时间内教育的进展。
NAEP评估的施测对象是美国4年级、8年级和12年级的学生。NAEP并不为单个的学生和学校报告分数。评估所报告的是以性别、种族为特征的群体的结果。
NAEP自1990年开始允许各州参与州水平的阅读、数学、科学和写作评估。有40到45个州参与了NAEP州评估(NAEP-State)。从2003年开始,“不让一个孩子落伍”法案要求所有的州和学校区域都接受联邦I号基金(Title I grant)参与两年一次针对4年级和8年级学生的NAEP阅读和数学评估。从 2002年开始,NAEP首次试验性的进行城区水平的评估(NAEP Trial Urban District Assessment)。六大公立学校的城市试验区志愿参与了这次评估,2003年有10个城市试验区开展了阅读和数学的实验性NAEP城区水平的评估。
NAEP的试卷编制与施测过程包括以下几个步骤:
1)确定评估框架
NAEP基于国家评估管理委员会(National Assessment Governing Board)制定的内容框架建构评价框架。每个科目的内容框架详细说明了特定年级的学生应该知道和应该能做的。内容框架指导试题的编制。
2)开发评估题目
NAEP的题目编制者做出了巨大努力使评估题目能够反应出教育者对于学生应该知道和应该能做的事情的最佳思考。基于NAEP的内容框架,测验专家在教师、课程专家和测量专家的帮助下编制出评估项目。为使题目更加恰当和公平,还进行了大量研究来审核以往的题目与作答反应。
“不让一个孩子落伍”法案规定国家评估管理委员会必须采取措施确保所有的题目都不存在种族、文化、性别和区域的偏差,必须是长期、中立、不带意识形态的。
在测验编制组成员、学科领域的专家和国家评估管理委员会经过最初的审核和评价之后,首先将评估测验对少量的学生进行预试。在预测验的结果分析与评审专家审核评价的基础上,对有异议的题目进行改善,组成测试卷进行实地测验。实地测验施测于成千上万的学生,评卷并进行分析。然后基于实地测验的结果和内容框架的规定选择合适的题目用于实际的评估。
3)编订评估手册
NAEP评估项目包含成百上千的题目。然而,不是每个参与NAEP的学生都完成NAEP评估的所有题目。测验题目分成不同的组,然后打包成不同的小册子。每个学生只需完成一份小册子中的题目,这些题目大约占总题量的10%-20%。将小册子分散开来,这样同一学校中只有很小部分的学生做的是同一小册子中的题目。小册子的发放是完全随机的。
NAEP中既包括了多选题,也包括了开放式的问题。开放式问题要求学生自主作答。学生既可以只言片语也可长篇大论,甚至比写作考试中写得更长。
在每次评估之后,有25%以上的测验题目公开作为样题并附有评分标准和学生作答的样本。
4)取样
NAEP选择了足够大的样本以保证评估结果的信度、效度。各州和各个行政区接受I号基金学校的4年级和8年级学生如果被选中的话都要求参与两年一次的NAEP阅读和数学评估。而其他的评估学校都是志愿参与的。
对于全国评估而言,在没有州评估的年份中,
NAEP选择公立和私立学校学生的随机样本代表全美的多样性学生总体。选择参与的学校和学生的数量会随科目的不同而有所不同。当组织一个无州评估的全国评估时,每个科目通常需要各个年级6000到10000个学生样本。
全国样本的获得通过两阶段分层取样设计:首先根据地理位置对学校进行分类,然后根据少数民族入学的水平进行分类。在每个基于位置与入学分类的类别之中,按照事先确定好的比例进行随机取样,为所有学生和所有的子群体提供精确的结果。
5)评估的实施
NAEP的实施从1月下旬开始持续到3月中旬。训练有素的NAEP实施成员与学校协作实施评估,对整个过程进行管理。要求学校指派一名校方协调者帮助NAEP工作人员进行校内的安排。每个州也都有联邦基金资助的州协调员与参与的学校一起工作。
每个参与NAEP评估的学生要求的作答时间是1小时。在完成每个测验手册中两个25分钟殴的科目相关问题后,学生还需完成两个5分钟段的背景调查。其内容主要涉及与成绩特别是所评定的科目的成绩相关的学校和家庭经历。学生可以跳过任何她/他们不想回答的题目,不过这种不参与和不回答会大大减少NAEP能提供的有用信息。
6)NAEP的评分
NAEP评估中既有多选题又有开放性的问题。多选题使用光电阅读器评分,开放式问题由经过培训的评分者依据评分指南进行评分。为了确保评分的可靠性和一致性,NAEP制定了详细的评分指南,对有经验的评分者进行训练并通过有资格的评分者对评分者的能力进行双重检验,对每个评分者评定的质量与一致性进行监控与评价。
每个开放式问题有各自的评分指南,评定标准。
扩展的开放式问题有4—5个水平的评分指南。
7)学生成绩的报告
NAEP报告每个科目每个年级学生NAEP量表的平均分数。平均量表分数概括了学生知道什么,能做什么。成就水平(Achievement Level)显示了学生在应该知道和应该会做的事情上达到的标准。依科目不同NAEP量表有两种:0-300或者0-500。报告中提供整个年级所有学生的量表平均分,通过区域、性别、种族、学校类型和其他特征所定义的各个团体的量表平均分。
除了报告特定评估年的分数以外,还报告NAEP结果随时间的变化而变化。
NAEP同时还报告成就水平,即在全国,某个州,或某个学生群体中达到特定成绩水平的学生的比例。NAEP将每个科目的成就水平划分为基本、精通和高级。成就水平的结果显示达到基本、精通和高级这三个水平的学生的百分比。
在报告量表分数和成就水平的基础上,NAEP还将数据分别按组别(例如种族、性别、有残障的学生、英语欠精熟的学生)、区域(国家的、州的、地方的)、背景(学生、教师、学校特征)进行分解。
教师、管理者和学生的完整背景调查作为NAEP评估的一部分也进行了分析。使用背景调查问卷获得的信息,就可以将学生的成绩在NAEP的报告变量之间进行比较。
NAEP的评估结果为家长、教师、教育决策者、研究者、课程专家、媒体和美国公众提供了共享的资源。在国家水平上,NAEP以多种形式进行结果报告。“报告卡”是延伸的报告,密切检查NAEP的结果,并且深入地考察评估的设计和实施。“最重要部分”对NAEP数据进行简要概括。在州的水平上,NAEP的结果打印在“最重要部分”中全国结果的旁边。另外, NAEP为每个参与的州提供一页的在线“快照”。NAEP提供的工具和资源使得各个州可以自己发展出综合的州报告和在线的快照报告。对于试验性的城市地区评估而言,可获得单独的“最重要部分”和参与的各个城市地区的在线快照。除了这些书面的资源外,NAEP的出版物和数据都可以在NAEP网站上找到。
2.2 州考试
2002年,美国颁布的《中小学教育修正法》首次要求各州必须实行统一考试,并以考试成绩衡量学校的教育质量,连续两年不达标的学校或地方必须采取措施提高成绩,否则,联邦教育部将扣减其联邦教育拨款。
来 源: 《中国考试》2006年第12期