首页 » 网站建设 » 永年夜php技巧_完善新高考学业水平等级考试赋分筹划的三种策略

永年夜php技巧_完善新高考学业水平等级考试赋分筹划的三种策略

访客 2024-12-05 0

扫一扫用手机浏览

文章目录 [+]

完善新高考学业水平等级考试赋分方案的三种策略

杨志明

择要:高考新方案中学业水平等级考试的赋分方案备受争议,由于方案履行后选考物理等较难学科的中上水平考生因“高手对决”得了低分,而选考较易学科的考生因“矮子里面拔将军”得到了高分,导致高考总分排序涌现了问题。
本文根据国际考试行业的成功履历和我国的实际情形,为完善赋分方案提出了“空想方案”和“满意方案”,谈论了一些“无奈方案”,期待这些谈论能为正在制订高考新方案的有关省市带来新的视角。

永年夜php技巧_完善新高考学业水平等级考试赋分筹划的三种策略

关键词:高考;学业水平考试;赋分方法

2014年9月颁布的《国务院关于深化考试招生制度改革的履行见地》(以下简称《履行见地》)明确提出,要“改革招生录取机制,探索基于统一高考和高中学业水平考试、参考综合本色评价的多元录取机制”,并在授予学生“选学选考自由”的权利、战胜“一考定终生”的弊端、实现“由选分为主到选人为主”的招生模式等方面提出了殷切期待。
从社会经济发展对人才本色的哀求等方面来看,《履行见地》是完备顺应时期发展方向的一项重大举措。
然而,“好马还需配好鞍”,一项政策的履行效果每每受制于许多成分,如思想不雅观念、公正机制、技能手段等,个中任何一个环节涌现问题都可能造成严重的负面影响。
从浙江、上海两地的试点情形来看,“技能环节”的一些不敷直接导致了“选考物理的学生人数大幅度低落”[1][2],以及“选学自由被‘田忌赛马’规则所旁边”[3]等非常棘手的问题。
从已经公布的6省市高考综合改革方案来看,大家的问题办理思路基本局限在“限定选择”等政策调度方面,技能方面的问题办理力度明显不足[4][5][6][7][8]。
比如,目前所设计的一些“保障机制”[9][10]就很可能演化成一系列“防不胜防”的麻烦。
实在,“赋分方案”好比是一辆汽车的“发动机”,汽车设计得再好,如果发动机质量存在先天毛病,整台汽车的质量就会大打折扣。
为了完善高考改革新方案,很有必要把“赋分方案”这台“发动机”设计到尽可能地令人满意。
为此,本文从教诲丈量学的理论与运用角度,为完善高中学业水平等级考试赋分方案,设计了“空想方案”和“满意方案”,并谈论了一些“无奈方案”,期待可以为其他正在准备履行高考新方案的省(区、市)供应一些参考。

一、学业水平等级考试赋分方案存在的问题

高考新方案的一个亮点是授予了学生选考的自由,即语文、数学和外语为必考科目,其他3门可以从政治、历史、地理、物理、化学、生物6门或7门(含信息技能)科目中任选。
个中,必考科目紧张为全国统一命题,其他科目为分省(市)命题,统考之外的科目成绩来自高中学业水平等级考试。
不过,目前的学业水平等级考试赋分规则值得进一步完善。
教诲部在《关于普通高中学业水平考试的履行见地》[11]中规定,“计入高校招生录取总成绩的学业水平考试3个科目成绩以等级呈现,其他科目一样平常以‘合格、不合格’呈现。
以等级呈现成绩的一样平常分为五个等级,位次由高到低为A、B、C、D、E。
原则上各省(区、市)各等级人数所占比例依次为:A等级15%,B等级30%,C等级30%,D、E等级共25%。
E等级为不合格,详细比例由各省(区、市)根据基本传授教化质量哀求和命题情形等确定”。
根据这个规定,目前出台的6省市高考综合改革赋分方案设计了如表1所示的详细赋分规则(海南省利用标准分,本文不做谈论)。

十分遗憾的是,这些赋分规则存在着一些问题,由于在“选考自由”的情形下,这些规则会直接导致很多考生的等级分数被严重低估或高估。
也便是说,一旦发生大量低水平考生弃考的情形(如物理),选考群体的原始得疏散布必定会呈极度负偏态,这时,很多中上水平考生的等级分数就会比应有水平低估很多;一旦涌现大多数高水平考生没有选考的情形(如浙江省的信息技能学科),选考群体的原始得疏散布必定会呈极端正偏态,这时很多中下水平考生的等级分数就会比应有水平高估很多。
有大数据仿照研究创造,只要某门学科的竞争对手很强并且低水平考生大规模弃考,很多本色上水平不错的考生(约66%)就必定会得到比自己应有水平更低的分数(最不幸者会少得6分);只要某门学科的竞争对手不强并且大多数高水平考生没有选考,很多本色上水平不高的考生(约84%)就必定会得到比自己应有水平更高的分数(最幸运者可多得6分)。
[12]于是,一个中等水平的考生,一旦他选考了很多低水平考生弃考的,而且一流高校招生又强行哀求的较难学科(比如物理),则很可能会比应有水平少拿6分;若他选考了大部分高水平考生看不上的,而且一流高校招生也可以利用的较易学科(比如信息技能),则很可能会比应有水平多得6分。
这样一反一复,一个中等水平考生的“选考决策”会直接导致高考总分少拿12分旁边的严重后果。
特殊地,当这种“低估或高估”征象在试点过程中被大家亲自感想熏染之后,选学选考过程中的“田忌赛马”行为就变得更加严重,这就极大地增加了社会管理本钱。

更为不妙的是,由于“避难就易”是人的天性,以是选学物理等较难学科的人数一定会更少。
这种征象纵然在国家或高校大力鼓励学生选学物理等学科的情形下也无法杜绝。
比如,美国的高考是高度自由选择的,学生在9~12年级期间,每年都有12次机会(6次SAT和6次ACT)参加任何一门学科或SAT-I的高考。
令人吃惊的是,美国的高中生仅有16%的人对较难学科STEM(科学、技能、工程和数学)干系的职业感兴趣[13],这还是在美国政府和许多高校从招生到助学贷款等方面给出许多本色性优惠政策,大力鼓励学生选学STEM项目的情形下发生的。
于是,“避难就易”的人性特点叠加上“田忌赛马”的游戏规则,直接导致了选学选考物理学科人数大幅度低落等一系列问题。

为理解决物理等学科涌现的大规模弃考等问题,试点省市推出了等级分数打算过程中的“保障机制”。
比如,浙江省规定,当物理考生人数低于6.5万人时,各等级分数的人数比例按分母为6.5万人由高到低打算(上海市为1.5万)。
十分遗憾的是,这种保障机制存在着很多隐患。
比如,除了物理学科,其他学科是否也须要设置保障机制?这个保障基数为什么是6.5万而不是7万或8万?不同省市的保障机制该如何设定?假若全省只有6500人参加物理考试,则无论大家的物理知识和能力水平如何,任何选考了物理学科的学生闭着眼睛也可以得到91分以上的成绩(按照浙江省的赋分规则)。
假若真的涌现这种情形,其他没有选考物理的考生是否会特殊委曲?这种保障机制是在肃清“田忌赛马”投契行为,还是在迫使大家更加仔细地去琢磨谁可能是自己的竞争对手?显然,目前设置的保障机制可能带来意想不到的麻烦。

实际上,高中学业水平等级考试赋分问题的办理还须要有丈量技能手段的强力支持,大略的行政命令或维稳方法是不可能肃清“田忌赛马”行为的。
这就好比一辆汽车,一旦其发动机在设计上出了问题,要想依赖调度汽车形状或内部装修等手段来办理问题显然是不可能的。
目前一些省市由于碰着分数转换等难题而推出的“限考一次”等规定,显然属于政策调度,其问题的完备办理还须要依赖教诲丈量科学等方面的手段。

二、完善高中学业水平等级考试赋分的“空想方案”

从教诲丈量的理论与运用角度看,根治“低估或高估等级分数”和“田忌赛马”问题的空想方案是采取“标准设定”(standard setting)与“测验等值”(test equating)相结合的办理方法。
[4]也便是说,各选考科目首次考试成绩要进行等级标准设定,往后每年要精心选择一个测验等值样本,通过测验等值的办法推算每个科目、每次考试的水平等级线。
详细来说,该方案包括“标杆试卷的研发”“学业标准的设定”“分数常模的研制”以及“测验等值的实现”4项内容。
[5]大略地说,规避学业水平等级考试赋分方案风险的空想方案是“固定标准+年年等值”。
其详细操作技能须要由干系的专业团队来完成。

事实上,我国目前碰着的问题在20世纪30~40年代美国实行高考(SAT)选考自由机制时也同样存在。
比较幸运的是,他们在经由3年旁边的混乱之后,通过“固定标准与年年等值”相结合的办法,在1941年就把问题办理了。
他们在1941年设定好高考标杆和标准之后,不再每年每次更新标准,而是长期利用同样的标准(1941—1990),所有新测验都被通过类似于美元与公民币兑换的测验等值办法,把卷面分数转换成标杆试卷刻度系统上的分数(量表分数)。
广东省当年的高考标准分制度本来效果不错,可惜其详细操作过程中所采取的“年年设定新标准”而不是“固定标准+年年等值”的思路,在碰着学生具有选考自由的情形下(“3+X”高考方案),直接造成了“低估高水平学天生就”的严重后果。
这种“缺失落标准和缺失落等值”的“伪标准分”制度终极被广东省所抛弃。

有评论说[8],“固定标准+年年等值”的赋分方案“是理论上最为完美的办理方案,是最与天下接轨的思路与做法,也是国外很多著名考试项目的常规做法”。
不过,不少人对这个方案表示担忧,认为“老百姓可能不会接管等值分数”。
比如,有学者指出,“我国的考情和欧美一些发达国家大不一样,他们很多成熟有效的做法在我国未必可行。
如每次考试都要组织动机相似的考生样本组进行保密的额外测试和数据剖析等值等事情,不仅在我国由于操作可行性缘故原由难以履行,从理论上看,我国高考和西方以选择题等客不雅观性题目为主的考试形式不同,大量内容是难以定量剖析的主不雅观性试题,更有满分达60分之多的写作等大型主不雅观题,也会提出更多的技能寻衅”[8]。

诚然,我国国情的分外性的确会造成一定困难,但这些困难也是有办法被战胜的。
比如,关于我国高考中主不雅观题题量大的问题,如果采代替表性样本根本上的等值“等组设计”(equivalent group design),合营“线性等值”(linear equating)或“等百分位等值”(equipercentile equating)技能,就不会成为问题。
关于“等值样本应考动机不强”和保密等问题,也可以通过“外锚设计”合营一定的优惠政策等办法得到办理。
当然,详细的等值操作过程须要有一批经由专门演习的丈量剖析专家(psychometrician),这就须要转变各省(区、市)考试机构的职能,变纯挚的管理部门为考试专业做事机构,通过培训和招募专业人才等办法,提升测验命题和丈量剖析的水平。
在美国的考试行业一贯盛行这样一个“潜规则”:如果舍不得花大价钱聘任高水平的测验命题和丈量剖析专家,就不得不用费大价钱聘任高水平的状师去帮测评机构打官司。
两种人才只管都是为测评机构“消灾解难”做事的,但管理的层次却差别很大。
显然,这个规则在我国同样很有参考代价,如果大家舍不得花大力气培植好各省市的测评机构,就一定会为后续的社会维稳等事情付出较高本钱。
事实上,在外洋所有专业性考试机构中,测验等值等生理计量学的事情一样平常由丈量学家(psychometrcian)和统计剖析师(statistician)组成的专业团队互助完成,他们大多具有生理计量学(psychometrics)、统计学和数学等干系专业的博士学位,并有过3年以上的实战履历。
这些做法值得各级考试机构参考。

三、完善高中学业水平等级考试赋分的“满意方案”

由于各级考试机构大多缺少测验等值的专业团队,老百姓也不太明白什么是等值分数,因此,直策应用国际考试行业通畅做法的机遇尚不成熟。
为此,建议暂时放弃“空想方案”中的“测验等值”,考试测验利用另一种方案,即保留各省(区、市)目前推出的赋分规则,但在确定各科等级分数时,“以全省(区、市)的代表性样本为参照”。
由于根据代表性样本所确定的等级分数,不会受到选考群体的得疏散布为极端正偏态或极度负偏态的影响。
这个方案只管不能保障每次考试的分数是等值的,但可以避免“田忌赛马”行为所造成的分数被低估或高估等问题,因此,这个方案可以称之为“满意方案”。

履行“满意方案”的步骤十分大略。
第一步,根据历年的高考数据确定全省(区、市)代表性样本的构成办法。
个中最主要的两个变量是:在理科综合(含物理、化学、生物)或文科综合(政治、历史、地理)考试中,全省各地、州、市历年的考生比例均值(用变量D表示),以及示范性高中与普通高中历年的考生比例均值(用变量K表示);第二步,按照原有模式举行学业水平等级考试,不改变现行考试的所有做法;第三步,从全省(区、市)选考群体中通过掌握变量D和K的办法,随机选取100个代表性样本(也可以是1000个代表性样本等);第四步,对每个代表性样本按照各省(区、市)现行赋分规则确定等级分数线(如5等21级),再求取这些分数线在100个或更多个代表性样本上所得等级分数线的均值,这些均值即为全省(区、市)该学科的“原始分数与等级分数的转换关系”(年度学科常模);第五步,根据“年度学科常模”,把所有考生在对应学科上的原始分数转换为等级分数。
其他事情与常规步骤完备同等。

根据大数据仿照研究的结果,利用代表性样本确定等级分数线的方案,无论考生群体是特殊精良的还是精良学生特殊少的,其原始分数经由“年度学科常模”转化之后的等级分数,都与“没有选考自由”情形下很多考生参加考试时的分数非常相似,没有考生的等级分数会被低估,但约有5.98%的中等水平考生可以多得3分。
这与“大约66%的中上水平考天生就被低估”和“大约84%的中下水平考天生就被高估”的局势完备不同。
[12]可以说,“田忌赛马”无法得到明显好处。
这时,只要明确高校招生事情中对物理等学科的哀求,选考物理学科的学生人数一定可以得到有力的保障。
不过,只要存在选考的自由,选考物理等较难学科的人数一定会有所低落,但利用“满意方案”后不会由于赋分规则的不合理而加剧这种低落。

利用“满意方案”的最大好处是,不须要对现行赋分规则做调度,仅仅须要在确定等级分数线的时候增加一个条件条件——用代表性样本确定等级分数线,“田忌赛马”难题就可以得到根治。
由此,中学选课走班制的试行、高考招生事情中管理本钱的降落等,都有了期许。

四、完善高中学业水平等级考试赋分的“无奈方案”

为了完善学业水平等级考试的赋分方案,许多专家提出了自己的办理方案,个中,“利用标准分”“利用原始分”和“将语、数、外考试作为锚测验去预测物理等学科等级分数”这3种思路影响最大。
实在,这些方案各自存在着一些不敷,可以被统一归纳为“无奈方案”。

关于“利用标准分”方案,该方案的条件条件是“标准设定或常模研发与分数等值相结合”“测验的原始得疏散布基本上呈正态分布”,缺少个中任何一个环节的标准分方案都属于“伪标准分”方案。
这是由于,一方面,一旦选考群体为高水平群体(如浙江省的物理考生),则注定会涌现原始分数的极度负偏态分布的局势(图1)。
这时,无论利用何种方法打算标准分(公式方法、百分位等级化方法、正态化方法等),由原始分所转换过来的任何标准分数都是不恰当的,由于会有相称多的中上水平考生的标准分数变得比应有的分数更低。

另一方面,一旦发生大家只能在物理和信息技能两科中选考一门的情形,精良学生为了报考“985”和“211”等高水平学校,必定会选考物理。
于是,选考信息技能的考生群体中的“高手”很可能会变得较少,考生原始得疏散布很可能会是极度的正偏态分布(图2)。
因此,这种情形下的“伪标准分”一定会把很多中下水平的考天生就推高,造成另一种不公正的结果。
广东省当年试行了几十年的高考标准分制度,在碰着“3+X”方案时,就由于物理选考群体紧张由“尖子”学生构成,导致了许多物理高水平学生的标准分数被严重低估。

关于利用原始分数,这种方案也是一种无奈的倒退。
这种倒退还特殊久远,由于这与持续了1300多年的科举考试赋分方法基本同等。
个中的问题或后果已经有大量研究报告,此处不再进行谈论。
不过,利用原始分数也有一个好处,即没有“3分一跳”的麻烦,老百姓认为这个分数很“公正”。
实在,“3分一跳”的麻烦若采取“山东方案”也是可以办理的,条件是命题水平要足够高,不能涌现很多高手都得同一个分数的局势,否则,谁也没有办法把学生区分开来。

关于“将语、数、外考试作为锚测验去预测物理等学科等级分数”的方案,它在当代考试科学面前是属于一种特殊没有底气的办法。
由于语、数、外与物理等学科的成绩之间仅仅具有一定的正干系关系,用语、数、外成绩来预测物理等学科的等级分数,不仅打算过程繁芜,而且偏差特殊大,并具有明显的“稠浊干系关系与因果关系”痕迹,这个办法实在是自找麻烦的无奈方案。

总之,高中学业水平等级考试的赋分方案存在着明显毛病。
这个问题如果放任自流,必定会带来重大负面影响,乃至造成“播下龙种收成跳蚤”的后果。
本文所归纳的“空想方案”“满意方案”和“无奈方案”可以粗略地看作是问题办理的上、中、下三策,期待能为正在制订赋分规则的有关部门带来一些启示。
当然,除了上述3类方案,可能还有其他更得当的方案。
无论何种方案,希望有关部门能组织考试科学方面的专业团队,结合本省(区、市)自身的特点进行攻关和试点,尽早把这个隐患肃清在没有发生之前,使得新高考这台“高档汽车”能够尽早配上高质量的“发动机”,安全、平稳和高效地行驶在改革大道之上。

参考文献

[1]熊丙奇.浙沪新高考改革试点,我们试得怎么样?[EB/OL].(2017-08-16)[2017-12-10].http://www.sohu.com/a/165029675_567589.

[2]朱邦芬.为什么浙江省选考物理人数大幅低落值得担忧[EB/OL]. [2018-11-10].http://cul.qq.com/a/20171024/013215.htm.

[3]浙江省教诲厅办公室.关于纠正部分普通高中学校违背教诲规律和传授教化哀求缺点做法的关照(浙教办基〔2016〕97号)[EB/OL]. [2018-11-10].http://www.zjedu.gov.cn/news/147737035226665750.html.

[4]杨志明.学业水平考试成绩等级化中的风险及其规避办法[J].教诲丈量与评价,2015(9):62-64.

[5]杨志明.做好高中学业水平考试所必需的四项丈量学准备[J].中国考试,2017,297(1):8-13.

[6]新高考改革研究课题组.沪浙新高考改革4年效果如何?等级赋分技能待改进[EB/OL]. (2018-07-13)[2018-09-10].http://cnews.chinadaily.com.cn/2018-07/13/content_36566407.htm.

[7]温忠麟.新高考选考科目计分办法磋商[J].中国考试,2017(12):23-29.

[8]于涵,韩宁,关丹丹,等.关于改进新高考选考科目赋分方案的多少思考[J].中国高档教诲研究,2018(6):44-49.

[9]浙江省教诲考试院.浙江:深化高考综合改革试点干系政策解读 [EB/OL]. (2017-11-30)[2018-09-10].http://www.moe.edu.cn/jyb_zwfw/zwfw_gdfw/gdfw_zjs/201711/t20171130_320254.html.

[10]上海市公民政府. 《关于进一步深化本市高考综合改革试点事情的多少见地》政策解读[EB/OL].(2018-04-03)[2018-09-10].http://www.shanghai.gov.cn/nw2/nw2 314/nw2319/nw12344/u26aw55501.html.

[11]教诲部.关于普通高中学业水平考试的履行见地(教基二〔2014〕10号)[EB/OL]. (2014-12-10).http://old.moe.gov.cn//publicfiles/business/htmlfiles/moe/s4559/2014 12/181664.html.

[12]Yang,Z. Big Data-Based Norming for Academic Proficiency Tests in China[R/OL].Keynote Speech at the Annual Conference of the Chinese American Educational Research and Development(2018-04-12).https://www.caerda.org/2018_caerda_conference_nyc.php.

[13]U.S.Department of Education.Science,Technology,Engineering and Math:Education for Global Leadership[EB/OL]. [2018-10-20].https://www.ed.gov/Stem.

(本文首次揭橥在《教诲丈量与评价》2018年第12期)

标签:

相关文章

php树屋技巧_最适合进修的轨范设计

但是,如果您认为从电脑学习编程很无聊,那么您也可以利用智好手机学习编程。以是,本日我要见告你关于学习编程最好的android运用程...

网站建设 2024-12-07 阅读0 评论0