国产日韩欧美_..真实国产乱子伦对白在线_欧_国产成人精品一区二区三区视频_国产一区二区_国产麻豆剧传媒精品国产AV_国内精品国产成人国产三级_亚洲国产成人精品女人久久久_国产农村妇女精品一二区_国产裸体美女永久免费无遮挡_国产aⅴ激情无码久久久无码

人工智能參與高考閱卷,給1078萬考生批卷的,可能不是個人

發(fā)布日期:2021-06-08

目前人工智能已經(jīng)與教育領(lǐng)域深度融合,利用大數(shù)據(jù)開展的個性化學(xué)習(xí)覆蓋學(xué)生已超千萬。

又一年高考開始了,4000余萬份高考試卷成績,還有背后1078萬考生的命運,都在各位閱卷組老師手中。

自1978年恢復(fù)高考,至今已有43年,高考閱卷拋棄了上世紀(jì)傳統(tǒng)的手改手核的方式,換上電腦開始無紙化閱卷。近幾年,全國多省陸續(xù)試點人工智能閱卷。采用人工智能輔助網(wǎng)上評卷質(zhì)量監(jiān)控系統(tǒng),最大限度考分的真實性。人工智能輔助網(wǎng)上評卷質(zhì)量監(jiān)控系統(tǒng)主要使用在作文評卷方面,它會在后臺對試卷進(jìn)行評判,將其結(jié)果與人工教師評卷結(jié)果進(jìn)行對照,如果發(fā)現(xiàn)偏差較大,就會對現(xiàn)場的人工評卷進(jìn)行提醒,保證評卷按照標(biāo)準(zhǔn)化操作繼續(xù)處理、進(jìn)行。未來,高考或許會拋棄人工,讓機(jī)器獨立閱卷。

近年來,人工智能技術(shù)快速發(fā)展,或許會成為解救閱卷老師的希望。

誰在雇傭AI閱卷?

人工智能閱卷的歷史,最早可以追溯到1996年。

美國杜克大學(xué)的埃利斯·佩奇設(shè)計開發(fā)出一款名為PEG的作文評分系統(tǒng),是世界上最早智能評分系統(tǒng)。

到2005年,美國一家非盈利性考試服務(wù)中心Educational Testing Service(簡稱ETS)便推出了一個名為E-rater的機(jī)器評分系統(tǒng),應(yīng)用于GRE、TOFEL等考試。

該組織官網(wǎng)資料,該系統(tǒng)用到了人工智能技術(shù)給試卷打分。這個AI系統(tǒng)不光能指出考生的語法、用詞和拼寫錯誤,在作文題中還可以評價考生的文章立意、組織結(jié)構(gòu)和語言風(fēng)格[7]。

2016年,日本文部科學(xué)省宣布,考慮引入AI為日本高考判卷[8]。

而國內(nèi)涉足AI評卷的科技公司,有兩家。

一家是阿里。2017年,浙江外國語學(xué)院在一次考試中,用阿里的人工智能系統(tǒng)為外國留學(xué)生的中文試卷閱卷,并宣稱AI閱卷準(zhǔn)確率已超過人類[9]。

次年9月,阿里又發(fā)起一場全球數(shù)學(xué)比賽,“閱卷老師”同樣是阿里自研的人工智能。

另一家,則是發(fā)跡于教育的科大訊飛。

科大訊飛在早年便開發(fā)出口語測評系統(tǒng),為多地普通話考試提供智能評分服務(wù)。后來,訊飛又把注意力從口語轉(zhuǎn)向文字,研究智能批改技術(shù)。

2015年11月,科大訊飛曾在安慶、合肥等地的學(xué)校試點用AI批改作文[11];一個月后的科大訊飛年度發(fā)布會上,董事長劉慶峰又推出智學(xué)網(wǎng),宣稱能實現(xiàn)全科閱卷、智能批改。

語文作文智能評分流程 | 來源:科大訊飛智慧教育

2017年中考,湖北襄陽首次引入訊飛的人工智能閱卷系統(tǒng)。一年后,安徽首次把該系統(tǒng)應(yīng)用于高考。

茲事體大,安徽教育考試院沒敢讓AI在高考中挑大梁,該系統(tǒng)主要用于作文題輔助閱卷,給老師“打打下手”。中安在線曾報道,“它在后臺對試卷進(jìn)行評判,與老師的閱卷結(jié)果進(jìn)行對照,如果偏差較大,會進(jìn)行提醒。”[13]

雖然人工智能暫時還是“輔助”角色,但并不影響各地教育考試院的采購熱情。自2018年起,科大訊飛先后中標(biāo)安徽、河北、湖北等地的采購需求。科大訊飛智慧教育公眾號文章中稱,該技術(shù)每年服務(wù)的中高考考生,已超過600萬。

訊飛子公司——訊飛啟明中標(biāo)湖北省教育考試院人工智能閱卷項目 | 來源:中國政府采購網(wǎng)[15]

Z老師也表示,當(dāng)?shù)馗呖茧m然未曾使用過人工智能閱卷,但教育考試院的技術(shù)部門確實在對接相關(guān)事宜。

雖然暫時派不上什么用處,但往好處看,這些系統(tǒng)的采購價格都不貴——

2018年8月,安徽省教育招生考試院采購智能閱卷網(wǎng)評質(zhì)量控制服務(wù),價格為15.8萬元;

2020年7月,湖北省教育考試院采購高考人工智能評卷服務(wù)和研考人工智能評卷檢測服務(wù),價格為20.3萬元;

2020年10月,河北省教育考試院采購人工智能AI質(zhì)檢技術(shù)測試服務(wù),價格為19.76萬元。

若按照每個高考閱卷老師補(bǔ)貼2000元計算,20萬元不過是100個老師的成本。一旦投入使用,將給教育考試院節(jié)省大量人力支出。

誰更有資格決定考生命運?

從前,考生的命運掌握在閱卷老師手心,他們答個卷都得想著閱卷老師的體驗——

答卷要用黑色簽字筆,閱卷老師看得更清楚;

寫字要寫楷體(至少要整潔),方便閱卷老師分辨;

答題卡要嚴(yán)格分區(qū),讓閱卷老師理解作答順序。

即便如此,人工閱卷仍然不盡人意。

2014年高考,有浙江閱卷老師反映閱卷速度過快,“主觀題平均用時9秒,作文平均1分鐘判閱完成”。上海交通大學(xué)教授、21世紀(jì)教育研究院副院長熊丙奇稱此類問題普遍存在,甚至有人直言高考閱卷是“草菅人命”[16]。

2020年,一篇名為《生活在樹上》的滿分作文引發(fā)爭議,浙江語文評卷組作文組組長被舉報開課賣書,“既做教練,又當(dāng)裁判”。

把閱卷任務(wù)交給AI,對考生來說就是好事嗎?

與人工閱卷相比,AI不知疲倦、閱卷速度快,而且有標(biāo)準(zhǔn)統(tǒng)一,犯錯幾率也小。但是,AI“眼中”的標(biāo)準(zhǔn),一定適用于高考嗎?

一方面,AI的偏見在閱卷中已有先例。

Vice曾指出,前述ETS的智能評分系統(tǒng)E-rater存在算法偏見——它更傾向于給中國學(xué)生高分,而給非裔美國學(xué)生、阿拉伯學(xué)生和西班牙學(xué)生低分。后經(jīng)ETS研究,發(fā)現(xiàn)這是由于中國學(xué)生作文篇幅更長,使用的句式和詞匯更加復(fù)雜[18]。但拗口的句子和華麗的辭藻,顯然不是高考作文的“金標(biāo)準(zhǔn)”。

另一方面,AI閱卷系統(tǒng)的“智能程度”,還有待檢驗。

2020年,美國一款服務(wù)于兩萬所學(xué)校的AI閱卷系統(tǒng)被指存在漏洞,考生只要列出相應(yīng)關(guān)鍵詞,就能被系統(tǒng)識別并獲得高分[19]。事實上,在中國高三學(xué)生群體中,“高分作文模板”也已流行多年,AI到底能給高分還是判定“抄襲”?一旦再出一篇半文半白的文章,AI讀得懂嗎?

根據(jù)科大訊飛在2021年4月公布的數(shù)據(jù),人工智能評閱語文作文的人機(jī)評分一致率為99.33%。但若全國均使用人工智能閱卷,今年上千萬的考生中,最終也會有7.2萬人受到AI的不公正對待,誰來保證少數(shù)考生的利益?

2020年8月,教育部考試中心稱要“堅決維護(hù)高考評卷和命題工作公平公正”,但是要做到絕對的公平,靠人很難,靠AI也還需要時日。

目前已有多個省市針對語文、英語作文等主觀性命題引入了機(jī)器閱卷。將機(jī)器閱卷與人工閱卷結(jié)合,當(dāng)機(jī)器與人工閱卷結(jié)果分差較大時,會自動挑選出來交給專家組進(jìn)行最后判別,從而減少主觀評價的差異性,使得主觀題的評價更加客觀、公平。


分享到: