舉世矚目的圍棋世界冠軍柯潔與谷歌AlphaGo的三番棋大戰(zhàn),以AlphaGo3 0完勝告終。機(jī)器人做高考題又會(huì)怎樣?本月7日,2017全國高考將舉行,當(dāng)日下午5時(shí)許,在成都將舉行一場(chǎng)特別的考試:“準(zhǔn)星數(shù)學(xué)高考機(jī)器人” AI-MATHS,將在公證機(jī)構(gòu)和媒體的見證下,挑戰(zhàn)2017年高考數(shù)學(xué)題。這將是國內(nèi)首次由機(jī)器人應(yīng)試高考題,它能考多少分呢?會(huì)比學(xué)霸厲害嗎?
考場(chǎng):斷網(wǎng)答題 公證機(jī)構(gòu)和媒體“監(jiān)考”
記者從研發(fā)單位了解到,與多數(shù)人對(duì)機(jī)器人的印象不同,即將參考的AI-MATHS其“身體”并非模仿人類的樣子,而是10余臺(tái)服務(wù)器,其“大腦”就是服務(wù)器上承載的人工智能系統(tǒng)。“考場(chǎng)”設(shè)在成都天府新谷10號(hào)樓的一個(gè)會(huì)議室里,屆時(shí)入場(chǎng)答題的實(shí)際上就是這些服務(wù)器。像考生會(huì)被切斷與外界的聯(lián)系一樣,這些服務(wù)器也會(huì)被切斷網(wǎng)絡(luò)連接。由公證機(jī)構(gòu)和媒體出任“監(jiān)考老師”。這場(chǎng)特殊的“高考”只設(shè)置數(shù)學(xué)科目,將在7日下午5時(shí)之后,也就是高考數(shù)學(xué)結(jié)束之后進(jìn)行,不會(huì)影響正常高考的進(jìn)行。
AI-MATHS具體將挑戰(zhàn)哪套試卷?成都準(zhǔn)星云學(xué)科技有限公司CEO、清華大學(xué)蘇州研究院大數(shù)據(jù)中心主任林輝表示,高考數(shù)學(xué)結(jié)束后,公司將立即從相關(guān)部門、網(wǎng)絡(luò)等多渠道爭(zhēng)取試卷,“目前擬爭(zhēng)取全國卷、北京卷等幾套,但是最終能拿到哪幾套,具體幾點(diǎn)鐘拿到還不確定。如果拿到多套試卷,AI-MATHS將在2小時(shí)內(nèi)同時(shí)作答多套試卷。”
屆時(shí),如果考題是AI-MATHS都會(huì)答的,它將會(huì)以大概20分鐘一套的速度作答,如果有它不會(huì)的考題,它將先跳過這些題目,把會(huì)答的都答完,再返回來爭(zhēng)取突破剩下的難題,直到解出答案或者考試時(shí)間結(jié)束。
預(yù)測(cè):目標(biāo)110分 今年模擬考得了93分
“成都造”高考機(jī)器人到底是什么來頭?為啥要“高考”?林輝介紹,AI-MATHS誕生于2014年,是依托清華大學(xué)大數(shù)據(jù)、人工智能、自然語言識(shí)別等前沿技術(shù),研發(fā)的一款以自動(dòng)解題技術(shù)為核心的人工智能系統(tǒng)。本次挑戰(zhàn)是對(duì)研發(fā)成效的一次階段性檢驗(yàn),挑戰(zhàn)結(jié)果將運(yùn)用到該公司對(duì)AI-MATHS的技術(shù)驗(yàn)證中。
在此之前,AI-MATHS也像普通高考考生一樣,大量“刷題”,目前已訓(xùn)練500套、約1.2萬道題了。對(duì)于AI-MATHS能在7日取得什么樣的“高考”成績,林輝在昨日接受記者采訪時(shí),并未預(yù)測(cè)分?jǐn)?shù)。
不過,去年5月,在宣布這款高考機(jī)器人參加考試時(shí),團(tuán)隊(duì)設(shè)定的目標(biāo)是110分,當(dāng)時(shí)其已在模擬考中取得過115分的成績。但在今年2月的一次模擬考中,AI-MATHS得到的分?jǐn)?shù)是93分。為何AI-MATHS練題增多,成績卻出現(xiàn)下降?林輝表示,研發(fā)團(tuán)隊(duì)經(jīng)分析發(fā)現(xiàn),問題出現(xiàn)在AI-MATHS對(duì)題意的理解環(huán)節(jié),“題目中出現(xiàn)了AI-MATHS從未 學(xué)習(xí) 過的生詞,如:投資、理財(cái),它以前做的練習(xí)題沒出現(xiàn)過這些詞,它不懂這些詞的意思,就卡在那兒了。”
分析:最大難點(diǎn) 準(zhǔn)確理解題干意思
作為人工智能,AI-MATHS與谷歌阿法狗(AlphaGo)的主要區(qū)別在哪兒?
林輝表示,阿法狗專攻圍棋,AI-MATHS專攻數(shù)學(xué)。研發(fā)圍棋機(jī)器人,用計(jì)算機(jī)語言描述圍棋規(guī)則相對(duì)容易,難在要讓系統(tǒng)在極短時(shí)間內(nèi)算出每次落子后的幾十步甚至幾百步的不同局面。而研發(fā)高考機(jī)器人最大的難點(diǎn)在于,首先要讓系統(tǒng)準(zhǔn)確理解人類語言,后面做題的步驟反而不多。人類的語言千變?nèi)f化,而且還在不斷創(chuàng)新,幾乎是學(xué)不完的。遇到?jīng)]學(xué)過的生詞,人類會(huì)聯(lián)系上下文去推測(cè)詞義,猜對(duì)是比較容易的事;而機(jī)器人卻會(huì)卡殼。比如,正切(tangent)的縮寫,近年來的教材和試題里面都用的是“tan”,但早些年用過“tg”。團(tuán)隊(duì)在訓(xùn)練AI-MATHS用的題都是“tan”,最近突然讓它做了一道“tg”的題,它就懵了。
對(duì)此,研發(fā)團(tuán)隊(duì)除了讓AI-MATHS練更多題,讓它理解更多詞匯的意思外,還對(duì)系統(tǒng)的答題程序設(shè)置進(jìn)行了一些修改,讓它在不能給出完整答案的情況下,也給出部分答案,爭(zhēng)取“步驟分”。