97超级碰碰碰久久久_精品成年人在线观看_精品国内女人视频免费观_福利一区二区久久

人工智能評判學(xué)生作文可靠嗎

時間:2022-07-03 12:39:32 人工智能 我要投稿
  • 相關(guān)推薦

人工智能評判學(xué)生作文可靠嗎

  深度學(xué)習(xí)目前最接近人類智能

人工智能評判學(xué)生作文可靠嗎

  要回答上述問題,需要先了解一下人工智能在自然語言處理中的工作模式。

  所謂自然語言處理,簡單點(diǎn)說,就是利用計(jì)算機(jī)對人類語言進(jìn)行分析,以完成自動分詞、詞性標(biāo)注、語音識別、自動文摘、機(jī)器翻譯、人機(jī)對話等一系列由簡到繁的語言任務(wù)。

  在自然語言處理技術(shù)的發(fā)展過程中,經(jīng)歷了三種研發(fā)模式:

  第一種是基于規(guī)則的自然語言處理模式,主要通過對話語進(jìn)行語法分析和語義分析,然后轉(zhuǎn)換成計(jì)算機(jī)程序以實(shí)現(xiàn)自然語言的理解和表達(dá)。這種工作模式是最容易想到也是最早進(jìn)行廣泛研究的,它依賴于語言學(xué)家和計(jì)算機(jī)專家的通力合作。

  但是,這種模式很快就遇到了無法突破的瓶頸,因?yàn)槿祟惖恼Z言理解過程實(shí)在太復(fù)雜,而語言學(xué)家對自然語言的分析很不充分,無法提供充足的語法規(guī)則和語義規(guī)則,計(jì)算機(jī)專家就陷入了“巧婦難為無米之炊”的窘境。

  第二種是基于統(tǒng)計(jì)的自然語言處理模式,主要是對語言表達(dá)進(jìn)行概率統(tǒng)計(jì)。這種模式下的人工智能,不需要了解話語的句法結(jié)構(gòu)和語義關(guān)系,只需考察它被人類說出的可能概率就行,被說出的概率越大,相關(guān)話語就越合理。而概率的計(jì)算,可以通過大語料庫基礎(chǔ)上的詞頻統(tǒng)計(jì)來實(shí)現(xiàn)。

  這種工作模式不需要語言學(xué)家提供復(fù)雜的規(guī)則,讓計(jì)算機(jī)搞統(tǒng)計(jì)正是它最拿手的工作。統(tǒng)計(jì)模式的廣泛運(yùn)用,在語音識別、機(jī)器翻譯等領(lǐng)域產(chǎn)生了革命性變化,使很多技術(shù)從實(shí)驗(yàn)室走向了實(shí)際應(yīng)用。

  第三種是深度學(xué)習(xí)的自然語言處理模式。深度學(xué)習(xí)依賴的是大規(guī)模人工神經(jīng)網(wǎng)絡(luò),也就是利用大量電腦處理單元對人類大腦的神經(jīng)元系統(tǒng)進(jìn)行模擬,然后讓這個人工神經(jīng)網(wǎng)絡(luò)通過不斷自我學(xué)習(xí)和自我調(diào)整來完成相應(yīng)的工作。

  這可能是目前最接近人類智能的一種人工智能模式,目前的發(fā)展態(tài)勢驚人,全面超越“阿爾法圍棋”的“阿爾法元”利用的主要就是深度學(xué)習(xí)技術(shù)。

  把作文評分交給電腦?高利害考試中無法實(shí)施

  三種工作模式下的不同人工智能能不能應(yīng)用于語文教育呢?我們不妨以作文評分為例來分別加以說明。

  如果讓人工智能給學(xué)生作文評分,按照基于規(guī)則的工作模式,就必須把評價一篇作文好壞的要素都找出來,如語言、結(jié)構(gòu)、內(nèi)容、思想等等。最關(guān)鍵的工作還要把這些評分因素量化,比如給一篇作文的“語言”項(xiàng)目打10分,你就得告訴電腦,這10分的依據(jù)是什么?是詞匯量多少,還是句子的復(fù)雜度,還是句式的不同類型?

  在第二語言教學(xué)中,類似的評分系統(tǒng)已經(jīng)得到較為廣泛的應(yīng)用,因?yàn)閮H是“語言”項(xiàng)目的話還比較容易量化,但在母語作文評價中其可行性顯然不大。因?yàn)閷τ谀刚Z作文評分來說,結(jié)構(gòu)、思想等項(xiàng)目更為重要,之前人類閱卷者的評價主要依賴整體感知,但這種感覺很難分解,更無法量化。因此,基于規(guī)則的人工智能模式很難在作文評分上有用武之地。

  如果是基于統(tǒng)計(jì)的工作模式,那我們就必須掌握足夠數(shù)量的作文語料,然后構(gòu)建大型語料庫,分析其中各類型作文的各種數(shù)據(jù)。

  比如,優(yōu)秀作文和一般作文在詞匯量和句子結(jié)構(gòu)上有什么統(tǒng)計(jì)差異;

  比如,議論文平均用幾個例子,平均引用多少句名人名言;

  又比如,記敘文寫了幾個細(xì)節(jié),每個細(xì)節(jié)平均多少字……

  在統(tǒng)計(jì)的基礎(chǔ)上,把每篇作文在各方面的表現(xiàn)與平均值進(jìn)行比對,然后評分?jǐn)?shù)。

  顯然,基于統(tǒng)計(jì)的人工智能模式可以詳細(xì)描寫作文的各方面數(shù)據(jù),也可以根據(jù)這些數(shù)據(jù)對作文進(jìn)行等級排序,但是統(tǒng)計(jì)哪些數(shù)據(jù)、這些數(shù)據(jù)的解釋意義,這些數(shù)據(jù)與作文分?jǐn)?shù)之間的關(guān)系,仍然需要語文專家提供意見,而這方面的研究仍然非常薄弱的。

  如果是深度學(xué)習(xí)的工作模式,那就需要有大量事先標(biāo)注好的作文對機(jī)器進(jìn)行訓(xùn)練,這些已經(jīng)精準(zhǔn)給分的學(xué)生作文,被稱為“訓(xùn)練語料”。

  將訓(xùn)練語料輸入到人工神經(jīng)網(wǎng)絡(luò),由其分解為一組向量,再通過分層計(jì)算得出評分,然后將機(jī)器評分與已經(jīng)標(biāo)注好的得分相比較,得到誤差值。

  再根據(jù)誤差值,調(diào)整人工神經(jīng)網(wǎng)絡(luò)的計(jì)算方法和各個向量的權(quán)重,這樣反復(fù)訓(xùn)練后最后可以達(dá)到理想效果:人工神經(jīng)網(wǎng)絡(luò)的評分結(jié)果和事先標(biāo)注的作文分?jǐn)?shù)高度一致。

  這樣,就算在訓(xùn)練語料的封閉環(huán)境里獲得了成功,然后就可以推向開放環(huán)境,也就是提供沒有正確評分的陌生作文,直接由機(jī)器打分。如果經(jīng)驗(yàn)證后和人類專家的評分結(jié)果一致,那么我們就得到了一個能自動評分的人工智能。

  深度學(xué)習(xí)的自動評分在理論上是有可能獲得成功的,但是問題也很多。

  首先,即使評分結(jié)果可用,過程的可解釋性也很差。人工神經(jīng)網(wǎng)絡(luò)把輸入的作文僅當(dāng)作一個數(shù)據(jù)序列,不考慮這篇作文的語言表現(xiàn)、思想內(nèi)容,只是通過各種復(fù)雜計(jì)算的調(diào)試獲得理想的結(jié)果。機(jī)器的分析過程是沒有理據(jù)的,準(zhǔn)確地說是和人類評價作文優(yōu)劣的理據(jù)截然不同——它只是把活干了,但是它是以機(jī)器的方式干成的,人類無法理解。

  其次,我們剛才對研發(fā)過程的說明其實(shí)是過于輕描淡寫了,真正要獲得實(shí)用的理想結(jié)果,訓(xùn)練復(fù)雜度以及因此而要耗費(fèi)的精力和財力在目前技術(shù)條件下恐怕是沒法想象的。

  更重要的是,這里還存在一個“智能倫理”問題,如果把代表人類智能結(jié)晶的作文交給機(jī)器去評分,而這機(jī)器又是以人類無法理解的方式評閱的,這恐怕會大規(guī)模引發(fā)公眾的質(zhì)疑甚至恐懼,在高利害考試中是根本無法實(shí)施的。

  根據(jù)以上分析,要在作文評價領(lǐng)域完全使用人工智能,不說完全不可能,至少要走的路還很長很長。

  作為語文教育的輔助工具人工智能將大有作為

  那么,在語文教育領(lǐng)域,人工智能是否毫無作為呢?當(dāng)然不是。我們認(rèn)為,人工智能可以成為一個很好的輔助工具,在諸多領(lǐng)域大有可為。

  在閱讀教學(xué)中,人工智能可以全面統(tǒng)計(jì)閱讀材料的各種表現(xiàn),為閱讀材料的難度分級提供可量化的標(biāo)準(zhǔn),從而為教材選文、編制課外閱讀書目等教學(xué)實(shí)踐提供有效的幫助。

  在寫作教學(xué)中,人工智能可以通過自動摘要、自動校對等技術(shù)對學(xué)生作文進(jìn)行輔導(dǎo),從而提升一些基本的語言技能和寫作技術(shù)。

  在練習(xí)系統(tǒng)中,人工功能可以構(gòu)建封閉的專家系統(tǒng),對一些有標(biāo)準(zhǔn)答案的知識自動出題、自動測試、自動講解,極大提高參與性和趣味性……

  在評價領(lǐng)域,我們還是以之前分析過的作文評分來詳細(xì)談?wù)勅斯ぶ悄艿目赡軕?yīng)用吧。在中考、高考這樣的高利害考試中,套題寫作是一個非常嚴(yán)峻的問題,在實(shí)際評分時,有時難以認(rèn)定并客觀給分。

  今后,如果有統(tǒng)計(jì)型的人工智能參與,那就可以找出相似度很高的作文來對比、評判,并且給出精確的重復(fù)率百分比。在記敘文評價時,甚至可以更精細(xì)地通過自動摘要技術(shù)、關(guān)鍵詞技術(shù)找出同樣事例來一起評分。這些技術(shù)處理無疑為杜絕抄襲、套題等不良行為提供了有效的防治措施。

  此外,可以通過計(jì)算作文語句在大數(shù)據(jù)庫中出現(xiàn)的概率值來對作文語言的規(guī)范性進(jìn)行評價。作文語言的出現(xiàn)概率值越高,說明其用法越常規(guī),越符合大眾的語言規(guī)范。而概率值特別低則提示了兩種可能性,一個是語言不規(guī)范,應(yīng)給予負(fù)面評價,一個是語言新穎,應(yīng)給予正面評價,機(jī)器初步篩選后的具體判斷工作可以交給人類專家來執(zhí)行,從而使作文語言項(xiàng)目的評分更加準(zhǔn)確規(guī)范。

  還有,統(tǒng)計(jì)型人工智能還可以對學(xué)生作文的整體表現(xiàn)進(jìn)行系統(tǒng)評估。通過對歷屆考試作文的統(tǒng)計(jì)分析,可以得出一系列大數(shù)據(jù),如作文平均詞量和字量、平均句長和句法復(fù)雜度、虛詞使用情況等進(jìn)行統(tǒng)計(jì)分析,為基層的作文教學(xué)提供充足的科學(xué)數(shù)據(jù)。

  最后想強(qiáng)調(diào)的是,人工智能除了在實(shí)際應(yīng)用中對語文教育有多方面的輔助作用,其開發(fā)和研究中遇到的一些問題也在倒逼語文教育工作者思考一些最基本的語文問題:

  要解決閱讀材料難度分級的問題,就必須搞清楚構(gòu)成閱讀材料難度的因素有哪些;

  要解決人工智能自動命題自動訓(xùn)練的問題,就必須搞清楚語文學(xué)科必備的知識點(diǎn)有哪些;

  要解決作文自動評分的問題,就必須搞清楚作文的可操作的評價量表是怎么樣的……

  這些基本的語文難題以前都是含混處理掉了,這些問題不解決,人工智能再先進(jìn)也不可能對語文教育產(chǎn)生決定性的影響。

【人工智能評判學(xué)生作文可靠嗎】相關(guān)文章:

京東超級理財可靠嗎?07-11

網(wǎng)上買的玫琳凱產(chǎn)品可靠嗎?07-12

想做兼職,安全可靠嗎?07-10

保險電銷無責(zé)底薪可靠嗎?07-13

華碩公司招暑期工可靠嗎?07-14

世紀(jì)佳緣相親網(wǎng)可靠嗎?07-10

家樂福兼職收銀員可靠嗎?07-10

華為榮耀3C部分硬件可靠性測試標(biāo)準(zhǔn)可靠嗎?07-11

泰康人壽保險公司可靠嗎?07-13

蘇州英格瑪人力資源公司可靠嗎?07-12