漢語(yǔ)智能寫(xiě)作獲重大突破 自動(dòng)生成有感情的文稿
輸入“時(shí)間”“學(xué)校”“參加人員”和“領(lǐng)導(dǎo)”等大學(xué)生運(yùn)動(dòng)會(huì)關(guān)鍵詞,,機(jī)器就迅速生成一篇1000多字的開(kāi)幕式致辭,,其中有致謝,、天氣情況,、運(yùn)動(dòng)會(huì)人數(shù)及項(xiàng)目等,。更難能可貴的是,,致辭還富有情感色彩——這是日前在“2016中國(guó)漢語(yǔ)智能寫(xiě)作成果發(fā)布會(huì)”上的一幕,。
5月下旬,,北京語(yǔ)言智能協(xié)同研究院發(fā)布漢語(yǔ)智能寫(xiě)作重大突破——體育賽事新聞,、大學(xué)生運(yùn)動(dòng)會(huì)開(kāi)幕式致辭和高校學(xué)術(shù)活動(dòng)總結(jié)稿件可以由智能寫(xiě)作平臺(tái)自動(dòng)完成寫(xiě)作。該成果是首都師范大學(xué)副校長(zhǎng)周建設(shè)教授擔(dān)任領(lǐng)銜專(zhuān)家的研究團(tuán)隊(duì)經(jīng)過(guò)多年探索,,在語(yǔ)言智能研究領(lǐng)域取得的一項(xiàng)重大理論和技術(shù)突破,。
如何看待能夠自動(dòng)寫(xiě)作的機(jī)器
智能寫(xiě)作平臺(tái)準(zhǔn)確、快捷地生成應(yīng)用稿件,,具有開(kāi)創(chuàng)性意義,。北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所所長(zhǎng)王厚峰教授說(shuō),“演示令我很驚訝”,。
據(jù)周建設(shè)介紹,,智能寫(xiě)作是利用計(jì)算機(jī)完全自動(dòng)地對(duì)收集的文檔進(jìn)行整理、提取,、過(guò)濾,、篩選、組裝、寫(xiě)作,,自動(dòng)地生成相關(guān)文章,。
北京語(yǔ)言智能協(xié)同研究院特聘教授呂學(xué)強(qiáng)說(shuō),研究團(tuán)隊(duì)通過(guò)對(duì)受限語(yǔ)體海量篇章文本數(shù)據(jù)的挖掘,,提出了一種大數(shù)據(jù)的漢語(yǔ)表達(dá)智能模型并研發(fā)了漢語(yǔ)受限語(yǔ)體智能寫(xiě)作系統(tǒng),,構(gòu)建了相關(guān)知識(shí)庫(kù)體系。目前,,智能寫(xiě)作平臺(tái)能夠完成受限語(yǔ)體的文稿,,受限語(yǔ)體是有特定使用場(chǎng)合,結(jié)構(gòu),、格式比較固定的語(yǔ)體,。
這項(xiàng)漢語(yǔ)智能寫(xiě)作重大突破,是國(guó)家社科基金重大招標(biāo)項(xiàng)目子項(xiàng)目——“自然語(yǔ)言信息處理的邏輯語(yǔ)義學(xué)研究·言語(yǔ)生成系統(tǒng)”“語(yǔ)言,、思維,、文化層次的高階認(rèn)知研究·語(yǔ)圖生成系統(tǒng)”的階段性成果;也是國(guó)家自然科學(xué)基金項(xiàng)目——“語(yǔ)義web中不確定知識(shí)的本體表示和融合的理論方法研究”“無(wú)監(jiān)督分詞及詞性歸納聯(lián)合方法研究”“e—earning中基于學(xué)業(yè)表情的情緒認(rèn)知分析研究”的階段性成果,。
據(jù)介紹,,漢語(yǔ)智能寫(xiě)作平臺(tái)包含32項(xiàng)關(guān)鍵技術(shù),其所寫(xiě)文稿內(nèi)容流暢性,、語(yǔ)義準(zhǔn)確性與人工寫(xiě)作的差別在縮小,。
智能寫(xiě)作平臺(tái)的理論技術(shù)創(chuàng)新
想要機(jī)器像人一樣自如寫(xiě)作,就要構(gòu)建“人一樣”的漢語(yǔ)表達(dá)智能模型,。在語(yǔ)言生成的過(guò)程中,,漢語(yǔ)智能寫(xiě)作平臺(tái)對(duì)所要表達(dá)的信息進(jìn)行語(yǔ)義和語(yǔ)法方面的聚合,其中,,內(nèi)容規(guī)劃即內(nèi)容確定+結(jié)構(gòu)構(gòu)造,,句子規(guī)劃包括選詞、優(yōu)化聚合,、指代表達(dá)式生成等,,句子實(shí)現(xiàn)就是將經(jīng)句子規(guī)劃后的文本描述映射至由文字、標(biāo)點(diǎn)符號(hào)和結(jié)構(gòu)注解信息組成的表層文本,。
首都師范大學(xué)文學(xué)院教授史金生說(shuō),,漢語(yǔ)智能寫(xiě)作平臺(tái)構(gòu)建了基于漢語(yǔ)智能表達(dá)的知識(shí)庫(kù),其一是語(yǔ)言模板庫(kù)——單詞,、短語(yǔ),、句子語(yǔ)料庫(kù);其二是語(yǔ)義類(lèi)型庫(kù)——給漢語(yǔ)智能表達(dá)提供話語(yǔ)論域,,以便將話題限定在特定語(yǔ)義領(lǐng)域內(nèi)布局謀篇,、組織語(yǔ)句,。有兩個(gè)子系統(tǒng)支持漢語(yǔ)表達(dá)智能模型,即“詞項(xiàng)—語(yǔ)句”語(yǔ)義網(wǎng)絡(luò),,實(shí)現(xiàn)從詞到句子的自動(dòng)生成,;“語(yǔ)句—語(yǔ)篇”語(yǔ)義網(wǎng)絡(luò),實(shí)現(xiàn)自然語(yǔ)言語(yǔ)篇的自動(dòng)生成,。
漢語(yǔ)智能寫(xiě)作平臺(tái)的理論突破主要是多源成像基礎(chǔ)理論體系,,即面向復(fù)雜教育知識(shí)體系,構(gòu)建音頻,、視頻,、文字、圖像為載體的多源異構(gòu)數(shù)據(jù)融合模型和多模態(tài)人機(jī)交互模型,,探索客體成像,、認(rèn)知成像和言語(yǔ)成像規(guī)律,解決客體,、人腦與語(yǔ)言三個(gè)世界的成像同構(gòu)問(wèn)題,。
漢語(yǔ)智能寫(xiě)作平臺(tái)的技術(shù)突破主要體現(xiàn)在多模態(tài)認(rèn)知意象可視化技術(shù),包括智能教育機(jī)器人技術(shù),、學(xué)習(xí)軌跡跟蹤與處理技術(shù)、“語(yǔ)—圖”及“圖—語(yǔ)”轉(zhuǎn)換生成技術(shù),、語(yǔ)言生成與理解中的多源成像融合技術(shù),。
中國(guó)科學(xué)技術(shù)信息研究所研究員張寅生說(shuō),從高混亂度的信息材料中抽取知識(shí),,按特定場(chǎng)景,、話題、文體進(jìn)行寫(xiě)作,,難度很大,。他認(rèn)為,這種漢語(yǔ)集成寫(xiě)作體現(xiàn)了人類(lèi)智慧,,是言語(yǔ)生成研究方向的歷史性突破,。
漢語(yǔ)智能寫(xiě)作的孕育和應(yīng)用前景
漢語(yǔ)智能寫(xiě)作從最初設(shè)想到最終實(shí)現(xiàn),經(jīng)過(guò)了漫長(zhǎng)跋涉,。周建設(shè)早在上世紀(jì)80年代即開(kāi)始語(yǔ)言智能理解表達(dá)相關(guān)問(wèn)題研究,,發(fā)表了多篇論文。其中《面向語(yǔ)言處理的計(jì)算與認(rèn)知取向》一文,,提出了“語(yǔ)言智能表達(dá)目標(biāo)”,,并初步提出構(gòu)建語(yǔ)言生成系統(tǒng)的設(shè)想;《基于大數(shù)據(jù)的漢語(yǔ)表達(dá)智能模型及其理論基礎(chǔ)》一文,,提出了構(gòu)建基于大數(shù)據(jù)的漢語(yǔ)表達(dá)智能模型,。
2015年,,在前期理論指導(dǎo)下,研究團(tuán)隊(duì)開(kāi)發(fā)了漢語(yǔ)受限預(yù)提智能寫(xiě)作平臺(tái),,初步實(shí)現(xiàn)了前期構(gòu)想的漢語(yǔ)智能表達(dá)系統(tǒng),。
北京語(yǔ)言智能協(xié)同研究院依托首都師范大學(xué),該校在語(yǔ)言智能研究領(lǐng)域擁有北京市成像技術(shù)高精尖中心,、自然科學(xué)與社會(huì)科學(xué)兩界協(xié)同創(chuàng)新基地,、市級(jí)協(xié)同創(chuàng)新中心等6個(gè)創(chuàng)新機(jī)構(gòu),還擁有3個(gè)相關(guān)博士學(xué)位授予權(quán)的一級(jí)學(xué)科,、多個(gè)國(guó)家重點(diǎn)學(xué)科和北京高校重點(diǎn)實(shí)驗(yàn)室,。研究院現(xiàn)有包括哈佛大學(xué)在內(nèi)的協(xié)同單位20余家,研究團(tuán)隊(duì)專(zhuān)家100余人,。近3年來(lái),,研究院參與科研項(xiàng)目30余項(xiàng),獲得發(fā)明專(zhuān)利15項(xiàng),,軟件著作權(quán)40項(xiàng),,各類(lèi)大數(shù)據(jù)資源庫(kù)、語(yǔ)料庫(kù)20余種,。研究團(tuán)隊(duì)2016年在研項(xiàng)目包括國(guó)家社科基金重大委托項(xiàng)目,、國(guó)家語(yǔ)委重大課題等,未來(lái)研究方向?yàn)榻鹑诤腕w育新聞,、應(yīng)用文書(shū)自動(dòng)寫(xiě)作,,中小學(xué)生作文輔助寫(xiě)作,還將瞄準(zhǔn)智能教育機(jī)器人產(chǎn)品,。
來(lái)自北京航空航天大學(xué)計(jì)算機(jī)學(xué)院的張小明認(rèn)為,,漢語(yǔ)智能寫(xiě)作平臺(tái)生成的文稿內(nèi)容流暢,還加入了情感因素,,有很大應(yīng)用價(jià)值,。(董洪亮)