人工智能技術(shù)在語言學(xué)領(lǐng)域的應(yīng)用
20世紀(jì)90年代初,我國著名學(xué)者周海中先生曾經(jīng)預(yù)言:人工智能技術(shù)將廣泛應(yīng)用到各學(xué)科領(lǐng)域,會產(chǎn)生意想不到的效果。如今,越來越多的事實(shí)證明了他的這一預(yù)言。有關(guān)專家指出:人工智能技術(shù)潛力無限,在語言學(xué)領(lǐng)域的應(yīng)用前景十分廣闊,將成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量。
人工智能技術(shù)是計(jì)算機(jī)科學(xué)的一個重要分支,屬于自然科學(xué)、社會科學(xué)、技術(shù)科學(xué)三向交叉學(xué)科;它從上世紀(jì)五十年代誕生起就表現(xiàn)出了極強(qiáng)的生命力,在八十年代后期得益于計(jì)算機(jī)軟硬件發(fā)展的日新月異而得到迅猛發(fā)展。人工智能技術(shù)作為當(dāng)下科技領(lǐng)域最熱門的技術(shù),吸引了眾多行內(nèi)和行外人士的關(guān)注;它也已滲透進(jìn)學(xué)術(shù)領(lǐng)域,正以各種方式玩轉(zhuǎn)學(xué)術(shù)界。目前,人工智能技術(shù)包括大數(shù)據(jù)、語音識別、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理五大部分。人工智能技術(shù)主要是建設(shè)在機(jī)器學(xué)習(xí)的基礎(chǔ)上,而機(jī)器學(xué)習(xí)不僅需要合理、適用和先進(jìn)的算法和算力,還需要依賴足夠好和足夠多的數(shù)據(jù)。
人工智能技術(shù),是一種對人類智能現(xiàn)象的模擬,其中包括對人類思維過程的模擬;它涉及到計(jì)算機(jī)科學(xué)、心理學(xué)、語言學(xué)等學(xué)科。人工智能技術(shù)的發(fā)展似乎并不遵循由低級到高級的進(jìn)化過程,而是會在一些“點(diǎn)”上,也就是某單一維度上突然變得比人類“聰明”很多。人類智能是綜合多維的,或許我們的學(xué)習(xí)、記憶、信息搜索、決策、判斷或者加工能力并不是最了不起的,AlphaGo已經(jīng)證明,我們?nèi)祟愒谶@些方面可能不如深度學(xué)習(xí)后產(chǎn)生的人工智能技術(shù)。
語言學(xué),顧名思義,是研究自然語言(即人們?nèi)粘J褂玫恼Z言)的學(xué)科;但是,語言學(xué)不是指學(xué)習(xí)某一門或幾門具體的語言過程。語言學(xué)的任務(wù)是研究、描寫語言的結(jié)構(gòu)、功能及其歷史發(fā)展,揭示語言的本質(zhì),探索語言的共同規(guī)律。因?yàn)橹挥腥祟愑姓Z言、使用有聲語言進(jìn)行交際,因此通過語言研究,可以更加清楚地了解人類在世界或宇宙中的位置,從而更加透徹地理解人類的本質(zhì)。語言是人類區(qū)別與萬物的重要標(biāo)準(zhǔn),機(jī)器理解人類的語言是人工智能技術(shù)最后一個挑戰(zhàn),也是最難的一個挑戰(zhàn)??梢哉f,自然語言是人類智能的最高層的抽象表達(dá)。
語言學(xué)作為研究自然語言的科學(xué),它的歷史非常古老;人類最早的語言研究是從解釋古代文獻(xiàn)開始的,是為了研究哲學(xué)、歷史和文學(xué)而研究語言的。而人類的多種智能都與語言有著密切的關(guān)系;語言是人類特有的溝通方式,在生物或心理層面上反映人類高度演化的心智能力,在社會文化層面上反映人類文明進(jìn)步。語言學(xué)就是要研究人類最核心本能的語言能力,透過對口語、書面語甚至手語進(jìn)行分析和研究,進(jìn)而了解人類的本質(zhì)。除了認(rèn)識人類的本質(zhì)外,語言學(xué)研究還具有多種應(yīng)用價(jià)值。
人的思維過程可以理解為符號處理的計(jì)算過程;人類的語言理解過程也可以理解為是一種在知識表示上的計(jì)算過程,這使得計(jì)算機(jī)理解自然語言在技術(shù)上具有可能性。因此,對語言的認(rèn)知研究自然延伸到對語言的計(jì)算分析??梢哉f,對語言有處理能力是人工智能技術(shù)的一種高級表現(xiàn)形式。雖然語言學(xué)與人工智能技術(shù)有重要的區(qū)別,但它們的研究卻有著密切的聯(lián)系;它們相互促進(jìn),共同發(fā)展。從理論與應(yīng)用的角度看,語言學(xué)目前至少有以下幾個分支學(xué)科與人工智能技術(shù)有關(guān)。
計(jì)算語言學(xué)
計(jì)算語言學(xué)是植根于計(jì)算機(jī)科學(xué)、語言學(xué)和數(shù)學(xué)等多學(xué)科沃土而成長起來的一門新興學(xué)科。它通過建立形式化的數(shù)學(xué)模型,來分析、處理自然語言,并在計(jì)算機(jī)上用程序來實(shí)現(xiàn)分析和處理的過程,從而達(dá)到以機(jī)器來模擬人的部分乃至全部語言能力的目的。它的項(xiàng)目有統(tǒng)計(jì)資料,檢索情報(bào),研究詞法、句法,識別文字,合成語音,編制機(jī)助教學(xué)程序,進(jìn)行機(jī)助翻譯等。擁有對語言的感悟和理解是語言計(jì)算的基礎(chǔ),語言與思維的密切聯(lián)系,語言的變化性、變異性、內(nèi)省性等都不為人們所把握和確知。計(jì)算語言學(xué)的主要目的為借助計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)領(lǐng)域中的模型與算法,解決語言學(xué)中的問題。可見,人工智能技術(shù)在計(jì)算語言學(xué)研究中起著舉足輕重的作用。
自然語言處理(NLP)是計(jì)算語言學(xué)的一個重要研究課題,它主要研究如何利用計(jì)算機(jī)來理解和生成自然語言。實(shí)現(xiàn)人機(jī)間自然語言通信意味著要使計(jì)算機(jī)既能理解自然語言文本的意義,也能以自然語言文本來表達(dá)給定的意圖、思想等。前者稱為自然語言理解,后者稱為自然語言生成。自然語言處理的目的是高效的可用于處理自然語言的算法,但實(shí)現(xiàn)自然語言理解和自然語言生成是十分困難的,造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性。
認(rèn)知語言學(xué)
認(rèn)知語言學(xué)主要是在認(rèn)知科學(xué)的理論背景下建立起來的,同時兩者之間亦有同步發(fā)展、相輔相成的關(guān)系。認(rèn)知科學(xué)既推動了認(rèn)知語言學(xué)的發(fā)展,成為后者的主要理論基礎(chǔ),同時也汲取了認(rèn)知語言學(xué)的研究成果,認(rèn)知語言學(xué)成為認(rèn)知科學(xué)的主要組成部分之一。因此,也有不少學(xué)者將認(rèn)知語言學(xué)視為認(rèn)知科學(xué)的一個分支,把它作為是認(rèn)知研究和語言學(xué)的邊緣學(xué)科。認(rèn)知語言學(xué)的特點(diǎn)是把人們的日常經(jīng)驗(yàn)看成是語言使用的基礎(chǔ),著重闡釋語言和一般認(rèn)知能力之間密不可分的聯(lián)系。人工智能模擬人的認(rèn)知過程和交際過程,可以幫助我們更好地揭示語言的本質(zhì)規(guī)律,進(jìn)而更好地認(rèn)識人類智能。可以說,人工智能技術(shù)對于認(rèn)知語言學(xué)研究具有十分重要的作用。
認(rèn)知語言學(xué)涉及人工智能、語言學(xué)、心理學(xué)、系統(tǒng)論等多種學(xué)科,它針對生成語言學(xué),提出語言的創(chuàng)建、學(xué)習(xí)及運(yùn)用,從基本上都必須能夠透過人類的認(rèn)知而加以解釋,因?yàn)檎J(rèn)知能力是人類知識的根本。認(rèn)知語言學(xué)對于構(gòu)建人工智能技術(shù)的操作系統(tǒng)來說是一種指導(dǎo)思想??梢韵胂笪磥砦覀儗θ斯ぶ悄芗夹g(shù)的交互不是再用一行行命令,而更像是人與人之間的交流;這就要求該技術(shù)必須具備語言能力。另外,語言也具有指導(dǎo)認(rèn)知和思維的作用。由此可見認(rèn)知語言學(xué)對于人工智能技術(shù)的重要性。
老年語言學(xué)
老年語言學(xué),顧名思義,就是研究老年人語言問題的學(xué)科。它主要研究老年人運(yùn)用的語言系統(tǒng)的性質(zhì)、結(jié)構(gòu)及其變化規(guī)律和言語交往問題。研究的基本內(nèi)容包括老年語音、音位、詞匯、語法、修辭、文字等和老年人語言風(fēng)格的靈活性、閱讀技能障礙以及雙語老人第二語言的喪失等。在應(yīng)用上,老年語言學(xué)還包括外語學(xué)習(xí)與成功老齡、老年看護(hù)溝通、臨終關(guān)懷與喪慰等方面。伴隨著年齡的增長,老齡人群會出現(xiàn)語言衰退、甚至語言障礙現(xiàn)象,老年語言學(xué)研究及其應(yīng)用正日益受到關(guān)注。實(shí)現(xiàn)老年人疾病的智能檢測與干預(yù)是智慧醫(yī)療的核心內(nèi)容之一,而人工智能技術(shù)可以在這方面提供協(xié)助。
老年語言學(xué)研究具有跨學(xué)科屬性,涉及語言學(xué)、認(rèn)知科學(xué)與腦科學(xué)等多個領(lǐng)域,也與人工智能技術(shù)密切相關(guān)。正常老年人及罹患神經(jīng)退行性疾病老年人語言能力衰退的神經(jīng)機(jī)制、疾病病理、治療康復(fù)等問題,屬于從分子、細(xì)胞及行為水平研究人腦機(jī)理的腦科學(xué)范疇;語言與感知、記憶、思維、情感、意識等緊密相關(guān),言語理解與產(chǎn)出研究及言語治療等問題,屬于認(rèn)知科學(xué)范疇;如何利用現(xiàn)代科技,對人腦的語言功能進(jìn)行模仿,對語言能力衰退及其干預(yù)進(jìn)行輔助,屬于人工智能研究及應(yīng)用范疇。
由上可見,人工智能技術(shù)和語言學(xué)是兩個相互獨(dú)立卻又密切相關(guān)的研究領(lǐng)域。人工智能技術(shù)的發(fā)展,需將語言學(xué)理論的研究成果運(yùn)用到人機(jī)對話的設(shè)計(jì)中,使機(jī)器理解“寒暄”、“安撫”甚至是“諷刺”、“幽默”這樣的言語修辭行為,讓機(jī)器真正讀懂人類語言的復(fù)雜語義,以及背后的意圖和情感,然后給予用戶擬人的反饋,從而達(dá)到更好的人機(jī)自然語言交互效果。同樣,人工智能技術(shù)也必將改變語言學(xué)研究的發(fā)展方向。傳統(tǒng)的重理論分析而輕實(shí)例,坐著想句子的研究方法將逐漸退出舞臺;真實(shí)語料、口語和書面語并重,側(cè)重對語言形態(tài)進(jìn)行統(tǒng)計(jì)分析的多模態(tài)研究將會大量涌現(xiàn)。