深度知識的六個維度：如何讓人工智能真正理解世界？

作者：小編更新時間：2022-05-24 點擊數(shù)：

近日，英特爾實驗室副總裁兼緊急人工智能研究主任Gadi Singer介紹了這種賦予人工智能更高認(rèn)知的知識構(gòu)建（knowledge constructs）的數(shù)個維度。

什么知識讓我們變得聰明？我們用來理解世界、解釋新體驗和做出深思熟慮的選擇的認(rèn)知結(jié)構(gòu)是什么？定義一個闡明給人類或人工智能更深入理解和更高認(rèn)知的知識的框架，將有助于我們對此話題進(jìn)行結(jié)構(gòu)化的討論。

近日，英特爾實驗室副總裁兼緊急人工智能研究主任Gadi Singer介紹了這種賦予人工智能更高認(rèn)知的知識構(gòu)建（knowledge constructs）的數(shù)個維度，并指出一條通往更高智能機器的道路。

深度知識的六個維度：如何讓人工智能真正理解世界？(圖1)

圖為英特爾實驗室副總裁 Gadi Singer

更高層次的機器智能的核心，可能是讓知識構(gòu)建幫助人工智能系統(tǒng)組織自己的世界觀，賦予人工智能理解意義、事件和任務(wù)的能力。如此一來，機器認(rèn)知將從數(shù)據(jù)擴(kuò)展到知識結(jié)構(gòu)，包括描述性知識、世界動態(tài)模型和起源等維度。

在學(xué)習(xí)語言時，我們要區(qū)分形式（form）和意義（meaning）：形式指的是用來表達(dá)意義的符號，也就是表面的表達(dá)。每種形式在特定的語境中都有特定的含義，而形式在不同的語境中可以有不同的含義。

正如Bengio和Sch?lkopf等人在“Towards Causal Representation Learning”一文中總結(jié)的那樣：“目前機器學(xué)習(xí)的大多數(shù)成功都是源于對適當(dāng)收集的獨立和相同分布（i.i.d）數(shù)據(jù)的大規(guī)模模式識別?！毕到y(tǒng)吸收可觀察到的元素，如文本字符、聲音信號和圖像像素，并建立模式和隨機相關(guān)性，同時在基于識別的任務(wù)中產(chǎn)生出色的結(jié)果。

深度知識的六個維度：如何讓人工智能真正理解世界？(圖2)

論文地址：https://arxiv.org/pdf/2102.11107.pdf

越來越多的人認(rèn)為，算法必須超越表面相關(guān)性，達(dá)到真正理解的水平，從而實現(xiàn)更高水平的機器智能。這種徹底的轉(zhuǎn)變將使所謂的System 2、3rdWave或廣義/靈活的 AI 成為可能。正如Gadi Singer在核心博客“認(rèn)知人工智能的崛起”中所說的那樣，更高水平的機器智能需要深層次的知識構(gòu)建，這種知識構(gòu)建可以將人工智能從表面相關(guān)性轉(zhuǎn)化為真正理解這個世界。

美國國防部高級研究計劃局（DARPA）的 John Launchbury 指出，在第三次人工智能浪潮中，抽象（比如創(chuàng)造新的意義）和推理（規(guī)劃和決策）將掀起一場新革命。第三次浪潮本身的特點是語境適應(yīng)，即系統(tǒng)為現(xiàn)實世界的各種現(xiàn)象構(gòu)建語境解釋模型。

知識維度中有兩個維度反映了對世界的看法，一個是描述性維度，描述性維度對世界上存在的事物進(jìn)行了概念性的抽象，另一個是現(xiàn)實世界及其現(xiàn)象的動態(tài)模型。

此外，故事提升了人類在共同信仰和神話基礎(chǔ)上的理解和交流復(fù)雜故事的能力。語境和來源歸因以及價值和優(yōu)先級是元知識維度，這些維度帶來了基于條件的有效性和知識的不斷疊加。最后，概念參考是結(jié)構(gòu)基礎(chǔ)，跨維度、模態(tài)和參考而存在。

這六個知識維度結(jié)合在一起，可以讓人工智能不僅僅停留在事件相關(guān)性上，而是獲得更深入的理解，因為這六個知識維度的潛在概念是持續(xù)的，可以解釋和預(yù)測過去和未來的事件，甚至允許計劃和干預(yù)，并考慮反事實的現(xiàn)實——因此文中使用了“深度知識（deep knowledge）”一詞。

闡明和描述機器智能所需的知識構(gòu)建類型，有助于確定實現(xiàn)這種知識構(gòu)建的最佳方式，從而實現(xiàn)更高水平的機器智能。

1 支持更高水平智能的六大知識維度

對于人工智能系統(tǒng)來說，實施人類理解和交流中觀察到的知識構(gòu)建可以為智能提供實質(zhì)性的價值。當(dāng)所有的知識類型都得到支持和組合時，實際價值會大幅增長。

深度知識的六個維度：如何讓人工智能真正理解世界？(圖3)

圖注：支持更高水平智能的知識維度。圖源：Gadi Singer/英特爾實驗室

（1）描述性知識：層次、分類和屬性繼承

描述性知識（即概念性的、命題性的或陳述性的知識）描述事物、事件、事物/事件的屬性以及其之間的關(guān)系。假設(shè)使用（適當(dāng)?shù)模╊惢蚋拍畹姆謱樱疃让枋鲂灾R就能擴(kuò)展其原本的定義。這類知識可以包括事實和記錄系統(tǒng)。與特定用例和環(huán)境相關(guān)的事實和信息可以作為層次知識進(jìn)行組織、利用和更新。

單個人工智能系統(tǒng)中使用的基礎(chǔ)本體（ontology）可以使用來自策劃系統(tǒng)的與任務(wù)相關(guān)的類和實體（例如，OpenCyc本體或AMR命名的實體類型）進(jìn)行播種。這種基礎(chǔ)本體應(yīng)該是可以通過神經(jīng)網(wǎng)絡(luò)/機器學(xué)習(xí)技術(shù)進(jìn)行擴(kuò)展——也就是說，獲取新知識就會得到新的實體，關(guān)系和類。

（2）世界模型

世界上的現(xiàn)象模型讓人工智能系統(tǒng)能夠理解情況、解釋輸入/事件以及預(yù)測潛在的未來結(jié)果并采取行動?，F(xiàn)象模型是抽象/概括，可以分為正式模型和近似（非正式）真實世界模型；現(xiàn)象模型允許在特定情況下對實例使用變量和應(yīng)用程序，并允許對特定實例或更通用的類進(jìn)行符號操作。

正式模型的例子包括邏輯、數(shù)學(xué)/代數(shù)和物理。與正式模型相比，現(xiàn)實世界的模型通常是經(jīng)驗的、實驗性的、有時甚至顯得有些混亂。現(xiàn)實世界的模型包括物理模型、心理模型和社會學(xué)模型。程序模型（“專有知識”）包括在這個類中。

因果模型可以幫助人工智能系統(tǒng)發(fā)展更上一層樓。在語境發(fā)生變化的情況下，如果與因果關(guān)系等知識模型相結(jié)合，并理解了控制原因的語境和考慮反事實的能力，那么過去的統(tǒng)計數(shù)據(jù)就可以有效地應(yīng)用于現(xiàn)在從而預(yù)測未來。這些模型有助于從條件和可能因素的角度理解情況或事件。因果推理是人類思想不可或缺的組成部分，通過這種方式可以實現(xiàn)人類智慧級別的機器智能。

（3）故事和腳本

正如歷史學(xué)家尤瓦爾·哈拉瑞所說，故事構(gòu)成了個人和社會的文化和世界觀的關(guān)鍵部分。故事的概念對于充分理解和解釋人類的行為和交流是必要的。故事是復(fù)雜的，在一個連貫的敘述中可能包含多個事件和各種信息。故事不僅僅是事實和事件的集合，故事還包含了重要的信息，這些信息有助于發(fā)展對所呈現(xiàn)數(shù)據(jù)之外的理解和概括。與世界模型不同的是，故事可以被視為具有歷史意義、參考意義或精神意義。故事可以代表價值觀和經(jīng)歷，這些價值觀和經(jīng)歷會影響人們的信仰和行為。例子包括宗教或民族故事、神話，以及在任何層次的人群中分享的故事。

（4）語境和來源歸因

語境的定義是圍繞著某個事件并為其自圓其說提供資源的框架。語境可以看作是一種覆蓋的知識結(jié)構(gòu)，調(diào)節(jié)著它所包含的知識。語境可以是持久的，也可以是短暫的。

持久的語境可以是長期的（比如從西方哲學(xué)角度或東方哲學(xué)角度獲取的知識），也可以隨著時間的推移、根據(jù)新的學(xué)習(xí)材料而改變。持久語境不會對每個任務(wù)進(jìn)行更改。
當(dāng)特定的本地語境很重要時，瞬態(tài)語境是相關(guān)的。單詞是根據(jù)其周圍句子或段落的局部語境來解釋的。圖像中感興趣的區(qū)域通常在整個圖像或視頻的語境中得到解釋。

持久語境和瞬態(tài)語境的結(jié)合可以為解釋和操作知識提供完整的設(shè)置。

知識的另一個相關(guān)方面是數(shù)據(jù)來源（又名數(shù)據(jù)追溯），其包括數(shù)據(jù)來源、在數(shù)據(jù)傳播的過程中發(fā)生了什么以及隨著時間的推移數(shù)據(jù)將去往何方。人工智能系統(tǒng)不能假設(shè)所接收的所有信息都是正確或可信的，尤其是在被稱為“后真相時代”的情況下信息更不可輕易相信。將信息與其來源相關(guān)聯(lián)可能是建立可信性、可認(rèn)證性和可追溯性所必需的。

（5）價值和優(yōu)先級（包括善/威脅和倫理）

知識的所有方面（例如，對象、概念或程序）在整個判斷范圍內(nèi)都有相對應(yīng)的價值——從最大的善到最大的惡都有對應(yīng)?？梢约僭O(shè)，人類智力的進(jìn)化包括追求回報和避免風(fēng)險（比如，追求吃午餐；避免被當(dāng)成午餐）。這種風(fēng)險/回報的關(guān)聯(lián)與知識緊密相連。潛在的得失具有功利價值；對于實體或潛在的未來狀態(tài)，還有一種基于倫理的價值。這種基于倫理的價值反映了一種道德價值觀，即“善”不是基于潛在的有形回報或威脅，而是基于對什么是正確的潛在信念。

價值和優(yōu)先級是元知識（meta-knowledge），其反映了人工智能系統(tǒng)對知識、行動和結(jié)果相關(guān)方面的主觀斷定。這為問責(zé)制奠定了基礎(chǔ)，應(yīng)該由負(fù)責(zé)特定人工智能系統(tǒng)的人認(rèn)真處理。當(dāng)人工智能系統(tǒng)與人類互動并做出影響人類福祉的選擇時，潛在的價值和優(yōu)先級系統(tǒng)很重要。

6. 概念參考：消除歧義，統(tǒng)一和跨模態(tài)

知識是以概念為基礎(chǔ)的。例如，“狗”是一個抽象概念——一個有多個名稱（在各種語言中狗的說法都不一樣）、一些視覺特征、聲音聯(lián)想等等的概念。然而不管其表現(xiàn)形式和用法如何，“狗”這個概念都是獨一無二的?！肮贰钡母拍畋挥成涞接⒄Z單詞“dog”，以及法語單詞“chien”?！肮贰钡囊曈X特征可能如下圖：

深度知識的六個維度：如何讓人工智能真正理解世界？(圖4)

同時“狗”也和汪汪吠叫聲對應(yīng)了起來。

概念引用（Concept Reference，簡稱ConceptRef）是與給定概念相關(guān)的所有事物的標(biāo)識符和引用集。概念引用本身實際上不包含任何知識——知識駐留在前面介紹的維度中。概念引用是多維知識庫（KB）的關(guān)鍵，因為概念引用融合了概念的所有表象。

Wikidata就是集中存儲結(jié)構(gòu)化數(shù)據(jù)的多維知識庫的一個很好的例子。在Wikidata中，項（items）代表人類知識中的所有事物，包括主題、概念和對象。Wikidata的條目與這個框架中ConceptRef的定義相似——只有一個關(guān)鍵的區(qū)別：在Wikidata中，術(shù)語“項”既指給定的標(biāo)識符，也指有關(guān)標(biāo)識符的信息；而ConceptRefs 只是帶有指向KB指針的標(biāo)識符。關(guān)于概念的信息則被填充在前面章節(jié)中描述的各種視圖中（例如與概念相關(guān)的描述性或程序性知識）。

常識

常識知識由隱性信息組成，隱性信息是指廣泛（且為大眾共享）的不成文的假設(shè)，人類自動運用這些假設(shè)來理解世界。人工智能想要更深入地理解這個世界，將常識應(yīng)用到情境中是必不可少的。在這個框架中，常識知識被認(rèn)為是上述六種知識類型的子集。

2 理解與知識類型之間的關(guān)系

理解是智能的基礎(chǔ)。向更高級機器智能的發(fā)展引發(fā)了一場關(guān)于“理解”的討論。約書亞·本吉奧將擁有人類理解能力的人工智能描述為：

明白因果關(guān)系，理解世界如何運轉(zhuǎn)；
理解抽象的行為；
知道如何使用以上知識去控制、推理和計劃，即使是在新穎的場景中也依然擁有這種能力；
解釋發(fā)生了什么;
out-of-distribution（即OOD，分布外）生成。

而以知識為中心的對理解的定義是：用豐富的知識表示創(chuàng)建世界觀的能力；獲取和解釋新信息以增強這種世界觀的能力；以及對現(xiàn)有知識和新信息進(jìn)行有效推理、決定和解釋的能力。

這種理解觀點的先決條件是以下四種功能：

具備豐富的知識；
獲取新的知識；
能夠跨實體和關(guān)系連接知識實例；
對知識進(jìn)行推理。

理解不是二元屬性，而是因類型和程度而異。這一觀點的核心是知識的本質(zhì)及其表征——知識結(jié)構(gòu)和模型的表達(dá)能力可以促進(jìn)理解和推理能力快速發(fā)展。

想象所有的人[和機器]

正如阿爾伯特·愛因斯坦所觀察到的：“智能的真正標(biāo)志不是知識，而是想象力?！币嬲斫?，機器智能必能超越數(shù)據(jù)、事實和故事。要重建，發(fā)現(xiàn)和創(chuàng)造一個可觀察屬性和事件背后的宇宙模型，想象力是必要的。從人工智能系統(tǒng)的角度來看，想象力是通過創(chuàng)造性推理實現(xiàn)的，也就是進(jìn)行歸納、演繹或溯因推理，并產(chǎn)生不受以往經(jīng)驗和輸入輸出相關(guān)性嚴(yán)格規(guī)定的新穎結(jié)果。

知識表示和推理是人工智能的一個成熟領(lǐng)域，這個領(lǐng)域處理關(guān)于世界的信息表示，使計算機系統(tǒng)能夠解決復(fù)雜的任務(wù)。知識和推理不一定是截然不同的，而是代表了一個從已知到推斷的光譜。機器理解將通過構(gòu)建知識的能力輔以先進(jìn)的相關(guān)推理（例如，概率推理和似是而非推理、溯及推理、類比推理、默認(rèn)推理等）來得到實現(xiàn)。

建立在深度知識基礎(chǔ)上的神經(jīng)符號AI

在使人工智能更有效、更負(fù)責(zé)任和更高效地為人們提供支持的過程中，我們的目標(biāo)是使人工智能系統(tǒng)更強大，同時推動人工智能達(dá)到更高的認(rèn)知和理解水平?？茖W(xué)家已經(jīng)在處理數(shù)據(jù)、識別模式和尋找轉(zhuǎn)瞬即逝的相關(guān)性方面取得了巨大的進(jìn)展，但仍有必要思考哪些知識類型能賦予人工智能系統(tǒng)對世界建模和理解世界的能力。

當(dāng)我們對人工智能獲得更高層次的認(rèn)知所需要的知識結(jié)構(gòu)的類型有了更深的理解時，我們就可以繼續(xù)在這個深度知識的基礎(chǔ)上進(jìn)行構(gòu)建，使機器能夠真正地理解世界。

加入收藏

上一篇：利用人工智能和大數(shù)據(jù)進(jìn)行心理測量分析

下一篇：使用移動人工智能構(gòu)建更智能的應(yīng)用程序

返回列表