2018年,Gartner首次宣布知(zhī)識圖譜是一項新興技術;1996年的資源描述框架(一種爲标準的主-動-賓語義掃清道(dào)路的圖譜數據模型)問世整整26年後,知(zhī)識圖譜才到(dào)達成熟度曲線的頂峰。
10年前,谷歌(現(xiàn)在是控股公司Alphabet的子公司)提及了(le)“知(zhī)識圖譜”(knowledge graph)這(zhè)個術語,并籠統地描述了(le)其知(zhī)識圖譜是如何工(gōng)作(zuò)的。
而20年前,Tim Berners-Lee、James Hendler和(hé)Ora Lassila發表了(le)他(tā)們的第一篇文(wén)章來(lái)描述他(tā)們設想的語義Web。許多知(zhī)識圖譜是使用(yòng)W3C随後在至少10年前實施的語義标準來(lái)構建的。
想想此後發生的事(shì)情蠻有意思。在過去這(zhè)十年,Alphabet逐漸發展成爲全球市值(已發行股票的總價值)超過1萬億美(měi)元的六大(dà)公司之一。
下(xià)面是2022年初Alphabet在市值方面與最接近的IT公司相比的排名:
這(zhè)些(xiē)市值領先者在知(zhī)識圖譜方面有何作(zuò)爲?
我做了(le)一些(xiē)案頭研究,分析圖中所示的這(zhè)些(xiē)公司中哪些(xiē)在過去十年緻力于開(kāi)發知(zhī)識圖譜:
•蘋果在2010年收購了(le)從(cóng)斯坦福研究院(SRI)的項目派生而來(lái)的Siri。Tom Gruber是SRI團隊的聯合創始人。作(zuò)爲人在回路AI領域的先驅,Gruber于1993年在SRI發表了(le)關于知(zhī)識共享本體(ontology)設計(jì)的成果。後來(lái)在2019年,蘋果的工(gōng)作(zuò)記錄描述了(le)其知(zhī)識圖譜工(gōng)程團隊的工(gōng)作(zuò),描述如下(xià):
Aaron Bradley通過Twitter提供,2019年1月19日
•微軟亞洲研究院在2010年開(kāi)發出了(le)Trinity分布式圖譜存儲,并在2013年的一篇論文(wén)中發表了(le)其内存中RDF圖譜功能(néng)。多年來(lái),Satori一直是微軟版的知(zhī)識/事(shì)實圖譜,類似谷歌知(zhī)識圖譜。微軟學術知(zhī)識圖譜(MAKG)出現(xiàn)在2019年前後。該公司在2022年的一份數據和(hé)分析科學家空(kōng)缺職位要求中提到(dào),推動“商業知(zhī)識圖譜模型和(hé)算(suàn)法的創新”是該職位的一項要求。
•多年來(lái),亞馬遜似乎對(duì)招聘本體專業人員猶豫不決,但(dàn)在2010年代後期着手開(kāi)發産品知(zhī)識圖譜。Alexa對(duì)話(huà)式助手基于知(zhī)識圖譜,Alexa的含義表示語言(MRL)基于圖譜,一篇關于該主題的論文(wén)在2016年發表。來(lái)自(zì)捷克技術大(dà)學的Alquist團隊因對(duì)話(huà)式知(zhī)識圖譜獲得了(le)第四屆年度Alexa大(dà)獎,該知(zhī)識圖譜是2020年Alquist 3.0智能(néng)助手的基礎。
•Meta(Facebook)在2013年3月宣布了(le)Facebook Graph,到(dào)2013年6月将其提供給 Facebook的所有美(měi)國英語用(yòng)戶。該圖譜含有當時(shí)十億不同Facebook用(yòng)戶的信息。Graph在2022年繼續提供給用(yòng)戶使用(yòng)。
•Alphabet(谷歌)在2012年宣布了(le)其知(zhī)識圖譜,員工(gōng)隊伍中繼續擁有語義标準方面有經驗的本體專業人員和(hé)數據架構師。
•特斯拉——我還沒有發現(xiàn)表明(míng)特斯拉在使用(yòng)知(zhī)識圖譜的任何證據。
谷歌早期的知(zhī)識圖譜
這(zhè)裏展示了(le)一張谷歌用(yòng)來(lái)描述其知(zhī)識圖譜的插圖。這(zhè)是一張有向圖,上(shàng)面有命名實體(達芬奇、蒙娜麗(lì)莎和(hé)盧浮宮)以及顯示實體之間關系的命名關系。
該圖表明(míng)了(le)可以開(kāi)發的上(shàng)下(xià)文(wén)片段,并将Tinker Toy風(fēng)格連接到(dào)另一個兼容的語義圖,這(zhè)是一種深度集成的過程,比鏈接關系表簡單得多、可擴展性強得多。爲了(le)減少獲取信息的點擊次數,谷歌随後使用(yòng)選擇的一些(xiē)達芬奇片段來(lái)填充知(zhī)識面闆,内容直接顯示在結果頁面上(shàng)。到(dào)2016年,谷歌上(shàng)每月有1000億次搜索結果,其中三分之一都附有知(zhī)識面闆。
谷歌搜索結果頁面通常很(hěn)快(kuài)就能(néng)響應返回結果,而且搜索引擎及算(suàn)法會(huì)确保你(nǐ)對(duì)這(zhè)些(xiē)檢索結果是否感興趣。
2020年代的知(zhī)識圖譜
快(kuài)進到(dào)2020年。Gartner随後在其《人工(gōng)智能(néng)成熟度曲線》中将知(zhī)識圖譜繪在靠近期望膨脹期頂峰的位置。
2018年,Gartner首次宣布知(zhī)識圖譜是一項新興技術;1996年的資源描述框架(一種爲标準的主-動-賓語義掃清道(dào)路的圖譜數據模型)問世整整26年後,知(zhī)識圖譜才到(dào)達成熟度曲線的頂峰。
當然,值得注意的是,神經網絡背後的理(lǐ)論可以追溯到(dào)1873年,而針對(duì)AI中的神經網絡的具體研究重點是從(cóng)1943年開(kāi)始的。但(dàn)直到(dào)1990年代,計(jì)算(suàn)、網絡和(hé)存儲才取得長足發展,神經網絡才站(zhàn)穩腳跟。許多AI專家表示,今天的神經網絡算(suàn)法與“AI”剛剛起步時(shí)開(kāi)發的算(suàn)法有短暫的相似之處。
緩慢發展的技術可能(néng)最有影響力
其他(tā)許多企業在各自(zì)實施的知(zhī)識圖譜方面取得了(le)重大(dà)進展。在2月28日至3月1日,Semantic Arts舉辦了(le)首次企業數據轉換和(hé)知(zhī)識圖譜采用(yòng)線上(shàng)活動。部分演講嘉賓包括如下(xià):
•Montefiore 醫(yī)院的Parsa Mirhaji
•西門(mén)子的Thomas Hubauer
•阿斯利康的Ben Gardner和(hé)Colin Wood
•宜家的Katarinna Kari
•斯沃琪集團的Peter Hutzli
現(xiàn)在說知(zhī)識圖譜已經成爲主流還爲時(shí)過早,但(dàn)很(hěn)明(míng)顯,越來(lái)越多的《财富》全球1000強公司正在針對(duì)許多不同的用(yòng)途采用(yòng)該技術。