01
人類有兩種主要的思維模式,一種是快速而直覺(jué)的,另一種是緩慢而深思熟慮的,這種說(shuō)法起源于并廣泛存在于古老的哲學(xué)和心理學(xué)著作中。通常用“系統(tǒng) 1 ”和“系統(tǒng) 2 ”來(lái)表示以上兩種類型的認(rèn)知過(guò)程,諾貝爾獎(jiǎng)獲得者心理學(xué)家丹尼爾·卡尼曼(Daniel Kahneman)在其著作《思考,快與慢》中詳細(xì)介紹了兩種認(rèn)知系統(tǒng)的區(qū)別之處,系統(tǒng) 1 是直覺(jué)性、快速、大容量、并行、無(wú)意識(shí)、情境化和自動(dòng)化的,其依賴情感、記憶和經(jīng)驗(yàn)迅速作出判斷,是類似于動(dòng)物認(rèn)知的內(nèi)隱知識(shí);系統(tǒng) 2 則是分析性、緩慢、有限容量、串行和抽象的,其受到規(guī)則的約束,依賴認(rèn)知能力的運(yùn)作,是人類進(jìn)化后期習(xí)得的外顯知識(shí)。目前深度學(xué)習(xí)包括大模型都在做系統(tǒng)1的工作,而知識(shí)圖譜擅長(zhǎng)做系統(tǒng) 2 的工作。
人工智能的發(fā)展有兩大經(jīng)典的流派,一個(gè)叫符號(hào)主義,一個(gè)叫連接主義。知識(shí)圖譜是經(jīng)典的符號(hào)主義,把知識(shí)符號(hào)化,通過(guò)三元組描述知識(shí)和知識(shí)之間的關(guān)系,再構(gòu)建成巨大的知識(shí)網(wǎng)絡(luò),這是知識(shí)的顯性表達(dá)。大模型是連接主義的最新成果,但是它的知識(shí)是隱性表達(dá),知識(shí)直接存儲(chǔ)到模型的神經(jīng)網(wǎng)絡(luò)參數(shù)中,人不可讀。這兩種知識(shí)表達(dá)方式有巨大的差別,也有各自的優(yōu)勢(shì)。
-
大語(yǔ)言模型的專業(yè)領(lǐng)域知識(shí)有限,特別是工業(yè)領(lǐng)域有大量的數(shù)據(jù)還未清晰甚至數(shù)字化;
-
大語(yǔ)言模型存在幻覺(jué)問(wèn)題,這個(gè)問(wèn)題基本無(wú)法通過(guò)訓(xùn)練從模型訓(xùn)練上解決;
-
大語(yǔ)言模型的知識(shí)運(yùn)維困難,訓(xùn)練成本高且校驗(yàn)成本高;
-
大語(yǔ)言模型無(wú)法做嚴(yán)密的知識(shí)推理;
-
知識(shí)圖譜存在構(gòu)建成本高的問(wèn)題。
我們的想法是將兩者結(jié)合起來(lái),用知識(shí)圖譜解決領(lǐng)域知識(shí)缺失、領(lǐng)域知識(shí)運(yùn)維、領(lǐng)域知識(shí)推理和大模型幻覺(jué)的問(wèn)題,用大模型解決知識(shí)圖譜構(gòu)建成本高的問(wèn)題,實(shí)現(xiàn)大模型和知識(shí)圖譜雙擎互相增強(qiáng)。
知識(shí)圖譜和大模型兩個(gè)技術(shù)的結(jié)合,會(huì)產(chǎn)生 1 + 1 >2 的效果。基于這樣的技術(shù)思路,我們提出了企業(yè)級(jí)的工業(yè)智能知識(shí)服務(wù)平臺(tái),核心的兩大底層技術(shù)就是知識(shí)圖譜和大模型。
上圖是整個(gè)知識(shí)服務(wù)平臺(tái)的技術(shù)架構(gòu),圍繞業(yè)務(wù)全生命周期,包含情報(bào)分析、研發(fā)設(shè)計(jì)、工業(yè)生產(chǎn)、運(yùn)營(yíng)管理、市場(chǎng)推廣、售后服務(wù)的業(yè)務(wù)完整鏈條,因?yàn)榈讓拥募夹g(shù)架構(gòu)是相通的,知識(shí)圖譜把各個(gè)部門的知識(shí)進(jìn)行統(tǒng)一的關(guān)聯(lián),所以就能產(chǎn)生 1 + 1 > 2 的效果。
這個(gè)知識(shí)服務(wù)平臺(tái)除了大模型和知識(shí)圖譜雙擎,還有兩大核心業(yè)務(wù)能力。
第一個(gè)核心是數(shù)據(jù)集成。可以將多模態(tài)的數(shù)據(jù)集中化的管理,包括文檔、視頻、圖片等等,只要是企業(yè)內(nèi)部能夠積累的數(shù)據(jù),都可以通過(guò)平臺(tái)采集,再做自動(dòng)知識(shí)抽取,可以大大降低員工的使用門檻。
第二個(gè)核心是持續(xù)學(xué)習(xí)。底層的知識(shí)圖譜和大模型之間能夠互相的增強(qiáng),而且是一個(gè)持續(xù)學(xué)習(xí)的過(guò)程。這里學(xué)習(xí)包括兩個(gè)方面,一個(gè)是大模型的迭代,另一個(gè)是知識(shí)圖譜的迭代。前者一是基于知識(shí)庫(kù)中數(shù)據(jù)做模型微調(diào),二是通過(guò)用戶反饋不斷優(yōu)化提示詞;后者主要是基于新增數(shù)據(jù)的變化,自動(dòng)更新知識(shí)圖譜本體,由本體驅(qū)動(dòng)圖譜的更新。
當(dāng)前大模型在應(yīng)用過(guò)程中,對(duì)于幻覺(jué)問(wèn)題的解決,知識(shí)圖譜與大模型結(jié)合是一個(gè)比較有效的解決思路,就是 GraphRAG 。
我們知道大模型應(yīng)用于知識(shí)庫(kù)場(chǎng)景,目前最有價(jià)值的就是 RAG ,這種方式能通過(guò)知識(shí)外掛最有性價(jià)比的解決大模型領(lǐng)域知識(shí)有限的問(wèn)題。RAG 的工作流程是,當(dāng)大模型接收到用戶提問(wèn)后,會(huì)先去外掛的知識(shí)庫(kù)里找到相關(guān)的文本分片,再把文本分片輸入給大語(yǔ)言模型,最后大語(yǔ)言模型再結(jié)合文本分片內(nèi)容回答問(wèn)題。受限于分文分片的召回方式, RAG 能利用的知識(shí)粒度只能是段落級(jí)別,這會(huì)導(dǎo)致兩個(gè)問(wèn)題,一是很難找到一個(gè)合適的段落分片策略兼顧準(zhǔn)確率和召回率,二是僅能回答基于有限段落原文的簡(jiǎn)單問(wèn)題。
GraphRAG 可以把文檔的知識(shí)粒度從段落級(jí)別拆成實(shí)體級(jí)別,其中的關(guān)鍵就是將文檔知識(shí)構(gòu)建成知識(shí)圖譜。用戶提問(wèn)后,先在知識(shí)圖譜中找到問(wèn)題相關(guān)的實(shí)體,通過(guò)知識(shí)圖譜更精準(zhǔn)的找到相關(guān)的知識(shí)內(nèi)容。對(duì)于專業(yè)技術(shù)要求比較高的領(lǐng)域,GraphRAG 的方式能更好地獲取到到更專業(yè)的結(jié)果,原因就在于知識(shí)的顆粒度更細(xì),能夠更好地通過(guò)用戶的問(wèn)題找到相關(guān)的、準(zhǔn)確的知識(shí)點(diǎn),再把這些知識(shí)點(diǎn)作為提示詞,輸入到大語(yǔ)言模型中,輸出的結(jié)果往往就會(huì)更精準(zhǔn)。
我們?cè)?GraphRAG 的實(shí)踐過(guò)程中,相比于常規(guī)的 GraphRAG ,我們還加入了用戶意圖推理和第三方知識(shí)圖譜利用兩部分內(nèi)容。
例如用戶提問(wèn)“剛出生的小孩可以接種肝炎疫苗嗎”,這里包含兩個(gè)重要的語(yǔ)義,一個(gè)是“剛出生的小孩”在專業(yè)用語(yǔ)中是“新生兒”;另外一個(gè)是“肝炎”,肝炎其實(shí)是一類疾病的總稱,也分很多不同類型的疾病,比如說(shuō)叫甲肝、乙肝、丙肝等等。通過(guò)知識(shí)圖譜增強(qiáng),把“剛出生的小孩”變成規(guī)范化的描述“新生兒”,把“肝炎”做知識(shí)推理得到肝炎包含“慢性乙型肝炎”、“丙型肝炎”等,然后把這些知識(shí)合并到一起,實(shí)現(xiàn)對(duì)用戶意圖的拓展,然后再用拓展的意圖走 GraphRAG 的流程,就能得到一個(gè)更好的結(jié)果。
大模型+知識(shí)圖譜的工業(yè)應(yīng)用場(chǎng)景
場(chǎng)景一:研發(fā)場(chǎng)景-設(shè)計(jì)方案智能管理。
不少工業(yè)企業(yè)都有非常多的設(shè)計(jì)文檔、設(shè)計(jì)方案等文檔,可能是 CAD 文件,也可能是一些文檔等等,尤其是研發(fā)型的單位,內(nèi)部可能有幾萬(wàn)份、幾十萬(wàn)份甚至上百萬(wàn)份的圖紙內(nèi)容。常規(guī)的檢索只能通過(guò)文件名、文件簡(jiǎn)介等進(jìn)行全文檢索,如果需要深入到 CAD 文件的內(nèi)容中查找,例如查找“同時(shí)包含某兩個(gè)零部件的設(shè)計(jì)方案”就非常困難。我們通過(guò)知識(shí)圖譜加上大語(yǔ)言模型的方式,可以很好地解決這一問(wèn)題,提前把 CAD 文件中的關(guān)鍵部件構(gòu)建成知識(shí)圖譜,這樣在搜索包含某個(gè)部件的設(shè)計(jì)圖紙,就可以直接對(duì)圖紙內(nèi)容進(jìn)行定位,非常高效。
場(chǎng)景二:生產(chǎn)場(chǎng)景-設(shè)備故障診斷。

工業(yè)型企業(yè)中,產(chǎn)線的任何一個(gè)故障,對(duì)生產(chǎn)的影響是非常大的,哪怕能縮短一點(diǎn)故障診斷的時(shí)間,對(duì)企業(yè)的幫助也是非常大。所以可以結(jié)合產(chǎn)品的運(yùn)維手冊(cè),以及前期積累的故障報(bào)告等,把這些作為知識(shí)庫(kù),當(dāng)出現(xiàn)新的故障時(shí),通過(guò)大模型的交互,逐漸把故障現(xiàn)象和故障原因結(jié)合起來(lái),然后推薦相關(guān)的故障解決思路,可以幫助運(yùn)檢人員更快地對(duì)故障進(jìn)行排除。這是在工業(yè)場(chǎng)景中,非常典型的一類大模型與知識(shí)圖譜結(jié)合的應(yīng)用。
場(chǎng)景三:售前場(chǎng)景-訂單智能分析
對(duì)于做非標(biāo)產(chǎn)品的企業(yè),產(chǎn)品的組合類型往往非常辦法,銷售往往無(wú)法全部了解。當(dāng)銷售接到客戶的需求單,需要判斷是否能做,以及用哪些產(chǎn)品能匹配,有時(shí)需求單會(huì)很長(zhǎng),可能幾頁(yè)紙,甚至十幾頁(yè)紙,經(jīng)驗(yàn)稍淺的銷售對(duì)需求的把握不是特別準(zhǔn)確,那么就可以通過(guò) AI 技術(shù)對(duì)銷售訂單的每個(gè)功能項(xiàng)、需求項(xiàng)做具體的分析,匹配需求與產(chǎn)品,同時(shí)對(duì)兼容性、庫(kù)存等風(fēng)險(xiǎn)因素做出預(yù)警。
場(chǎng)景四:售前/售后場(chǎng)景-智能客服
智能客服主要是售前和售后場(chǎng)景。售前實(shí)現(xiàn)智能導(dǎo)購(gòu),售后實(shí)現(xiàn)設(shè)備使用的回答,或者是故障的簡(jiǎn)單排除等等,這些都是比較典型的應(yīng)用場(chǎng)景。特別是有出海業(yè)務(wù)的企業(yè),涉及到多語(yǔ)言的處理能力,企業(yè)不可能在搭建售后團(tuán)隊(duì)時(shí),每個(gè)小語(yǔ)種都招一個(gè)人,通過(guò)大語(yǔ)言模型,企業(yè)只需要維護(hù)一套標(biāo)準(zhǔn)知識(shí)庫(kù),大語(yǔ)言模型可以自動(dòng)地理解各語(yǔ)種的問(wèn)題,再基于標(biāo)準(zhǔn)的中文手冊(cè),自動(dòng)以對(duì)應(yīng)語(yǔ)種來(lái)進(jìn)行回復(fù),不僅可以提高效率,同時(shí)可以極大地降低成本。
04
第一個(gè)案例是技術(shù)售前場(chǎng)景實(shí)踐。

基于產(chǎn)品手冊(cè)構(gòu)建知識(shí)圖譜,再把各類手冊(cè)錄入到知識(shí)庫(kù)中進(jìn)行外掛,最終實(shí)現(xiàn)設(shè)備運(yùn)維助手的構(gòu)建。
可以看到這里有很多問(wèn)題,如果只是用常規(guī)大模型 RAG 形式進(jìn)行回答,很難回答得很全面,核心原因在于沒(méi)有對(duì)用戶問(wèn)題中蘊(yùn)含的領(lǐng)域知識(shí)進(jìn)行推理。例如用戶提問(wèn)某系列產(chǎn)品斷路器的附件能否通用,如果不通過(guò)知識(shí)推理知道某系列產(chǎn)品包含的所有產(chǎn)品型號(hào),那模型回答的答案通常是不準(zhǔn)確或者不全面的,所以優(yōu)先通過(guò)知識(shí)圖譜進(jìn)行推理是非常重要的環(huán)節(jié)。
第二個(gè)案例主要知識(shí)庫(kù)的構(gòu)建應(yīng)用。
知識(shí)庫(kù)的一個(gè)大核心的價(jià)值點(diǎn)就是實(shí)現(xiàn)企業(yè)經(jīng)驗(yàn)或者知識(shí)的積累。案例中的企業(yè)要去做跨部門的經(jīng)驗(yàn)傳承,海外部門在零部件生產(chǎn)和設(shè)計(jì)上有非常多的經(jīng)驗(yàn),但現(xiàn)在隨著業(yè)務(wù)轉(zhuǎn)移,海外工廠業(yè)務(wù)遷到國(guó)內(nèi)工廠,那么相關(guān)的經(jīng)驗(yàn)就需要由海外的老師傅傳遞到新的工人身上。結(jié)合 Agent 技術(shù),可以完成只有人類專家才能掌握的復(fù)雜問(wèn)題解決。
我們用了“PDCA”的核心思路,PDCA 對(duì)于工業(yè)企業(yè)來(lái)說(shuō)用得非常多,所以在知識(shí)庫(kù)建設(shè)時(shí),同樣可以用這套指導(dǎo)思路來(lái)進(jìn)行建設(shè)。
(來(lái)源愛(ài)分析ifenxi)