圖模型由節(jié)點(diǎn)和邊組成。
節(jié)點(diǎn)代表實(shí)體或概念,而邊由屬性或關(guān)系組成。
實(shí)體是指可區(qū)分且獨(dú)立的事物,例如某個(gè)人,某個(gè)城市,某種植物,某種商品等。
它是圖模型中最基本的元素;概念是特征組合形成的知識(shí)單元主要是指集合,類別,對(duì)象類型和事物的類型,例如人,地理等。
屬性主要是指實(shí)體或概念的特征或特性,例如一個(gè)人的國(guó)籍和生日。
我們采用“哲學(xué)家”的觀點(diǎn)。
以設(shè)計(jì)圖形模型為例,如圖5-13所示。
▲圖5-13邏輯示意圖模型示例邏輯示意圖模型的構(gòu)建包括幾個(gè)關(guān)鍵步驟,如圖5-14所示。
▲圖5-14建立企業(yè)圖模型的步驟。
第一步:業(yè)務(wù)場(chǎng)景定義業(yè)務(wù)場(chǎng)景確定信息覆蓋范圍和信息粒度的表示形式。
以支持業(yè)務(wù)連續(xù)性為例。
由于不可抗力的影響,某些地區(qū)的供應(yīng)商工廠無(wú)法正常生產(chǎn)和運(yùn)輸。
涉及的信息包括供應(yīng)商信息,產(chǎn)能,組件和內(nèi)部材料,合同和客戶信息。
根據(jù)用戶輸入的當(dāng)前物料儲(chǔ)備和合同狀態(tài),獲取影響內(nèi)部物料,產(chǎn)品,合同交付和客戶的清單和范圍。
這種應(yīng)用涉及產(chǎn)品目錄和配置的解釋,并且需要從收集的信息中提取最少的購(gòu)買組件。
信息粒度是圖模型構(gòu)建中不可忽視的問(wèn)題。
根據(jù)應(yīng)用場(chǎng)景確定信息的粒度以及圖模型的準(zhǔn)確性和有效性。
例如,手機(jī)包括品牌,型號(hào),批次和整個(gè)手機(jī)。
在相同的信息范圍內(nèi),粒度越細(xì),圖模型的應(yīng)用范圍越廣,關(guān)系越豐富,但是冗余度越高,知識(shí)消耗的效率就越低。
信息粒度的原理是“可以滿足業(yè)務(wù)應(yīng)用程序的最粗粒度”。
第二步:信息收集信息的選擇應(yīng)考慮兩個(gè)方面。
與應(yīng)用場(chǎng)景直接相關(guān)的信息。
例如,為了確定不可抗力供應(yīng)中斷的影響范圍,直接相關(guān)的信息包括物料信息,產(chǎn)品配置,合同信息等。
它與應(yīng)用場(chǎng)景間接相關(guān),但可以幫助理解問(wèn)題的信息。
這包括公司信息,專業(yè)領(lǐng)域信息,行業(yè)信息和開(kāi)放域信息。
第三步:圖建模中的相同數(shù)據(jù)可以用幾種模式定義。
好的模型可以減少數(shù)據(jù)冗余并提高實(shí)體識(shí)別的準(zhǔn)確性。
在建模過(guò)程中,有必要結(jié)合數(shù)據(jù)特征和應(yīng)用場(chǎng)景來(lái)完成。
相同的數(shù)據(jù)可以從不同的角度繪制不同的圖形模型。
步驟4:注釋實(shí)體,概念,屬性和關(guān)系。
公司圖模型中涉及的實(shí)體和概念可以分為三類:公共類別,例如人名,組織名稱,地名,公司名稱,時(shí)間等;公司類別,例如業(yè)務(wù)術(shù)語(yǔ),公司部門等;行業(yè)類別,例如金融業(yè),通信業(yè)等。
步驟5:實(shí)體和概念的識(shí)別。
公司圖模型中實(shí)體和概念的識(shí)別可以使用業(yè)務(wù)輸入和數(shù)據(jù)資產(chǎn)中的現(xiàn)有信息作為種子,并使用命名實(shí)體識(shí)別(NER)的方法來(lái)擴(kuò)展新的實(shí)體概念。
確認(rèn)后,它將包含在實(shí)體和概念庫(kù)中。
步驟6:屬性識(shí)別和關(guān)系識(shí)別。
通常,基于業(yè)務(wù)知識(shí)在模式級(jí)別定義公司圖模型中的屬性和關(guān)系。
屬性和關(guān)系相對(duì)穩(wěn)定,并且沒(méi)有很多擴(kuò)展方案。
企業(yè)圖模型的存儲(chǔ)技術(shù)必須全面考慮應(yīng)用場(chǎng)景,圖模型中節(jié)點(diǎn)和連接的數(shù)量,邏輯的復(fù)雜性,屬性的復(fù)雜性以及性能要求。
通常建議使用混合存儲(chǔ)方法,使用圖形數(shù)據(jù)庫(kù)存儲(chǔ)關(guān)系,使用關(guān)系數(shù)據(jù)庫(kù)或鍵值對(duì)存儲(chǔ)屬性。
強(qiáng)調(diào)邏輯推理的應(yīng)用場(chǎng)景使用RDF存儲(chǔ)方法,而強(qiáng)調(diào)圖計(jì)算的應(yīng)用場(chǎng)景