CRM系統(tǒng):基于C IDOC CRM的虛擬博物館語(yǔ)義網(wǎng)絡(luò)架構(gòu)
物館之間相同的數(shù)據(jù),也可以容納不同的數(shù)據(jù)。CIDOC CRM模
型可以方便地使文化遺產(chǎn)領(lǐng)域的各種數(shù)據(jù)得到映射,從而使得
集成并且解釋領(lǐng)域內(nèi)各種異構(gòu)數(shù)據(jù)成為可能。
基于以上考慮,我們?cè)O(shè)計(jì)了語(yǔ)義層包括:用OWL 表示的
CIDOC CRM文物數(shù)據(jù)模型,數(shù)據(jù)模型到各個(gè)博物館后臺(tái)數(shù)據(jù)
庫(kù)的映射以及請(qǐng)求重新形成(Query Reformulation)機(jī)制。當(dāng)用
戶根據(jù)CIDOC CRM數(shù)據(jù)模型發(fā)出請(qǐng)求時(shí),系統(tǒng)自動(dòng)根據(jù)模型
與相關(guān)博物館間的映射機(jī)制對(duì)請(qǐng)求進(jìn)行重新形成,轉(zhuǎn)換成對(duì)應(yīng)
博物館能夠執(zhí)行的請(qǐng)求。
(2)數(shù)據(jù)映射機(jī)制和查詢轉(zhuǎn)換機(jī)制
本系統(tǒng)的數(shù)據(jù)映射機(jī)制和查詢轉(zhuǎn)換機(jī)制的設(shè)計(jì)具有以下
特點(diǎn):
①目標(biāo)數(shù)據(jù)源,即系統(tǒng)中基于本體的語(yǔ)義模型是根據(jù)CI2
DOC CRM獨(dú)立于各個(gè)博物館源數(shù)據(jù)預(yù)定義的,而源數(shù)據(jù)模型
又是各自獨(dú)立并且獨(dú)立于目標(biāo)數(shù)據(jù)模型的。
②目標(biāo)數(shù)據(jù)和源數(shù)據(jù)模型具有不同的結(jié)構(gòu),系統(tǒng)需要在設(shè)
計(jì)階段定義從各個(gè)源模式到目標(biāo)模式的映射規(guī)則,在指令執(zhí)行
階段由查詢轉(zhuǎn)換機(jī)制自動(dòng)完成映射。
③當(dāng)新的數(shù)據(jù)源加入時(shí),相應(yīng)的映射規(guī)則也要隨之創(chuàng)建。
④如果目標(biāo)數(shù)據(jù)模式發(fā)生改變,映射規(guī)則也應(yīng)隨之改變。
假設(shè)本系統(tǒng)命名為I,則I可以表示為一個(gè)三元組( T,
{ Si } , {Mi } ) , 其中T是基于本體概念語(yǔ)義模型的目標(biāo)模式
(以下簡(jiǎn)稱目標(biāo)模式) , { Si } 是多個(gè)分布式博物館數(shù)據(jù)庫(kù)源模
式(以下簡(jiǎn)稱為源模式)集合, {Mi } 就是從源模式到目標(biāo)模式
轉(zhuǎn)換關(guān)系集合。也就是對(duì)于任意一個(gè)數(shù)據(jù)庫(kù)源模式Si ,就有一
個(gè)映射關(guān)系Mi 與之對(duì)應(yīng),完成從Si 到T的映射, 1≤i≤n, n是
分布式博物館源數(shù)據(jù)模式的個(gè)數(shù)。
無(wú)論是源模式還是目標(biāo)模式,對(duì)于一個(gè)命名為H的模式,
它的組成元素由對(duì)象集合O和關(guān)系集合R構(gòu)成,記作ΣH。由
于請(qǐng)求是針對(duì)目標(biāo)模式發(fā)出的,所涉及到的目標(biāo)模式元素在源
模式中有些是不存在的,這部分模式元素稱為源的虛擬模式元
素,記作VS。因而對(duì)應(yīng)于從源模式S到目標(biāo)模式T的映射分
為兩種情況: ①直接匹配,從一個(gè)或多個(gè)源數(shù)據(jù)模式元素( ∈
ΣS )直接映射到目標(biāo)數(shù)據(jù)模式元素( ∈ΣT ) ; ②間接匹配,源
與目標(biāo)模式元素之間并不存在直接對(duì)應(yīng)關(guān)系,只能由一個(gè)源模
式中虛擬的模式元素( ∈VS )映射到目標(biāo)模式元素( ∈ΣT ) 。
源模式中,VS 經(jīng)過(guò)一系列由源到目標(biāo)的映射規(guī)則ms
A {Mi }重
新解釋為由源模式元素( ∈ΣS )組成的表示。
映射規(guī)則是指如何將源模式中的VS 部分通過(guò)操作運(yùn)算
轉(zhuǎn)換為由ΣS 組成的表達(dá)式表示。其中操作運(yùn)算包括標(biāo)準(zhǔn)運(yùn)
算符Selection σ, Union ∪, Natural Join þ ü | , Projection π, and
Renameρ以及根據(jù)系統(tǒng)數(shù)據(jù)需要自定義的一些其他操作運(yùn)算,
如組合關(guān)系Composition,郵編、街道組合(Composition)成地址;
與之相反的分解關(guān)系Decomposition等。這些關(guān)系的設(shè)計(jì)都是
在系統(tǒng)設(shè)計(jì)階段完成的。
如上所述,系統(tǒng)在設(shè)計(jì)時(shí)收集所有映射規(guī)則信息,在處理
請(qǐng)求時(shí),由查詢轉(zhuǎn)換機(jī)制進(jìn)行請(qǐng)求指令重新翻譯。原理如下:
假如用戶的請(qǐng)求指令是建立在關(guān)系代數(shù)的基礎(chǔ)上的,那么將遵
循Select2Project2Join模式。如果q代表一個(gè)用戶請(qǐng)求,當(dāng)q被
發(fā)出時(shí),系統(tǒng)自動(dòng)將q解釋成qRe , qRe就是一個(gè)在系統(tǒng)I中數(shù)
據(jù)源能夠執(zhí)行的用戶指令。對(duì)于請(qǐng)求q具有形式:π(X)σP ( r1
þ ü |
r2
þ ü | ⋯rN ) , 1≤i≤N , attr ( q) = X, 其中, P是選擇謂詞; q是針
對(duì)ΣT 中的對(duì)象和關(guān)系發(fā)出的,目標(biāo)模式中的每一個(gè)關(guān)系ri 都
與{Mi }中的一系列映射規(guī)則相聯(lián)系,表示為Sj ×m s
A ri ,代表
將映射規(guī)則序列m s 作用于某數(shù)據(jù)源Sj 可以得到目標(biāo)關(guān)系ri。
其中m s ∈{Mj } , 1≤j≤n, n指數(shù)據(jù)源的個(gè)數(shù)。將q中的ri 用
∪ ( Sj ×mS )替代從而獲得qRe ,這樣當(dāng)向數(shù)據(jù)源Sj 發(fā)送由qRe
分解的請(qǐng)求時(shí),系統(tǒng)同時(shí)將相應(yīng)的映射規(guī)則mS 也發(fā)送給Sj ,
數(shù)據(jù)源Sj通過(guò)Σsj就能夠正確地獲取目標(biāo)系統(tǒng)中的關(guān)系ri。
例如,用戶可針對(duì)圖3中基于本體語(yǔ)義模型的瀏覽器向?qū)?
發(fā)出以下查詢請(qǐng)求:“西周材質(zhì)為銅的禮器有哪些?”。這個(gè)請(qǐng)
求是建立在CIDOC CRM模型的目標(biāo)模式基礎(chǔ)上的,涉及到了
E22, E41, E57, P1, P4, P45, P108模式元素,與源數(shù)據(jù)模式中的
元素不吻合,這就需要根據(jù)表1與圖3之間的映射規(guī)則由系統(tǒng)
的查詢轉(zhuǎn)換模塊將指令翻譯成表1所在系統(tǒng)能夠執(zhí)行的請(qǐng)求:
ΠAntique_name (σDATE_FROM > 1134BC∧DATE_TO < 781BC∧
MATER IAL = bronze∧USUAGE = gift Antique_table)
其中σ表示Selection,π表示Projection; Antique_table為表名。
31112 其他模塊
UDD I是分布式Web服務(wù)的信息注冊(cè)規(guī)范,它主要實(shí)現(xiàn)注
冊(cè)和發(fā)現(xiàn)功能。服務(wù)發(fā)布者可以根據(jù)這一規(guī)范進(jìn)行注冊(cè),以便
被需要該服務(wù)的用戶發(fā)現(xiàn)。當(dāng)用戶通過(guò)瀏覽器發(fā)出請(qǐng)求后,命
令被轉(zhuǎn)換為UDD I查找命令,UDD I提供給用戶Web服務(wù)的名
稱和地址,命令分發(fā)模塊負(fù)責(zé)綁定和調(diào)用目標(biāo)服務(wù)。分散在各
個(gè)地方數(shù)字博物館的服務(wù)執(zhí)行完后,將各自的返回結(jié)果發(fā)送給
信息重組模塊進(jìn)行信息的整合重組,最后返回給用戶。
312 Web服務(wù)層
Web Services在系統(tǒng)集成方面是非常適用的技術(shù)。全國(guó)乃
至世界各地的文物博物館都可以提供基于Web Services的服務(wù)
接口,供其他的應(yīng)用程序調(diào)用,達(dá)到共享服務(wù)的目的。在Web
Services的模型下,任意的服務(wù)消費(fèi)者(即接口使用者)只需理解
一種通用的組件接口(即Web Services) ,就可以利用現(xiàn)有的In2
ternet上的Web服務(wù),而無(wú)須考慮Web服務(wù)的內(nèi)部實(shí)現(xiàn)機(jī)制、操
作平臺(tái)、開發(fā)語(yǔ)言等。此外對(duì)服務(wù)的調(diào)用是SOAP ( Simp le Ob2
jectAccess Protocol) [17 ]消息機(jī)制下的遠(yuǎn)程調(diào)用,因此兩者實(shí)現(xiàn)
的是松散耦合機(jī)制。即使在日后的運(yùn)作過(guò)程中,當(dāng)Web服務(wù)產(chǎn)
生了接口上或功能上的更改,服務(wù)的消費(fèi)者可以通過(guò)Web Ser2
vices的描述性文檔發(fā)現(xiàn)這樣的更改,自動(dòng)適應(yīng)這種更改。
針對(duì)目前數(shù)字博物館系統(tǒng)的分散和異構(gòu)特性,我們選用
Web Services技術(shù)進(jìn)行集成。一般各個(gè)分散的數(shù)字博物館系
統(tǒng)都提供基于關(guān)鍵字的查找以及基于圖片內(nèi)容檢索的功能,對(duì)
這些功能函數(shù)進(jìn)行改造以Web服務(wù)的形式發(fā)布并在文物私有
UDD I注冊(cè)中心注冊(cè)以便服務(wù)的發(fā)現(xiàn)。圖4所示的系統(tǒng)中的分
布式博物館、中間層和瀏覽器用Web Services技術(shù)連接起來(lái)。
下面結(jié)合圖4說(shuō)明虛擬文物博物館參觀者在瀏覽器發(fā)出
請(qǐng)求后的處理流程:
(1)虛擬博物館瀏覽者通過(guò)瀏覽器提交文物的查詢請(qǐng)求,
UDD I接收查詢要求,確定目標(biāo)Web服務(wù)名稱和綁定地址。
(2)如果查找請(qǐng)求是基于關(guān)鍵字或基于內(nèi)容的查找,那么
由系統(tǒng)的命令分發(fā)模塊直接將請(qǐng)求定向到相應(yīng)的博物館,調(diào)用
相應(yīng)的Web服務(wù)。
(3)如果查找請(qǐng)求是基于語(yǔ)義的,那么命令定向到語(yǔ)義層
處理,語(yǔ)義層接到請(qǐng)求后,根據(jù)CIDOC CRM模型與后臺(tái)博物
館數(shù)據(jù)庫(kù)數(shù)據(jù)結(jié)構(gòu)的映射關(guān)系,將查找請(qǐng)求重新翻譯成當(dāng)?shù)財(cái)?shù)
據(jù)庫(kù)格式能夠理解的請(qǐng)求,再調(diào)用后臺(tái)博物館的Web服務(wù)。
(4)從各個(gè)博物館返回的調(diào)用結(jié)果經(jīng)系統(tǒng)信息重組機(jī)制
匯總轉(zhuǎn)換返回到服務(wù)調(diào)用者。
313 用戶接口設(shè)計(jì)
瀏覽器是將博物館大量信息對(duì)外展示的窗口,所以瀏覽器
設(shè)計(jì)也相當(dāng)重要。本系統(tǒng)瀏覽器的檢索入口部分主要包含基
于關(guān)鍵詞、圖像內(nèi)容以及基于語(yǔ)義的檢索。基于關(guān)鍵字和圖像
內(nèi)容的檢索服務(wù)主要是通過(guò)Web服務(wù)從博物館舊系統(tǒng)中集成
過(guò)來(lái)的。用戶輸入查詢關(guān)鍵字或者是上傳需要匹配的圖片,分
布在各地博物館的Web服務(wù)在當(dāng)?shù)貓?zhí)行任務(wù),將結(jié)果各自傳
給信息重組機(jī)制最后通過(guò)瀏覽器呈現(xiàn)給用戶。
基于語(yǔ)義的查找部分是建立在基于本體語(yǔ)義搜索引擎基
礎(chǔ)上的。為了幫助用戶較好地形成查找問(wèn)題,我們?cè)O(shè)計(jì)了基于
視角(View2based)的瀏覽器[ 18, 19 ]。所謂視角就是將描述文物
信息的術(shù)語(yǔ)歸類,每一類稱為一個(gè)視角。例如,我們把描述文
物的信息分為四個(gè)視角類型共九個(gè)視角,每個(gè)視角下又包含若
干個(gè)術(shù)語(yǔ),具體如表2所示。
表2 文物視角信息
視角類型視 角
文物特征文物類型、文物材質(zhì)
文物創(chuàng)作創(chuàng)作者、創(chuàng)作時(shí)間、創(chuàng)作地點(diǎn)
文物用途使用人、使用地點(diǎn)、使用場(chǎng)合
文物展覽博物館
用戶可以根據(jù)視角中術(shù)語(yǔ)來(lái)形成查找問(wèn)題,如在圖6所示
的現(xiàn)實(shí)界面右側(cè),用戶通過(guò)選擇文物類型中的“銅器”,文物材
質(zhì)中的“黃銅”,創(chuàng)作時(shí)間中的“周”,使用場(chǎng)合中的“禮物”,就
形成了以下查找:周朝用作禮物的、材質(zhì)為黃銅的銅器是什么?
通過(guò)以上選擇,查找命令在圖6的右下角形成,點(diǎn)擊“提交”按
鈕就啟動(dòng)查詢。查找到的文物可能是一個(gè)集合,用戶可以根據(jù)
以上查找機(jī)制繼續(xù)提煉查找結(jié)果。當(dāng)用戶點(diǎn)擊某一個(gè)文物的
小圖標(biāo)時(shí),此文物相關(guān)的信息將展示在圖6所示頁(yè)面的左側(cè)。
展示界面中間部分提供了本文物相關(guān)查找的查找入口,如查找
與本文物相同創(chuàng)作時(shí)間、相似使用場(chǎng)合的作品等。
4 結(jié)論
本系統(tǒng)利用CIDOC CRM概念模型及Web Services技術(shù),
構(gòu)建了領(lǐng)域內(nèi)智能型知識(shí)搜尋及信息查找的分布式架構(gòu)。使
得數(shù)字博物館在查詢使用上不再局限于關(guān)鍵詞或是圖片基于
內(nèi)容的查找,而且在不改變?cè)邢到y(tǒng)數(shù)據(jù)的基礎(chǔ)上,最大程度
地實(shí)現(xiàn)了數(shù)據(jù)共享與交換。另外還為數(shù)據(jù)進(jìn)一步推論、驗(yàn)證提
供了基礎(chǔ)。實(shí)踐證明文化遺產(chǎn)領(lǐng)域的概念參考模型CIDOC
CRM更適合用于數(shù)字博物館數(shù)據(jù)的描述。本系統(tǒng)的一系列架
構(gòu),配合不同領(lǐng)域的Ontology,可應(yīng)用在電子、電機(jī)、醫(yī)藥、航天
等Ontology定義的各個(gè)領(lǐng)域。由于CIDOC CRM模型是從認(rèn)識(shí)
論的角度對(duì)文物描述而制定的,而對(duì)于文物的多媒體信息描述
不是很全面,另外為保護(hù)文物的屬地特性,對(duì)于某些文物信息
的版權(quán)控制也顯得相當(dāng)重要。為滿足以上要求,國(guó)際上已有相
關(guān)組織分別使用MPEG27 和MPEG221[ 20 ]標(biāo)準(zhǔn)對(duì)CIDOC CRM
進(jìn)行擴(kuò)展融合[ 21, 22 ] ,以使數(shù)字博物館數(shù)據(jù)得到更加全面的基
于語(yǔ)義的描述。
參考文獻(xiàn):
[ 1 ] Time Berners Lee, James Hendler, Ora Lassila. The Semantic Web
[ J ]. Scientific American, 2001, (5) .
[ 2 ] Vernadat F B. Enterp rise Modelling and Integration: Princip les and
App lications[M ]. France: Chapman & Hall, 1996.
[ 3 ] ICOM /CIDOC CRM Special Interest Group. CIDOC CRM version
31419 [ EB /OL ]. http: / / cidoc. ics. forth. gr/docs/ cidoc_cr m _ver2
s