基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)知識管理研究
引言
非物質(zhì)文化遺產(chǎn)(以下簡稱“非遺”)作為各民族優(yōu)秀傳統(tǒng)文化的重要組成部分,彰顯著地域的特色,蘊(yùn)含著群體的智慧,對于每個(gè)國家都是不可再生的文化財(cái)富。非遺文化的表現(xiàn)形式多樣,涉及領(lǐng)域廣泛,蘊(yùn)含著豐富的知識。對非遺領(lǐng)域知識進(jìn)行結(jié)構(gòu)化表示與語義化組織,是知識時(shí)代對非遺文化保護(hù)與知識傳播的必然要求。然而,中國非遺網(wǎng)及各省市非遺傳播平臺在對非遺知識進(jìn)行管理時(shí),僅以列表的形式展示非遺項(xiàng)目與代表性傳承人的信息,缺少項(xiàng)目與傳承人、項(xiàng)目與地區(qū)等知識要素之間的關(guān)聯(lián);非遺領(lǐng)域知識由于缺乏有效的組織和管理,造成了信息的碎片化,大大限制了知識的完整性與可傳播性。同時(shí),在非遺垂直領(lǐng)域缺少專業(yè)的知識型關(guān)聯(lián)數(shù)據(jù)集,尚未形成成熟的非遺百科類知識庫。雖然國內(nèi)在通用領(lǐng)域的中文百科知識圖譜研究方面取得了一定成果,包括zhishi.me(東南大學(xué))、CN-DBpedia(復(fù)旦大學(xué))、PKUPie(北京大學(xué))、Xlore(清華大學(xué))等中文百科知識圖譜;OpenKG也正在促進(jìn)這些百科類知識圖譜的開放與互聯(lián)[1]。但在中文知識百科領(lǐng)域,缺少像DBpedia、Freebase等大型百科知識型數(shù)據(jù)集。由于非遺領(lǐng)域數(shù)據(jù)仍以半結(jié)構(gòu)化數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)庫為主,碎片化的數(shù)據(jù)較多,缺乏高質(zhì)量的非遺開放數(shù)據(jù)集;對非遺知識單一線性的組織,無法體現(xiàn)非遺文化的多元特征,無法滿足多維度揭示與知識檢索的需要[2]。這限制了對非遺的科學(xué)研究,也限制了非遺知識的傳播和對非遺文化的傳承。
傳統(tǒng)的非遺項(xiàng)目的知識管理方式主要依據(jù)主題、地域與級別等進(jìn)行分類歸檔,組織單元的顆粒度較粗,組織模式是線性的、一維的;非遺領(lǐng)域知識元素的語義化程度較低,無法充分表達(dá)與揭示知識元素之間的關(guān)系。隨著知識組織與知識管理研究的深入,非遺領(lǐng)域知識的管理向主題圖譜、知識圖譜、語義組織等新型組織方式發(fā)展,更加注重領(lǐng)域知識間關(guān)系的多維度揭示。尤其是語義網(wǎng)技術(shù)堆棧中的本體與關(guān)聯(lián)數(shù)據(jù)技術(shù)為非遺領(lǐng)域知識的語義組織提供了新的解決思路和方案。關(guān)聯(lián)數(shù)據(jù)被看作是語義網(wǎng)的輕量級實(shí)現(xiàn),其以關(guān)聯(lián)開放數(shù)據(jù)的形式聚合異構(gòu)的信息資源,能夠提高資源與知識的可見度、共享性和開放性?;陉P(guān)聯(lián)數(shù)據(jù)對非遺知識的組織與管理,是在規(guī)范統(tǒng)一的領(lǐng)域本體模型的指導(dǎo)下,以結(jié)構(gòu)化、形式化方式表達(dá)非遺領(lǐng)域知識元素及其屬性,并構(gòu)建知識元素之間的語義關(guān)系,進(jìn)而達(dá)到知識的語義化與有序化的目的,并提供開放的數(shù)據(jù)獲取和知識服務(wù)。
基于此背景,本文針對非遺知識的有效管理與知識關(guān)聯(lián)問題,提出基于關(guān)聯(lián)數(shù)據(jù)的非遺知識組織與非遺知識關(guān)聯(lián)數(shù)據(jù)庫構(gòu)建的方法體系,包括從非遺知識本體模型設(shè)計(jì)到關(guān)聯(lián)數(shù)據(jù)構(gòu)建、存儲與發(fā)布的整個(gè)過程;研究將非遺領(lǐng)域內(nèi)部關(guān)聯(lián)數(shù)據(jù)集與DBpedia及GeoNames外部知識型數(shù)據(jù)庫進(jìn)行知識關(guān)聯(lián),建立一個(gè)擁有豐富語義關(guān)系、知識互聯(lián)共享的非遺知識關(guān)聯(lián)數(shù)據(jù)庫,提供領(lǐng)域知識的有序組織及知識可視化。并以湖北省非遺項(xiàng)目為例,將非遺項(xiàng)目有關(guān)的知識進(jìn)行關(guān)聯(lián)聚合,構(gòu)建了非遺知識關(guān)聯(lián)數(shù)據(jù)集與服務(wù)平臺。在數(shù)字人文研究背景下,通過對非遺知識組織與管理的深入研究,以期為我國非遺知識的組織與管理以及非遺文化的保護(hù)與傳播提供參考。
1 非遺領(lǐng)域知識本體研究與關(guān)聯(lián)數(shù)據(jù)技術(shù)應(yīng)用現(xiàn)狀
非遺領(lǐng)域知識涉及的內(nèi)容豐富,文化形態(tài)多元,但是由于缺少詳盡的分類體系標(biāo)準(zhǔn),導(dǎo)致非遺知識組織的程度較低,非遺領(lǐng)域知識無法得到有效的管理。如何將海量、零散的非遺知識按照知識的內(nèi)在關(guān)系進(jìn)行表示與組織,成為亟待深入研究的問題。隨著語義網(wǎng)的發(fā)展,一些研究者已經(jīng)將本體及關(guān)聯(lián)數(shù)據(jù)的理論與方法引入到非遺知識組織和知識管理領(lǐng)域,在本體構(gòu)建、資源整合、資源組織等方面開展了大量的研究。在非遺領(lǐng)域知識結(jié)構(gòu)分析與本體構(gòu)建研究方面,蔡璐等[3]從系統(tǒng)論角度分析非遺的各要素,構(gòu)建了由非遺項(xiàng)目類、人物類、事物類、事件類以及文獻(xiàn)類等核心概念組成的本體概念模型,并制定非遺資源的元數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范。黃永等[4]分析了非遺知識本體構(gòu)建的難點(diǎn),以民間舞蹈為例設(shè)計(jì)了面向文本與多媒體數(shù)據(jù)的非遺知識本體構(gòu)建系統(tǒng)。滕春娥、王萍[5]基于本體理論從非遺項(xiàng)目及人物、事件、文獻(xiàn)等維度對赫哲族非遺信息資源進(jìn)行組織與整合。周耀林等[6]以本體方法為研究視角,從本體表示與語義組織、語義檢索兩個(gè)層面,設(shè)計(jì)了非遺信息資源組織與檢索框架,以戲劇類非遺項(xiàng)目為例實(shí)現(xiàn)非遺信息資源本體的構(gòu)建。此外,國內(nèi)學(xué)者針對不同類型的非遺項(xiàng)目,對知識本體的構(gòu)建與應(yīng)用進(jìn)行了探索。比如,郝挺雷[7]、胡駿等[8]和隗昊[9]研究端午節(jié)、盤王節(jié)等傳統(tǒng)節(jié)日領(lǐng)域知識本體的設(shè)計(jì)與構(gòu)建方法。綜上,學(xué)者們從不同角度或針對具體的非遺細(xì)分領(lǐng)域提出了許多有價(jià)值的非遺領(lǐng)域本體模型。目前,國內(nèi)對非遺領(lǐng)域本體的研究處在起步階段,雖然取得了一定的成果,但尚未形成統(tǒng)一規(guī)范、完善的知識組織本體模型?,F(xiàn)有的研究多針對非遺信息資源的組織,缺少在知識層面的分析和研究,沒有突出非遺領(lǐng)域知識內(nèi)部之間以及與外部知識的關(guān)聯(lián)性,造成非遺項(xiàng)目蘊(yùn)含的知識內(nèi)容孤立與流失。
在關(guān)聯(lián)開放數(shù)據(jù)的環(huán)境下,越來越多的領(lǐng)域資源和數(shù)據(jù)以關(guān)聯(lián)數(shù)據(jù)的方式提供開放訪問服務(wù),關(guān)聯(lián)開放數(shù)據(jù)云圖中的數(shù)據(jù)集逐年增長。關(guān)聯(lián)數(shù)據(jù)技術(shù)的優(yōu)勢為非遺知識管理與信息資源的聚合,提供了強(qiáng)有力的工具和技術(shù)手段。王燕紅[10]梳理國內(nèi)基于關(guān)聯(lián)數(shù)據(jù)的資源整合研究現(xiàn)狀,發(fā)現(xiàn)基于關(guān)聯(lián)數(shù)據(jù)的資源整合集中應(yīng)用在網(wǎng)絡(luò)信息資源、數(shù)字圖書館、書目資源等領(lǐng)域,呈現(xiàn)出從理論研究向應(yīng)用研究發(fā)展的趨勢。戎軍濤[11]對基于關(guān)聯(lián)數(shù)據(jù)的知識組織深度序化機(jī)制進(jìn)行了研究,認(rèn)為關(guān)聯(lián)數(shù)據(jù)為知識組織的深度序化提供了實(shí)現(xiàn)路徑和基礎(chǔ)。翟姍姍等[12]對非遺數(shù)字資源內(nèi)容的語義表達(dá)、知識單元關(guān)聯(lián)揭示的問題進(jìn)行研究,提出了面向非遺傳承和傳播的多維度研究框架。李姍姍等[13]針對非遺檔案資源,提出了基于關(guān)聯(lián)數(shù)據(jù)的非遺檔案資源開發(fā)模型。董坤[14]利用關(guān)聯(lián)數(shù)據(jù)技術(shù)對非遺知識進(jìn)行語義化組織,實(shí)現(xiàn)了對非遺資源及其關(guān)系的語義化揭示與組織。仝召娟等[15]基于關(guān)聯(lián)數(shù)據(jù)對非遺數(shù)字資源聚合進(jìn)行研究,實(shí)現(xiàn)對來源異構(gòu)、內(nèi)容異構(gòu)的非遺數(shù)字化資源的整合與聚合,使數(shù)字化資源有序重組,更好地得到利用。此外,關(guān)聯(lián)數(shù)據(jù)技術(shù)在數(shù)字人文領(lǐng)域也得到了廣泛矚目和應(yīng)用,出現(xiàn)了大量的利用關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)數(shù)字人文服務(wù)的項(xiàng)目[16]。從上述研究中可以看出,利用關(guān)聯(lián)數(shù)據(jù)技術(shù)針對非遺數(shù)字化資源的研究較為豐富,主要集中在非遺數(shù)字資源的聚合、數(shù)字資源內(nèi)容的語義揭示等方面。但在非遺知識管理與知識組織方面,缺少系統(tǒng)性的研究,非遺領(lǐng)域知識也較少以關(guān)聯(lián)數(shù)據(jù)的方式進(jìn)行組織與管理。在實(shí)踐應(yīng)用方面,尚缺乏可供非遺領(lǐng)域參考的標(biāo)準(zhǔn)化、批量化、可供操作的關(guān)聯(lián)數(shù)據(jù)應(yīng)用方案,非遺知識亟待有效的組織與管理。
在借鑒國內(nèi)外相關(guān)研究成果的基礎(chǔ)上,本文從知識組織與知識關(guān)聯(lián)的角度,研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識管理與知識關(guān)聯(lián)的方法,并構(gòu)建非遺知識庫,實(shí)現(xiàn)非遺知識表示、知識可視化等創(chuàng)新性知識服務(wù)。首先,分析非遺領(lǐng)域知識的結(jié)構(gòu),梳理非遺項(xiàng)目之間、項(xiàng)目與傳承人以及項(xiàng)目與地域等領(lǐng)域內(nèi)部知識要素之間的關(guān)聯(lián)關(guān)系,構(gòu)建了非遺知識本體模型。其次,研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識組織與知識庫的構(gòu)建過程,包括實(shí)體RDF化、實(shí)體關(guān)聯(lián)、數(shù)據(jù)存儲與發(fā)布等核心過程。在此基礎(chǔ)上,研究與DBpedia、GeoNames外部關(guān)聯(lián)數(shù)據(jù)庫的知識關(guān)聯(lián),最終構(gòu)建非遺知識關(guān)聯(lián)數(shù)據(jù)庫,促進(jìn)非遺領(lǐng)域知識關(guān)聯(lián)與知識發(fā)現(xiàn)。最后,在非遺知識關(guān)聯(lián)數(shù)據(jù)庫的基礎(chǔ)上,提供非遺知識的瀏覽、關(guān)聯(lián)可視化表達(dá)等創(chuàng)新性知識服務(wù)。采用本體與關(guān)聯(lián)數(shù)據(jù)技術(shù)規(guī)范描述非遺領(lǐng)域的知識,能夠提高非遺知識的關(guān)聯(lián)性、開放性與可見度,能夠?yàn)榉沁z領(lǐng)域、數(shù)字人文等方面的科學(xué)研究提供開放數(shù)據(jù)服務(wù),有助于非遺知識的挖掘與發(fā)現(xiàn),以及我國非遺文化的國際傳播。
2 非遺知識本體模型的設(shè)計(jì)與構(gòu)建
本體被認(rèn)為是共享概念模型的明確的形式化規(guī)范說明[17];在信息科學(xué)與計(jì)算機(jī)領(lǐng)域,本體可以看作是一種模型,是對客觀存在對象或概念及其屬性和相關(guān)關(guān)系形式化的表達(dá)。對非遺領(lǐng)域知識的有效組織與管理,首先需要明確非遺知識的結(jié)構(gòu)、知識的構(gòu)成要素及內(nèi)部關(guān)系等。然后,在參考國際通用本體模型的基礎(chǔ)上,針對非遺領(lǐng)域的知識特征,建立非遺領(lǐng)域知識本體模型。
非遺知識本體是對非遺內(nèi)涵及其組成要素高度抽象概括而形成的一個(gè)形式化的概念模型。本文在本體理論與現(xiàn)有研究成果的基礎(chǔ)上,按照領(lǐng)域本體設(shè)計(jì)與構(gòu)建的思路與步驟,通過分析非遺項(xiàng)目的知識結(jié)構(gòu)和構(gòu)成要素,構(gòu)建了非遺知識本體模型,旨在為非遺知識描述及知識關(guān)聯(lián)提供統(tǒng)一規(guī)范的知識表示模型和數(shù)據(jù)模型。目前我國對非遺文化的保護(hù)與傳承,制定了“國家—省—市—縣”四級非遺保護(hù)名錄制度,每個(gè)非遺項(xiàng)目有其組織申報(bào)的地域或單位,并在口頭文學(xué)、表演儀式、手工技藝等領(lǐng)域認(rèn)定非遺項(xiàng)目的代表性傳承人。因此,有關(guān)非遺的基本知識可以看成由非遺項(xiàng)目、傳承人、相關(guān)機(jī)構(gòu)、項(xiàng)目類型、地理位置等要素構(gòu)成,組成要素之間存在著傳承關(guān)系、地域分布關(guān)系、類屬關(guān)系等語義關(guān)系。
在分析非遺知識基本結(jié)構(gòu)與關(guān)系的基礎(chǔ)上,本文設(shè)計(jì)構(gòu)建的非遺知識本體模型如圖1所示。該本體模型參考借鑒了CIDOCCRM①、FOAF②、GeoNames③、人物關(guān)系詞表(Relationship)④等本體模型以及都柏林核心(Dublin Core,DC)元數(shù)據(jù)標(biāo)準(zhǔn)。根據(jù)非遺領(lǐng)域知識構(gòu)成的核心要素,將非遺領(lǐng)域知識本體抽象出非遺項(xiàng)目(ICHproject)、代表性傳承人(Person)、地理位置(Place)、項(xiàng)目類型(Category)四大核心類;每個(gè)核心類定義相應(yīng)的數(shù)據(jù)屬性(Data Properties),實(shí)體之間的關(guān)系通過對象屬性(Object Properties)進(jìn)行描述與揭示。非遺知識本體模型提供對非遺領(lǐng)域知識概念及其關(guān)系的宏觀理解,規(guī)范統(tǒng)一非遺領(lǐng)域的基本術(shù)語及關(guān)系,并準(zhǔn)確描述知識概念之間的內(nèi)在關(guān)聯(lián)。
圖1 非遺知識本體模型
注:前綴ich表示本文構(gòu)建的非遺知識本體的命名空間,定義為http://localhost:8890/ontology/。
2.1 非遺項(xiàng)目類
非遺項(xiàng)目類(ICHProject)是對非遺項(xiàng)目的抽象,其實(shí)例指我國建立的“國家—省—市—縣”四級非遺保護(hù)名錄中的每一個(gè)具體的項(xiàng)目。非遺項(xiàng)目實(shí)例是一個(gè)復(fù)合型對象,既具有本身的內(nèi)涵屬性,還包括與之相關(guān)的傳承人、地域等實(shí)體。非遺項(xiàng)目實(shí)體的屬性主要包括項(xiàng)目簡介、基本內(nèi)容、歷史淵源、存續(xù)狀態(tài)、保護(hù)與傳承情況等關(guān)于項(xiàng)目內(nèi)容的描述信息,根據(jù)我國《國家級非遺代表作申報(bào)書》中設(shè)置的主要欄目,從中選取非遺專指概念;此外,除了以上基本屬性外,不同種類的非遺項(xiàng)目又有其獨(dú)有的特征;比如,民間音樂類非遺項(xiàng)目使用的樂器、獨(dú)特的唱腔等,民間舞蹈中的服裝,傳統(tǒng)手工技藝類包含的制作技術(shù)、方法或過程、工具材料、相關(guān)制品及應(yīng)用等。非遺項(xiàng)目類的具體屬性如圖2所示。
圖2 非遺項(xiàng)目類及其屬性
2.2 項(xiàng)目類型類
項(xiàng)目類型類(Category)用于對非遺項(xiàng)目分類體系的構(gòu)建;為使非遺分類體系具有國際通用性,將其細(xì)分為聯(lián)合國分類(UNCategory)與我國“十分法”(CNCategory)兩個(gè)子類。依據(jù)我國《國家級非物質(zhì)文化遺產(chǎn)名錄》將非遺分為民俗、民間文學(xué)、傳統(tǒng)音樂、曲藝、傳統(tǒng)舞蹈等十大類;聯(lián)合國教科文組織在《保護(hù)非物質(zhì)文化遺產(chǎn)公約》中將非遺分為口頭傳說和表述、表演藝術(shù)、社會實(shí)踐、禮儀和節(jié)慶活動、有關(guān)自然界的知識和實(shí)踐、傳統(tǒng)手工藝技能五種形式[18]。通過使用表示概念上下級關(guān)系的對象屬性(skos:broader、skos:narrower等),可以構(gòu)建一個(gè)多視角、多層次、可伸縮的非遺項(xiàng)目分類體系。
2.3 代表性傳承人類
非遺作為活態(tài)的遺產(chǎn),需要人的傳承才能延續(xù)與發(fā)展。非遺代表性傳承人是非遺文化的重要組成部分,傳承人掌握著杰出的技藝、技能,對群體、族群具有影響力,代表著非遺蘊(yùn)含的深厚文化傳統(tǒng);傳承人在培養(yǎng)傳人、技藝傳授等方面起到關(guān)鍵作用。本文定義的本體模型中主體類(Agent)的定義復(fù)用FOAF本體模型,將主體類可以分為“傳承人個(gè)體”與“組織與機(jī)構(gòu)”兩個(gè)子類;“個(gè)體”主要指認(rèn)證的國家級、省市級代表性傳承人個(gè)人,“組織與機(jī)構(gòu)”則表示某些非遺項(xiàng)目的申報(bào)單位,比如,農(nóng)歷二十四節(jié)氣的申報(bào)單位為中國農(nóng)業(yè)博物館。對于非遺項(xiàng)目代表性傳承人對象,其屬性包括傳承人編號、姓名、性別、稱謂、民族、出生日期、籍貫等基本信息,以及其掌握的技能、技藝傳承的情況等。本體模型中代表性傳承人類的具體屬性如圖3所示。此外,復(fù)用人物關(guān)系詞匯表(Relationship)中的屬性,來更好地表達(dá)傳承人之間錯綜復(fù)雜的傳承關(guān)系和傳承譜系。
2.4 地理位置類
非遺具有鮮明的地域特色,不同地域的風(fēng)俗習(xí)慣、語言、文化和歷史孕育了不同特色的非遺內(nèi)容。本體模型中定義地理位置類,一方面為表達(dá)非遺項(xiàng)目分布與流傳的地理空間,另一方面記錄傳承人的居住地與籍貫等信息。并為地理位置類賦予其省、市、縣、村鎮(zhèn)行政級別的數(shù)據(jù)屬性,與我國的行政區(qū)劃相對應(yīng)。同時(shí),將每個(gè)地理位置實(shí)例與地理數(shù)據(jù)庫GeoNames進(jìn)行實(shí)體的關(guān)聯(lián),獲取地理位置簡介、經(jīng)緯度等信息。結(jié)合地理信息系統(tǒng)(GIS)技術(shù),不僅通過地圖空間分布的直觀可視化形式表達(dá)非遺的空間分布,還可以從深層次挖掘出非遺中空間維度的隱含信息,通過空間聚類、核密度分析等GIS空間分析技術(shù),對非遺的空間結(jié)構(gòu)與演變及特征進(jìn)行分析,對理解非遺文化的內(nèi)涵具有重要意義。
圖3 代表性傳承人類及其屬性
2.5 實(shí)體之間的關(guān)聯(lián)關(guān)系
通過對非遺知識結(jié)構(gòu)的分析,抽象出本體模型的核心類之外,還需要定義知識要素間豐富的關(guān)系。通過對非遺領(lǐng)域?qū)嶓w之間的關(guān)系進(jìn)行梳理,可以概括出非遺項(xiàng)目與傳承人間的代表關(guān)系、項(xiàng)目與地域的位置關(guān)系、傳承人間的傳承關(guān)系、項(xiàng)目類別之間的層級關(guān)系等,這些關(guān)系對了解和認(rèn)識非遺文化的活態(tài)流變性非常重要。在本體模型中通過定義對象屬性,對實(shí)體間關(guān)系進(jìn)行描述與表示,最終,在對非遺領(lǐng)域知識結(jié)構(gòu)分析的基礎(chǔ)上,定義對象屬性及其定義域與值域,如表1所示。實(shí)體間的關(guān)聯(lián)關(guān)系將獨(dú)立的知識要素聯(lián)系起來,形成非遺知識網(wǎng)絡(luò),改變傳統(tǒng)知識組織的單線索模式。此外,在這些關(guān)聯(lián)關(guān)系的基礎(chǔ)上,通過定義規(guī)則與關(guān)系推理,能夠推斷并發(fā)現(xiàn)隱形的知識。
圍繞非遺項(xiàng)目相關(guān)知識的組織與管理,本文在參考借鑒CIDOC CRM、FOAF、Relationship等國際通用本體模型的基礎(chǔ)上,根據(jù)非遺知識的特點(diǎn)進(jìn)行本體的復(fù)用和自定義擴(kuò)展。最終,設(shè)計(jì)構(gòu)建的非遺知識本體模型包含8個(gè)核心類和25個(gè)對象屬性、非遺項(xiàng)目和傳承人類的27個(gè)數(shù)據(jù)屬性,以及本體推理規(guī)則等,為非遺領(lǐng)域知識的組織與形式化表示提供了較為全面的、規(guī)范統(tǒng)一的模型,滿足了對非遺領(lǐng)域知識結(jié)構(gòu)的形式化描述與表示。使用本體編輯軟件protégé進(jìn)行非遺知識本體模型的開發(fā)與實(shí)現(xiàn),本體模型的結(jié)構(gòu)如圖4所示。非遺知識本體模型面向非遺知識的組織與管理,提供對非遺領(lǐng)域知識的形式化表示,滿足了對非遺項(xiàng)目申報(bào)與認(rèn)證過程中的知識管理需求。對湖北省非遺知識組織與管理的實(shí)踐,驗(yàn)證了本文構(gòu)建的非遺知識本體模型的合理性和有效性。
圖4 非遺知識本體模型的可視化
非遺知識本體模型構(gòu)建的主要作用是對非遺知識的描述和形式化表達(dá)進(jìn)行規(guī)范,而數(shù)據(jù)的語義轉(zhuǎn)化、知識的結(jié)構(gòu)化表示與存儲則需要借助關(guān)聯(lián)數(shù)據(jù)相關(guān)技術(shù)進(jìn)行實(shí)現(xiàn)。
3 非遺知識關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建與發(fā)布
關(guān)聯(lián)數(shù)據(jù)技術(shù)使用統(tǒng)一資源標(biāo)識符(URI)對資源實(shí)體進(jìn)行命名描述,采用RDF作為其數(shù)據(jù)模型,鏈接、發(fā)布、共享各類信息、數(shù)據(jù)和知識,從而構(gòu)成數(shù)據(jù)的關(guān)聯(lián)網(wǎng)絡(luò);采用關(guān)聯(lián)數(shù)據(jù)技術(shù)對信息與知識進(jìn)行組織,使得人與機(jī)器都能夠獲取與理解這些語義關(guān)聯(lián)化與結(jié)構(gòu)化的數(shù)據(jù)。關(guān)聯(lián)數(shù)據(jù)靈活的內(nèi)外部鏈接機(jī)制,能夠?qū)⒖珙I(lǐng)域、跨類型的知識對象連接成一個(gè)整體的知識網(wǎng)絡(luò)[11]。
非遺知識關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建是一個(gè)龐大而系統(tǒng)的工程。首先,明確研究范圍,梳理非遺領(lǐng)域的知識對象;其次,對領(lǐng)域?qū)嶓w進(jìn)行抽取,明確實(shí)體的各類屬性,構(gòu)建領(lǐng)域本體模型,形成敘詞表和術(shù)語表;再次,按照本體模型對實(shí)體進(jìn)行RDF化屬性描述,建立實(shí)體鏈接,包括領(lǐng)域內(nèi)部實(shí)體之間以及與外部開放數(shù)據(jù)間的實(shí)體鏈接;最后,選擇合適的數(shù)據(jù)存儲與發(fā)布平臺,為人機(jī)提供訪問和數(shù)據(jù)接口。遵循關(guān)聯(lián)數(shù)據(jù)的基本原則,非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)庫的構(gòu)建可以分為五個(gè)關(guān)鍵步驟,即數(shù)據(jù)建模、實(shí)體命名、實(shí)體RDF化、實(shí)體關(guān)聯(lián)、實(shí)體發(fā)布[19]。其中,數(shù)據(jù)建模過程即非遺領(lǐng)域知識本體模型的構(gòu)建過程。本文以湖北省非遺項(xiàng)目為例,探索非遺知識關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建步驟和具體實(shí)現(xiàn)的方法。非遺知識關(guān)聯(lián)數(shù)據(jù)集構(gòu)建的技術(shù)框架如圖5所示。
3.1 非遺項(xiàng)目數(shù)據(jù)的獲取與處理
由于我國非遺項(xiàng)目數(shù)量相當(dāng)龐大,而且非遺項(xiàng)目和傳承人的認(rèn)定是動態(tài)變化的,導(dǎo)致整個(gè)非遺領(lǐng)域知識庫的建設(shè)過程需要分層次、分批進(jìn)行。本文以湖北省非遺項(xiàng)目為例,收集整理湖北省非遺項(xiàng)目和代表性傳承人的基本信息,在此基礎(chǔ)上構(gòu)建湖北省非遺知識關(guān)聯(lián)數(shù)據(jù)集。數(shù)據(jù)來源主要有兩個(gè)途徑,一是非遺項(xiàng)目申報(bào)與代表性傳承人認(rèn)證申請的數(shù)據(jù),二是通過網(wǎng)絡(luò)爬蟲、實(shí)體抽取等技術(shù),從我國非物質(zhì)文化遺產(chǎn)網(wǎng)、湖北非物質(zhì)文化遺產(chǎn)網(wǎng)等網(wǎng)站上收集的互聯(lián)網(wǎng)數(shù)據(jù),最后對收集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗等預(yù)處理,并存儲在數(shù)據(jù)庫中。共收集整理了湖北省國家級、省級和地市級非遺項(xiàng)目370項(xiàng),代表性傳承人310位,包括湖北省行政區(qū)劃與非遺項(xiàng)目類型等數(shù)據(jù)。為準(zhǔn)確研究非遺的地域分布,將不同地區(qū)的同一非遺項(xiàng)目進(jìn)行拆分。
圖5 非遺知識關(guān)聯(lián)數(shù)據(jù)集構(gòu)建的技術(shù)框架
3.2 實(shí)體RDF化
RDF(Resource Description Framework)即資源描述框架,是關(guān)聯(lián)數(shù)據(jù)使用的數(shù)據(jù)模型,其采用三元組的結(jié)構(gòu)化形式對資源進(jìn)行描述。RDF使用“實(shí)體、屬性、屬性值”三元組陳述來描述事物。實(shí)體RDF化即是對每個(gè)對象及其屬性利用RDF語義描述語言進(jìn)行規(guī)范化和結(jié)構(gòu)化描述。在標(biāo)準(zhǔn)詞表和領(lǐng)域本體的前提下,進(jìn)行詞匯的RDF映射與實(shí)體對象的RDF描述;實(shí)體RDF化可以分為手動描述和自動轉(zhuǎn)化,自動轉(zhuǎn)化是將結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)依據(jù)本體模型進(jìn)行數(shù)據(jù)映射,轉(zhuǎn)換成RDF數(shù)據(jù)。
由于眾多傳統(tǒng)的非遺信息系統(tǒng)主要用關(guān)系型數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲,本文選擇基于D2RQ進(jìn)行數(shù)據(jù)語義映射,將關(guān)系型數(shù)據(jù)庫中的內(nèi)容轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)。D2RQ平臺是目前關(guān)聯(lián)數(shù)據(jù)構(gòu)建過程中廣泛使用的工具,其以虛擬RDF圖的方式訪問關(guān)系型數(shù)據(jù)庫,支持主流的關(guān)系型數(shù)據(jù)庫,并提供SPARQL查詢接口及Web化的執(zhí)行界面⑤。D2RQ平臺的核心功能模塊包括D2R Server、D2R Engine與D2R Mapping,其中,Mapping映射語言定義數(shù)據(jù)映射的規(guī)則,規(guī)范關(guān)系型數(shù)據(jù)庫結(jié)構(gòu)與本體模型的關(guān)系。數(shù)據(jù)的語義映射即是將二維表結(jié)構(gòu)轉(zhuǎn)換成更善于處理復(fù)雜關(guān)系、更富有語義信息的關(guān)聯(lián)數(shù)據(jù);具體包括數(shù)據(jù)表向類映射、數(shù)據(jù)表中的列向?qū)傩杂成?、關(guān)系表向關(guān)聯(lián)關(guān)系映射。在映射語言中,使用d2rq:ClassMap定義本體模型的類,對應(yīng)數(shù)據(jù)表的映射,使用d2rq:PropertyBridge定義本體模型中的屬性,對應(yīng)數(shù)據(jù)表中的列及關(guān)系表的映射。
對關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)向RDF的映射,要遵循本體模型中定義的類與屬性。如圖6所示,將關(guān)系型數(shù)據(jù)庫中五個(gè)主要數(shù)據(jù)表映射為非遺項(xiàng)目、傳承人、分類與地理位置四個(gè)核心類及其屬性,其中,關(guān)系表映射為“hasInheritor”對象屬性;每個(gè)數(shù)據(jù)表的字段映射為相應(yīng)的屬性。表2對應(yīng)映射框架,是將項(xiàng)目表、傳承人、傳承關(guān)系表進(jìn)行語義映射的核心語句。
圖6 類及屬性的映射框架
最后,根據(jù)數(shù)據(jù)映射文件,使用D2RQ平臺的dump-rdf工具將關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換生成RDF/XML格式文件,供其他數(shù)據(jù)庫或第三方應(yīng)用程序使用。雖然D2RQ也可以對關(guān)聯(lián)數(shù)據(jù)進(jìn)行發(fā)布,但其對數(shù)據(jù)的更新與管理不夠靈活,對復(fù)雜關(guān)系和海量數(shù)據(jù)的支持有限。因此本文使用D2RQ對數(shù)據(jù)進(jìn)行語義轉(zhuǎn)換,將其轉(zhuǎn)換為RDF/XML格式文件。然后將數(shù)據(jù)存儲在專門的Triplestore數(shù)據(jù)庫中,并配置服務(wù)器實(shí)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)發(fā)布和數(shù)據(jù)開放接口。
3.3 實(shí)體關(guān)聯(lián)
實(shí)體關(guān)聯(lián)是在實(shí)體RDF化描述的基礎(chǔ)上,采用RDF鏈接描述不同實(shí)體對象間的語義關(guān)系,同時(shí)盡可能地與外部數(shù)據(jù)建立關(guān)聯(lián),從而構(gòu)建關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)[20]。將數(shù)據(jù)關(guān)聯(lián)到其他開放RDF數(shù)據(jù)集與詞匯表是豐富關(guān)聯(lián)數(shù)據(jù)語義的關(guān)鍵步驟[21]。實(shí)體鏈接應(yīng)更多地將內(nèi)部數(shù)據(jù)與外部開放數(shù)據(jù)集進(jìn)行語義鏈接,通過跨領(lǐng)域、跨學(xué)科、跨數(shù)據(jù)庫的知識聚合,實(shí)現(xiàn)知識的發(fā)現(xiàn)。
在語義網(wǎng)環(huán)境下,借助關(guān)聯(lián)數(shù)據(jù)的規(guī)范性和開放互聯(lián)性等突出特點(diǎn),并整合多個(gè)知識庫,能夠提高非遺領(lǐng)域知識的豐富程度和廣度,為非遺文化的科學(xué)研究與知識傳播提供數(shù)據(jù)基礎(chǔ)和知識服務(wù)。為豐富非遺領(lǐng)域知識,本文選擇與DBpedia以及GeoNames關(guān)聯(lián)數(shù)據(jù)項(xiàng)目進(jìn)行數(shù)據(jù)匹配與關(guān)聯(lián)。通過與DBpedia及其數(shù)據(jù)來源維基百科的關(guān)聯(lián),獲得與非遺項(xiàng)目對應(yīng)的中英文詞條;通過與全球地理數(shù)據(jù)庫(GeoNames)的關(guān)聯(lián),獲取有關(guān)非遺領(lǐng)域涉及地域的更多信息。使用OWL內(nèi)置屬性owl:sameAs將內(nèi)部知識實(shí)體與外部數(shù)據(jù)集中的實(shí)體進(jìn)行關(guān)聯(lián),表示鏈接的兩個(gè)實(shí)體對象為同一個(gè)事物。與DBpedia和GeoNames數(shù)據(jù)集的語義關(guān)聯(lián)如圖7所示。
圖7 非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)與外部數(shù)據(jù)集關(guān)聯(lián)示意
(1)非遺項(xiàng)目實(shí)體與DBpedia關(guān)聯(lián)
DBpedia項(xiàng)目是抽取維基百科的數(shù)據(jù)而建立的以關(guān)聯(lián)數(shù)據(jù)為標(biāo)準(zhǔn)的大型知識型數(shù)據(jù)集,是關(guān)聯(lián)開放數(shù)據(jù)云圖中的核心中樞。DBpedia數(shù)據(jù)集中包含大量的用中英文描述的有關(guān)我國非遺文化的信息,與之進(jìn)行實(shí)體關(guān)聯(lián)能夠豐富非遺領(lǐng)域知識,提高非遺知識的可見度和通用性。本文采用自動檢索與人工檢查相結(jié)合的方式,首先通過SPARQL語言在線檢索DBpedia中與非遺項(xiàng)目相關(guān)的資源條目,然后對檢索的結(jié)果通過人工檢查的方式進(jìn)行篩選和核對[22],最后將檢索到的資源的URI通過owl:sameAs屬性與內(nèi)部非遺項(xiàng)目實(shí)體進(jìn)行關(guān)聯(lián)。
在DBpedia本體模型中,db:abstract屬性表示該資源的摘要,foaf:isPrimaryTopicOf屬性鏈接與該資源對應(yīng)的維基百科頁面。在線調(diào)用DBpedia的SPARQL Endpoint站點(diǎn),將非遺項(xiàng)目的相關(guān)概念通過構(gòu)建SPARQL語句,檢索包含該關(guān)鍵詞的資源條目。如表3所示,以“黑暗傳”為關(guān)鍵詞對DBpedia的中文標(biāo)簽進(jìn)行全文檢索,同時(shí)獲取該資源的摘要信息及對應(yīng)的維基百科頁面;然后經(jīng)過人工判斷確定檢索結(jié)果是否為相同的資源實(shí)體,并將其與內(nèi)部數(shù)據(jù)集中的非遺項(xiàng)目實(shí)體進(jìn)行鏈接。
由于DBpedia存在不完善的地方,如有些非遺項(xiàng)目缺少詞條,DBpedia提供的中文信息不全,維基百科中有關(guān)非遺的資源條目DBpedia沒有收錄,還因?yàn)榉沁z項(xiàng)目的稱謂不統(tǒng)一,通過以上方式只能正確匹配部分實(shí)體,有些還無法完全匹配。因此,本文在自動檢索的基礎(chǔ)上,結(jié)合人工檢查的方式,盡可能多地將內(nèi)部非遺項(xiàng)目實(shí)體與DBpedia相關(guān)資源進(jìn)行關(guān)聯(lián)。最終,大概1/3的非遺項(xiàng)目與DBpedia或維基百科進(jìn)行了實(shí)體關(guān)聯(lián),也從側(cè)面凸顯了建立我國非遺百科型數(shù)據(jù)庫的必要性。
(2)地理位置實(shí)體與GeoNames關(guān)聯(lián)
GeoNames⑥地理數(shù)據(jù)庫包含全世界1000萬余條地理名稱,并提供地理名稱替代名、經(jīng)緯度、人口數(shù)量及維基百科等信息。其采用關(guān)聯(lián)數(shù)據(jù)的原則進(jìn)行組織,為每條地理名稱定義唯一的資源URI,將地理空間語義信息發(fā)布到互聯(lián)網(wǎng)上。為了獲取更多有關(guān)地理位置的信息,豐富領(lǐng)域知識,同時(shí)為基于地理信息對非遺文化的空間分析提供數(shù)據(jù)基礎(chǔ),本文將非遺項(xiàng)目申報(bào)地區(qū)、傳承人居住地等涉及地理位置的實(shí)體與GeoNames數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)。
GeoNames數(shù)據(jù)的獲取可以調(diào)用其官方API,或者借助第三方提供的SPARQL端點(diǎn)進(jìn)行獲?。粸楸WC與DBpedia數(shù)據(jù)關(guān)聯(lián)方式的一致,本文使用Factforge⑦網(wǎng)站的SPARQL端點(diǎn)獲取GeoNames數(shù)據(jù),其核心SPARQL查詢語句如表4所示。該查詢語句檢索“恩施州”在GeoNames數(shù)據(jù)庫中對應(yīng)的資源條目,并限定檢索的范圍為中國(編碼為CN)、資源類型為國家與地區(qū)(編碼為A)。檢索結(jié)果將返回該地理位置對象的URI,<http://sws.geonames.org/1811624/>,并可以進(jìn)一步獲取該地理位置的經(jīng)緯度以及維基百科鏈接等信息。對于地理名稱相同的情況,可以通過判斷市級與省級地理名稱(parentADM2、parentADM1)來消歧。通過上述方式,對地理位置實(shí)體的關(guān)聯(lián)達(dá)到了100%的匹配。
最后,在構(gòu)建內(nèi)部非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)上,將非遺項(xiàng)目、人物、地理位置等多個(gè)類別的實(shí)體與DBpedia和GeoNames等外部數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)。最終構(gòu)建的非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)庫中實(shí)體與三元組數(shù)量如圖8所示,其中共有9600余個(gè)三元組,涉及非遺項(xiàng)目、傳承人、機(jī)構(gòu)、地理、類型等多個(gè)類別的對象,與DBpedia關(guān)聯(lián)的實(shí)體有306個(gè),與GeoNames關(guān)聯(lián)的實(shí)體有124個(gè)。通過鏈接DBpedia可以更方便地與維基百科、WIKIDATA、YAGO等資源進(jìn)行關(guān)聯(lián)。而且,構(gòu)建的非遺知識關(guān)聯(lián)數(shù)據(jù)以W3C標(biāo)準(zhǔn)完全開放,可以通過在線檢索、SPARQL Endpoint等多種數(shù)據(jù)調(diào)用方式獲取數(shù)據(jù)服務(wù)。
圖8 非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)的統(tǒng)計(jì)
3.4 非遺知識關(guān)聯(lián)數(shù)據(jù)的存儲與發(fā)布
將非遺領(lǐng)域各類數(shù)據(jù)與知識轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)的形式之后,需要對其進(jìn)行持久化存儲與發(fā)布,關(guān)聯(lián)數(shù)據(jù)的存儲與發(fā)布直接影響數(shù)據(jù)的共享與重用。關(guān)聯(lián)數(shù)據(jù)存儲與發(fā)布有多種途徑,本文采用原生方式進(jìn)行存儲,配置關(guān)聯(lián)數(shù)據(jù)發(fā)布的服務(wù)器,提供開放數(shù)據(jù)服務(wù)和知識服務(wù);使用OpenLink Virtuoso作為RDF數(shù)據(jù)的存儲與管理數(shù)據(jù)庫,并利用LodView為用戶提供非遺知識庫的數(shù)據(jù)瀏覽,利用LodLive提供非遺知識關(guān)聯(lián)圖譜的可視化表示。
(1)關(guān)聯(lián)數(shù)據(jù)的存儲
關(guān)聯(lián)數(shù)據(jù)的存儲方案大致分為基于關(guān)系型數(shù)據(jù)的存儲、使用NOSQL數(shù)據(jù)庫存儲以及Triplestore數(shù)據(jù)庫存儲等[23]。其中,Triplestore數(shù)據(jù)庫是專門針對RDF數(shù)據(jù)結(jié)構(gòu)的特點(diǎn)開發(fā)的,具有高效的數(shù)據(jù)存儲、查詢及推理機(jī)制;同時(shí)因其采用統(tǒng)一的數(shù)據(jù)模型,可以實(shí)現(xiàn)數(shù)據(jù)間高效的交互。考慮到未來非遺領(lǐng)域知識的擴(kuò)展和數(shù)據(jù)的增長,本文選擇應(yīng)用較為廣泛的OpenLinkVirtuoso⑧作為數(shù)據(jù)庫管理軟件。Virtuoso數(shù)據(jù)庫是跨平臺可伸縮的高性能數(shù)據(jù)庫管理軟件,提供SQL、XML、RDF數(shù)據(jù)庫管理功能,支持?jǐn)?shù)十億規(guī)模三元組的存儲和管理[24]。Virtuoso數(shù)據(jù)庫為數(shù)據(jù)導(dǎo)入提供WEB頁面或ISQL命令等多重機(jī)制。將非遺相關(guān)的原始數(shù)據(jù)經(jīng)過語義描述或語義映射生成RDF格式數(shù)據(jù),然后導(dǎo)入到Virtuoso數(shù)據(jù)存儲中,并指定數(shù)據(jù)所屬的命名圖的IRI(Internationalized Resource Identifiers)。
(2)關(guān)聯(lián)數(shù)據(jù)的發(fā)布
通過上文構(gòu)建的非遺領(lǐng)域知識RDF數(shù)據(jù)需要經(jīng)過關(guān)聯(lián)數(shù)據(jù)發(fā)布,才能夠?qū)崿F(xiàn)數(shù)據(jù)的利用與共享;關(guān)聯(lián)數(shù)據(jù)常用的發(fā)布方式有基于靜態(tài)RDF/XML文件、基于關(guān)系型數(shù)據(jù)、基于RDF數(shù)據(jù)存儲庫、使用RDFa方式等多種途徑[25]。本文在Virtuoso數(shù)據(jù)庫平臺的基礎(chǔ)上,遵循W3C的關(guān)聯(lián)數(shù)據(jù)發(fā)布的四原則,配置關(guān)聯(lián)數(shù)據(jù)發(fā)布的服務(wù)器,提供RDF數(shù)據(jù)管理、關(guān)聯(lián)數(shù)據(jù)瀏覽、SPARQL端點(diǎn)、內(nèi)容協(xié)商等服務(wù)。
為了完整、全面地展示非遺關(guān)聯(lián)數(shù)據(jù)集中每個(gè)實(shí)體的屬性及其關(guān)系,使用LodView工具為用戶提供非遺關(guān)聯(lián)數(shù)據(jù)的瀏覽。LodView⑨是基于Jena與Spring框架開發(fā)的WEB應(yīng)用程序,支持符合W3C標(biāo)準(zhǔn)的國際化資源標(biāo)識符(IRI)的解析,將RDF數(shù)據(jù)格式轉(zhuǎn)化到HTML的工具;配置LodView的SPARQL站點(diǎn)及多媒體展示及經(jīng)緯度等屬性,根據(jù)內(nèi)容協(xié)商機(jī)制返回正確的RDF數(shù)據(jù)和網(wǎng)頁描述。非遺知識關(guān)聯(lián)數(shù)據(jù)集的實(shí)體,按照實(shí)體的類型進(jìn)行區(qū)分,包括非遺項(xiàng)目、傳承人、地名、項(xiàng)目類型等。實(shí)體命名的URI格式為http://[baseURI]/[entityTypeName]/[entityID],其中,[entityTypeName]與本體模型中的類對應(yīng);如http://localhost:8890/resource/ichproject/359表示“非遺項(xiàng)目類”的實(shí)例“黑暗傳”;使用LodView工具展示該實(shí)例詳細(xì)信息的頁面如圖9所示。
圖9展示了非遺項(xiàng)目“黑暗傳”實(shí)例的所有屬性。頁面上部為多媒體展示部分,直觀顯示與其相關(guān)的圖片、視頻等多媒體資源,頁面中羅列出該項(xiàng)目的代表性傳承人、所屬類型、分布地區(qū)等關(guān)聯(lián)對象。比如,通過ich:hasInheritor屬性鏈接該項(xiàng)目的代表性傳承人,點(diǎn)擊超鏈接跳轉(zhuǎn)至圖10所示傳承人對象的詳細(xì)頁面。當(dāng)用戶訪問時(shí),提供直觀的HTML頁面;應(yīng)用程序訪問時(shí),根據(jù)不同的內(nèi)容請求,返回RDF/XML、RDF/Turtle、JSON等相應(yīng)格式的數(shù)據(jù)。
在非遺知識關(guān)聯(lián)數(shù)據(jù)集中,地理位置類對象與GeoNames進(jìn)行了關(guān)聯(lián)。圖11是地理位置類“神農(nóng)架林區(qū)”實(shí)例的信息頁面,使用在線地圖的形式,根據(jù)經(jīng)緯度信息顯示地圖中的位置。頁面中部顯示地理位置類的具體屬性,并與DBpedia、GeoNames及Wikipedia進(jìn)行關(guān)聯(lián);頁面底部通過ich:hasPlace屬性的逆反性,反向檢索出該地區(qū)擁有的非遺項(xiàng)目和傳承人對象。
3.5 非遺知識關(guān)聯(lián)數(shù)據(jù)的可視化
非遺知識關(guān)聯(lián)數(shù)據(jù)集的獨(dú)特性是以事物間的關(guān)系為核心,而事物間復(fù)雜的關(guān)系最適合使用圖形化的方式表示。非遺知識關(guān)聯(lián)關(guān)系的可視化通過LodLive⑩系統(tǒng)實(shí)現(xiàn),LodLive以可視化知識圖譜的方式對非遺知識庫的數(shù)據(jù)提供直觀的數(shù)據(jù)瀏覽服務(wù)。LodLive僅僅基于SPARQL端點(diǎn)就可以實(shí)現(xiàn)對RDF資源進(jìn)行導(dǎo)航;通過配置SPARQL Endpoint站點(diǎn),LodLive可自動查詢與該實(shí)例相關(guān)的三元組信息,并與DBpedia、GeoNames等外部數(shù)據(jù)集進(jìn)行關(guān)聯(lián)查詢。
圖9 非遺項(xiàng)目對象頁面
圖10 傳承人對象頁面
圖11 地理位置對象頁面
在知識關(guān)聯(lián)圖譜中,節(jié)點(diǎn)表示對象實(shí)例,鏈接兩個(gè)節(jié)點(diǎn)的箭頭則表示二者間的關(guān)系。每兩個(gè)實(shí)例對象之間,都直接或間接地存在某種聯(lián)系,以任意一個(gè)知識對象為起點(diǎn),都可以發(fā)現(xiàn)其他與之相關(guān)的對象及他們之間的相互關(guān)系,以遞進(jìn)的方式展示知識的關(guān)聯(lián)性。這種細(xì)粒度的知識組織和互聯(lián)方式使數(shù)據(jù)的集成與利用變得更加容易。
圖12是以非遺項(xiàng)目“黑暗傳”為中心的知識關(guān)聯(lián)圖譜。其中,右側(cè)描述了該項(xiàng)目的基本信息,中間區(qū)域是領(lǐng)域內(nèi)部知識關(guān)聯(lián)數(shù)據(jù)集,包括項(xiàng)目傳承人、項(xiàng)目類型、分布地區(qū)等具體實(shí)例,與之鏈接的節(jié)點(diǎn)可以繼續(xù)展開。左側(cè)區(qū)域?yàn)殛P(guān)聯(lián)的外部DBpedia、GeoNames等數(shù)據(jù)集,通過自建的關(guān)聯(lián)數(shù)據(jù)集與外部不同數(shù)據(jù)源的實(shí)體關(guān)聯(lián),可以獲得更多相關(guān)的知識信息。通過關(guān)聯(lián)關(guān)系的圖譜化呈現(xiàn),能夠發(fā)現(xiàn)更多隱含的有價(jià)值的非遺知識。
除了將非遺知識以關(guān)聯(lián)圖譜的形式進(jìn)行可視化之外,還可以借助地理信息系統(tǒng)(GIS)以在線地圖的形式展示非遺知識中的地理特征。通過與GeoNames數(shù)據(jù)庫關(guān)聯(lián)以及利用地理編碼技術(shù)獲取非遺項(xiàng)目或傳承人實(shí)體的經(jīng)緯度信息,在基礎(chǔ)地圖服務(wù)的基礎(chǔ)上實(shí)現(xiàn)非遺知識地圖可視化。圖13是非遺地圖可視化界面,頁面左側(cè)按照行政區(qū)劃與項(xiàng)目類型提供分類導(dǎo)航;此外,提供地圖查詢功能,查詢結(jié)果將在地圖中標(biāo)記出來,點(diǎn)擊地圖上的興趣點(diǎn)可以查看詳細(xì)信息。以地理空間為主線,以非遺領(lǐng)域知識為對象,將領(lǐng)域知識圍繞地理特征進(jìn)行匯聚與組織,從而實(shí)現(xiàn)非遺知識服務(wù)的智慧化系統(tǒng)。
圖12 非遺項(xiàng)目“黑暗傳”的關(guān)聯(lián)圖譜
本文構(gòu)建的非遺知識庫以關(guān)聯(lián)開放數(shù)據(jù)集的形式進(jìn)行開放,通過互聯(lián)網(wǎng)提供非遺領(lǐng)域數(shù)據(jù)的消費(fèi)接口;在領(lǐng)域?qū)<液头沁z保護(hù)機(jī)構(gòu)的支持下,非遺領(lǐng)域知識將會得到進(jìn)一步的補(bǔ)充和更新。通過標(biāo)準(zhǔn)化的知識組織,向社會提供數(shù)據(jù)的共享與重用,促進(jìn)非遺領(lǐng)域知識的規(guī)范控制、數(shù)據(jù)共建與共享以及知識的創(chuàng)新性應(yīng)用。基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識管理的研究,為大數(shù)據(jù)和數(shù)字人文背景下非遺領(lǐng)域知識的深度組織與開發(fā)提供了思路,對我國非遺知識的管理具有一定的參考價(jià)值。
圖13 非遺知識的地圖瀏覽與地圖查詢
4 結(jié)論與展望
語義網(wǎng)及關(guān)聯(lián)數(shù)據(jù)的發(fā)展,為非遺領(lǐng)域知識的組織與共享提供了新的思路與方法,改變了非遺知識的表示與表達(dá)方式。為實(shí)現(xiàn)對非遺知識的有效組織與管理,本文在對非遺領(lǐng)域知識進(jìn)行加工與整理的基礎(chǔ)上,梳理出非遺知識要素與語義關(guān)系,構(gòu)建了非遺知識本體模型,以揭示非遺領(lǐng)域豐富的知識以及知識間的內(nèi)在聯(lián)系?;陉P(guān)聯(lián)數(shù)據(jù)技術(shù)構(gòu)建的非遺知識關(guān)聯(lián)數(shù)據(jù)集,以關(guān)聯(lián)開放數(shù)據(jù)的形式提供數(shù)據(jù)的消費(fèi)與共享,并基于關(guān)聯(lián)數(shù)據(jù)集提供領(lǐng)域知識的關(guān)聯(lián)展示、知識可視化等知識服務(wù)。
本體與關(guān)聯(lián)數(shù)據(jù)的思想與技術(shù)在非遺領(lǐng)域知識組織方面具有巨大的優(yōu)勢,利用關(guān)聯(lián)數(shù)據(jù)技術(shù)構(gòu)建我國非遺領(lǐng)域知識庫,并與國際上的開放數(shù)據(jù)集進(jìn)行實(shí)體鏈接,能夠提高非遺領(lǐng)域知識的關(guān)聯(lián)性、共享與開放性、影響力。高質(zhì)量的非遺知識開放數(shù)據(jù)集與知識服務(wù)平臺的構(gòu)建,一方面為更深層次非遺文化的分析與研究提供了科學(xué)的數(shù)據(jù)集,另一方面促使非遺知識發(fā)揮出更大的價(jià)值,對非遺文化的傳播與傳承具有重要的意義。
非遺蘊(yùn)含著豐富的知識,本文僅僅研究梳理了非遺項(xiàng)目、傳承人、地域、傳承關(guān)系等基本知識要素,知識組織的顆粒度還有待進(jìn)一步細(xì)化。非遺知識本體模型仍需要根據(jù)實(shí)際需求進(jìn)行進(jìn)一步的擴(kuò)展與豐富。后續(xù)研究將擴(kuò)大數(shù)據(jù)來源與研究對象,在大數(shù)據(jù)環(huán)境下,研究非遺海量異構(gòu)知識的組織與管理,并在此基礎(chǔ)上分析非遺項(xiàng)目的時(shí)空演變與歷史發(fā)展歷程,以及非遺文化的存續(xù)狀態(tài),深入挖掘非遺領(lǐng)域的知識內(nèi)涵。
欄目分類
- 創(chuàng)造性舞蹈在少兒舞蹈教學(xué)中的實(shí)踐研究
- 藏族民間游戲融入少兒舞蹈作品的實(shí)踐與探索
- 舞臺美術(shù)設(shè)計(jì)中的空間布局與觀眾體驗(yàn)研究
- 數(shù)字化背景下湖湘文化賦能高校舞蹈教育發(fā)展路徑研究
- 情境教學(xué)在舞蹈線上教學(xué)中的運(yùn)用
- 課程思政視閾下高校舞蹈教學(xué)的創(chuàng)新開展研究
- 高校民族舞教育體系構(gòu)建與教學(xué)實(shí)踐
- AI技術(shù)融入高校體育舞蹈中的現(xiàn)狀和發(fā)展路徑研究
- 老莊哲學(xué)視域下贛南采茶舞蹈中丑角表演探究 ——以舞蹈作品《劉二尋花》為例
- 吉林秧歌與文旅融合的協(xié)同發(fā)展路徑
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級黨報(bào)?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!