優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)知識管理研究

作者:侯西龍,談國新,莊文杰,唐銘來源:《中國圖書館學(xué)報》日期:2020-09-28人氣:1631

 引言

非物質(zhì)文化遺產(chǎn)(以下簡稱“非遺”)作為各民族優(yōu)秀傳統(tǒng)文化的重要組成部分,彰顯著地域的特色,蘊含著群體的智慧,對于每個國家都是不可再生的文化財富。非遺文化的表現(xiàn)形式多樣,涉及領(lǐng)域廣泛,蘊含著豐富的知識。對非遺領(lǐng)域知識進行結(jié)構(gòu)化表示與語義化組織,是知識時代對非遺文化保護與知識傳播的必然要求。然而,中國非遺網(wǎng)及各省市非遺傳播平臺在對非遺知識進行管理時,僅以列表的形式展示非遺項目與代表性傳承人的信息,缺少項目與傳承人、項目與地區(qū)等知識要素之間的關(guān)聯(lián);非遺領(lǐng)域知識由于缺乏有效的組織和管理,造成了信息的碎片化,大大限制了知識的完整性與可傳播性。同時,在非遺垂直領(lǐng)域缺少專業(yè)的知識型關(guān)聯(lián)數(shù)據(jù)集,尚未形成成熟的非遺百科類知識庫。雖然國內(nèi)在通用領(lǐng)域的中文百科知識圖譜研究方面取得了一定成果,包括zhishi.me(東南大學(xué))、CN-DBpedia(復(fù)旦大學(xué))、PKUPie(北京大學(xué))、Xlore(清華大學(xué))等中文百科知識圖譜;OpenKG也正在促進這些百科類知識圖譜的開放與互聯(lián)[1]。但在中文知識百科領(lǐng)域,缺少像DBpedia、Freebase等大型百科知識型數(shù)據(jù)集。由于非遺領(lǐng)域數(shù)據(jù)仍以半結(jié)構(gòu)化數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)庫為主,碎片化的數(shù)據(jù)較多,缺乏高質(zhì)量的非遺開放數(shù)據(jù)集;對非遺知識單一線性的組織,無法體現(xiàn)非遺文化的多元特征,無法滿足多維度揭示與知識檢索的需要[2]。這限制了對非遺的科學(xué)研究,也限制了非遺知識的傳播和對非遺文化的傳承。

傳統(tǒng)的非遺項目的知識管理方式主要依據(jù)主題、地域與級別等進行分類歸檔,組織單元的顆粒度較粗,組織模式是線性的、一維的;非遺領(lǐng)域知識元素的語義化程度較低,無法充分表達與揭示知識元素之間的關(guān)系。隨著知識組織與知識管理研究的深入,非遺領(lǐng)域知識的管理向主題圖譜、知識圖譜、語義組織等新型組織方式發(fā)展,更加注重領(lǐng)域知識間關(guān)系的多維度揭示。尤其是語義網(wǎng)技術(shù)堆棧中的本體與關(guān)聯(lián)數(shù)據(jù)技術(shù)為非遺領(lǐng)域知識的語義組織提供了新的解決思路和方案。關(guān)聯(lián)數(shù)據(jù)被看作是語義網(wǎng)的輕量級實現(xiàn),其以關(guān)聯(lián)開放數(shù)據(jù)的形式聚合異構(gòu)的信息資源,能夠提高資源與知識的可見度、共享性和開放性?;陉P(guān)聯(lián)數(shù)據(jù)對非遺知識的組織與管理,是在規(guī)范統(tǒng)一的領(lǐng)域本體模型的指導(dǎo)下,以結(jié)構(gòu)化、形式化方式表達非遺領(lǐng)域知識元素及其屬性,并構(gòu)建知識元素之間的語義關(guān)系,進而達到知識的語義化與有序化的目的,并提供開放的數(shù)據(jù)獲取和知識服務(wù)。

基于此背景,本文針對非遺知識的有效管理與知識關(guān)聯(lián)問題,提出基于關(guān)聯(lián)數(shù)據(jù)的非遺知識組織與非遺知識關(guān)聯(lián)數(shù)據(jù)庫構(gòu)建的方法體系,包括從非遺知識本體模型設(shè)計到關(guān)聯(lián)數(shù)據(jù)構(gòu)建、存儲與發(fā)布的整個過程;研究將非遺領(lǐng)域內(nèi)部關(guān)聯(lián)數(shù)據(jù)集與DBpedia及GeoNames外部知識型數(shù)據(jù)庫進行知識關(guān)聯(lián),建立一個擁有豐富語義關(guān)系、知識互聯(lián)共享的非遺知識關(guān)聯(lián)數(shù)據(jù)庫,提供領(lǐng)域知識的有序組織及知識可視化。并以湖北省非遺項目為例,將非遺項目有關(guān)的知識進行關(guān)聯(lián)聚合,構(gòu)建了非遺知識關(guān)聯(lián)數(shù)據(jù)集與服務(wù)平臺。在數(shù)字人文研究背景下,通過對非遺知識組織與管理的深入研究,以期為我國非遺知識的組織與管理以及非遺文化的保護與傳播提供參考。

1 非遺領(lǐng)域知識本體研究與關(guān)聯(lián)數(shù)據(jù)技術(shù)應(yīng)用現(xiàn)狀

非遺領(lǐng)域知識涉及的內(nèi)容豐富,文化形態(tài)多元,但是由于缺少詳盡的分類體系標準,導(dǎo)致非遺知識組織的程度較低,非遺領(lǐng)域知識無法得到有效的管理。如何將海量、零散的非遺知識按照知識的內(nèi)在關(guān)系進行表示與組織,成為亟待深入研究的問題。隨著語義網(wǎng)的發(fā)展,一些研究者已經(jīng)將本體及關(guān)聯(lián)數(shù)據(jù)的理論與方法引入到非遺知識組織和知識管理領(lǐng)域,在本體構(gòu)建、資源整合、資源組織等方面開展了大量的研究。在非遺領(lǐng)域知識結(jié)構(gòu)分析與本體構(gòu)建研究方面,蔡璐等[3]從系統(tǒng)論角度分析非遺的各要素,構(gòu)建了由非遺項目類、人物類、事物類、事件類以及文獻類等核心概念組成的本體概念模型,并制定非遺資源的元數(shù)據(jù)標準與規(guī)范。黃永等[4]分析了非遺知識本體構(gòu)建的難點,以民間舞蹈為例設(shè)計了面向文本與多媒體數(shù)據(jù)的非遺知識本體構(gòu)建系統(tǒng)。滕春娥、王萍[5]基于本體理論從非遺項目及人物、事件、文獻等維度對赫哲族非遺信息資源進行組織與整合。周耀林等[6]以本體方法為研究視角,從本體表示與語義組織、語義檢索兩個層面,設(shè)計了非遺信息資源組織與檢索框架,以戲劇類非遺項目為例實現(xiàn)非遺信息資源本體的構(gòu)建。此外,國內(nèi)學(xué)者針對不同類型的非遺項目,對知識本體的構(gòu)建與應(yīng)用進行了探索。比如,郝挺雷[7]、胡駿等[8]和隗昊[9]研究端午節(jié)、盤王節(jié)等傳統(tǒng)節(jié)日領(lǐng)域知識本體的設(shè)計與構(gòu)建方法。綜上,學(xué)者們從不同角度或針對具體的非遺細分領(lǐng)域提出了許多有價值的非遺領(lǐng)域本體模型。目前,國內(nèi)對非遺領(lǐng)域本體的研究處在起步階段,雖然取得了一定的成果,但尚未形成統(tǒng)一規(guī)范、完善的知識組織本體模型。現(xiàn)有的研究多針對非遺信息資源的組織,缺少在知識層面的分析和研究,沒有突出非遺領(lǐng)域知識內(nèi)部之間以及與外部知識的關(guān)聯(lián)性,造成非遺項目蘊含的知識內(nèi)容孤立與流失。

在關(guān)聯(lián)開放數(shù)據(jù)的環(huán)境下,越來越多的領(lǐng)域資源和數(shù)據(jù)以關(guān)聯(lián)數(shù)據(jù)的方式提供開放訪問服務(wù),關(guān)聯(lián)開放數(shù)據(jù)云圖中的數(shù)據(jù)集逐年增長。關(guān)聯(lián)數(shù)據(jù)技術(shù)的優(yōu)勢為非遺知識管理與信息資源的聚合,提供了強有力的工具和技術(shù)手段。王燕紅[10]梳理國內(nèi)基于關(guān)聯(lián)數(shù)據(jù)的資源整合研究現(xiàn)狀,發(fā)現(xiàn)基于關(guān)聯(lián)數(shù)據(jù)的資源整合集中應(yīng)用在網(wǎng)絡(luò)信息資源、數(shù)字圖書館、書目資源等領(lǐng)域,呈現(xiàn)出從理論研究向應(yīng)用研究發(fā)展的趨勢。戎軍濤[11]對基于關(guān)聯(lián)數(shù)據(jù)的知識組織深度序化機制進行了研究,認為關(guān)聯(lián)數(shù)據(jù)為知識組織的深度序化提供了實現(xiàn)路徑和基礎(chǔ)。翟姍姍等[12]對非遺數(shù)字資源內(nèi)容的語義表達、知識單元關(guān)聯(lián)揭示的問題進行研究,提出了面向非遺傳承和傳播的多維度研究框架。李姍姍等[13]針對非遺檔案資源,提出了基于關(guān)聯(lián)數(shù)據(jù)的非遺檔案資源開發(fā)模型。董坤[14]利用關(guān)聯(lián)數(shù)據(jù)技術(shù)對非遺知識進行語義化組織,實現(xiàn)了對非遺資源及其關(guān)系的語義化揭示與組織。仝召娟等[15]基于關(guān)聯(lián)數(shù)據(jù)對非遺數(shù)字資源聚合進行研究,實現(xiàn)對來源異構(gòu)、內(nèi)容異構(gòu)的非遺數(shù)字化資源的整合與聚合,使數(shù)字化資源有序重組,更好地得到利用。此外,關(guān)聯(lián)數(shù)據(jù)技術(shù)在數(shù)字人文領(lǐng)域也得到了廣泛矚目和應(yīng)用,出現(xiàn)了大量的利用關(guān)聯(lián)數(shù)據(jù)實現(xiàn)數(shù)字人文服務(wù)的項目[16]。從上述研究中可以看出,利用關(guān)聯(lián)數(shù)據(jù)技術(shù)針對非遺數(shù)字化資源的研究較為豐富,主要集中在非遺數(shù)字資源的聚合、數(shù)字資源內(nèi)容的語義揭示等方面。但在非遺知識管理與知識組織方面,缺少系統(tǒng)性的研究,非遺領(lǐng)域知識也較少以關(guān)聯(lián)數(shù)據(jù)的方式進行組織與管理。在實踐應(yīng)用方面,尚缺乏可供非遺領(lǐng)域參考的標準化、批量化、可供操作的關(guān)聯(lián)數(shù)據(jù)應(yīng)用方案,非遺知識亟待有效的組織與管理。

在借鑒國內(nèi)外相關(guān)研究成果的基礎(chǔ)上,本文從知識組織與知識關(guān)聯(lián)的角度,研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識管理與知識關(guān)聯(lián)的方法,并構(gòu)建非遺知識庫,實現(xiàn)非遺知識表示、知識可視化等創(chuàng)新性知識服務(wù)。首先,分析非遺領(lǐng)域知識的結(jié)構(gòu),梳理非遺項目之間、項目與傳承人以及項目與地域等領(lǐng)域內(nèi)部知識要素之間的關(guān)聯(lián)關(guān)系,構(gòu)建了非遺知識本體模型。其次,研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識組織與知識庫的構(gòu)建過程,包括實體RDF化、實體關(guān)聯(lián)、數(shù)據(jù)存儲與發(fā)布等核心過程。在此基礎(chǔ)上,研究與DBpedia、GeoNames外部關(guān)聯(lián)數(shù)據(jù)庫的知識關(guān)聯(lián),最終構(gòu)建非遺知識關(guān)聯(lián)數(shù)據(jù)庫,促進非遺領(lǐng)域知識關(guān)聯(lián)與知識發(fā)現(xiàn)。最后,在非遺知識關(guān)聯(lián)數(shù)據(jù)庫的基礎(chǔ)上,提供非遺知識的瀏覽、關(guān)聯(lián)可視化表達等創(chuàng)新性知識服務(wù)。采用本體與關(guān)聯(lián)數(shù)據(jù)技術(shù)規(guī)范描述非遺領(lǐng)域的知識,能夠提高非遺知識的關(guān)聯(lián)性、開放性與可見度,能夠為非遺領(lǐng)域、數(shù)字人文等方面的科學(xué)研究提供開放數(shù)據(jù)服務(wù),有助于非遺知識的挖掘與發(fā)現(xiàn),以及我國非遺文化的國際傳播。

2 非遺知識本體模型的設(shè)計與構(gòu)建

本體被認為是共享概念模型的明確的形式化規(guī)范說明[17];在信息科學(xué)與計算機領(lǐng)域,本體可以看作是一種模型,是對客觀存在對象或概念及其屬性和相關(guān)關(guān)系形式化的表達。對非遺領(lǐng)域知識的有效組織與管理,首先需要明確非遺知識的結(jié)構(gòu)、知識的構(gòu)成要素及內(nèi)部關(guān)系等。然后,在參考國際通用本體模型的基礎(chǔ)上,針對非遺領(lǐng)域的知識特征,建立非遺領(lǐng)域知識本體模型。

非遺知識本體是對非遺內(nèi)涵及其組成要素高度抽象概括而形成的一個形式化的概念模型。本文在本體理論與現(xiàn)有研究成果的基礎(chǔ)上,按照領(lǐng)域本體設(shè)計與構(gòu)建的思路與步驟,通過分析非遺項目的知識結(jié)構(gòu)和構(gòu)成要素,構(gòu)建了非遺知識本體模型,旨在為非遺知識描述及知識關(guān)聯(lián)提供統(tǒng)一規(guī)范的知識表示模型和數(shù)據(jù)模型。目前我國對非遺文化的保護與傳承,制定了“國家—省—市—縣”四級非遺保護名錄制度,每個非遺項目有其組織申報的地域或單位,并在口頭文學(xué)、表演儀式、手工技藝等領(lǐng)域認定非遺項目的代表性傳承人。因此,有關(guān)非遺的基本知識可以看成由非遺項目、傳承人、相關(guān)機構(gòu)、項目類型、地理位置等要素構(gòu)成,組成要素之間存在著傳承關(guān)系、地域分布關(guān)系、類屬關(guān)系等語義關(guān)系。

在分析非遺知識基本結(jié)構(gòu)與關(guān)系的基礎(chǔ)上,本文設(shè)計構(gòu)建的非遺知識本體模型如圖1所示。該本體模型參考借鑒了CIDOCCRM①、FOAF②、GeoNames③、人物關(guān)系詞表(Relationship)④等本體模型以及都柏林核心(Dublin Core,DC)元數(shù)據(jù)標準。根據(jù)非遺領(lǐng)域知識構(gòu)成的核心要素,將非遺領(lǐng)域知識本體抽象出非遺項目(ICHproject)、代表性傳承人(Person)、地理位置(Place)、項目類型(Category)四大核心類;每個核心類定義相應(yīng)的數(shù)據(jù)屬性(Data Properties),實體之間的關(guān)系通過對象屬性(Object Properties)進行描述與揭示。非遺知識本體模型提供對非遺領(lǐng)域知識概念及其關(guān)系的宏觀理解,規(guī)范統(tǒng)一非遺領(lǐng)域的基本術(shù)語及關(guān)系,并準確描述知識概念之間的內(nèi)在關(guān)聯(lián)。

圖1 非遺知識本體模型

注:前綴ich表示本文構(gòu)建的非遺知識本體的命名空間,定義為http://localhost:8890/ontology/。

2.1 非遺項目類

非遺項目類(ICHProject)是對非遺項目的抽象,其實例指我國建立的“國家—省—市—縣”四級非遺保護名錄中的每一個具體的項目。非遺項目實例是一個復(fù)合型對象,既具有本身的內(nèi)涵屬性,還包括與之相關(guān)的傳承人、地域等實體。非遺項目實體的屬性主要包括項目簡介、基本內(nèi)容、歷史淵源、存續(xù)狀態(tài)、保護與傳承情況等關(guān)于項目內(nèi)容的描述信息,根據(jù)我國《國家級非遺代表作申報書》中設(shè)置的主要欄目,從中選取非遺專指概念;此外,除了以上基本屬性外,不同種類的非遺項目又有其獨有的特征;比如,民間音樂類非遺項目使用的樂器、獨特的唱腔等,民間舞蹈中的服裝,傳統(tǒng)手工技藝類包含的制作技術(shù)、方法或過程、工具材料、相關(guān)制品及應(yīng)用等。非遺項目類的具體屬性如圖2所示。

圖2 非遺項目類及其屬性

2.2 項目類型類

項目類型類(Category)用于對非遺項目分類體系的構(gòu)建;為使非遺分類體系具有國際通用性,將其細分為聯(lián)合國分類(UNCategory)與我國“十分法”(CNCategory)兩個子類。依據(jù)我國《國家級非物質(zhì)文化遺產(chǎn)名錄》將非遺分為民俗、民間文學(xué)、傳統(tǒng)音樂、曲藝、傳統(tǒng)舞蹈等十大類;聯(lián)合國教科文組織在《保護非物質(zhì)文化遺產(chǎn)公約》中將非遺分為口頭傳說和表述、表演藝術(shù)、社會實踐、禮儀和節(jié)慶活動、有關(guān)自然界的知識和實踐、傳統(tǒng)手工藝技能五種形式[18]。通過使用表示概念上下級關(guān)系的對象屬性(skos:broader、skos:narrower等),可以構(gòu)建一個多視角、多層次、可伸縮的非遺項目分類體系。

2.3 代表性傳承人類

非遺作為活態(tài)的遺產(chǎn),需要人的傳承才能延續(xù)與發(fā)展。非遺代表性傳承人是非遺文化的重要組成部分,傳承人掌握著杰出的技藝、技能,對群體、族群具有影響力,代表著非遺蘊含的深厚文化傳統(tǒng);傳承人在培養(yǎng)傳人、技藝傳授等方面起到關(guān)鍵作用。本文定義的本體模型中主體類(Agent)的定義復(fù)用FOAF本體模型,將主體類可以分為“傳承人個體”與“組織與機構(gòu)”兩個子類;“個體”主要指認證的國家級、省市級代表性傳承人個人,“組織與機構(gòu)”則表示某些非遺項目的申報單位,比如,農(nóng)歷二十四節(jié)氣的申報單位為中國農(nóng)業(yè)博物館。對于非遺項目代表性傳承人對象,其屬性包括傳承人編號、姓名、性別、稱謂、民族、出生日期、籍貫等基本信息,以及其掌握的技能、技藝傳承的情況等。本體模型中代表性傳承人類的具體屬性如圖3所示。此外,復(fù)用人物關(guān)系詞匯表(Relationship)中的屬性,來更好地表達傳承人之間錯綜復(fù)雜的傳承關(guān)系和傳承譜系。

2.4 地理位置類

非遺具有鮮明的地域特色,不同地域的風(fēng)俗習(xí)慣、語言、文化和歷史孕育了不同特色的非遺內(nèi)容。本體模型中定義地理位置類,一方面為表達非遺項目分布與流傳的地理空間,另一方面記錄傳承人的居住地與籍貫等信息。并為地理位置類賦予其省、市、縣、村鎮(zhèn)行政級別的數(shù)據(jù)屬性,與我國的行政區(qū)劃相對應(yīng)。同時,將每個地理位置實例與地理數(shù)據(jù)庫GeoNames進行實體的關(guān)聯(lián),獲取地理位置簡介、經(jīng)緯度等信息。結(jié)合地理信息系統(tǒng)(GIS)技術(shù),不僅通過地圖空間分布的直觀可視化形式表達非遺的空間分布,還可以從深層次挖掘出非遺中空間維度的隱含信息,通過空間聚類、核密度分析等GIS空間分析技術(shù),對非遺的空間結(jié)構(gòu)與演變及特征進行分析,對理解非遺文化的內(nèi)涵具有重要意義。

圖3 代表性傳承人類及其屬性

2.5 實體之間的關(guān)聯(lián)關(guān)系

通過對非遺知識結(jié)構(gòu)的分析,抽象出本體模型的核心類之外,還需要定義知識要素間豐富的關(guān)系。通過對非遺領(lǐng)域?qū)嶓w之間的關(guān)系進行梳理,可以概括出非遺項目與傳承人間的代表關(guān)系、項目與地域的位置關(guān)系、傳承人間的傳承關(guān)系、項目類別之間的層級關(guān)系等,這些關(guān)系對了解和認識非遺文化的活態(tài)流變性非常重要。在本體模型中通過定義對象屬性,對實體間關(guān)系進行描述與表示,最終,在對非遺領(lǐng)域知識結(jié)構(gòu)分析的基礎(chǔ)上,定義對象屬性及其定義域與值域,如表1所示。實體間的關(guān)聯(lián)關(guān)系將獨立的知識要素聯(lián)系起來,形成非遺知識網(wǎng)絡(luò),改變傳統(tǒng)知識組織的單線索模式。此外,在這些關(guān)聯(lián)關(guān)系的基礎(chǔ)上,通過定義規(guī)則與關(guān)系推理,能夠推斷并發(fā)現(xiàn)隱形的知識。

圍繞非遺項目相關(guān)知識的組織與管理,本文在參考借鑒CIDOC CRM、FOAF、Relationship等國際通用本體模型的基礎(chǔ)上,根據(jù)非遺知識的特點進行本體的復(fù)用和自定義擴展。最終,設(shè)計構(gòu)建的非遺知識本體模型包含8個核心類和25個對象屬性、非遺項目和傳承人類的27個數(shù)據(jù)屬性,以及本體推理規(guī)則等,為非遺領(lǐng)域知識的組織與形式化表示提供了較為全面的、規(guī)范統(tǒng)一的模型,滿足了對非遺領(lǐng)域知識結(jié)構(gòu)的形式化描述與表示。使用本體編輯軟件protégé進行非遺知識本體模型的開發(fā)與實現(xiàn),本體模型的結(jié)構(gòu)如圖4所示。非遺知識本體模型面向非遺知識的組織與管理,提供對非遺領(lǐng)域知識的形式化表示,滿足了對非遺項目申報與認證過程中的知識管理需求。對湖北省非遺知識組織與管理的實踐,驗證了本文構(gòu)建的非遺知識本體模型的合理性和有效性。

圖4 非遺知識本體模型的可視化

非遺知識本體模型構(gòu)建的主要作用是對非遺知識的描述和形式化表達進行規(guī)范,而數(shù)據(jù)的語義轉(zhuǎn)化、知識的結(jié)構(gòu)化表示與存儲則需要借助關(guān)聯(lián)數(shù)據(jù)相關(guān)技術(shù)進行實現(xiàn)。

3 非遺知識關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建與發(fā)布

關(guān)聯(lián)數(shù)據(jù)技術(shù)使用統(tǒng)一資源標識符(URI)對資源實體進行命名描述,采用RDF作為其數(shù)據(jù)模型,鏈接、發(fā)布、共享各類信息、數(shù)據(jù)和知識,從而構(gòu)成數(shù)據(jù)的關(guān)聯(lián)網(wǎng)絡(luò);采用關(guān)聯(lián)數(shù)據(jù)技術(shù)對信息與知識進行組織,使得人與機器都能夠獲取與理解這些語義關(guān)聯(lián)化與結(jié)構(gòu)化的數(shù)據(jù)。關(guān)聯(lián)數(shù)據(jù)靈活的內(nèi)外部鏈接機制,能夠?qū)⒖珙I(lǐng)域、跨類型的知識對象連接成一個整體的知識網(wǎng)絡(luò)[11]。

非遺知識關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建是一個龐大而系統(tǒng)的工程。首先,明確研究范圍,梳理非遺領(lǐng)域的知識對象;其次,對領(lǐng)域?qū)嶓w進行抽取,明確實體的各類屬性,構(gòu)建領(lǐng)域本體模型,形成敘詞表和術(shù)語表;再次,按照本體模型對實體進行RDF化屬性描述,建立實體鏈接,包括領(lǐng)域內(nèi)部實體之間以及與外部開放數(shù)據(jù)間的實體鏈接;最后,選擇合適的數(shù)據(jù)存儲與發(fā)布平臺,為人機提供訪問和數(shù)據(jù)接口。遵循關(guān)聯(lián)數(shù)據(jù)的基本原則,非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)庫的構(gòu)建可以分為五個關(guān)鍵步驟,即數(shù)據(jù)建模、實體命名、實體RDF化、實體關(guān)聯(lián)、實體發(fā)布[19]。其中,數(shù)據(jù)建模過程即非遺領(lǐng)域知識本體模型的構(gòu)建過程。本文以湖北省非遺項目為例,探索非遺知識關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建步驟和具體實現(xiàn)的方法。非遺知識關(guān)聯(lián)數(shù)據(jù)集構(gòu)建的技術(shù)框架如圖5所示。

3.1 非遺項目數(shù)據(jù)的獲取與處理

由于我國非遺項目數(shù)量相當龐大,而且非遺項目和傳承人的認定是動態(tài)變化的,導(dǎo)致整個非遺領(lǐng)域知識庫的建設(shè)過程需要分層次、分批進行。本文以湖北省非遺項目為例,收集整理湖北省非遺項目和代表性傳承人的基本信息,在此基礎(chǔ)上構(gòu)建湖北省非遺知識關(guān)聯(lián)數(shù)據(jù)集。數(shù)據(jù)來源主要有兩個途徑,一是非遺項目申報與代表性傳承人認證申請的數(shù)據(jù),二是通過網(wǎng)絡(luò)爬蟲、實體抽取等技術(shù),從我國非物質(zhì)文化遺產(chǎn)網(wǎng)、湖北非物質(zhì)文化遺產(chǎn)網(wǎng)等網(wǎng)站上收集的互聯(lián)網(wǎng)數(shù)據(jù),最后對收集的數(shù)據(jù)進行數(shù)據(jù)清洗等預(yù)處理,并存儲在數(shù)據(jù)庫中。共收集整理了湖北省國家級、省級和地市級非遺項目370項,代表性傳承人310位,包括湖北省行政區(qū)劃與非遺項目類型等數(shù)據(jù)。為準確研究非遺的地域分布,將不同地區(qū)的同一非遺項目進行拆分。

圖5 非遺知識關(guān)聯(lián)數(shù)據(jù)集構(gòu)建的技術(shù)框架

3.2 實體RDF化

RDF(Resource Description Framework)即資源描述框架,是關(guān)聯(lián)數(shù)據(jù)使用的數(shù)據(jù)模型,其采用三元組的結(jié)構(gòu)化形式對資源進行描述。RDF使用“實體、屬性、屬性值”三元組陳述來描述事物。實體RDF化即是對每個對象及其屬性利用RDF語義描述語言進行規(guī)范化和結(jié)構(gòu)化描述。在標準詞表和領(lǐng)域本體的前提下,進行詞匯的RDF映射與實體對象的RDF描述;實體RDF化可以分為手動描述和自動轉(zhuǎn)化,自動轉(zhuǎn)化是將結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)依據(jù)本體模型進行數(shù)據(jù)映射,轉(zhuǎn)換成RDF數(shù)據(jù)。

由于眾多傳統(tǒng)的非遺信息系統(tǒng)主要用關(guān)系型數(shù)據(jù)庫進行數(shù)據(jù)存儲,本文選擇基于D2RQ進行數(shù)據(jù)語義映射,將關(guān)系型數(shù)據(jù)庫中的內(nèi)容轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)。D2RQ平臺是目前關(guān)聯(lián)數(shù)據(jù)構(gòu)建過程中廣泛使用的工具,其以虛擬RDF圖的方式訪問關(guān)系型數(shù)據(jù)庫,支持主流的關(guān)系型數(shù)據(jù)庫,并提供SPARQL查詢接口及Web化的執(zhí)行界面⑤。D2RQ平臺的核心功能模塊包括D2R Server、D2R Engine與D2R Mapping,其中,Mapping映射語言定義數(shù)據(jù)映射的規(guī)則,規(guī)范關(guān)系型數(shù)據(jù)庫結(jié)構(gòu)與本體模型的關(guān)系。數(shù)據(jù)的語義映射即是將二維表結(jié)構(gòu)轉(zhuǎn)換成更善于處理復(fù)雜關(guān)系、更富有語義信息的關(guān)聯(lián)數(shù)據(jù);具體包括數(shù)據(jù)表向類映射、數(shù)據(jù)表中的列向?qū)傩杂成洹㈥P(guān)系表向關(guān)聯(lián)關(guān)系映射。在映射語言中,使用d2rq:ClassMap定義本體模型的類,對應(yīng)數(shù)據(jù)表的映射,使用d2rq:PropertyBridge定義本體模型中的屬性,對應(yīng)數(shù)據(jù)表中的列及關(guān)系表的映射。

對關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)向RDF的映射,要遵循本體模型中定義的類與屬性。如圖6所示,將關(guān)系型數(shù)據(jù)庫中五個主要數(shù)據(jù)表映射為非遺項目、傳承人、分類與地理位置四個核心類及其屬性,其中,關(guān)系表映射為“hasInheritor”對象屬性;每個數(shù)據(jù)表的字段映射為相應(yīng)的屬性。表2對應(yīng)映射框架,是將項目表、傳承人、傳承關(guān)系表進行語義映射的核心語句。

圖6 類及屬性的映射框架

最后,根據(jù)數(shù)據(jù)映射文件,使用D2RQ平臺的dump-rdf工具將關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換生成RDF/XML格式文件,供其他數(shù)據(jù)庫或第三方應(yīng)用程序使用。雖然D2RQ也可以對關(guān)聯(lián)數(shù)據(jù)進行發(fā)布,但其對數(shù)據(jù)的更新與管理不夠靈活,對復(fù)雜關(guān)系和海量數(shù)據(jù)的支持有限。因此本文使用D2RQ對數(shù)據(jù)進行語義轉(zhuǎn)換,將其轉(zhuǎn)換為RDF/XML格式文件。然后將數(shù)據(jù)存儲在專門的Triplestore數(shù)據(jù)庫中,并配置服務(wù)器實現(xiàn)數(shù)據(jù)的關(guān)聯(lián)發(fā)布和數(shù)據(jù)開放接口。

3.3 實體關(guān)聯(lián)

實體關(guān)聯(lián)是在實體RDF化描述的基礎(chǔ)上,采用RDF鏈接描述不同實體對象間的語義關(guān)系,同時盡可能地與外部數(shù)據(jù)建立關(guān)聯(lián),從而構(gòu)建關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)[20]。將數(shù)據(jù)關(guān)聯(lián)到其他開放RDF數(shù)據(jù)集與詞匯表是豐富關(guān)聯(lián)數(shù)據(jù)語義的關(guān)鍵步驟[21]。實體鏈接應(yīng)更多地將內(nèi)部數(shù)據(jù)與外部開放數(shù)據(jù)集進行語義鏈接,通過跨領(lǐng)域、跨學(xué)科、跨數(shù)據(jù)庫的知識聚合,實現(xiàn)知識的發(fā)現(xiàn)。

在語義網(wǎng)環(huán)境下,借助關(guān)聯(lián)數(shù)據(jù)的規(guī)范性和開放互聯(lián)性等突出特點,并整合多個知識庫,能夠提高非遺領(lǐng)域知識的豐富程度和廣度,為非遺文化的科學(xué)研究與知識傳播提供數(shù)據(jù)基礎(chǔ)和知識服務(wù)。為豐富非遺領(lǐng)域知識,本文選擇與DBpedia以及GeoNames關(guān)聯(lián)數(shù)據(jù)項目進行數(shù)據(jù)匹配與關(guān)聯(lián)。通過與DBpedia及其數(shù)據(jù)來源維基百科的關(guān)聯(lián),獲得與非遺項目對應(yīng)的中英文詞條;通過與全球地理數(shù)據(jù)庫(GeoNames)的關(guān)聯(lián),獲取有關(guān)非遺領(lǐng)域涉及地域的更多信息。使用OWL內(nèi)置屬性owl:sameAs將內(nèi)部知識實體與外部數(shù)據(jù)集中的實體進行關(guān)聯(lián),表示鏈接的兩個實體對象為同一個事物。與DBpedia和GeoNames數(shù)據(jù)集的語義關(guān)聯(lián)如圖7所示。

圖7 非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)與外部數(shù)據(jù)集關(guān)聯(lián)示意

(1)非遺項目實體與DBpedia關(guān)聯(lián)

DBpedia項目是抽取維基百科的數(shù)據(jù)而建立的以關(guān)聯(lián)數(shù)據(jù)為標準的大型知識型數(shù)據(jù)集,是關(guān)聯(lián)開放數(shù)據(jù)云圖中的核心中樞。DBpedia數(shù)據(jù)集中包含大量的用中英文描述的有關(guān)我國非遺文化的信息,與之進行實體關(guān)聯(lián)能夠豐富非遺領(lǐng)域知識,提高非遺知識的可見度和通用性。本文采用自動檢索與人工檢查相結(jié)合的方式,首先通過SPARQL語言在線檢索DBpedia中與非遺項目相關(guān)的資源條目,然后對檢索的結(jié)果通過人工檢查的方式進行篩選和核對[22],最后將檢索到的資源的URI通過owl:sameAs屬性與內(nèi)部非遺項目實體進行關(guān)聯(lián)。

在DBpedia本體模型中,db:abstract屬性表示該資源的摘要,foaf:isPrimaryTopicOf屬性鏈接與該資源對應(yīng)的維基百科頁面。在線調(diào)用DBpedia的SPARQL Endpoint站點,將非遺項目的相關(guān)概念通過構(gòu)建SPARQL語句,檢索包含該關(guān)鍵詞的資源條目。如表3所示,以“黑暗傳”為關(guān)鍵詞對DBpedia的中文標簽進行全文檢索,同時獲取該資源的摘要信息及對應(yīng)的維基百科頁面;然后經(jīng)過人工判斷確定檢索結(jié)果是否為相同的資源實體,并將其與內(nèi)部數(shù)據(jù)集中的非遺項目實體進行鏈接。

由于DBpedia存在不完善的地方,如有些非遺項目缺少詞條,DBpedia提供的中文信息不全,維基百科中有關(guān)非遺的資源條目DBpedia沒有收錄,還因為非遺項目的稱謂不統(tǒng)一,通過以上方式只能正確匹配部分實體,有些還無法完全匹配。因此,本文在自動檢索的基礎(chǔ)上,結(jié)合人工檢查的方式,盡可能多地將內(nèi)部非遺項目實體與DBpedia相關(guān)資源進行關(guān)聯(lián)。最終,大概1/3的非遺項目與DBpedia或維基百科進行了實體關(guān)聯(lián),也從側(cè)面凸顯了建立我國非遺百科型數(shù)據(jù)庫的必要性。

(2)地理位置實體與GeoNames關(guān)聯(lián)

GeoNames⑥地理數(shù)據(jù)庫包含全世界1000萬余條地理名稱,并提供地理名稱替代名、經(jīng)緯度、人口數(shù)量及維基百科等信息。其采用關(guān)聯(lián)數(shù)據(jù)的原則進行組織,為每條地理名稱定義唯一的資源URI,將地理空間語義信息發(fā)布到互聯(lián)網(wǎng)上。為了獲取更多有關(guān)地理位置的信息,豐富領(lǐng)域知識,同時為基于地理信息對非遺文化的空間分析提供數(shù)據(jù)基礎(chǔ),本文將非遺項目申報地區(qū)、傳承人居住地等涉及地理位置的實體與GeoNames數(shù)據(jù)庫進行關(guān)聯(lián)。

GeoNames數(shù)據(jù)的獲取可以調(diào)用其官方API,或者借助第三方提供的SPARQL端點進行獲??;為保證與DBpedia數(shù)據(jù)關(guān)聯(lián)方式的一致,本文使用Factforge⑦網(wǎng)站的SPARQL端點獲取GeoNames數(shù)據(jù),其核心SPARQL查詢語句如表4所示。該查詢語句檢索“恩施州”在GeoNames數(shù)據(jù)庫中對應(yīng)的資源條目,并限定檢索的范圍為中國(編碼為CN)、資源類型為國家與地區(qū)(編碼為A)。檢索結(jié)果將返回該地理位置對象的URI,<http://sws.geonames.org/1811624/>,并可以進一步獲取該地理位置的經(jīng)緯度以及維基百科鏈接等信息。對于地理名稱相同的情況,可以通過判斷市級與省級地理名稱(parentADM2、parentADM1)來消歧。通過上述方式,對地理位置實體的關(guān)聯(lián)達到了100%的匹配。

最后,在構(gòu)建內(nèi)部非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)上,將非遺項目、人物、地理位置等多個類別的實體與DBpedia和GeoNames等外部數(shù)據(jù)庫進行關(guān)聯(lián)。最終構(gòu)建的非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)庫中實體與三元組數(shù)量如圖8所示,其中共有9600余個三元組,涉及非遺項目、傳承人、機構(gòu)、地理、類型等多個類別的對象,與DBpedia關(guān)聯(lián)的實體有306個,與GeoNames關(guān)聯(lián)的實體有124個。通過鏈接DBpedia可以更方便地與維基百科、WIKIDATA、YAGO等資源進行關(guān)聯(lián)。而且,構(gòu)建的非遺知識關(guān)聯(lián)數(shù)據(jù)以W3C標準完全開放,可以通過在線檢索、SPARQL Endpoint等多種數(shù)據(jù)調(diào)用方式獲取數(shù)據(jù)服務(wù)。

圖8 非遺領(lǐng)域知識關(guān)聯(lián)數(shù)據(jù)的統(tǒng)計

3.4 非遺知識關(guān)聯(lián)數(shù)據(jù)的存儲與發(fā)布

將非遺領(lǐng)域各類數(shù)據(jù)與知識轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)的形式之后,需要對其進行持久化存儲與發(fā)布,關(guān)聯(lián)數(shù)據(jù)的存儲與發(fā)布直接影響數(shù)據(jù)的共享與重用。關(guān)聯(lián)數(shù)據(jù)存儲與發(fā)布有多種途徑,本文采用原生方式進行存儲,配置關(guān)聯(lián)數(shù)據(jù)發(fā)布的服務(wù)器,提供開放數(shù)據(jù)服務(wù)和知識服務(wù);使用OpenLink Virtuoso作為RDF數(shù)據(jù)的存儲與管理數(shù)據(jù)庫,并利用LodView為用戶提供非遺知識庫的數(shù)據(jù)瀏覽,利用LodLive提供非遺知識關(guān)聯(lián)圖譜的可視化表示。

(1)關(guān)聯(lián)數(shù)據(jù)的存儲

關(guān)聯(lián)數(shù)據(jù)的存儲方案大致分為基于關(guān)系型數(shù)據(jù)的存儲、使用NOSQL數(shù)據(jù)庫存儲以及Triplestore數(shù)據(jù)庫存儲等[23]。其中,Triplestore數(shù)據(jù)庫是專門針對RDF數(shù)據(jù)結(jié)構(gòu)的特點開發(fā)的,具有高效的數(shù)據(jù)存儲、查詢及推理機制;同時因其采用統(tǒng)一的數(shù)據(jù)模型,可以實現(xiàn)數(shù)據(jù)間高效的交互??紤]到未來非遺領(lǐng)域知識的擴展和數(shù)據(jù)的增長,本文選擇應(yīng)用較為廣泛的OpenLinkVirtuoso⑧作為數(shù)據(jù)庫管理軟件。Virtuoso數(shù)據(jù)庫是跨平臺可伸縮的高性能數(shù)據(jù)庫管理軟件,提供SQL、XML、RDF數(shù)據(jù)庫管理功能,支持數(shù)十億規(guī)模三元組的存儲和管理[24]。Virtuoso數(shù)據(jù)庫為數(shù)據(jù)導(dǎo)入提供WEB頁面或ISQL命令等多重機制。將非遺相關(guān)的原始數(shù)據(jù)經(jīng)過語義描述或語義映射生成RDF格式數(shù)據(jù),然后導(dǎo)入到Virtuoso數(shù)據(jù)存儲中,并指定數(shù)據(jù)所屬的命名圖的IRI(Internationalized Resource Identifiers)。

(2)關(guān)聯(lián)數(shù)據(jù)的發(fā)布

通過上文構(gòu)建的非遺領(lǐng)域知識RDF數(shù)據(jù)需要經(jīng)過關(guān)聯(lián)數(shù)據(jù)發(fā)布,才能夠?qū)崿F(xiàn)數(shù)據(jù)的利用與共享;關(guān)聯(lián)數(shù)據(jù)常用的發(fā)布方式有基于靜態(tài)RDF/XML文件、基于關(guān)系型數(shù)據(jù)、基于RDF數(shù)據(jù)存儲庫、使用RDFa方式等多種途徑[25]。本文在Virtuoso數(shù)據(jù)庫平臺的基礎(chǔ)上,遵循W3C的關(guān)聯(lián)數(shù)據(jù)發(fā)布的四原則,配置關(guān)聯(lián)數(shù)據(jù)發(fā)布的服務(wù)器,提供RDF數(shù)據(jù)管理、關(guān)聯(lián)數(shù)據(jù)瀏覽、SPARQL端點、內(nèi)容協(xié)商等服務(wù)。

為了完整、全面地展示非遺關(guān)聯(lián)數(shù)據(jù)集中每個實體的屬性及其關(guān)系,使用LodView工具為用戶提供非遺關(guān)聯(lián)數(shù)據(jù)的瀏覽。LodView⑨是基于Jena與Spring框架開發(fā)的WEB應(yīng)用程序,支持符合W3C標準的國際化資源標識符(IRI)的解析,將RDF數(shù)據(jù)格式轉(zhuǎn)化到HTML的工具;配置LodView的SPARQL站點及多媒體展示及經(jīng)緯度等屬性,根據(jù)內(nèi)容協(xié)商機制返回正確的RDF數(shù)據(jù)和網(wǎng)頁描述。非遺知識關(guān)聯(lián)數(shù)據(jù)集的實體,按照實體的類型進行區(qū)分,包括非遺項目、傳承人、地名、項目類型等。實體命名的URI格式為http://[baseURI]/[entityTypeName]/[entityID],其中,[entityTypeName]與本體模型中的類對應(yīng);如http://localhost:8890/resource/ichproject/359表示“非遺項目類”的實例“黑暗傳”;使用LodView工具展示該實例詳細信息的頁面如圖9所示。

圖9展示了非遺項目“黑暗傳”實例的所有屬性。頁面上部為多媒體展示部分,直觀顯示與其相關(guān)的圖片、視頻等多媒體資源,頁面中羅列出該項目的代表性傳承人、所屬類型、分布地區(qū)等關(guān)聯(lián)對象。比如,通過ich:hasInheritor屬性鏈接該項目的代表性傳承人,點擊超鏈接跳轉(zhuǎn)至圖10所示傳承人對象的詳細頁面。當用戶訪問時,提供直觀的HTML頁面;應(yīng)用程序訪問時,根據(jù)不同的內(nèi)容請求,返回RDF/XML、RDF/Turtle、JSON等相應(yīng)格式的數(shù)據(jù)。

在非遺知識關(guān)聯(lián)數(shù)據(jù)集中,地理位置類對象與GeoNames進行了關(guān)聯(lián)。圖11是地理位置類“神農(nóng)架林區(qū)”實例的信息頁面,使用在線地圖的形式,根據(jù)經(jīng)緯度信息顯示地圖中的位置。頁面中部顯示地理位置類的具體屬性,并與DBpedia、GeoNames及Wikipedia進行關(guān)聯(lián);頁面底部通過ich:hasPlace屬性的逆反性,反向檢索出該地區(qū)擁有的非遺項目和傳承人對象。

3.5 非遺知識關(guān)聯(lián)數(shù)據(jù)的可視化

非遺知識關(guān)聯(lián)數(shù)據(jù)集的獨特性是以事物間的關(guān)系為核心,而事物間復(fù)雜的關(guān)系最適合使用圖形化的方式表示。非遺知識關(guān)聯(lián)關(guān)系的可視化通過LodLive⑩系統(tǒng)實現(xiàn),LodLive以可視化知識圖譜的方式對非遺知識庫的數(shù)據(jù)提供直觀的數(shù)據(jù)瀏覽服務(wù)。LodLive僅僅基于SPARQL端點就可以實現(xiàn)對RDF資源進行導(dǎo)航;通過配置SPARQL Endpoint站點,LodLive可自動查詢與該實例相關(guān)的三元組信息,并與DBpedia、GeoNames等外部數(shù)據(jù)集進行關(guān)聯(lián)查詢。

圖9 非遺項目對象頁面

圖10 傳承人對象頁面

圖11 地理位置對象頁面

在知識關(guān)聯(lián)圖譜中,節(jié)點表示對象實例,鏈接兩個節(jié)點的箭頭則表示二者間的關(guān)系。每兩個實例對象之間,都直接或間接地存在某種聯(lián)系,以任意一個知識對象為起點,都可以發(fā)現(xiàn)其他與之相關(guān)的對象及他們之間的相互關(guān)系,以遞進的方式展示知識的關(guān)聯(lián)性。這種細粒度的知識組織和互聯(lián)方式使數(shù)據(jù)的集成與利用變得更加容易。

圖12是以非遺項目“黑暗傳”為中心的知識關(guān)聯(lián)圖譜。其中,右側(cè)描述了該項目的基本信息,中間區(qū)域是領(lǐng)域內(nèi)部知識關(guān)聯(lián)數(shù)據(jù)集,包括項目傳承人、項目類型、分布地區(qū)等具體實例,與之鏈接的節(jié)點可以繼續(xù)展開。左側(cè)區(qū)域為關(guān)聯(lián)的外部DBpedia、GeoNames等數(shù)據(jù)集,通過自建的關(guān)聯(lián)數(shù)據(jù)集與外部不同數(shù)據(jù)源的實體關(guān)聯(lián),可以獲得更多相關(guān)的知識信息。通過關(guān)聯(lián)關(guān)系的圖譜化呈現(xiàn),能夠發(fā)現(xiàn)更多隱含的有價值的非遺知識。

除了將非遺知識以關(guān)聯(lián)圖譜的形式進行可視化之外,還可以借助地理信息系統(tǒng)(GIS)以在線地圖的形式展示非遺知識中的地理特征。通過與GeoNames數(shù)據(jù)庫關(guān)聯(lián)以及利用地理編碼技術(shù)獲取非遺項目或傳承人實體的經(jīng)緯度信息,在基礎(chǔ)地圖服務(wù)的基礎(chǔ)上實現(xiàn)非遺知識地圖可視化。圖13是非遺地圖可視化界面,頁面左側(cè)按照行政區(qū)劃與項目類型提供分類導(dǎo)航;此外,提供地圖查詢功能,查詢結(jié)果將在地圖中標記出來,點擊地圖上的興趣點可以查看詳細信息。以地理空間為主線,以非遺領(lǐng)域知識為對象,將領(lǐng)域知識圍繞地理特征進行匯聚與組織,從而實現(xiàn)非遺知識服務(wù)的智慧化系統(tǒng)。

圖12 非遺項目“黑暗傳”的關(guān)聯(lián)圖譜

本文構(gòu)建的非遺知識庫以關(guān)聯(lián)開放數(shù)據(jù)集的形式進行開放,通過互聯(lián)網(wǎng)提供非遺領(lǐng)域數(shù)據(jù)的消費接口;在領(lǐng)域?qū)<液头沁z保護機構(gòu)的支持下,非遺領(lǐng)域知識將會得到進一步的補充和更新。通過標準化的知識組織,向社會提供數(shù)據(jù)的共享與重用,促進非遺領(lǐng)域知識的規(guī)范控制、數(shù)據(jù)共建與共享以及知識的創(chuàng)新性應(yīng)用?;陉P(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識管理的研究,為大數(shù)據(jù)和數(shù)字人文背景下非遺領(lǐng)域知識的深度組織與開發(fā)提供了思路,對我國非遺知識的管理具有一定的參考價值。

圖13 非遺知識的地圖瀏覽與地圖查詢

4 結(jié)論與展望

語義網(wǎng)及關(guān)聯(lián)數(shù)據(jù)的發(fā)展,為非遺領(lǐng)域知識的組織與共享提供了新的思路與方法,改變了非遺知識的表示與表達方式。為實現(xiàn)對非遺知識的有效組織與管理,本文在對非遺領(lǐng)域知識進行加工與整理的基礎(chǔ)上,梳理出非遺知識要素與語義關(guān)系,構(gòu)建了非遺知識本體模型,以揭示非遺領(lǐng)域豐富的知識以及知識間的內(nèi)在聯(lián)系?;陉P(guān)聯(lián)數(shù)據(jù)技術(shù)構(gòu)建的非遺知識關(guān)聯(lián)數(shù)據(jù)集,以關(guān)聯(lián)開放數(shù)據(jù)的形式提供數(shù)據(jù)的消費與共享,并基于關(guān)聯(lián)數(shù)據(jù)集提供領(lǐng)域知識的關(guān)聯(lián)展示、知識可視化等知識服務(wù)。

本體與關(guān)聯(lián)數(shù)據(jù)的思想與技術(shù)在非遺領(lǐng)域知識組織方面具有巨大的優(yōu)勢,利用關(guān)聯(lián)數(shù)據(jù)技術(shù)構(gòu)建我國非遺領(lǐng)域知識庫,并與國際上的開放數(shù)據(jù)集進行實體鏈接,能夠提高非遺領(lǐng)域知識的關(guān)聯(lián)性、共享與開放性、影響力。高質(zhì)量的非遺知識開放數(shù)據(jù)集與知識服務(wù)平臺的構(gòu)建,一方面為更深層次非遺文化的分析與研究提供了科學(xué)的數(shù)據(jù)集,另一方面促使非遺知識發(fā)揮出更大的價值,對非遺文化的傳播與傳承具有重要的意義。

非遺蘊含著豐富的知識,本文僅僅研究梳理了非遺項目、傳承人、地域、傳承關(guān)系等基本知識要素,知識組織的顆粒度還有待進一步細化。非遺知識本體模型仍需要根據(jù)實際需求進行進一步的擴展與豐富。后續(xù)研究將擴大數(shù)據(jù)來源與研究對象,在大數(shù)據(jù)環(huán)境下,研究非遺海量異構(gòu)知識的組織與管理,并在此基礎(chǔ)上分析非遺項目的時空演變與歷史發(fā)展歷程,以及非遺文化的存續(xù)狀態(tài),深入挖掘非遺領(lǐng)域的知識內(nèi)涵。

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請及時告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關(guān)注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言