科研模式變革中的數(shù)據(jù)管理服務(wù):實現(xiàn)開放獲取、開放數(shù)據(jù)、開放科學(xué)的途徑
隨著信息技術(shù)的發(fā)展與普及,全球?qū)W術(shù)交流模式總體朝著開放獲取的趨勢發(fā)展。信息時代的科學(xué)活動若要更好地進行,更好地促進科研成果的利用并保護相關(guān)權(quán)益,需要采取更為廣泛的數(shù)據(jù)開放共享戰(zhàn)略。從開放獲取到開放數(shù)據(jù)再到開放科學(xué),各個環(huán)節(jié)都充滿變革與挑戰(zhàn)。無論是對于圖書館工作還是對于信息服務(wù)和知識服務(wù)來說,科研模式的變革都是一種新的挑戰(zhàn),與此同時,在這種大背景下,也產(chǎn)生了一種新的機遇,即與科研數(shù)據(jù)管理相關(guān)的一系列新內(nèi)容。
信息時代的發(fā)展使得科研人員的研究、教學(xué)和學(xué)術(shù)交流方式正在發(fā)生重大轉(zhuǎn)變,科學(xué)研究的對象也日益復(fù)雜,現(xiàn)有的科研方法和手段面臨新的挑戰(zhàn)。在一系列科研創(chuàng)新的改革當(dāng)中,力求在不同國家、不同地區(qū)的科研機構(gòu)和科研人員之間加強交流,避免重復(fù)勞動以及更妥善地進行科研資源配置等成為全球科研社群以及國家政府的核心政策之一。普遍的認識是人們應(yīng)當(dāng)充分利用數(shù)字化科研帶來的機遇,最大限度地加強科研機構(gòu)和科研人員之間的交流與協(xié)作,這要求在各個方面調(diào)整工作方式,其中的關(guān)鍵之一即是數(shù)據(jù)管理服務(wù)。
數(shù)據(jù)管理服務(wù)的核心是數(shù)據(jù)權(quán)益,首要問題是明確科研數(shù)據(jù)管理的各利益方,包括科研成果的創(chuàng)作者、科研數(shù)據(jù)貢獻者、科研團隊和成員,以及政府行政機構(gòu)、科研資助機構(gòu)、科研教育機構(gòu)、出版團體、圖書館界乃至跨界而來的網(wǎng)絡(luò)運營服務(wù)商;比如,數(shù)據(jù)提交者的科學(xué)貢獻度的認可機制,不只是某類科學(xué)家普遍性的個人訴求,而是應(yīng)當(dāng)放在眾多利益相關(guān)者權(quán)益博弈的不平衡的框架上去看待這個問題。其次,明確數(shù)據(jù)管理服務(wù)的主要內(nèi)容,包括創(chuàng)建數(shù)據(jù)、處理數(shù)據(jù)、分析數(shù)據(jù)、保存數(shù)據(jù)、訪問數(shù)據(jù)以及明晰重復(fù)使用的數(shù)據(jù)在不同學(xué)科之間的共性和差異等。再者,在實施細節(jié)上,為更好地實現(xiàn)數(shù)據(jù)管理,有效提升工作效率,需要明確科學(xué)數(shù)據(jù)開放共享的政策研究。政策是為了鼓勵或者抑制人們的某些行為,因此,如果從科研數(shù)據(jù)生命周期的角度進行考慮,需要對數(shù)據(jù)備份、數(shù)據(jù)采集、數(shù)據(jù)遴選、數(shù)據(jù)典藏、數(shù)據(jù)共享各個環(huán)節(jié)的政策進行研究。最后,在政策執(zhí)行層面,要明確協(xié)助執(zhí)行的具體人員,協(xié)助的內(nèi)容,以及協(xié)助者應(yīng)該具備的知識技能等,在這方面需要明確數(shù)據(jù)館員發(fā)揮的作用和職業(yè)價值,并且隨著社會經(jīng)濟發(fā)展和科研模式的需求變化,以及組織單位的戰(zhàn)略調(diào)整,同時進行調(diào)整。
1 科研模式變革
1.1 開放獲取、開放數(shù)據(jù)與開放科學(xué)的發(fā)展趨勢
科研模式變革已經(jīng)不僅僅是一種特定的工具技術(shù)升級或者更換,更是適應(yīng)全球政治經(jīng)濟局勢發(fā)展演進中的科技政策和管理機制的變革。目前,通過激勵科研創(chuàng)新帶動社會經(jīng)濟發(fā)展的國家戰(zhàn)略主要有兩種:第一種是知識產(chǎn)權(quán)的所有權(quán)控制戰(zhàn)略,主要是利用文獻、專利、軟件著作權(quán)等方式,給予創(chuàng)作者財貨和名譽上的回報,作為激勵科研創(chuàng)新的途徑,核心取決于中介者的權(quán)益管理。第二種是開放共享的主動權(quán)控制戰(zhàn)略,主要手段是通過科技論文的開放獲取、科研數(shù)據(jù)的開放共享、科研工具的開源發(fā)布、資金人員的眾籌眾包等途徑,使創(chuàng)作者快速擴大影響力和宣傳力,從而擁有更多的跟進者、參與者、投入資助等,以此作為激勵科研創(chuàng)新的途徑。它體現(xiàn)在標(biāo)準(zhǔn)規(guī)格的制定、價格成本的談判、版本的迭代更替等多方面、全領(lǐng)域、各途徑的組織動員能力,其根本核心是全球科技交流制度重構(gòu)中的話語權(quán)和制定權(quán),核心不再取決于中介者的權(quán)益管理,而是由眾多中介者集體參與的權(quán)益博弈。
在過去很長一段時間內(nèi),全球科技交流制度主要由美國、西歐等少數(shù)科技發(fā)達國家和地區(qū)的政府行政機構(gòu)和科研資助機構(gòu)掌握。近期,歐盟研究理事推動了科學(xué)出版物和科研數(shù)據(jù)的開放獲取[1-2],該戰(zhàn)略是一種有別于二戰(zhàn)以及冷戰(zhàn)時期延續(xù)的科技傳播交流機制,即:將論文及數(shù)據(jù)存儲在機構(gòu)知識庫或指定的數(shù)據(jù)知識庫中,或者通過發(fā)表在開放獲取期刊或存儲在數(shù)據(jù)中心,實現(xiàn)開放共享;同時,以用戶明確同意或者知曉默認的方式,按照發(fā)布者和中介者所要求的使用目的、途徑、場景、方式等給予作者一定形式的回饋,來界定數(shù)據(jù)權(quán)益的邊界和使用范圍。此種交流機制下,一方面,創(chuàng)作者的權(quán)益得到更完整的保護;另一方面,對局勢和戰(zhàn)略有著深刻理解的組織機構(gòu)能夠更快速、更大范圍地掌握主動權(quán)、主導(dǎo)權(quán)、話語權(quán)甚至制定權(quán)。
當(dāng)前,歐盟、美國、日本紛紛出臺了相應(yīng)的開放科學(xué)戰(zhàn)略。日本內(nèi)閣府2018年6月15日發(fā)布的《創(chuàng)新集成戰(zhàn)略》指出,充分利用大數(shù)據(jù)、人工智能、云計算等,進行跨界整合,實施基于數(shù)據(jù)共享平臺的數(shù)據(jù)驅(qū)動發(fā)展戰(zhàn)略,該戰(zhàn)略是為了支持Society 5.0國家發(fā)展戰(zhàn)略的實施[3]。日本機構(gòu)知識庫聯(lián)盟提出的《關(guān)于創(chuàng)新集成戰(zhàn)略的理解報告》強調(diào),從機構(gòu)知識庫和數(shù)據(jù)管理服務(wù)的角度,可以支持該戰(zhàn)略第二章“知識泉源”的數(shù)據(jù)基礎(chǔ)設(shè)施[4]。該聯(lián)盟由日本國立情報研究所牽頭組織,從圖書館與信息中心的角度為國家發(fā)展戰(zhàn)略提供科技信息政策建言以及組織等相關(guān)工作。在美國執(zhí)行“開放政府”計劃之后,美國國家科學(xué)院于2018年7月17日發(fā)布了《設(shè)計開放科學(xué)》報告[5],該報告組織學(xué)科專家進行研討,對美國社會和政府提出政策建議:開放科學(xué)的基礎(chǔ)是科技論文開放獲取與科學(xué)數(shù)據(jù)開放共享,需要充分利用已有的大數(shù)據(jù)共享平臺和措施,促進更多科研人員從事科學(xué)數(shù)據(jù)管理計劃和科學(xué)數(shù)據(jù)共享,結(jié)合數(shù)據(jù)科學(xué)和公眾科學(xué)等,為社會經(jīng)濟創(chuàng)造新的知識和科研價值。事實上,美國高校圖書館以及研究型圖書館已經(jīng)從事了相關(guān)工作,例如,美國圖書館協(xié)會受谷歌公司贊助發(fā)布了圖書館開放代碼館藏(Libraries Ready to Code)的測試版[6],加利福尼亞數(shù)字圖書館與跨界互聯(lián)網(wǎng)運營服務(wù)者開展了數(shù)據(jù)共享和保存試點項目[7]。歐洲開放科學(xué)云(European Open Science Cloud,EOSC)于2018年2月發(fā)布政策報告[8],指出在知識經(jīng)濟和全球數(shù)據(jù)價值鏈背景下,開放科學(xué)政策起到了促進作用,提出了在科研部門、公共部門、私營部門和公民社會的四重螺旋中自由流動的與數(shù)據(jù)信息、知識相關(guān)的整合政策及各種具體措施。值得注意的是,每年資助經(jīng)費合計約76億歐元(約人民幣616億元)的歐洲11個國家科研資助組織,于2018年9月4日推出一項規(guī)定,要求到2020年,它們所資助科研項目的每篇論文發(fā)表后立即開放獲取[9-10]。從英國、荷蘭、法國的國家資助機構(gòu)以及意大利國家核物理研究所等11所研究機構(gòu)獲得經(jīng)費資助的科研人員,其研究成果不能發(fā)表在有6個月或12個月開放獲取時滯期的期刊、混合開放獲取期刊和非開放獲取期刊上。這些科研人員將不得不放棄在Nature和Science上發(fā)表論文,除非這些期刊改變自己的商業(yè)模式。
從情報分析的角度看,我們可以發(fā)現(xiàn)這些趨勢的外在規(guī)律:隨著時間推移,出現(xiàn)了從合同內(nèi)容的一系列變化到越來越多的開放許可協(xié)議的出臺,以及愈來愈高級別的政策頒布,乃至法律制定和體制改革的現(xiàn)象,說明開放科學(xué)政策一直在發(fā)生改變,相應(yīng)的數(shù)據(jù)管理服務(wù)也在進行各種調(diào)整。然而,從政策研究的角度看,我們能更深入地找到它的內(nèi)在邏輯,即在無法避免數(shù)字化復(fù)制、互聯(lián)網(wǎng)傳播、修改刪選極為便利的時代里,科研人員對于科研成果的開放程度越高,就越可以得到更好的傳播和利用,對于自身利益的保護就越全面;而且,科研資助機構(gòu)和科研教育機構(gòu)可以進行更高效率的科研管理,從而吸納全球范圍內(nèi)的科技人才,這也是為什么各組織機構(gòu)要控制開放共享主動權(quán)的原因之一。越來越多證據(jù)顯示,國外圖書館和信息中心的專家參與了這些政策建議與實施方案的制定和實現(xiàn)。
1.2 科研模式的數(shù)字化、開放化和社群化發(fā)展
開放科學(xué)是一個較為廣泛和不斷發(fā)展的概念,它是促進科研人員之間合作的一種新的科研方式,使得研究人員可以將自己的研究成果中的每個要素與他人共享[11]。開放科學(xué)所包含的內(nèi)容比較全面和廣泛,如“Data Sharing” “Open Research Data” “Science 2.0+” “Citizen Science” “Open Innovation”等[12]。英國皇家學(xué)會在2012年5月發(fā)布的《科學(xué):開放事業(yè)》報告中指出,開放科學(xué)不僅能有效促進科學(xué)發(fā)現(xiàn),還有助于發(fā)現(xiàn)、遏制和清理“壞的科學(xué)”,開放性促進系統(tǒng)化的科學(xué)誠信,如果開放數(shù)據(jù)能被置于合適的治理框架下,這將符合公共利益[13]。Web 2.0時代的到來,使得信息的傳播方式由單向輸出變?yōu)殡p向傳播,科研模式的發(fā)展產(chǎn)生了各種各樣的組合配置:傳統(tǒng)模式、現(xiàn)代模式、開放科學(xué)模式和創(chuàng)新模式(見表1)。傳統(tǒng)科研模式是研究者將發(fā)現(xiàn)的信息進行分析研究后撰寫論文并發(fā)表在優(yōu)質(zhì)期刊上,將其作為一種科研產(chǎn)出或一種研究記錄,之后送交權(quán)威性的機構(gòu)進行科研評審?,F(xiàn)代模式最大的變化是這種傳統(tǒng)意義上的“出版即完成”正在轉(zhuǎn)變?yōu)椤鞍l(fā)布才開始”,未來的科學(xué)研究者所要考慮的是其內(nèi)容的存儲位置、開放程度以及對全社會的貢獻大小[14]。這也是真正意義上的革命性變革,是新時代的新挑戰(zhàn)。開放科學(xué)模式是指研究者將產(chǎn)生的科學(xué)數(shù)據(jù)呈現(xiàn)在互聯(lián)網(wǎng)上進行開放共享,眾籌、眾包、共享經(jīng)濟是開放科學(xué)模式的典型代表[15]。創(chuàng)新模式則依靠大眾的力量來獲取數(shù)據(jù),并進行深入研究,這是另一種突破傳統(tǒng)模式的思考方式[16]。
當(dāng)前,正在發(fā)展和逐步完善的一種機制是“同行評審評價”(Peer Review Evaluation)模型[17],當(dāng)新的文章出現(xiàn)或發(fā)布時,不單單依靠少數(shù)的專家進行長達3個月到1年的審稿,而是直接將其投放到互聯(lián)網(wǎng)上,請具有相關(guān)資格的專家或者擁有相關(guān)專長的工作人員進行評述,并對這些評述進行分析,來判斷哪些人可以真正成為專業(yè)的評論員,這些評論也可以成為最終科研成果的一部分。
OpenAIRE的調(diào)查內(nèi)容提出,未來科研模式的發(fā)展趨勢之一是Open Peer Review[18]模式,它所涉及的具體概念有以下幾點:第一,開放身份,即作者和評論者知道彼此的身份,了解彼此;第二,開放報告,是指評論報告與相關(guān)文章一起發(fā)布;第三,開放參與,需要更開放的社區(qū)為評審過程提供平臺;第四,開放式互動,允許并鼓勵作者和評論者之間,評論者與評論者之間的互惠式討論;第五,開放預(yù)審稿,手稿即刻創(chuàng)作,在任何正式的同行評審程序之前可供開放預(yù)審(例如通過像ArXiv這樣的預(yù)印本服務(wù));第六,開放最終版本評論,審查或評論最終的“記錄版本”出版物;第七,開放平臺,由出版地不同的組織實體促成,將評論與出版先做脫鉤再做連接。
科研模式的數(shù)字化、開放化和社群化發(fā)展,不僅僅是文獻和文獻信息的數(shù)字化,或資源開放利用以及通過社交網(wǎng)絡(luò)的傳播,而且是在知識創(chuàng)造的階段就開始了;知識管理的方式也不遵循創(chuàng)作、生產(chǎn)、分配、傳播、存儲的流程,而是環(huán)繞文本(Text)本身所處的當(dāng)前情境(Context),進行知識、信息、數(shù)據(jù)的再創(chuàng)作、再生產(chǎn)、再分配、再傳播、再存儲,選擇最佳方案開展。
2 科研數(shù)據(jù)管理
2.1 科研數(shù)據(jù)管理所涉及的利益相關(guān)者
所有數(shù)據(jù)皆有其價值,但是相對于科學(xué)數(shù)據(jù)(Scientific Data)而言,科研數(shù)據(jù)(Research Data)是經(jīng)過處理且在當(dāng)時被視為具有高度價值的數(shù)據(jù)??蒲袛?shù)據(jù)也是數(shù)字化科研時代的重要戰(zhàn)略資源,為了更好地管理科研項目的成果,使其得到更好的保護和傳播,各國都先后出臺了國家層面的數(shù)據(jù)管理政策及管理機構(gòu)實施辦法,學(xué)術(shù)領(lǐng)域就相關(guān)問題達成了共識,科研團隊也積累了豐富的實踐。我國已經(jīng)在科研數(shù)據(jù)管理方面進行了許多嘗試,積累了一定的經(jīng)驗和基礎(chǔ),并于2018年3月出臺了國家層面的指導(dǎo)意見《科學(xué)數(shù)據(jù)管理辦法》[19],目前,各相關(guān)機構(gòu)正在依照此管理辦法進行實施方案的設(shè)計、運行、執(zhí)行和評估考核。
在實踐層面上,主要分為兩種范式。第一種是數(shù)據(jù)集中式管理,需要提高數(shù)據(jù)管理的性能,比如分層分級的辦法、人員制度和考核、數(shù)量質(zhì)量的指標(biāo),其著力點是提高單個機關(guān)的組織動員能力;第二種是數(shù)據(jù)分布式管理,需要提高節(jié)點之間互聯(lián)互通的能力,比如團隊乃至不同院所之間的協(xié)作、標(biāo)準(zhǔn)、規(guī)范以及分工,其著力點是提高數(shù)據(jù)之間互相流動的能力。如果僅僅考慮數(shù)據(jù)的采集和利用,集中式管理下的數(shù)據(jù)互聯(lián)互通能力就會略顯不足;如果顧慮多個利益主體在發(fā)布和共享過程中的訴求,分布式管理下的組織動員效率就會大打折扣[20-21]。
理想情況下,既希望組織機關(guān)具有數(shù)據(jù)質(zhì)量和數(shù)量的資產(chǎn)增長,又希望協(xié)作網(wǎng)絡(luò)能夠暢通運行,促進數(shù)據(jù)利用和共享;而現(xiàn)實情況是,數(shù)據(jù)權(quán)益主體或者利益相關(guān)者的訴求全部滿足才能達到組織動員和協(xié)作能力的最佳效果。訴求包括兩個方面:一是滿足激勵因素,二是消除阻礙因素。因此,科學(xué)數(shù)據(jù)管理政策是很有必要參考的框架。然而在實際處理科研數(shù)據(jù)管理服務(wù)的具體問題上,不得不考慮利益相關(guān)者的訴求[22-24]。筆者通過長期文獻閱讀、政策解讀、跟蹤掃描,并對國內(nèi)外各家機構(gòu)的專家進行訪問的基礎(chǔ)上,整理匯總出利益相關(guān)者的主要訴求(見表2)。
數(shù)據(jù)管理服務(wù)的首要任務(wù)是了解各方的核心利益。在擁有共同目標(biāo)即開放科學(xué)或者類似理念的基礎(chǔ)上,公平合理地滿足各方訴求,才能盡可能地平衡利益相關(guān)方的權(quán)益,尤其要關(guān)注數(shù)據(jù)生產(chǎn)者、貢獻者和提交者的核心權(quán)益;確保根據(jù)各個利益相關(guān)者的核心利益所設(shè)計的政策實施方案能有效落實,并且據(jù)此產(chǎn)生和設(shè)計的科研數(shù)據(jù)管理服務(wù)會有相對可靠的用戶需求和可檢驗的任務(wù)規(guī)劃。
2.2 科研數(shù)據(jù)管理服務(wù)的核心要點
基于數(shù)據(jù)管理的數(shù)據(jù)服務(wù)主要包括數(shù)據(jù)創(chuàng)建、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)保存、數(shù)據(jù)獲取和數(shù)據(jù)重用等六項內(nèi)容(見表3)。此項清單可以為數(shù)據(jù)管理提供一定的經(jīng)驗和基礎(chǔ)。在此過程中需要著重注意以下三點內(nèi)容[25-30]:第一,科研數(shù)據(jù)的生命周期,包括備份、采集、遴選、典藏、共享等各個環(huán)節(jié);第二,參與者和權(quán)益者,包括科研人員、學(xué)術(shù)社群、機構(gòu)、研究資助者、出版商、公眾等各個利益群體;第三,記錄、存儲、保存、發(fā)布文件的措施,考慮數(shù)據(jù)重用能力、數(shù)據(jù)授權(quán)許可、開放性、實施條件等。
表3所列科研數(shù)據(jù)管理服務(wù)的核心要點,是筆者根據(jù)連續(xù)七年的中國開放獲取推介周、連續(xù)五年的中國機構(gòu)知識庫學(xué)術(shù)研討會、連續(xù)三年的中國合理使用周和中國數(shù)據(jù)館員研討班的眾多專家就數(shù)據(jù)共享、數(shù)據(jù)管理、數(shù)據(jù)獲取、開放數(shù)據(jù)、開放科學(xué)等主題的報告內(nèi)容,匯聚整理而成[31],并融匯了筆者在中國科學(xué)院大學(xué)開設(shè)的公共選修課100多位研究生的課題交流內(nèi)容,以及2017年進行的10次數(shù)據(jù)館員沙龍的交流討論內(nèi)容,旨在探索和發(fā)現(xiàn)我國科研教育環(huán)境中數(shù)據(jù)管理服務(wù)的具體需求。
2.3 科研數(shù)據(jù)開放共享的價值
對于科研數(shù)據(jù)的開放共享,最重要的基礎(chǔ)是要有共同的目標(biāo)和價值觀,如果沒有核心價值觀和共識,就很難達成一致,也很難平衡好各方的核心利益。利用政策驅(qū)動知識與技能、技術(shù)與人文基礎(chǔ)設(shè)施發(fā)展的同時,促使科研人員的利益得以改變,利用第三方共同推動文化實踐,最終實現(xiàn)數(shù)據(jù)開放的共同目標(biāo)[32]。
隨著數(shù)字經(jīng)濟的發(fā)展,科研數(shù)據(jù)開放共享已經(jīng)成為一項必要的公共服務(wù),是否在同一機構(gòu)內(nèi)的不同團隊間(組內(nèi))進行共享,是否在更大的業(yè)務(wù)平臺讓各方參與者共享,是否能在公共服務(wù)平臺給予各方包括競爭對手在內(nèi)的無差別共享,甚至在日益推進的開放數(shù)據(jù)運動中與政府信息一道為公民、公眾和國際友人共享等,在考驗新時期的智慧??蒲袛?shù)據(jù)開放共享使得各個組織充分利用他們的核心資源,產(chǎn)生了基于現(xiàn)存數(shù)據(jù)的新的洞見,但同時也帶來了新的道德倫理方面的風(fēng)險[33]。如何識別和降低這類風(fēng)險,主要依靠兩種手段:一種是行業(yè)內(nèi)以及社會中的科研數(shù)據(jù)開放共享文化,另一種是圖書館或相關(guān)機構(gòu)合作開展各個利益相關(guān)者之間的數(shù)據(jù)對話。
塑造科研數(shù)據(jù)開放共享文化,在制定使用政策時可參考國外已有的實踐和經(jīng)驗[24,34-36]:一部分來自科研資助機構(gòu)的倡導(dǎo),一部分來自組織單位的宣傳,也有委托圖書館和信息中心來進行文化建設(shè)的。然而,數(shù)據(jù)共享文化的實際成效,仍然來自學(xué)科領(lǐng)域內(nèi)不斷增長的共識。以醫(yī)學(xué)領(lǐng)域為例[37],數(shù)據(jù)共享文化的范圍至少包括以下方面。
(1)數(shù)據(jù)共享能夠增強對于單個臨床試驗結(jié)果的理解,并且相對單一研究的數(shù)據(jù)而言,數(shù)據(jù)共享促進來自多個試驗的數(shù)據(jù)結(jié)果匯集,可能促進進一步的科學(xué)發(fā)現(xiàn)。
(2)促進數(shù)據(jù)共享中心在科研參與者、最小化安全風(fēng)險以及尊重醫(yī)學(xué)研究作為公共利益本質(zhì)等方面的道德與倫理討論,產(chǎn)生新的探索領(lǐng)域。
(3)數(shù)據(jù)共享的實踐和科學(xué)討論包括:提高研究的精確性,告知治療方案選擇的風(fēng)險或益處分析,增強合作,加速生物醫(yī)學(xué)研究,恢復(fù)對于臨床研究企業(yè)的信任等,產(chǎn)生新的探索領(lǐng)域。
(4)數(shù)據(jù)共享參與者的層級劃分尤其重要,避免因數(shù)據(jù)再分析可能得出的不精確或者錯誤結(jié)論,但是數(shù)據(jù)再分析也可能產(chǎn)生新的探索領(lǐng)域。
(5)當(dāng)產(chǎn)業(yè)界、學(xué)術(shù)界和監(jiān)管機構(gòu)的領(lǐng)導(dǎo)者已經(jīng)意識到不斷增長的透明度和數(shù)據(jù)共享方面的價值時,文化上的轉(zhuǎn)變已經(jīng)開始,即主要關(guān)注數(shù)據(jù)應(yīng)該如何被共享,而非數(shù)據(jù)被共享的原因。
數(shù)據(jù)對話是另一種建設(shè)數(shù)據(jù)共享文化的方式。數(shù)據(jù)對話[38-39]是讓科研人員一起分享他們的數(shù)據(jù)故事,討論問題,交換想法。無論是關(guān)于數(shù)據(jù)的創(chuàng)建、收集、使用、處理、共享和管理,還是從他們自己的失敗中吸取的經(jīng)驗教訓(xùn)(如數(shù)據(jù)故事),或是在數(shù)據(jù)處理方面的成功,數(shù)據(jù)對話的目的是促進數(shù)據(jù)共享的經(jīng)驗交流,最終達到數(shù)據(jù)共享的目的。人們甚至開始考慮這種來自圖書館和信息中心的數(shù)據(jù)對話,可以作為開放科學(xué)的重要組成部分[40]。因此,科研數(shù)據(jù)管理服務(wù)在這些實踐上的缺失,往往是系統(tǒng)項目建設(shè)所沒有考慮到的核心關(guān)鍵問題,目前國外正在逐步建立這類服務(wù)的執(zhí)行、評估和檢驗機制,值得國內(nèi)同行關(guān)注和參考。
2.4 科研數(shù)據(jù)開放共享的政策
科研數(shù)據(jù)開放共享的一項關(guān)鍵問題是如何促進數(shù)據(jù)利用并且保護數(shù)據(jù)權(quán)益。數(shù)據(jù)權(quán)益是分析和提出問題解決方案的核心,需要系統(tǒng)梳理各利益相關(guān)者的角色、權(quán)益訴求、政策博弈與政策細節(jié),相關(guān)研究對象和研究內(nèi)容包括:國家政府政策、科研資助機構(gòu)、科研教育機構(gòu)、圖書館與信息中心、國際出版商、數(shù)據(jù)出版、數(shù)據(jù)知識庫、數(shù)據(jù)管理服務(wù)、數(shù)據(jù)管理計劃、數(shù)據(jù)監(jiān)管、數(shù)據(jù)級別計量等。這些政策研究的目的是為了更好地實現(xiàn)對科研數(shù)據(jù)的有效管理。
從系統(tǒng)性、全面性和完整性的角度看,政策研究可以粗略分為兩個部分:一是宏觀的政策內(nèi)容,二是微觀的政策實施細節(jié)。目前主要包括但不限于以下內(nèi)容[41]:
(1)國家行政級別的政策:數(shù)據(jù)驅(qū)動創(chuàng)新發(fā)展戰(zhàn)略。
(2)研究資助機構(gòu)的政策:資助成果的最大化利用。
(3)研究教育機構(gòu)的政策:知識資產(chǎn)的管理與傳播。
(4)圖書館和信息中心政策:開放信息資源整合利用。
(5)出版團體和期刊政策:新興學(xué)術(shù)交流體系基礎(chǔ)。
(6)機構(gòu)知識庫、學(xué)術(shù)知識庫、數(shù)據(jù)知識庫:內(nèi)容長期可持續(xù)。
(7)數(shù)據(jù)管理計劃:研究工作流程中的數(shù)據(jù)整理備份。
(8)數(shù)據(jù)管理服務(wù):處理數(shù)據(jù)的工具、流程、方法。
(9)數(shù)據(jù)監(jiān)管政策:遴選具有優(yōu)秀質(zhì)量和價值的數(shù)據(jù)。
(10)數(shù)據(jù)級別計量:承認以及評估數(shù)據(jù)共享的貢獻。
科研資助與教育機構(gòu)、學(xué)術(shù)出版界、信息服務(wù)機構(gòu)等學(xué)術(shù)社群成員目前正在積極聯(lián)合起來,將數(shù)據(jù)治理、科研資助、科研管理與數(shù)據(jù)服務(wù)深度整合,充分依托機構(gòu)知識庫,進行科學(xué)數(shù)據(jù)管理,借此有效地提升數(shù)據(jù)資源的利用效率,發(fā)揮“數(shù)據(jù)驅(qū)動科研”的重要價值[42-46]。助力聯(lián)合行動的有效落實,一方面需要實踐經(jīng)驗,并且要持續(xù)不斷地改善和更新,以及新的需求導(dǎo)引下的新型試驗;另一方面需要國家科技信息政策研究,以及政策執(zhí)行層面的咨詢與服務(wù)。
2.5 科研數(shù)據(jù)生命周期中的數(shù)據(jù)管理規(guī)范
在科研數(shù)據(jù)開放共享的政策框架之下,在執(zhí)行層面需要將數(shù)據(jù)備份、數(shù)據(jù)采集、數(shù)據(jù)遴選、數(shù)據(jù)典藏、數(shù)據(jù)共享作為各自節(jié)點考慮,而不是作為各個環(huán)節(jié)進行服務(wù)設(shè)計。即數(shù)據(jù)采集也需要考慮數(shù)據(jù)共享,反之亦然;不是把兩者割裂為一個項目的不同組成部分,或者一條流水線上的不同分工,而是同為數(shù)據(jù)開放共享政策中數(shù)據(jù)管理服務(wù)的一個整體,只是這項服務(wù)是依托數(shù)據(jù)生命周期的架構(gòu)進行理論上的拆解,但在實踐層面幾乎沒有割裂的情況。
國外的相關(guān)機構(gòu)對于科研數(shù)據(jù)管理服務(wù)的經(jīng)驗和實踐案例,可給我們提供借鑒。例如,加利福尼亞大學(xué)圖書館(University of California Library)的學(xué)術(shù)交流、數(shù)據(jù)策展和科研數(shù)據(jù)管理方案和計劃[47-48],約翰霍普金斯大學(xué)圖書館(Johns Hopkins University Libraries)、密歇根大學(xué)圖書館(University of Michigan Libraries)、羅格斯大學(xué)圖書館(Rutgers University Libraries)的科研數(shù)據(jù)服務(wù)等內(nèi)容[49-51]。筆者在對已有分析框架深度解析的基礎(chǔ)上,又走訪了一線科研工作崗位人員,其對于科學(xué)數(shù)據(jù)服務(wù)的反饋結(jié)果仍然是過于抽象,具體反映為寬泛而不接地氣,或者過于細致而缺乏優(yōu)先次序。所以在政策執(zhí)行層面的規(guī)范化主要有兩個方面的考慮:一是如何細致完整地描述規(guī)范,這有利于提高質(zhì)量和準(zhǔn)確度,但不利于增加數(shù)量和推廣力;二是如何完成框架性的原則內(nèi)容,這有利于提高普適性和接納特殊情況,但不利于精準(zhǔn)核查和量化評估。這兩種考慮方案都具有客觀性,都能成立,而且可以付諸實現(xiàn),但是在科研數(shù)據(jù)管理服務(wù)的領(lǐng)域?qū)嵤?,其協(xié)調(diào)性往往欠佳。因此,我們梳理了“五—四—三”方案,即五個數(shù)據(jù)生命周期的節(jié)點:數(shù)據(jù)備份、數(shù)據(jù)采集、數(shù)據(jù)遴選、數(shù)據(jù)典藏、數(shù)據(jù)共享,四種政策規(guī)范要素:固定要素、變動要素、項目數(shù)據(jù)、多源數(shù)據(jù)(見表4),以及三項簡單明了的實施步驟:數(shù)據(jù)存繳層、數(shù)據(jù)存儲層和數(shù)據(jù)使用層。
綜上所述,對于有效的科研數(shù)據(jù)管理,首先要明確數(shù)據(jù)存繳層,即“人”的問題——數(shù)據(jù)的創(chuàng)建者/提供者(Data Creater/Provider),他的任務(wù)應(yīng)該包括創(chuàng)建數(shù)據(jù)、搜集數(shù)據(jù)、處理數(shù)據(jù)、分析數(shù)據(jù)和提供可重用的數(shù)據(jù)。他的權(quán)利和責(zé)任應(yīng)該包括[52]:①管理數(shù)據(jù)、存儲數(shù)據(jù)、長期保存數(shù)據(jù);②遵守科研機構(gòu)與資助機構(gòu)的政策:為共享和重用而備妥數(shù)據(jù);③符合學(xué)科社群與科研機構(gòu)的標(biāo)準(zhǔn):遴選、部署、轉(zhuǎn)換數(shù)據(jù);④考慮數(shù)據(jù)在未來可視化中的法律與倫理問題。
其次是數(shù)據(jù)存儲層:知識庫(Repository),它的任務(wù)是監(jiān)管數(shù)據(jù),提供數(shù)據(jù)訪問,提供合適的工具以及整合各項應(yīng)用。知識庫應(yīng)該能夠詳述數(shù)據(jù)管理政策,確保系統(tǒng)的日常維護,管理數(shù)據(jù)使之能夠長期使用,保存數(shù)據(jù)的真實性并符合標(biāo)準(zhǔn)規(guī)范,保護數(shù)據(jù)提供者的權(quán)益,確保流量用戶的合理獲取并且提供有效的數(shù)據(jù)訪問、重用的工具和可視化工具,以及提供用戶教育培訓(xùn)等。
第三是明確數(shù)據(jù)使用層,即流量用戶(Downstream user/reuser)的角色、權(quán)利與責(zé)任。流量用戶可以搜集數(shù)據(jù),通過瀏覽、下載、抽取等行為獲取數(shù)據(jù),或者抽取、操控、重用數(shù)據(jù)、訪問元數(shù)據(jù)以使用、引用和可視化數(shù)據(jù)。但是流量用戶必須遵守許可條款,向數(shù)據(jù)的提供者致謝并有效地管理衍生數(shù)據(jù)。
為了解決理論和實踐相結(jié)合的問題,筆者在長期研究和走訪的基礎(chǔ)上,以固定要素和變動要素進行規(guī)范要點的主次區(qū)分,以及項目數(shù)據(jù)和多源數(shù)據(jù)的情境劃分,重新界定科學(xué)數(shù)據(jù)權(quán)益分析的基本框架,探索在數(shù)據(jù)治理[63]中尚未解決的問題。
3 數(shù)據(jù)館員的發(fā)展
3.1 數(shù)據(jù)館員的角色
開放科學(xué)的發(fā)展趨勢以及《科學(xué)數(shù)據(jù)管理辦法》的頒布,促進了我國科研數(shù)據(jù)管理服務(wù)的發(fā)展,同時也帶動了學(xué)術(shù)界、教育界、出版界和圖書館界的發(fā)展。數(shù)據(jù)管理服務(wù)的核心基礎(chǔ)是數(shù)據(jù)權(quán)益,需要從事這項工作的人具有相應(yīng)的知識、技能、理念和經(jīng)驗,執(zhí)行各項協(xié)作的任務(wù),完成許多尚未預(yù)見的法律、信息技術(shù)、服務(wù)轉(zhuǎn)型等方面的攻關(guān)工作。
眾所周知,社會經(jīng)濟的發(fā)展已從信息時代過渡到大數(shù)據(jù)時代,人類社會所擁有的數(shù)據(jù)量和統(tǒng)計量的增長比以往任何時候都要快,科研人員對于“大智移云”(大數(shù)據(jù)、人工智能、移動服務(wù)、云計算云存儲)的需求,促使國外許多圖書館和信息中心設(shè)置了數(shù)據(jù)館員的新職位,在美國和西歐,數(shù)據(jù)館員已經(jīng)成為研究型圖書館的一個重要職位。
圖書館員在科研數(shù)據(jù)重用和數(shù)據(jù)中心中發(fā)揮重要的作用,有學(xué)者基于過去處理eScience、Science 2.0乃至Open Science的發(fā)展歷程,對圖書館員在其中發(fā)揮的作用進行系統(tǒng)梳理,進而提出了數(shù)據(jù)館員的新角色和新定位[64]。美國圖書館協(xié)會(ALA)正在就這一新興職業(yè)開發(fā)核心競爭力框架,在2018年的國際圖書館大會(IFLA)期間,也有報告建議圖書館和信息科學(xué)(LIS)應(yīng)開設(shè)數(shù)據(jù)館員的相關(guān)課程,以快速促進這個領(lǐng)域的專業(yè)化[65]。有的學(xué)者從數(shù)據(jù)生命周期考慮,基于圖書館員能夠做的事情,提出數(shù)據(jù)館員可以擔(dān)當(dāng)?shù)慕巧校簷C構(gòu)數(shù)據(jù)知識庫管理人員、政策制定者、數(shù)據(jù)管理計劃咨詢者、數(shù)據(jù)咨詢者、數(shù)據(jù)出版者等[66];也有學(xué)者認為應(yīng)該是以下角色[67]:數(shù)據(jù)管理者(data manager)、數(shù)據(jù)工程師、數(shù)據(jù)管家(data steward)、數(shù)據(jù)監(jiān)護者、數(shù)據(jù)科學(xué)家、數(shù)據(jù)檔案管理員等。
我國學(xué)者[68]認為,數(shù)據(jù)館員應(yīng)當(dāng)與原先的圖書館工作相銜接,可以在大數(shù)據(jù)時代培養(yǎng)幾種不同類型的數(shù)據(jù)館員,如元數(shù)據(jù)館員、科學(xué)數(shù)據(jù)館員、數(shù)據(jù)分析館員等。也有學(xué)者[69]從終端用戶的需求考慮,認為在圖書館員走向數(shù)據(jù)館員的道路上,可以有選擇性地遴選計算機科學(xué)與統(tǒng)計科學(xué)中與未來發(fā)展的數(shù)據(jù)科學(xué)相關(guān)的內(nèi)容進行培養(yǎng)。在2016年的中國機構(gòu)知識庫學(xué)術(shù)研討會上,筆者曾經(jīng)做題為《在開放科學(xué)中探索數(shù)據(jù)館員的發(fā)展》的報告[70],提出核心目標(biāo)是“促進開放科學(xué)政策成真”,三項任務(wù)是:①充分了解和利用開放許可協(xié)議來協(xié)助人們分享和使用文獻;②完全熟練掌握數(shù)據(jù)管理計劃來協(xié)助人們組織數(shù)據(jù);③妥善運用和推廣期刊出版規(guī)范指南來協(xié)助人們選擇發(fā)表刊物。
3.2 數(shù)據(jù)館員的培訓(xùn)
數(shù)據(jù)科學(xué)家、數(shù)據(jù)公民、數(shù)據(jù)館員正在成為創(chuàng)新社會的新興力量,也是推動開放獲取、開放數(shù)據(jù)、開放科學(xué)發(fā)展的主要力量。數(shù)據(jù)館員的專業(yè)培訓(xùn)有助于提升廣大圖書館員的職業(yè)技能,適應(yīng)信息社會發(fā)展的新態(tài)勢,滿足面向國家科技信息政策的實踐工作的需要。筆者通過中國科學(xué)院文獻情報中心開展的科研模式變革與數(shù)據(jù)管理服務(wù)方面的研究、咨詢與實踐,根據(jù)定期舉辦數(shù)據(jù)館員培訓(xùn)班以及每月舉辦的數(shù)據(jù)館員沙龍的總結(jié)和經(jīng)驗,整理數(shù)據(jù)館員培訓(xùn)的課程體系,具體應(yīng)包括基礎(chǔ)課程和進階課程兩個方面(分別見表5和表6)。
4 結(jié)語
科研模式的變革與科研數(shù)據(jù)管理為圖書館事業(yè)的發(fā)展帶來了更多的挑戰(zhàn),也提出了更高要求。圖書館是社會發(fā)展的基礎(chǔ)設(shè)施,既要作為公共知識供給的服務(wù)平臺,又要成為各種科技創(chuàng)新投入施放的表演舞臺??蒲袛?shù)據(jù)管理是圖書館發(fā)展的新興機遇,圖書館對科研數(shù)據(jù)的發(fā)現(xiàn)、評價與遴選的能力,以及描述、組織、檢索或者分析科研數(shù)據(jù)的能力,在未來至關(guān)重要。
在開放獲取、開放數(shù)據(jù)以及開放科學(xué)的發(fā)展趨勢上,未來可能的發(fā)展方向依然是持續(xù):①消除知識鴻溝,使得科研人員、公眾和企業(yè)都可以獲得公共資金資助產(chǎn)生的科研成果;②促進知識創(chuàng)新,科研成果公開共享,有利于人們檢視、利用和宣傳優(yōu)秀的科研成果;③打破知識高墻,壓制付費高墻乃至打破數(shù)據(jù)共享壁壘。開放共享戰(zhàn)略可以吸引優(yōu)秀人才,可以在數(shù)字化時代里掌握規(guī)范、規(guī)格、國際學(xué)術(shù)交流的話語權(quán),在這一過程中,不能缺少圖書館和信息中心的專家的參與。
國家社會經(jīng)濟發(fā)展戰(zhàn)略和科學(xué)數(shù)據(jù)共享、科研成果開放獲取正在緊密關(guān)聯(lián),數(shù)據(jù)科學(xué)家、公眾科學(xué)家、數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)管理員等正成為新的職業(yè)??蒲袛?shù)據(jù)管理服務(wù)是開放和共享的主要推動力量,盡管人人手上皆有數(shù)據(jù),而且都有所謂的數(shù)據(jù)管理經(jīng)驗,但是整體推進行業(yè)乃至社會經(jīng)濟發(fā)展卻并不容易,在實施過程中可能出現(xiàn)尚未遇到的問題。在促進科研數(shù)據(jù)管理服務(wù)以及數(shù)據(jù)共享的過程中,關(guān)鍵是要明確目標(biāo),清晰權(quán)益以及厘清風(fēng)險,才能使人們更好地認識數(shù)據(jù)的價值、數(shù)據(jù)共享的價值以及科研數(shù)據(jù)管理服務(wù)的價值。
數(shù)據(jù)館員的職業(yè)價值應(yīng)該得到認可。數(shù)據(jù)館員服務(wù)于科研數(shù)據(jù)管理,他們的職責(zé)不僅是管理數(shù)據(jù),而且是利用學(xué)科專業(yè)知識和圖書館學(xué)情報學(xué)的知識協(xié)助學(xué)科館員更好地進行數(shù)據(jù)管理服務(wù);通過數(shù)據(jù)管理服務(wù),圖書館員能更好地服務(wù)科研人員,在科研生命周期的各個節(jié)點發(fā)揮重要作用,最終促進開放獲取、開放數(shù)據(jù)、開放科學(xué)的實現(xiàn)。
- 館藏《(增修)施南府志》的修復(fù)與保存
- 紙媒介在平面設(shè)計創(chuàng)作中的應(yīng)用與教學(xué)方法探討
- 廣電媒資從紙質(zhì)向數(shù)字化轉(zhuǎn)型中的敘事重構(gòu)研究
- 空間設(shè)計教學(xué)中紙藝技術(shù)的創(chuàng)意應(yīng)用與學(xué)生創(chuàng)新能力培養(yǎng)
- 人工智能驅(qū)動下的紙質(zhì)出版智能化轉(zhuǎn)型:技術(shù)融合與創(chuàng)新路徑
- 非遺傳統(tǒng)手工藝中紙張應(yīng)用的技術(shù)體系與活態(tài)傳承策略
- 紙藝術(shù)的跨文化符號:中西方剪紙的英譯對比研究
- 數(shù)智時代非物質(zhì)文化遺產(chǎn)的保護與傳承路徑——以河南剪紙為例
- 基于環(huán)保視角的紙制品企業(yè)廢物管理與再利用策略
- 圖書館紙質(zhì)文獻數(shù)字化存儲平臺的優(yōu)化設(shè)計與文件管理方法研究
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學(xué)者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了