優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

科研模式變革中的數(shù)據(jù)管理服務:實現(xiàn)開放獲取、開放數(shù)據(jù)、開放科學的途徑

作者:顧立平來源:《中國圖書館學報》日期:2020-04-10人氣:1362

隨著信息技術的發(fā)展與普及,全球學術交流模式總體朝著開放獲取的趨勢發(fā)展。信息時代的科學活動若要更好地進行,更好地促進科研成果的利用并保護相關權益,需要采取更為廣泛的數(shù)據(jù)開放共享戰(zhàn)略。從開放獲取到開放數(shù)據(jù)再到開放科學,各個環(huán)節(jié)都充滿變革與挑戰(zhàn)。無論是對于圖書館工作還是對于信息服務和知識服務來說,科研模式的變革都是一種新的挑戰(zhàn),與此同時,在這種大背景下,也產(chǎn)生了一種新的機遇,即與科研數(shù)據(jù)管理相關的一系列新內(nèi)容。

信息時代的發(fā)展使得科研人員的研究、教學和學術交流方式正在發(fā)生重大轉變,科學研究的對象也日益復雜,現(xiàn)有的科研方法和手段面臨新的挑戰(zhàn)。在一系列科研創(chuàng)新的改革當中,力求在不同國家、不同地區(qū)的科研機構和科研人員之間加強交流,避免重復勞動以及更妥善地進行科研資源配置等成為全球科研社群以及國家政府的核心政策之一。普遍的認識是人們應當充分利用數(shù)字化科研帶來的機遇,最大限度地加強科研機構和科研人員之間的交流與協(xié)作,這要求在各個方面調(diào)整工作方式,其中的關鍵之一即是數(shù)據(jù)管理服務。

數(shù)據(jù)管理服務的核心是數(shù)據(jù)權益,首要問題是明確科研數(shù)據(jù)管理的各利益方,包括科研成果的創(chuàng)作者、科研數(shù)據(jù)貢獻者、科研團隊和成員,以及政府行政機構、科研資助機構、科研教育機構、出版團體、圖書館界乃至跨界而來的網(wǎng)絡運營服務商;比如,數(shù)據(jù)提交者的科學貢獻度的認可機制,不只是某類科學家普遍性的個人訴求,而是應當放在眾多利益相關者權益博弈的不平衡的框架上去看待這個問題。其次,明確數(shù)據(jù)管理服務的主要內(nèi)容,包括創(chuàng)建數(shù)據(jù)、處理數(shù)據(jù)、分析數(shù)據(jù)、保存數(shù)據(jù)、訪問數(shù)據(jù)以及明晰重復使用的數(shù)據(jù)在不同學科之間的共性和差異等。再者,在實施細節(jié)上,為更好地實現(xiàn)數(shù)據(jù)管理,有效提升工作效率,需要明確科學數(shù)據(jù)開放共享的政策研究。政策是為了鼓勵或者抑制人們的某些行為,因此,如果從科研數(shù)據(jù)生命周期的角度進行考慮,需要對數(shù)據(jù)備份、數(shù)據(jù)采集、數(shù)據(jù)遴選、數(shù)據(jù)典藏、數(shù)據(jù)共享各個環(huán)節(jié)的政策進行研究。最后,在政策執(zhí)行層面,要明確協(xié)助執(zhí)行的具體人員,協(xié)助的內(nèi)容,以及協(xié)助者應該具備的知識技能等,在這方面需要明確數(shù)據(jù)館員發(fā)揮的作用和職業(yè)價值,并且隨著社會經(jīng)濟發(fā)展和科研模式的需求變化,以及組織單位的戰(zhàn)略調(diào)整,同時進行調(diào)整。

1 科研模式變革

1.1 開放獲取、開放數(shù)據(jù)與開放科學的發(fā)展趨勢

科研模式變革已經(jīng)不僅僅是一種特定的工具技術升級或者更換,更是適應全球政治經(jīng)濟局勢發(fā)展演進中的科技政策和管理機制的變革。目前,通過激勵科研創(chuàng)新帶動社會經(jīng)濟發(fā)展的國家戰(zhàn)略主要有兩種:第一種是知識產(chǎn)權的所有權控制戰(zhàn)略,主要是利用文獻、專利、軟件著作權等方式,給予創(chuàng)作者財貨和名譽上的回報,作為激勵科研創(chuàng)新的途徑,核心取決于中介者的權益管理。第二種是開放共享的主動權控制戰(zhàn)略,主要手段是通過科技論文的開放獲取、科研數(shù)據(jù)的開放共享、科研工具的開源發(fā)布、資金人員的眾籌眾包等途徑,使創(chuàng)作者快速擴大影響力和宣傳力,從而擁有更多的跟進者、參與者、投入資助等,以此作為激勵科研創(chuàng)新的途徑。它體現(xiàn)在標準規(guī)格的制定、價格成本的談判、版本的迭代更替等多方面、全領域、各途徑的組織動員能力,其根本核心是全球科技交流制度重構中的話語權和制定權,核心不再取決于中介者的權益管理,而是由眾多中介者集體參與的權益博弈。

在過去很長一段時間內(nèi),全球科技交流制度主要由美國、西歐等少數(shù)科技發(fā)達國家和地區(qū)的政府行政機構和科研資助機構掌握。近期,歐盟研究理事推動了科學出版物和科研數(shù)據(jù)的開放獲取[1-2],該戰(zhàn)略是一種有別于二戰(zhàn)以及冷戰(zhàn)時期延續(xù)的科技傳播交流機制,即:將論文及數(shù)據(jù)存儲在機構知識庫或指定的數(shù)據(jù)知識庫中,或者通過發(fā)表在開放獲取期刊或存儲在數(shù)據(jù)中心,實現(xiàn)開放共享;同時,以用戶明確同意或者知曉默認的方式,按照發(fā)布者和中介者所要求的使用目的、途徑、場景、方式等給予作者一定形式的回饋,來界定數(shù)據(jù)權益的邊界和使用范圍。此種交流機制下,一方面,創(chuàng)作者的權益得到更完整的保護;另一方面,對局勢和戰(zhàn)略有著深刻理解的組織機構能夠更快速、更大范圍地掌握主動權、主導權、話語權甚至制定權。

當前,歐盟、美國、日本紛紛出臺了相應的開放科學戰(zhàn)略。日本內(nèi)閣府2018年6月15日發(fā)布的《創(chuàng)新集成戰(zhàn)略》指出,充分利用大數(shù)據(jù)、人工智能、云計算等,進行跨界整合,實施基于數(shù)據(jù)共享平臺的數(shù)據(jù)驅動發(fā)展戰(zhàn)略,該戰(zhàn)略是為了支持Society 5.0國家發(fā)展戰(zhàn)略的實施[3]。日本機構知識庫聯(lián)盟提出的《關于創(chuàng)新集成戰(zhàn)略的理解報告》強調(diào),從機構知識庫和數(shù)據(jù)管理服務的角度,可以支持該戰(zhàn)略第二章“知識泉源”的數(shù)據(jù)基礎設施[4]。該聯(lián)盟由日本國立情報研究所牽頭組織,從圖書館與信息中心的角度為國家發(fā)展戰(zhàn)略提供科技信息政策建言以及組織等相關工作。在美國執(zhí)行“開放政府”計劃之后,美國國家科學院于2018年7月17日發(fā)布了《設計開放科學》報告[5],該報告組織學科專家進行研討,對美國社會和政府提出政策建議:開放科學的基礎是科技論文開放獲取與科學數(shù)據(jù)開放共享,需要充分利用已有的大數(shù)據(jù)共享平臺和措施,促進更多科研人員從事科學數(shù)據(jù)管理計劃和科學數(shù)據(jù)共享,結合數(shù)據(jù)科學和公眾科學等,為社會經(jīng)濟創(chuàng)造新的知識和科研價值。事實上,美國高校圖書館以及研究型圖書館已經(jīng)從事了相關工作,例如,美國圖書館協(xié)會受谷歌公司贊助發(fā)布了圖書館開放代碼館藏(Libraries Ready to Code)的測試版[6],加利福尼亞數(shù)字圖書館與跨界互聯(lián)網(wǎng)運營服務者開展了數(shù)據(jù)共享和保存試點項目[7]。歐洲開放科學云(European Open Science Cloud,EOSC)于2018年2月發(fā)布政策報告[8],指出在知識經(jīng)濟和全球數(shù)據(jù)價值鏈背景下,開放科學政策起到了促進作用,提出了在科研部門、公共部門、私營部門和公民社會的四重螺旋中自由流動的與數(shù)據(jù)信息、知識相關的整合政策及各種具體措施。值得注意的是,每年資助經(jīng)費合計約76億歐元(約人民幣616億元)的歐洲11個國家科研資助組織,于2018年9月4日推出一項規(guī)定,要求到2020年,它們所資助科研項目的每篇論文發(fā)表后立即開放獲取[9-10]。從英國、荷蘭、法國的國家資助機構以及意大利國家核物理研究所等11所研究機構獲得經(jīng)費資助的科研人員,其研究成果不能發(fā)表在有6個月或12個月開放獲取時滯期的期刊、混合開放獲取期刊和非開放獲取期刊上。這些科研人員將不得不放棄在Nature和Science上發(fā)表論文,除非這些期刊改變自己的商業(yè)模式。

從情報分析的角度看,我們可以發(fā)現(xiàn)這些趨勢的外在規(guī)律:隨著時間推移,出現(xiàn)了從合同內(nèi)容的一系列變化到越來越多的開放許可協(xié)議的出臺,以及愈來愈高級別的政策頒布,乃至法律制定和體制改革的現(xiàn)象,說明開放科學政策一直在發(fā)生改變,相應的數(shù)據(jù)管理服務也在進行各種調(diào)整。然而,從政策研究的角度看,我們能更深入地找到它的內(nèi)在邏輯,即在無法避免數(shù)字化復制、互聯(lián)網(wǎng)傳播、修改刪選極為便利的時代里,科研人員對于科研成果的開放程度越高,就越可以得到更好的傳播和利用,對于自身利益的保護就越全面;而且,科研資助機構和科研教育機構可以進行更高效率的科研管理,從而吸納全球范圍內(nèi)的科技人才,這也是為什么各組織機構要控制開放共享主動權的原因之一。越來越多證據(jù)顯示,國外圖書館和信息中心的專家參與了這些政策建議與實施方案的制定和實現(xiàn)。

1.2 科研模式的數(shù)字化、開放化和社群化發(fā)展

開放科學是一個較為廣泛和不斷發(fā)展的概念,它是促進科研人員之間合作的一種新的科研方式,使得研究人員可以將自己的研究成果中的每個要素與他人共享[11]。開放科學所包含的內(nèi)容比較全面和廣泛,如“Data Sharing” “Open Research Data” “Science 2.0+” “Citizen Science” “Open Innovation”等[12]。英國皇家學會在2012年5月發(fā)布的《科學:開放事業(yè)》報告中指出,開放科學不僅能有效促進科學發(fā)現(xiàn),還有助于發(fā)現(xiàn)、遏制和清理“壞的科學”,開放性促進系統(tǒng)化的科學誠信,如果開放數(shù)據(jù)能被置于合適的治理框架下,這將符合公共利益[13]。Web 2.0時代的到來,使得信息的傳播方式由單向輸出變?yōu)殡p向傳播,科研模式的發(fā)展產(chǎn)生了各種各樣的組合配置:傳統(tǒng)模式、現(xiàn)代模式、開放科學模式和創(chuàng)新模式(見表1)。傳統(tǒng)科研模式是研究者將發(fā)現(xiàn)的信息進行分析研究后撰寫論文并發(fā)表在優(yōu)質期刊上,將其作為一種科研產(chǎn)出或一種研究記錄,之后送交權威性的機構進行科研評審。現(xiàn)代模式最大的變化是這種傳統(tǒng)意義上的“出版即完成”正在轉變?yōu)椤鞍l(fā)布才開始”,未來的科學研究者所要考慮的是其內(nèi)容的存儲位置、開放程度以及對全社會的貢獻大小[14]。這也是真正意義上的革命性變革,是新時代的新挑戰(zhàn)。開放科學模式是指研究者將產(chǎn)生的科學數(shù)據(jù)呈現(xiàn)在互聯(lián)網(wǎng)上進行開放共享,眾籌、眾包、共享經(jīng)濟是開放科學模式的典型代表[15]。創(chuàng)新模式則依靠大眾的力量來獲取數(shù)據(jù),并進行深入研究,這是另一種突破傳統(tǒng)模式的思考方式[16]。

當前,正在發(fā)展和逐步完善的一種機制是“同行評審評價”(Peer Review Evaluation)模型[17],當新的文章出現(xiàn)或發(fā)布時,不單單依靠少數(shù)的專家進行長達3個月到1年的審稿,而是直接將其投放到互聯(lián)網(wǎng)上,請具有相關資格的專家或者擁有相關專長的工作人員進行評述,并對這些評述進行分析,來判斷哪些人可以真正成為專業(yè)的評論員,這些評論也可以成為最終科研成果的一部分。

OpenAIRE的調(diào)查內(nèi)容提出,未來科研模式的發(fā)展趨勢之一是Open Peer Review[18]模式,它所涉及的具體概念有以下幾點:第一,開放身份,即作者和評論者知道彼此的身份,了解彼此;第二,開放報告,是指評論報告與相關文章一起發(fā)布;第三,開放參與,需要更開放的社區(qū)為評審過程提供平臺;第四,開放式互動,允許并鼓勵作者和評論者之間,評論者與評論者之間的互惠式討論;第五,開放預審稿,手稿即刻創(chuàng)作,在任何正式的同行評審程序之前可供開放預審(例如通過像ArXiv這樣的預印本服務);第六,開放最終版本評論,審查或評論最終的“記錄版本”出版物;第七,開放平臺,由出版地不同的組織實體促成,將評論與出版先做脫鉤再做連接。

科研模式的數(shù)字化、開放化和社群化發(fā)展,不僅僅是文獻和文獻信息的數(shù)字化,或資源開放利用以及通過社交網(wǎng)絡的傳播,而且是在知識創(chuàng)造的階段就開始了;知識管理的方式也不遵循創(chuàng)作、生產(chǎn)、分配、傳播、存儲的流程,而是環(huán)繞文本(Text)本身所處的當前情境(Context),進行知識、信息、數(shù)據(jù)的再創(chuàng)作、再生產(chǎn)、再分配、再傳播、再存儲,選擇最佳方案開展。

2 科研數(shù)據(jù)管理

2.1 科研數(shù)據(jù)管理所涉及的利益相關者

所有數(shù)據(jù)皆有其價值,但是相對于科學數(shù)據(jù)(Scientific Data)而言,科研數(shù)據(jù)(Research Data)是經(jīng)過處理且在當時被視為具有高度價值的數(shù)據(jù)??蒲袛?shù)據(jù)也是數(shù)字化科研時代的重要戰(zhàn)略資源,為了更好地管理科研項目的成果,使其得到更好的保護和傳播,各國都先后出臺了國家層面的數(shù)據(jù)管理政策及管理機構實施辦法,學術領域就相關問題達成了共識,科研團隊也積累了豐富的實踐。我國已經(jīng)在科研數(shù)據(jù)管理方面進行了許多嘗試,積累了一定的經(jīng)驗和基礎,并于2018年3月出臺了國家層面的指導意見《科學數(shù)據(jù)管理辦法》[19],目前,各相關機構正在依照此管理辦法進行實施方案的設計、運行、執(zhí)行和評估考核。

在實踐層面上,主要分為兩種范式。第一種是數(shù)據(jù)集中式管理,需要提高數(shù)據(jù)管理的性能,比如分層分級的辦法、人員制度和考核、數(shù)量質量的指標,其著力點是提高單個機關的組織動員能力;第二種是數(shù)據(jù)分布式管理,需要提高節(jié)點之間互聯(lián)互通的能力,比如團隊乃至不同院所之間的協(xié)作、標準、規(guī)范以及分工,其著力點是提高數(shù)據(jù)之間互相流動的能力。如果僅僅考慮數(shù)據(jù)的采集和利用,集中式管理下的數(shù)據(jù)互聯(lián)互通能力就會略顯不足;如果顧慮多個利益主體在發(fā)布和共享過程中的訴求,分布式管理下的組織動員效率就會大打折扣[20-21]。

理想情況下,既希望組織機關具有數(shù)據(jù)質量和數(shù)量的資產(chǎn)增長,又希望協(xié)作網(wǎng)絡能夠暢通運行,促進數(shù)據(jù)利用和共享;而現(xiàn)實情況是,數(shù)據(jù)權益主體或者利益相關者的訴求全部滿足才能達到組織動員和協(xié)作能力的最佳效果。訴求包括兩個方面:一是滿足激勵因素,二是消除阻礙因素。因此,科學數(shù)據(jù)管理政策是很有必要參考的框架。然而在實際處理科研數(shù)據(jù)管理服務的具體問題上,不得不考慮利益相關者的訴求[22-24]。筆者通過長期文獻閱讀、政策解讀、跟蹤掃描,并對國內(nèi)外各家機構的專家進行訪問的基礎上,整理匯總出利益相關者的主要訴求(見表2)。

數(shù)據(jù)管理服務的首要任務是了解各方的核心利益。在擁有共同目標即開放科學或者類似理念的基礎上,公平合理地滿足各方訴求,才能盡可能地平衡利益相關方的權益,尤其要關注數(shù)據(jù)生產(chǎn)者、貢獻者和提交者的核心權益;確保根據(jù)各個利益相關者的核心利益所設計的政策實施方案能有效落實,并且據(jù)此產(chǎn)生和設計的科研數(shù)據(jù)管理服務會有相對可靠的用戶需求和可檢驗的任務規(guī)劃。

2.2 科研數(shù)據(jù)管理服務的核心要點

基于數(shù)據(jù)管理的數(shù)據(jù)服務主要包括數(shù)據(jù)創(chuàng)建、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)保存、數(shù)據(jù)獲取和數(shù)據(jù)重用等六項內(nèi)容(見表3)。此項清單可以為數(shù)據(jù)管理提供一定的經(jīng)驗和基礎。在此過程中需要著重注意以下三點內(nèi)容[25-30]:第一,科研數(shù)據(jù)的生命周期,包括備份、采集、遴選、典藏、共享等各個環(huán)節(jié);第二,參與者和權益者,包括科研人員、學術社群、機構、研究資助者、出版商、公眾等各個利益群體;第三,記錄、存儲、保存、發(fā)布文件的措施,考慮數(shù)據(jù)重用能力、數(shù)據(jù)授權許可、開放性、實施條件等。

表3所列科研數(shù)據(jù)管理服務的核心要點,是筆者根據(jù)連續(xù)七年的中國開放獲取推介周、連續(xù)五年的中國機構知識庫學術研討會、連續(xù)三年的中國合理使用周和中國數(shù)據(jù)館員研討班的眾多專家就數(shù)據(jù)共享、數(shù)據(jù)管理、數(shù)據(jù)獲取、開放數(shù)據(jù)、開放科學等主題的報告內(nèi)容,匯聚整理而成[31],并融匯了筆者在中國科學院大學開設的公共選修課100多位研究生的課題交流內(nèi)容,以及2017年進行的10次數(shù)據(jù)館員沙龍的交流討論內(nèi)容,旨在探索和發(fā)現(xiàn)我國科研教育環(huán)境中數(shù)據(jù)管理服務的具體需求。

2.3 科研數(shù)據(jù)開放共享的價值

對于科研數(shù)據(jù)的開放共享,最重要的基礎是要有共同的目標和價值觀,如果沒有核心價值觀和共識,就很難達成一致,也很難平衡好各方的核心利益。利用政策驅動知識與技能、技術與人文基礎設施發(fā)展的同時,促使科研人員的利益得以改變,利用第三方共同推動文化實踐,最終實現(xiàn)數(shù)據(jù)開放的共同目標[32]。

隨著數(shù)字經(jīng)濟的發(fā)展,科研數(shù)據(jù)開放共享已經(jīng)成為一項必要的公共服務,是否在同一機構內(nèi)的不同團隊間(組內(nèi))進行共享,是否在更大的業(yè)務平臺讓各方參與者共享,是否能在公共服務平臺給予各方包括競爭對手在內(nèi)的無差別共享,甚至在日益推進的開放數(shù)據(jù)運動中與政府信息一道為公民、公眾和國際友人共享等,在考驗新時期的智慧??蒲袛?shù)據(jù)開放共享使得各個組織充分利用他們的核心資源,產(chǎn)生了基于現(xiàn)存數(shù)據(jù)的新的洞見,但同時也帶來了新的道德倫理方面的風險[33]。如何識別和降低這類風險,主要依靠兩種手段:一種是行業(yè)內(nèi)以及社會中的科研數(shù)據(jù)開放共享文化,另一種是圖書館或相關機構合作開展各個利益相關者之間的數(shù)據(jù)對話。

塑造科研數(shù)據(jù)開放共享文化,在制定使用政策時可參考國外已有的實踐和經(jīng)驗[24,34-36]:一部分來自科研資助機構的倡導,一部分來自組織單位的宣傳,也有委托圖書館和信息中心來進行文化建設的。然而,數(shù)據(jù)共享文化的實際成效,仍然來自學科領域內(nèi)不斷增長的共識。以醫(yī)學領域為例[37],數(shù)據(jù)共享文化的范圍至少包括以下方面。

(1)數(shù)據(jù)共享能夠增強對于單個臨床試驗結果的理解,并且相對單一研究的數(shù)據(jù)而言,數(shù)據(jù)共享促進來自多個試驗的數(shù)據(jù)結果匯集,可能促進進一步的科學發(fā)現(xiàn)。

(2)促進數(shù)據(jù)共享中心在科研參與者、最小化安全風險以及尊重醫(yī)學研究作為公共利益本質等方面的道德與倫理討論,產(chǎn)生新的探索領域。

(3)數(shù)據(jù)共享的實踐和科學討論包括:提高研究的精確性,告知治療方案選擇的風險或益處分析,增強合作,加速生物醫(yī)學研究,恢復對于臨床研究企業(yè)的信任等,產(chǎn)生新的探索領域。

(4)數(shù)據(jù)共享參與者的層級劃分尤其重要,避免因數(shù)據(jù)再分析可能得出的不精確或者錯誤結論,但是數(shù)據(jù)再分析也可能產(chǎn)生新的探索領域。

(5)當產(chǎn)業(yè)界、學術界和監(jiān)管機構的領導者已經(jīng)意識到不斷增長的透明度和數(shù)據(jù)共享方面的價值時,文化上的轉變已經(jīng)開始,即主要關注數(shù)據(jù)應該如何被共享,而非數(shù)據(jù)被共享的原因。

數(shù)據(jù)對話是另一種建設數(shù)據(jù)共享文化的方式。數(shù)據(jù)對話[38-39]是讓科研人員一起分享他們的數(shù)據(jù)故事,討論問題,交換想法。無論是關于數(shù)據(jù)的創(chuàng)建、收集、使用、處理、共享和管理,還是從他們自己的失敗中吸取的經(jīng)驗教訓(如數(shù)據(jù)故事),或是在數(shù)據(jù)處理方面的成功,數(shù)據(jù)對話的目的是促進數(shù)據(jù)共享的經(jīng)驗交流,最終達到數(shù)據(jù)共享的目的。人們甚至開始考慮這種來自圖書館和信息中心的數(shù)據(jù)對話,可以作為開放科學的重要組成部分[40]。因此,科研數(shù)據(jù)管理服務在這些實踐上的缺失,往往是系統(tǒng)項目建設所沒有考慮到的核心關鍵問題,目前國外正在逐步建立這類服務的執(zhí)行、評估和檢驗機制,值得國內(nèi)同行關注和參考。

2.4 科研數(shù)據(jù)開放共享的政策

科研數(shù)據(jù)開放共享的一項關鍵問題是如何促進數(shù)據(jù)利用并且保護數(shù)據(jù)權益。數(shù)據(jù)權益是分析和提出問題解決方案的核心,需要系統(tǒng)梳理各利益相關者的角色、權益訴求、政策博弈與政策細節(jié),相關研究對象和研究內(nèi)容包括:國家政府政策、科研資助機構、科研教育機構、圖書館與信息中心、國際出版商、數(shù)據(jù)出版、數(shù)據(jù)知識庫、數(shù)據(jù)管理服務、數(shù)據(jù)管理計劃、數(shù)據(jù)監(jiān)管、數(shù)據(jù)級別計量等。這些政策研究的目的是為了更好地實現(xiàn)對科研數(shù)據(jù)的有效管理。

從系統(tǒng)性、全面性和完整性的角度看,政策研究可以粗略分為兩個部分:一是宏觀的政策內(nèi)容,二是微觀的政策實施細節(jié)。目前主要包括但不限于以下內(nèi)容[41]:

(1)國家行政級別的政策:數(shù)據(jù)驅動創(chuàng)新發(fā)展戰(zhàn)略。

(2)研究資助機構的政策:資助成果的最大化利用。

(3)研究教育機構的政策:知識資產(chǎn)的管理與傳播。

(4)圖書館和信息中心政策:開放信息資源整合利用。

(5)出版團體和期刊政策:新興學術交流體系基礎。

(6)機構知識庫、學術知識庫、數(shù)據(jù)知識庫:內(nèi)容長期可持續(xù)。

(7)數(shù)據(jù)管理計劃:研究工作流程中的數(shù)據(jù)整理備份。

(8)數(shù)據(jù)管理服務:處理數(shù)據(jù)的工具、流程、方法。

(9)數(shù)據(jù)監(jiān)管政策:遴選具有優(yōu)秀質量和價值的數(shù)據(jù)。

(10)數(shù)據(jù)級別計量:承認以及評估數(shù)據(jù)共享的貢獻。

科研資助與教育機構、學術出版界、信息服務機構等學術社群成員目前正在積極聯(lián)合起來,將數(shù)據(jù)治理、科研資助、科研管理與數(shù)據(jù)服務深度整合,充分依托機構知識庫,進行科學數(shù)據(jù)管理,借此有效地提升數(shù)據(jù)資源的利用效率,發(fā)揮“數(shù)據(jù)驅動科研”的重要價值[42-46]。助力聯(lián)合行動的有效落實,一方面需要實踐經(jīng)驗,并且要持續(xù)不斷地改善和更新,以及新的需求導引下的新型試驗;另一方面需要國家科技信息政策研究,以及政策執(zhí)行層面的咨詢與服務。

2.5 科研數(shù)據(jù)生命周期中的數(shù)據(jù)管理規(guī)范

在科研數(shù)據(jù)開放共享的政策框架之下,在執(zhí)行層面需要將數(shù)據(jù)備份、數(shù)據(jù)采集、數(shù)據(jù)遴選、數(shù)據(jù)典藏、數(shù)據(jù)共享作為各自節(jié)點考慮,而不是作為各個環(huán)節(jié)進行服務設計。即數(shù)據(jù)采集也需要考慮數(shù)據(jù)共享,反之亦然;不是把兩者割裂為一個項目的不同組成部分,或者一條流水線上的不同分工,而是同為數(shù)據(jù)開放共享政策中數(shù)據(jù)管理服務的一個整體,只是這項服務是依托數(shù)據(jù)生命周期的架構進行理論上的拆解,但在實踐層面幾乎沒有割裂的情況。

國外的相關機構對于科研數(shù)據(jù)管理服務的經(jīng)驗和實踐案例,可給我們提供借鑒。例如,加利福尼亞大學圖書館(University of California Library)的學術交流、數(shù)據(jù)策展和科研數(shù)據(jù)管理方案和計劃[47-48],約翰霍普金斯大學圖書館(Johns Hopkins University Libraries)、密歇根大學圖書館(University of Michigan Libraries)、羅格斯大學圖書館(Rutgers University Libraries)的科研數(shù)據(jù)服務等內(nèi)容[49-51]。筆者在對已有分析框架深度解析的基礎上,又走訪了一線科研工作崗位人員,其對于科學數(shù)據(jù)服務的反饋結果仍然是過于抽象,具體反映為寬泛而不接地氣,或者過于細致而缺乏優(yōu)先次序。所以在政策執(zhí)行層面的規(guī)范化主要有兩個方面的考慮:一是如何細致完整地描述規(guī)范,這有利于提高質量和準確度,但不利于增加數(shù)量和推廣力;二是如何完成框架性的原則內(nèi)容,這有利于提高普適性和接納特殊情況,但不利于精準核查和量化評估。這兩種考慮方案都具有客觀性,都能成立,而且可以付諸實現(xiàn),但是在科研數(shù)據(jù)管理服務的領域實施,其協(xié)調(diào)性往往欠佳。因此,我們梳理了“五—四—三”方案,即五個數(shù)據(jù)生命周期的節(jié)點:數(shù)據(jù)備份、數(shù)據(jù)采集、數(shù)據(jù)遴選、數(shù)據(jù)典藏、數(shù)據(jù)共享,四種政策規(guī)范要素:固定要素、變動要素、項目數(shù)據(jù)、多源數(shù)據(jù)(見表4),以及三項簡單明了的實施步驟:數(shù)據(jù)存繳層、數(shù)據(jù)存儲層和數(shù)據(jù)使用層。

綜上所述,對于有效的科研數(shù)據(jù)管理,首先要明確數(shù)據(jù)存繳層,即“人”的問題——數(shù)據(jù)的創(chuàng)建者/提供者(Data Creater/Provider),他的任務應該包括創(chuàng)建數(shù)據(jù)、搜集數(shù)據(jù)、處理數(shù)據(jù)、分析數(shù)據(jù)和提供可重用的數(shù)據(jù)。他的權利和責任應該包括[52]:①管理數(shù)據(jù)、存儲數(shù)據(jù)、長期保存數(shù)據(jù);②遵守科研機構與資助機構的政策:為共享和重用而備妥數(shù)據(jù);③符合學科社群與科研機構的標準:遴選、部署、轉換數(shù)據(jù);④考慮數(shù)據(jù)在未來可視化中的法律與倫理問題。

其次是數(shù)據(jù)存儲層:知識庫(Repository),它的任務是監(jiān)管數(shù)據(jù),提供數(shù)據(jù)訪問,提供合適的工具以及整合各項應用。知識庫應該能夠詳述數(shù)據(jù)管理政策,確保系統(tǒng)的日常維護,管理數(shù)據(jù)使之能夠長期使用,保存數(shù)據(jù)的真實性并符合標準規(guī)范,保護數(shù)據(jù)提供者的權益,確保流量用戶的合理獲取并且提供有效的數(shù)據(jù)訪問、重用的工具和可視化工具,以及提供用戶教育培訓等。

第三是明確數(shù)據(jù)使用層,即流量用戶(Downstream user/reuser)的角色、權利與責任。流量用戶可以搜集數(shù)據(jù),通過瀏覽、下載、抽取等行為獲取數(shù)據(jù),或者抽取、操控、重用數(shù)據(jù)、訪問元數(shù)據(jù)以使用、引用和可視化數(shù)據(jù)。但是流量用戶必須遵守許可條款,向數(shù)據(jù)的提供者致謝并有效地管理衍生數(shù)據(jù)。

為了解決理論和實踐相結合的問題,筆者在長期研究和走訪的基礎上,以固定要素和變動要素進行規(guī)范要點的主次區(qū)分,以及項目數(shù)據(jù)和多源數(shù)據(jù)的情境劃分,重新界定科學數(shù)據(jù)權益分析的基本框架,探索在數(shù)據(jù)治理[63]中尚未解決的問題。

3 數(shù)據(jù)館員的發(fā)展

3.1 數(shù)據(jù)館員的角色

開放科學的發(fā)展趨勢以及《科學數(shù)據(jù)管理辦法》的頒布,促進了我國科研數(shù)據(jù)管理服務的發(fā)展,同時也帶動了學術界、教育界、出版界和圖書館界的發(fā)展。數(shù)據(jù)管理服務的核心基礎是數(shù)據(jù)權益,需要從事這項工作的人具有相應的知識、技能、理念和經(jīng)驗,執(zhí)行各項協(xié)作的任務,完成許多尚未預見的法律、信息技術、服務轉型等方面的攻關工作。

眾所周知,社會經(jīng)濟的發(fā)展已從信息時代過渡到大數(shù)據(jù)時代,人類社會所擁有的數(shù)據(jù)量和統(tǒng)計量的增長比以往任何時候都要快,科研人員對于“大智移云”(大數(shù)據(jù)、人工智能、移動服務、云計算云存儲)的需求,促使國外許多圖書館和信息中心設置了數(shù)據(jù)館員的新職位,在美國和西歐,數(shù)據(jù)館員已經(jīng)成為研究型圖書館的一個重要職位。

圖書館員在科研數(shù)據(jù)重用和數(shù)據(jù)中心中發(fā)揮重要的作用,有學者基于過去處理eScience、Science 2.0乃至Open Science的發(fā)展歷程,對圖書館員在其中發(fā)揮的作用進行系統(tǒng)梳理,進而提出了數(shù)據(jù)館員的新角色和新定位[64]。美國圖書館協(xié)會(ALA)正在就這一新興職業(yè)開發(fā)核心競爭力框架,在2018年的國際圖書館大會(IFLA)期間,也有報告建議圖書館和信息科學(LIS)應開設數(shù)據(jù)館員的相關課程,以快速促進這個領域的專業(yè)化[65]。有的學者從數(shù)據(jù)生命周期考慮,基于圖書館員能夠做的事情,提出數(shù)據(jù)館員可以擔當?shù)慕巧校簷C構數(shù)據(jù)知識庫管理人員、政策制定者、數(shù)據(jù)管理計劃咨詢者、數(shù)據(jù)咨詢者、數(shù)據(jù)出版者等[66];也有學者認為應該是以下角色[67]:數(shù)據(jù)管理者(data manager)、數(shù)據(jù)工程師、數(shù)據(jù)管家(data steward)、數(shù)據(jù)監(jiān)護者、數(shù)據(jù)科學家、數(shù)據(jù)檔案管理員等。

我國學者[68]認為,數(shù)據(jù)館員應當與原先的圖書館工作相銜接,可以在大數(shù)據(jù)時代培養(yǎng)幾種不同類型的數(shù)據(jù)館員,如元數(shù)據(jù)館員、科學數(shù)據(jù)館員、數(shù)據(jù)分析館員等。也有學者[69]從終端用戶的需求考慮,認為在圖書館員走向數(shù)據(jù)館員的道路上,可以有選擇性地遴選計算機科學與統(tǒng)計科學中與未來發(fā)展的數(shù)據(jù)科學相關的內(nèi)容進行培養(yǎng)。在2016年的中國機構知識庫學術研討會上,筆者曾經(jīng)做題為《在開放科學中探索數(shù)據(jù)館員的發(fā)展》的報告[70],提出核心目標是“促進開放科學政策成真”,三項任務是:①充分了解和利用開放許可協(xié)議來協(xié)助人們分享和使用文獻;②完全熟練掌握數(shù)據(jù)管理計劃來協(xié)助人們組織數(shù)據(jù);③妥善運用和推廣期刊出版規(guī)范指南來協(xié)助人們選擇發(fā)表刊物。

3.2 數(shù)據(jù)館員的培訓

數(shù)據(jù)科學家、數(shù)據(jù)公民、數(shù)據(jù)館員正在成為創(chuàng)新社會的新興力量,也是推動開放獲取、開放數(shù)據(jù)、開放科學發(fā)展的主要力量。數(shù)據(jù)館員的專業(yè)培訓有助于提升廣大圖書館員的職業(yè)技能,適應信息社會發(fā)展的新態(tài)勢,滿足面向國家科技信息政策的實踐工作的需要。筆者通過中國科學院文獻情報中心開展的科研模式變革與數(shù)據(jù)管理服務方面的研究、咨詢與實踐,根據(jù)定期舉辦數(shù)據(jù)館員培訓班以及每月舉辦的數(shù)據(jù)館員沙龍的總結和經(jīng)驗,整理數(shù)據(jù)館員培訓的課程體系,具體應包括基礎課程和進階課程兩個方面(分別見表5和表6)。

4 結語

科研模式的變革與科研數(shù)據(jù)管理為圖書館事業(yè)的發(fā)展帶來了更多的挑戰(zhàn),也提出了更高要求。圖書館是社會發(fā)展的基礎設施,既要作為公共知識供給的服務平臺,又要成為各種科技創(chuàng)新投入施放的表演舞臺??蒲袛?shù)據(jù)管理是圖書館發(fā)展的新興機遇,圖書館對科研數(shù)據(jù)的發(fā)現(xiàn)、評價與遴選的能力,以及描述、組織、檢索或者分析科研數(shù)據(jù)的能力,在未來至關重要。

在開放獲取、開放數(shù)據(jù)以及開放科學的發(fā)展趨勢上,未來可能的發(fā)展方向依然是持續(xù):①消除知識鴻溝,使得科研人員、公眾和企業(yè)都可以獲得公共資金資助產(chǎn)生的科研成果;②促進知識創(chuàng)新,科研成果公開共享,有利于人們檢視、利用和宣傳優(yōu)秀的科研成果;③打破知識高墻,壓制付費高墻乃至打破數(shù)據(jù)共享壁壘。開放共享戰(zhàn)略可以吸引優(yōu)秀人才,可以在數(shù)字化時代里掌握規(guī)范、規(guī)格、國際學術交流的話語權,在這一過程中,不能缺少圖書館和信息中心的專家的參與。

國家社會經(jīng)濟發(fā)展戰(zhàn)略和科學數(shù)據(jù)共享、科研成果開放獲取正在緊密關聯(lián),數(shù)據(jù)科學家、公眾科學家、數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)管理員等正成為新的職業(yè)??蒲袛?shù)據(jù)管理服務是開放和共享的主要推動力量,盡管人人手上皆有數(shù)據(jù),而且都有所謂的數(shù)據(jù)管理經(jīng)驗,但是整體推進行業(yè)乃至社會經(jīng)濟發(fā)展卻并不容易,在實施過程中可能出現(xiàn)尚未遇到的問題。在促進科研數(shù)據(jù)管理服務以及數(shù)據(jù)共享的過程中,關鍵是要明確目標,清晰權益以及厘清風險,才能使人們更好地認識數(shù)據(jù)的價值、數(shù)據(jù)共享的價值以及科研數(shù)據(jù)管理服務的價值。

數(shù)據(jù)館員的職業(yè)價值應該得到認可。數(shù)據(jù)館員服務于科研數(shù)據(jù)管理,他們的職責不僅是管理數(shù)據(jù),而且是利用學科專業(yè)知識和圖書館學情報學的知識協(xié)助學科館員更好地進行數(shù)據(jù)管理服務;通過數(shù)據(jù)管理服務,圖書館員能更好地服務科研人員,在科研生命周期的各個節(jié)點發(fā)揮重要作用,最終促進開放獲取、開放數(shù)據(jù)、開放科學的實現(xiàn)。 


網(wǎng)絡客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權、違規(guī),請及時告知。

版權所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言