数字馆藏展览研究进展_数据管理论文

数字策展的研究进展,本文主要内容关键词为:研究进展论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       修回日期:2014-06-05

       近年来,关于“digital/data curation”的研究逐步引起业界和学界的重视。而“digital/data curation”是个问世不太久的新概念,在国内也有不同的译法,如杨鹤林[1]将其翻译为“数据监护”,谭榕和亓靖涛[2]把它翻译为“数字监管”,此外,还有“数据存管”[3]“数字策管”[4]“数据管理”[5]等多种理解和译法。而这一概念,在欧洲常用Digital curation,在美国却常用Data curation,国内科研人员在接触相关资料时,由于个人倾向的差异导致了翻译结果多种多样。Curation一词本身来源于拉丁语,原本主要用于文化遗产领域,有策划、筛选并展示的意思,早期的定义是艺术展览活动中的构思、组织和管理工作,通常翻译为“策展”。为保证术语的统一,在无特别说明的情况下,相关概念均译为“数字策展”。本文主要关心的是数字策展这一研究方向下所包含的研究内容和研究进展,并阐述国外学者对其关键问题的界定,以期推动国内相关的理论研究和实践进展。

       1 数字策展的提出过程

       数字策展的提出有着深刻的学术背景和社会背景。特别地,一系列有关数字信息领域的研究报告推动了这一研究的兴起[6]。2003年,在美国国家科学基金会(NSF)发布的《通过信息基础设施推动科学和工程变革》研究报告[7]中提到了数字策展,报告认为在目前的科学研究中缺乏系统且有效的科学数据管理措施,数字信息面临丢失甚至消失的危险。这一报告侧重的是大规模科学和工程数据集合,报告认为应将网络基础设施的实际建设和数字策展联系起来,维护、保存和策展网络基础设施中的研究成果,以便为未来所使用,同时报告建议数字策展的成本应作为基础设施建设资金预先发放,此外还需开展相应的专业教育以应对科学数据管理带来的挑战。

       美国学术团体协会(American Council of Learned Societies,ACLS)[8]在2006年的报告则侧重的是人文社会科学,报告指出在生成、策展和保存信息时,研究者们越来越倚重各类功能完善的系统,而数字策展更多地被认为是对传统数据管理工作的一种扩展。报告将保存和策展看成两个不同的概念实体,前者是维持数据长期存在,而后者则提供存取服务。为了强调数据生产者和数据长期策展工作缺失之间的间隙,报告还指出高等院校及其联盟应该建立用于支持现有人文社会科学研究的新的计算中心,这些计算中心应该具备针对独特数据集合开展高级培训、研究和策展的功能。和NSF在2003年的报告类似,ACLS的报告提出了可持续性运行的模型,同时也强调了要开展相关教育培育。

       2006年,NSF发布的《21世纪信息基础设施发展愿景》研究报告[9]再次关注了数字策展问题,并指出了数字策展的专业化发展和教育实践等存在的问题。而数据密集型科学发现[10]的到来推动了对数据管理或数字策展专业化的巨大需求,这些职业需求可能包括要建立将图书馆学和某一具体学科结合起来的一种新的学位课程(degree program)。目前,这种课程设置已经在国外很多图书情报学院和数据管理机构中有所开展[5]。同时,数据可视化和其他展示技术在解释数据和挖掘价值方面所展现出的力量也要求社会提供能将视觉艺术和科学工程学科结合起来的就业机会。

       由数字保存演化而来的数字策展概念,其内涵至今还处于动态发展之中,许多学者和研究机构也都提出了各自的观点[11-12]。联合信息系统委员会(Joint Information Systems Committee,JISC)指出,数字策展是在数字数据和研究成果的整个生命周期内,维护和利用它们以服务当前和未来的用户的一系列活动。在JISC和e-Science Core Programme(eSCP)的支持下,英国数字策展中心(Digital Curation Centre,DCC)得以成立。DCC认为数字策展的目的是维持和增加数字信息可信部分的价值以满足当前和未来的使用。Lee和Tibbo[13]对此还有着更为具体的阐述,他们认为数字策展包括数字生产者和保管者对数字资源的选择和评价;提供知识存取的新途径;数字资源的冗余存储;格式转换和数据迁移;对某些数字资源开展长期保存等方面的内容。总的看来,数字策展是一项旨在再现和重用可信数字数据和其他数字资产的管理工作。同时,可信和持久数字知识库的开发;合理有效元数据创建和获取的原则;文件格式和数据编码开放标准的使用;信息管理素养的培养和提升等对于数字资源的长期有效和策展工作的成功都至关重要。

       2 主要学术活动主题

       围绕“数字策展”这一概念不断涌现出的各种观点,说明了对该领域展开深入研究的紧迫性。自2004年以来,有关数字策展的学术会议相继出现。特别是近几年,随着学术界对数字策展研究热度升温,众多高等院校和研究机构纷纷组织和开展研讨会,并且形成了一些颇具影响力的国际会议。

       “数字策展”一词首次是出现在由数字保存联盟和英国国家空间中心于2001年10月19日在伦敦举行的国际研讨会“Digital Curation:Digital Archives,Libraries and e-Science Seminar”上[11]。与会者一致认为档案专家、图书情报学家和数据管理专家应在e-Science中展开跨部门领域间的对话。

       由于数字策展与数字保存之间的紧密联系,数字保存领域普遍关心数字策展的研究现状与发展。数字对象保存国际会议(iPRES)是数字保存领域中一个持续时间较长、影响力较大的国际会议,在历次会议中都有着与数字策展的相关议题出现[14-19]。此外,还有一些其他的学术会议活动。比如:2011年世界图书馆与信息大会(IFLA WLIC)就举办了“电子存缴”和“数字策展教育”两个主题分会;2011年Screening the Future会议讨论了音视频数字资源长期保存的成本、安全、工作流程及保存方案等议题;2011年永久访问联盟会议(APA)主要议题包括科学数据长期保存和数字资源长期保存政策等;2011年语义数字档案国际会议(SDA)旨在推动语义网和数字存档的交叉研究;2011年eSciDoc会议关注了高校教育科研数据管理及数据共享的技术和知识;2012年国家档案长期保存会议(NARA)关注了新的挑战和机遇下保存策略的调整;2012年LIBER数字保存会议关注了欧洲数字资源策展项目及相关合作;2013年研究方法与研究成果数字保存国际会议(DPRMA Workshop),探讨了大规模研究数据集处理、方法工具创新以及交叉学科合作等问题;2010年以来连续召开的个人数字存档国际会议(PDA),其中PDA 2013强调了应用各种个人数字资源探寻发现历史记忆。

       在2005年9月,第一届以数字策展为主题的国际会议(International Digital Curation Conference,IDCC)在英国的巴斯举行,主办方为DCC,目前已经连续举办了九届(见表1)。在首届会议上,DCC主任Chris Rusbridge介绍了该中心开展的一系列工作,重点讨论了数字策展的基本概念和原理、全球数字策展政策现状、相关社会法律问题、可持续性及用户需求等议题。

       近期的几次IDCC侧重在数字策展的应用和影响方面。IDCC 2011以“谁引导了开放数据时代?公众,私人,还是个人?”为主题,重点关注了数字策展中的管理、保存和维护,讨论了如何提升数字资源的价值并贯穿到整个生命周期中、如何降低数字资源长期保存中的价值流失和如何应对数字资源老化并有效提升其学术和科研价值等议题。IDCC 2013以“基础设施、情报和创新:共同推动数据科学研究”为主题,讨论了科学研究中数据的作用、数据科学家及人才培养、研究数据管理平台和机构知识库等基础设施的建设和如何实现研究数据创新应用等议题。另外,IDCC 2013还关注了国家层面的数字策展、云服务、研究数据开放以及元数据、数据格式、数据出版等议题[20]。IDCC 2014则以“数据推动科研、教育、商业和社会的转变”为主题,重点关注数据驱动式的发展是如何改变我们周围的世界,识别日益增长的海量性和复杂性数据给科研机构、研究人员、企业和社区带来的机遇和挑战。由于IDCC是目前持续时间较长、影响力较大的专题国际会议,因此本文以该会议为主对数字策展的研究内容和研究进展进行梳理和总结。

      

       3 研究内容及进展

       本文调研分析了第1届至第8届IDCC会议123篇文献,其中大部分又刊登在DCC创办的开放期刊International Journal of Digital Curation上。根据文献调研,数字策展的相关研究大致可划分为6个研究主题:策展工作、应用技术、专业教育与技能培训、基础设施与机构组织、政策规划与法律法规、开放描述与标准规范,表2归纳总结了各个主题当前的主要研究内容和文献分布。从文献数量上看,IDCC重点关注的是策展工作。

      

       3.1 策展工作 策展工作是数字策展的核心内容,IDCC对策展工作的研究主要包括数字策展生命周期管理和各学科领域的数据研究等方面。数字策展生命周期管理有助于保持策展工作的完整性和连续性。Frey[21]指出,随着实验室数据采集范围不断扩大、程度不断加深,采集全生命周期的相关实验环境数据可以帮助研究人员避免诸多问题,同时还提出应将数字策展提升为实验室管理规范,提高元数据质量、数据质量和数据可复用性。Wallis等[22]通过研究生态遥感数据,指出全生命周期的策展工作能够防止原始信息和环境信息丢失。通过调查,他们将数字策展生命周期划分为九个阶段,包括实验设计、校准、采集、清洗、整合、派生、分析、出版、保存,并指出生命周期各个阶段的决策在后期会产生积累效应。Janée等[23]研究了数字策展生命周期中的信息从物理层到逻辑层再到管理层的传递过程,提出要构建一个传递保存基础设施来降低基础信息的丢失风险。Constantopoulos等[24]对DCC提出的数字策展生命周期模型[25]进行了融合改进,规定记录和维护用户体验信息,增加了表示概念、属性和关系的受控词表以提升权威性,并将“知识增强”添加到新的生命周期模型中。

       作为数字策展生命周期的一个阶段,评估和选择策展工作对象成为研究重点。Esteva等[26]就大量复杂数字资源保存现状的评估提出要将交互式可视化技术应用于数据集的特征信息分析中。数字对象识别是策展工作的首要步骤,针对相关识别工具的识别结果缺乏透明度、难以验证等问题,Fetherston和Gollins[27]提出要建立数字对象测试语料库,以检验识别结果,提高识别工具的可信度。GESIS数据档案在欧盟认证和审计框架下启动了认证和审计机制,包括数据审批等流程[28]。

       各学科领域的研究数据作为策展工作的主要对象之一,在历届IDCC中都受到了众多学者的关注。Jacobs和Worley[29]研究了美国国家气象研究中心的研究数据档案(RDA),指出数字策展对于研究气候变化和提高气象预测能力十分重要,提出了保持数字策展可持续性的7个必要条件,包括完善的数据存储软硬件设施、灾备计划、具有良好科学素养的员工、非独占性的数据格式、稳定的人员结构、国内外合作和稳定的资助等。针对工程知识的长期保存,Brunsmann和Wilkes[30]指出,工程知识存在于产品生命周期的各个阶段,经过较长时间的保存,知识的语义和表达都会发生变化,可能导致知识无法重用,因此必须注重知识演化和知识表达技术,使用新的知识表达方法迁移数据。McNally等[31]研究了下一代基因测序(NGS)和环境监测传感网络(ENS)数据流的特征,指出在数据密集型科学研究中,规模、体量和速度等外部属性描述的是数据的“数量”特征,而对持久性、可复用性和计量等内部属性的分析才能揭示数据是如何走向“密集”的。同时,科学仪器分布、数据积累速度、机构合作模式等因素也影响了数据流的特征。Garrett等[32]指出在视觉艺术领域中,没有艺术机构制定研究数据管理政策、相关实践缺乏支持和指导、视觉艺术数据复杂多样且保存难度大,他们提出了视觉艺术数据策展基础框架(Kaptur)。

       研究数据出版也是策展工作的重要组成部分。在天文学等数据密集型科学研究中,产生了大量经过深度加工和分析的数据。在学术出版物中,这些数据通常以图示等形式被描述和解释,但却缺乏有效的缴存机制管理数据,无法验证结果、引证数据和长期存取。对此,Choudhury等[33]实现了一个基于虚拟天文台(Virtual Observatory)的端对端原型系统,并在系统中将数据缴存纳入同行评议,旨在提高科研人员的数据缴存意愿,获取学术出版物的研究数据,促进数据引证研究,并最终建立一个分布式数字知识库网络。Grootveld等[34]也指出,出版物的同行评议中缺乏对研究所涉数据质量的独立评价,提出建立开放研究数据存档,通过同行评议丰富存档数据的元数据。

       3.2 应用技术 IDCC在应用技术方面主要关注了数据保存技术、数据仿真技术和格式管理技术。英国国家档案馆(TNA)以文件格式登记技术(PRONOM)为核心,以面向服务的可拓展架构为基础,提出了数据主动保存技术框架。其中,PRONOM登记了格式唯一标识符和使用风险信息、工具和技术的更新信息和工具适用的格式信息等。更为重要的是,PRONOM能够识别最佳数据迁移格式,并提供最佳的数据迁移路径及所用工具。目前,DCC也在研究表征信息登记技术[35]。

       Brody等[36]在PRONOM的基础上提出了PRONOM-ROAR,在机构知识库的保存信息登记表中添加格式配置文件,监控机构知识库中数据格式的类型和数量变化。StORe项目提出一种中间件技术,在保存研究数据的机构知识库和保存期刊文献的机构知识库之间形成双向连接,实现了从研究成果到研究数据的相互获取[37]。Beagrie等[38]开发了一套KRDS效益分析套件,包括效益分析框架和效益影响分析工具,旨在评估保存研究数据所产生的效益,并通过价值链分析这些效益带来的影响和价值。作为一种先进的分布式数字保存技术,LOCKSS系统利用本地磁盘收集和保存PC服务器发布的内容,并形成网络节点对内容进行审计。但是,在对云存储和本地磁盘存储的成本进行仿真研究后,Rosenthal和Vargas[39]指出,相比于本地磁盘存储,LOCKSS系统的云存储服务并不具有成本优势。

       仿真是一种保护性技术,通过封装数据、软件和环境信息等,待到仿真环境下加载执行,保证了数据的长期存取。Woods和Brown[40]提出了一种脚本仿真技术,在脚本中封装软件运行的环境信息,自动配置和执行仿真环境,减少软件对环境信息的依赖。同时,实现了一种基于环境仿真的工具,能够远程控制数据保存软件,通过Web向用户提供出具存取服务。Hsu和Brown[41]以CD-ROM镜像为研究对象,思考了如何提高封装的数据、软件和环境信息的相关性,保证封装包的有效性。

       格式老化是数据长期保存的一大威胁。澳大利亚国家图书馆(NLA)的AONSⅡ项目开发了一套能够自动识别格式老化风险的工具[42]。作为应对格式老化的技术之一,格式迁移也得到了关注。Frisz等[43]通过实验证实,在多种数据格式并存的环境下,存在格式迁移路径保障多种数据的安全迁移。在格式识别方面,Spencer[44]在使用PRONOM文件格式签名生成语料库的经验基础上,使用用户生成数字对象生成语料库,用于格式识别工具开发和测试。

       3.3 专业教育与技能培训 美国国家科学委员会(NSB)[45]在《21世纪长期数字数据集合的研究与教育》报告中表示了对于缺乏合格的科学数据管理专业人员感到担忧。康威尔管理顾问公司(Cornwell Management Consultants)[46]在一份受JISC资助的《数字保存联盟培训需求分析最终报告》中指出,目前尤其缺乏数字策展专业人员和相关的培训项目。数字策展专业人员的培养是持续开展数字策展工作的重要基础和前提,但是目前这方面的研究稍显不足,历届IDCC主要是从教学课程和培训项目的内容设置来关注这一主题[5]。

       Palmer等[47]认为,在生物学等数据密集型科学中,研究成果的发现依赖科学数据的互通互用、保存共享以及多维尺度的数据集成分析,需要培育具有跨领域知识背景的数据管理人员。为此,他们提出了生物信息专家培养教育计划,包括生物信息专业硕士课程和数据策展课程。在新近课程中,开设了数字策展基础、元数据理论与实践、生态信息学等课程。Ward等[48]研究发现,研究人员存在数据组织形式随意,数据检索和重用困难;数据存储缺乏安全保障与备份;数据共享仅停留于口头等诸多问题。由此可见,不仅需要培养更多的数字策展专业人员,更要让数字策展的观点深入人心。

       Botticelli等[49]从策展教育工作者的角度指出,目前数字策展的教育工作在课程设置和培训项目开展方面困难重重,尤其是界定和选择课程内容、如何将技术应用于实践和如何界定培训项目中涉及的技能。数字策展教育项目得以持续开展的关键在于相关的项目认证能够被市场所认可。由JISC和DCC联合资助的DaMSSI项目回顾、整合和扩展了JISC研究数据管理培训教材RDMTrain的培训内容。DCC在DaMSSI项目的基础上,将课程向数字策展生命周期模型靠拢,并拟定了针对特定学科领域的长期数据管理技能培训规划[50]。DCERC项目[51]关注了研究中心的数字策展教育,开发出一种可持续、可迁移的模型,通过具体实践向图书馆和信息科学专业的学生开展数字策展教育,并制定实施了针对研究生的数字策展教育计划。3TU.Datacentrum开展的数据知识培训,向参与者提供在线资源和培训,旨在传递交流数据管理知识,提高受训人员增加数据附加值的能力。该培训将掌握信息和通信技术、图书馆专业知识和企业家精神等作为核心能力,并设计了包括热门话题、数据管理、专业技能和咨询技能的模块化课程[52]。

       3.4 基础设施与机构组织 目前,针对基础设施与机构组织研究,IDCC会议集中关注了基础设施的研究和建设。加利福尼亚数字图书馆指出,以数字保存为核心目标的机构知识库,需要大量部署数据存储系统,难以快速响应用户需求,无法长期持续管理和运行。在新一轮机构建设中,加利福尼亚数字图书馆将数字策展作为机构的建设和发展目标,以程序化的数字策展流程指导实践工作,开展面向服务的数字策展,提供松散耦合的服务[53]。Chronopolis数字保存网络整合了数字图书馆和数字网格,提供数字资源长期保存和跨领域资源共享,它利用现有的教育研究网络和大规模存储基础设施投资,试图提高加州大学圣迭戈分校等项目参与方的数据存储能力,构建一个异构冗余的数据保存系统[54]。在美国高校的数字策展研究中,有望成为“数字信息管理中心”的部分图书馆和数据中心在传统信息资源管理基础上向外快速延伸,乔治亚理工大学也正在推进数字策展项目。但是这些项目大多为高校自主开展,缺乏更高层的指导和激励,在机构层面难以获取推动数字策展项目发展的资源[55]。

       牛津大学的Edicsr项目研究了科学研究中的机构数字策展服务嵌入,Sudamih项目研究了人文社会科学领域的数据管理基础设施开发,Edicsr和Sudamih的开展推动了牛津大学的校内合作。为了建设满足全校科研需求的基础设施,科研人员广泛参与了Edicsr和Sudamih的基础设施研究,包括校内政策规划、研究数据存档系统设计、基于Web的数据库创建与共享、培训资料制订等方面[56]。

       同时,部分学者关注了基础设施建设中的机构合作。国家数字信息基础设施和保存项目(NDIIPP)提出要构建一个数字信息资源保存国家合作网络,该网络连接了来自不同国家的数字信息生产方、管理方和服务提供方。总结以往的合作经验,NDIIPP指出,在数字保存合作中各方相对重视元数据、格式标准和工作流程等方面的互联互通,但忽视了数字保存生命周期各个层面出现的其他互联互通问题,例如:研究机构和商业组织的管理运作模式协同、复杂的合作网络下研究数据的互联互通、机构的元数据标准难以向更高层面迁移扩展等[57]。Day[58]指出,国家图书馆是从国家层面开展数字保存合作的关键,目前众多的国家图书馆已经参与到NDIIPP等国家合作网络中,它们通过互设协调机构、项目嵌入和研讨会等多种方式与其他机构开展合作。同时,Halbert[59]指出,NDIIPP等官方推行的数据保存合作项目忽视了中小型图书馆、档案馆、艺术馆和博物馆等文化记忆组织(CMOs)在数字文化资源方面的数字保存需求。针对这一问题,出现了一种新的公益性合作网络(MetaArchive Cooperative),它以LOCKSS技术为基础,建立了一种共享基础设施,为中小型文化记忆组织提供低成本的分布式数字保存解决方案。

       3.5 政策规划与法律法规 目前,IDCC会议对于这一主题的研究主要集中于数字策展的政策规划及其执行情况,而对数字策展涉及的法律问题鲜有提及。

       PLEDGE项目对数字档案馆和机构知识库等执行的数字策展政策进行了调研,对相关政策进行了鉴别和分类,并对政策执行过程中涉及的相关规则进行了定义。项目认为,标准化的数字策展政策有利于策展机构的政策解读和政策迁移[60]。Innocenti等[61]指出,政策框架是数字图书馆和数字知识库的运行基础,政策互通是数字图书馆和机构知识库等实现互联互通的重要前提。政策互通,即政策互换和政策重用,是更高级的政策标准化。

       DCC认为切实有效的政策框架是评价策展机构的核心标准。DCC从2008年起就开始跟踪研究英国的数据政策,发现《数据政策共同准则》和《研究数据政策框架》主导了英国数字政策的转变。受政策转变影响,许多策展机构改进了机构的政策和基础架构[62]。Bicarregui等[63]认为,在大数据的和跨国合作的大型研究项目中,需要以政策规划推动项目的数据管理规划,从政策层面确保项目的数据管理在其成员国法律框架内开展、充分释放项目的数据管理资源、明确项目的数据开放原则、制定项目的数据保存目标。

       Pryor[64]针对爱丁堡大学生命科学领域的一些案例研究总结到,目前由国家政策推动的数据共享效率低下,推动国家层面的数据共享,需要政策制定者和研究者开展自底向上的合作。Faniel和Zimmerman[65]也对数据共享现状进行了反思,他们认为导致数据共享效率低下的主要原因是目前许多学科领域难以应对长期大规模数据共享带来的挑战,难以预知数据的策展价值,难以选择合适的数据保存方法。对此,他们提出了三点建议,即促进数据共享和重用的广泛参与、增加各类共享中介的数量、生产更多的数字产品。DataRes项目调查还发现,目前部分高校执行数字策展政策的情况不容乐观,对数字策展工作持观望态度的高校居多[66]。

       3.6 开放描述与标准规范 从开放描述与标准规范的视角研究数字策展,主要包括元数据、标识符、标准框架等方面的内容。

       Vardigan等[67]认为,数据文档作为一种元数据,能够提高数据集的有效性和准确性。标准化的数据文档在数据存取、数据质量、数据长期保存、决策支持等方面都大有裨益,数据文档方案(DDI)覆盖了研究数据的生命周期,支持元数据重用和比较。将元数据及相关语义信息嵌入数据文档,可以促进e-Research服务和数据长期保存,也便于用户缴存数据和数据出版。对此,Sefton等[68]提出了一项元数据嵌入技术,将元数据和元数据元素的内在层次关系等信息嵌入到文档中。Matthews等[69]指出,目前虽然有许多针对不同领域和数据源的元数据,但是涵盖科学数据基本结构的元数据模型还相对较少。为此,他们提出了核心科学元数据模型(CSMD)。CSMD以数据为导向,定义了科学研究结构的层次模型,包括调查、主题、关键词等九个核心实体。在其元数据结构中,包括科学行为模型、科学数据模型和相关参数等三部分。CSMD的提出,为科学数据的统一管理和存取提供了新的途径,尤其是化学、材料科学和地球科学等领域“结构化”特征明显的科学数据。与CSMD不同,Yarmey和Baker[70]提出的科学元数据标准参考框架强调的是不同研究群体在制定和修改元数据标准过程中的动态参与和合作。该框架采用分层结构,清晰描述了科学元数据“标准化”的动态过程。

       数据的评价、保存、引证和出版等多个环节都要涉及标识符的构建。针对科学数据保存和应用,Wynholds[71]认为其标识符必须达到4点要求,即数据集为语义逻辑混合对象,数据集标识符是内嵌的和不可分离的,标识符体现了作者、权利、约束的框架,标识符转换为可行的检索和引用机制。Callaghan等[72]根据NERC环境数据中心的实践指出,相比于URL,数字对象标识符更适用于数据引证和出版。

       各种标准框架的研究涉及数字策展的多个方面。Knight和Hedges[73]在首届IDCC上就提出要以开放档案信息系统(OAIS)为机构知识库标准框架,并研究了多个机构知识库之间OAIS的开放共享。之后,Jantz[74]提出了可信数字对象生成标准框架,该框架旨在保证数字对象的持续可信。在该框架中,数字策展机构的工作被划分为三段模型,即数字采集与描述、存档和生命周期管理,嵌入了基于公钥密码体制的数字签名与CA认证,同时要求采用公认、准确和完整的元数据描述。DCC就数字策展过程中的标准选择问题提出了DIFFUSE标准框架,该框架建立了基于DCC策展生命周期模型的数字策展相关标准数据库,并提供可视化查询工具。用户可以依据其所处的不同策展阶段选择相应的标准框架,也可以对比发现现行策展规划中的不足[75]。

       4 总结与展望

       传统的数字保存注重数字资源的长期存取,强调在经历环境变迁和技术老化等影响之后数字资源的可获得性和有用性。与数字保存不同,数字策展注重数字资源的管理和价值提升,强调数字资源的动态改进和更新、数字资源价值发现和重用。数字策展以数字保存为前提和基础,包含的内容更加宽泛和全面。目前,国内的相关研究以数字保存为主,对数字策展的研究还处于引入和介绍阶段。

       本文对IDCC的相关会议文献内容进行了梳理,将其分为策展工作、应用技术、专业教育与技能培训、基础设施与机构组织、政策规划与法律法规、开放描述与标准规范这6大主题。进一步地,可以总结出当前数字策展的主题框架,如图1所示。主题框架中包括三个部分,其中策展工作是核心部分,其他5个主题分为两大部分围绕策展工作展开。应用技术、专业教育与技能培训、基础设施与机构组织三个主题作为一部分,从微观上支撑和推动策展工作。政策规划与法律法规、开放描述与标准规范两个主题作为一部分,从宏观上引导和规范策展工作。策展工作作为具体实践,对其他两部分形成反馈。

      

       图1 数字策展的主题框架

       从表2来看,过往的八届IDCC研究重点集中于策展工作;对于政策规划与法律法规和专业教育与技能培训关注最少,特别是在数字策展所涉及的缴送制度、知识产权、隐私保护等政策法规问题和数字策展教育培训的内容、形式和人才培养机制等方面;而对数字策展中的资源数字化、数字资源评估认证、数字资源价值管理、数字策展服务体系建设和机构审计等方面IDCC也缺乏系统的研究成果。

       IDCC缺乏关注的这些内容需要加强研究,同时也为未来我国数字策展研究提供了以下三个方向:a.加强宏观战略研究。政策规划、法律法规、标准规范等能在宏观上引导和规范策展工作,国外相关实践项目已经开始探索建立可靠的数字策展和数字保存机制,来保障符合成本-效益的解决方案,并支持大规模实用系统的研发和应用。在这点上,我国还缺少对相关宏观战略的研究。b.积极开展教育培训。结合孟祥保和钱鹏[5]对国外数字策展专业教育实践的调查结果来看,国外相关教育机构对数字策展教育培训的内容也不一致,处于探索阶段,且与e-Science、大数据等结合的还不是很紧密。数字策展教育培训具有实践性和实用性,因此高等教育机构特别是图书情报、信息管理相关学院应当发挥作用,结合自身特点和优势,积极探索课程设置上的改革。c.努力转向技术实践。从IDCC重点关注在策展工作上可以看出,国外的研究已经从概念框架转向技术实践,并在不同的研究机构中积极应用,迈出了从理论到实践的重要步伐,但我国还处于概念引入和介绍阶段。因此,需要努力探索在不同技术和管理模型下的最佳实践经验。

标签:;  ;  ;  

数字馆藏展览研究进展_数据管理论文
下载Doc文档

猜你喜欢