数字人文仓储的构建与实现,本文主要内容关键词为:人文论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数字图书馆(Digital Library)、数字档案馆(Digital Arc hive)和数字博物馆(Digital Museum)是公共文化机构应用现代信息技术整合传统资源而发展出的新服务形态,由于服务模式的相似性和业务范围的交叉性,它们的整合与共享一直是学术界思考的重要问题。目前,学术界对图书馆、档案馆和博物馆资源整合问题的思考大多基于垂直整合策略[1],即建立图书馆、档案馆和博物馆数字化联盟,基于三方公共技术平台进行相关信息资源的整合,通过一体化门户向大众提供服务。然而,我国的图书馆、档案馆和博物馆均隶属于不同的行政部门,各自为政的管理体制使垂直整合策略的实施面临巨大的阻力,短期内难以实现根本性突破。因此,在垂直整合策略之外,在不打乱现有公共文化机构管理秩序的前提下,探索新的整合模式就成为推动图书、档案、文物数字化服务融合研究和实践的迫切需要。 1 数字人文仓储的建设背景 图书馆、档案馆和博物馆资源水平整合策略最典型的应用就是特色馆藏资源建设,一般是围绕主题进行相关信息资源的广泛搜集,图书、档案、文物都可能被纳入对应主题特色馆藏的范畴。由国家推动的文化信息资源水平整合可以追溯到本世纪初期启动的“国家文化信息资源共享工程”[2]。2002年6月,为了促进文化信息资源的传播和共享,文化部和财政部共同启动了“文化信息资源共享工程”,应用现代信息技术,将中华优秀文化信息资源进行数字化加工与整合,依托各级公共图书馆、文化馆(站)等公共文化设施,通过互联网、广播电视网、无线通信网等新型传播载体,在全国范围内实现中华优秀文化资源的共建共享。“文化信息资源共享工程”的主要任务是围绕特定主题整合相关信息资源,由各级分中心和站点开发具有区域文化特色的主题信息资源数据库或者网站并向社会大众提供浏览服务。各分中心和站点在进行特色主题文化资源库或网站建设过程中,数字图书馆、数字档案馆和数字博物馆是其中最为重要的三个来源。基于主题信息资源库的文化信息资源共享模式在保障公民基本文化权益,满足社会大众基本文化需求方面发挥了重要作用,也面临着一系列迫切需要解决的挑战和问题。例如,文化信息资源库规范化程度低、文化信息资源著录深度不够、公众参与度不高等,亟待进行改革与升级,探索更加科学有效的文化信息资源保存和服务体系。 “文化信息资源共享工程”是“社会信息化”进程中基于互联网进行的公共文化信息资源传播,目前正面临着“社会智慧化”潮流的巨大挑战。从需求角度来看,用户对文化信息资源获取和利用正呈现出一系列新的特征,主要表现在:(1)集成性需求,即用户希望实现信息资源的集成获取,可以通过单一入口访问到原本需要从多个异构系统中逐一检索的各类文化信息资源;(2)专业性需求,即用户希望不仅仅访问到文化信息资源的数据本身,还能够从中获取数据所蕴含的知识体系,从对文化信息资源浅层数据的关注过渡到对文化内容本身的关注;(3)精确化需求,即用户希望信息检索过程中,计算机系统能够相对准确地理解用户的检索需求,尽可能减少自然语言歧义和多义现象对检索结果的干扰,为用户提供与需求基本一致的检索结果;(4)智能化需求,即用户希望计算机系统可以基于某种推理规则,对检索结果进行一些智能化处理,例如同时提交近义词的检索结果等;(5)互动性需求,即用户希望在接受文化信息服务的过程中不仅与技术系统进行交互,而且可以与领域相关人员有互动和交流,促进领域知识更好地理解和传播。 上述需求对“文化信息资源共享工程”的完善和升级提出了新的思路和方向。在数字图书馆、数字档案馆和数字博物馆等大众化数字文化信息服务难以满足特定群体深层次信息需求的情况下,依托文化信息资源共享工程的技术平台,建立面向主题领域的小众化、专业化、精细化、智能化的深层次信息服务模式,成为公共文化服务体系的重要补充和趋势,也成为文化信息资源服务创新的重要源泉。基于水平整合策略和数字人文(Digital Humanities)理论,构建基于特定主题的文化信息资源数字仓储(Digital Repository)和面向用户群体深层次需求的多功能复合服务形态,就成为解决这一问题的重要思路。本文将这种特定人文社科科学主题领域内,集数字图书馆、数字档案馆、数字博物馆等功能于一体的新型数字信息服务形态称之为“数字人文仓储”(Digital Humanities Repository,DHR),并对其建设背景、概念内涵、架构模型、实现思路等基础问题进行分析,进而探讨“国家数字人文基础设施建设工程”的策划和实施等问题。 2 数字人文仓储的概念界定 “数字人文仓储”是与文化信息服务集成化、精细化、智能化潮流相适应的服务形态,其出现具有一定的必然性,对其概念和内涵的准确界定是进行理论和实践探索的前提条件。 2.1 “数字人文仓储”的定义 “数字人文仓储”(Digital Humanities Repository)是“数字人文”与“数字仓储”两个领域的合成概念,是数字人文项目实现的技术基础,也是数字仓储技术在人文社科领域的应用方式。 “数字人文”(Digital Humanities)是近年来西方国家逐步发展起来的新兴的研究领域,目前全球已经有超过180所大学相继成立了数字人文领域的研究和服务机构。“数字人文”是指围绕人文社会科学领域特定研究对象知识本体数字化保存和应用所进行的相关信息资源采集、加工、组织、服务、研究、教育等活动的总称[3]。“数字人文”的精髓就是在人文社会科学领域数字对象内容的深度整合的基础上开发与之相关的各类应用,满足用户群体的深层次需求。数字人文项目是数字人文建设的关键,一般具有六大特征[2]:面向主题(Subject Oriented)、关注本体(Ontology Focused)、基于数字仓储(Digital Repository Based)、跨学科整合(Cross-Disciplines Integration)、多机构协同(Multiple Institutions Collaboration)、持续性开发(Long-Term Development)。因此,数字仓储是数字人文项目顺利进行的基础,也是数字人文项目研究成果展示的主要平台。 “数字仓储”(Digital Repository)是在数据仓库(Data Warehouse)基础上发展而来的一个概念。数据仓库是计算机科学发展多年的领域,是指面向主题的、集成的、稳定的、随时间变化的数据集合,主要通过对多种来源的数值数据进行集成保存进而为决策支持系统提供支持。把数据仓库的开放性和集成性特征应用到数字对象的管理和保存领域,就产生了“数字仓储”的概念。“数字仓储”是在网络环境下为各类数字对象提供保存和管理服务的系统,进行保存的数据内容和形式呈现出高度多样性特征。一般而言,数字图书馆、数字档案馆和数字博物馆只保存特定专业领域内的数据,而“数字仓储”是一种通用型的数据保存环境,与主题相关的各类文本、图片、音频、视频、网页等数据都可以被纳入保存的范畴。数字仓储可以分为机构仓储(Institution Repository)和领域仓储(Domain Repository)两种类型,前者是组织机构提供集成数据保存服务,例如为分散在各地的分支机构提供一体化的数据仓储服务;后者实现某一学科领域多类型数字对象的集成访问,例如根据特定主题或者特定学科进行学术资源的集成仓储。由于Repository含有知识库之意,所以数字仓储涉及的各类数字对象并不是简单的保存关系,而是要按照知识管理思想从内容层面上进行数字对象的深度整合。近年来,数字仓储领域发展迅速,大量基于DSPACE、Fedora等平台的数字仓储系统被开发出来,成为组织推行知识管理的基础技术架构。 综上所述,“数字人文仓储”是指在人文社会科学领域特定主题领域内,基于研究对象知识本体进行相关数字对象的采集、加工、组织和保存,并为对应用户群体提供集成化、专业化、精确化、智能化、互动性服务的信息系统及相关资源的总和。数字人文仓储是数字人文项目的信息资源基础,有助于推动人文社会科学领域数字对象的深度整合,提高特定领域专业化信息服务的质量,满足目标用户群体深层次服务需求,从而促进数字信息技术与人文社科领域专业知识的融合,最终推动人文社会科学研究范式的转型。 2.2 “数字人文仓储”与相关概念 “数字人文仓储”与一系列学术概念紧密联系又相互区别: (1)“数字人文仓储”与“文化信息资源库”。“文化信息资源库”是对集中保存和管理文化信息资源的技术系统的总称,常见的文化信息资源库大多基于网络环境,通过数据库或者主题网页来保存文化信息资源。“数字人文仓储”是文化信息资源库的一种表现形式,与常见的文化信息资源库按照主题分类进行信息组织不同的是,“数字人文仓储”是基于本体进行相关信息资源的采集和组织,文化资源对象所蕴含的知识体系也纳入保存范围,因而“数字人文仓储”可以看作是建立在知识管理层面上的主题文化信息资源库,即主题文化知识库。 (2)“数字人文仓储”与“数字图书馆”。由于Library一词具有多种含义,除了我们一般理解的主要用来保存图书文献的图书馆之外,Library还包括了个人收藏、资料库等含义。如果从广义的角度来理解,“数字人文仓储”实际上也是Digital Library的一种表现形式。在实践中,很多本质上属于数字人文仓储的信息系统对外使用的名称是数字图书馆,例如美国弗吉尼亚大学藏学中心建立的“喜马拉雅数字图书馆”所收藏的信息资源并不限于图书、论文等文献资料,大量与藏学研究有关的图片、音频、视频等资料也在收藏的范围[4]。本文认为,围绕特定主题进行信息资源服务多维度聚合服务与图书馆为社会大众提供基本图书文献资料信息服务具有多方面的差异,其建设思路也是不同的,为了避免概念冲突,本文从狭义视角进行数字图书馆概念界定。 (3)“数字人文仓储”与“数位典藏”。“数位典藏”(Digital Archive)是我国台湾地区的学者在推动数字人文项目建设过程中提出的概念,其基本思想是通过信息技术手段将文化资源所蕴含的信息真实、完整地保存到长期可读的数字档案当中并提供与之相关的各类利用[5]。台湾地区于2008年启动了面向整个地区的“数位典藏科技计划”,先后召开了四届“数位典藏与数位人文国际学术研讨会”,包括台湾大学在内的多所学术研究机构和博物馆参与了该计划。“数位典藏”即“数字典藏”,就概念而言,“数字人文仓储”(DHR)与我国台湾地区的“数位典藏”(DA)的范畴基本一致,只是“数位典藏”更强调对文化信息资源的档案化保存和管理,而对数字图书馆、数字博物馆相关的展示、互动等功能关注相对较少。 (4)“数字人文仓储”与“文化遗产数字化”。“数字人文仓储”与“文化遗产数字化”都属于计算机等现代信息技术在文化资源保护领域的应用,但是“文化遗产数字化”主要强调文化遗产相关信息的数字化采集技术和过程,而“数字人文仓储”更多地强调基于文化资源本体实现文化资源数字化成果的深度整合与共享。因此,“数字人文仓储”可以看做是基于文化遗产数字化成果构建的主题领域知识库。 可见,“数字人文仓储”是与数字图书馆、数字档案馆和数字博物馆不同的一种文化信息服务形态,主要表现在:第一,数字人文仓储所保存信息资源的内容只限于具体的主题领域,而数字图书馆、数字档案馆和数字博物馆往往没有明确的主题,需要从服务大众的角度出发收藏各类主题的信息资源;第二,数字人文仓储所保存信息资源的形式极为广泛,可以囊括与主题相关的各类数字对象,无论这些数字对象的内容来自图书、档案还是文物,其格式是文本、图形、图像、音频、视频还是多媒体复合文件;第三,数字人文仓储要在知识管理层面上实现信息资源组织和保存,对信息资源标注要求比一般的信息管理系统要高,本质上是针对人文社科领域特定主题建立的文化知识库;第四,数字人文仓储提供的信息服务具有集成性特征,融合了数字图书馆、数字档案馆、数字博物馆、数字出版社、数字社群等在线信息服务的多重特征。 3 数字人文仓储的体系架构 数字人文仓储是围绕特定主题构建的数字对象多功能复合服务系统,是多种数字化服务功能的融合与集成,根据数字人文仓储的定义和原理对其体系架构进行分析,结果如图1所示。 图1所示的数字人文仓储模型整体分为人文实体界定、领域本体建模、人文实体数字化采集与归档、跨库信息资源搜集和导入、多源信息资源的知识组织和存储、多维度聚合服务等模块,各模块的主要任务简要介绍如下: (1)人文(Humanities)实体。数字人文仓储是面向主题的,因而整个仓储必须围绕特定的研究对象进行,这个研究对象就是“人文实体”。人文实体可以分为多种类型,特定的学科、古籍、文物、建筑、绘画、音乐、舞蹈等都可能成为实体的表现形式,从而使数字人文仓储具有丰富多彩的形态。例如,“敦煌学数字仓储”、“《大藏经》数字仓储”、“唐卡数字仓储”、“故宫建筑艺术数字仓储”、“民歌数字仓储”等。 (2)人文领域本体建模。数字人文仓储是通过信息资源的采集和组织实现人文实体的虚拟保存,因而建立人文实体的本体模型是构建数字仓储的重要基础。领域本体建模是一项复杂的任务,需要按照知识本体工程的规范和流程进行构建并根据实际应用情况进行持续完善。 (3)人文实体数字化采集与归档。在领域本体建模完成以后,就可以参照本体模型对人文实体数字化加工成果的类型进行详细规划,根据需要进行相关数字信息资源的采集。例如,通过摄影或二维扫描设备进行古籍、绘画等人文实体的数字化拍摄或扫描,通过三维扫描设备进行建筑、文物等的立体数字扫描,通过音频信息技术进行歌曲、语言等声音信息的数字化采集,通过视频拍摄或者动作捕捉技术对舞蹈进行数字化记录和采集。各类数字化采集成果根据数字仓储建设需求进行格式转换,基于领域本体进行知识标注后归档保存到数字仓储系统当中。 (4)跨库信息资源搜集与导入。除主动采集途径之外,从数字图书馆(DL)、数字档案馆(DA)和数字博物馆(DM)检索和导入也是数字人文仓储的重要来源。搜集来自数字图书馆、数字档案馆和数字博物馆的信息资源可以采用虚拟集成和实体导入两种方式,前者主要是基于开放文献元数据收割协议OAI-PMH进行元数据采集和处理,按照统一的界面对外发布,信息的访问仍然是从原有路径进行;后者是将相关文献信息资源进行下载和加工后导入数字仓储库,实现了数据的实体集成。在检索过程中,可以根据领域本体进行检索词的扩展,尽可能全面地搜集来自图书馆、档案馆和博物馆的相关信息资源。在转换过程中,需要基于领域知识本体对各类信息资源进行深度标注,以满足智能检索的需求。 (5)多源信息资源的知识组织与存储。从数字化采集、跨库搜集两种途径获取主题领域内的信息资源以后,需要基于领域知识本体进行各类信息资源的标注与存储,以实现人文实体各类属性在信息技术环境下的数字化再现。由于数据来源的多样性,采用统一的元数据格式成为信息共享的前提条件。具体采用哪种数据格式,需要根据人文实体的类型来判断,可以选择与该实体类型最匹配的一种元数据框架同时兼顾其余类型,例如文化遗产语义元数据模型CIDOC CRM、电子档案描述框架EAD或者书目记录的功能需求模型FRBR等。如果人文实体是某个学科领域,来自图书馆、档案馆和博物馆的信息资源数量都很多,则可以转换为通用型的元数据模型,如Dublin Core、RDF等。 (6)多维度聚合服务。数字人文仓储通过对主题信息资源的搜集和保存,基于数字人文仓储平台,为特定群体提供多维度智能信息服务,满足用户群体的深层次信息需求。这里的多维度服务是指对用户群体而言,数字人文仓储平台提供的信息服务同时融合了多种大众化信息服务的资源和特征,主要有:①主题数字图书馆(Humanities-Digital Library,H-DL),提供与主题相关的各类文献信息资源在线服务;②主题数字档案馆(Humanities-Digital Archive,H-DA)提供与主题相关的各类数字档案在线服务;③主题数字博物馆(Humanities-Digital Museum,H-DM)提供与主题相关的各类场景和实物的在线展示服务;④主题出版社(Humanities-Digital Press,H-DP)提供与主题相关的各类图书、期刊的在线发布或发表服务;⑤主题社群信息中心(Humanities-Digital Community Center,H-DCC)为对主题有持续兴趣的目标用户群体提供沟通和交流服务。 总之,数字人文仓储是在人文社会科学领域范围内为目标用户群体所提供的融数字图书馆、数字档案馆、数字博物馆、数字出版社、数字社群等功能于一体的小众化、集成化、智能化信息服务形态,是公共信息机构大众化信息服务的重要补充和深度拓展,具有重要的社会价值。 4 数字人文仓储的实现思路 “数字人文仓储”是数字仓储在人文社科领域的具体应用,其实现必须综合考虑制度、技术和管理等多重因素,最终推动数字人文仓储在我国文化信息资源共享工程中的应用和发展。 4.1 数字人文仓储的建设规范 数字仓储建设是涉及多种因素的系统工程,在技术、安全、管理等多个方面存在使信息服务不可持续或信息内容无法被信任的风险,为了确保数字仓储的可靠性,美国研究图书馆学会(RGL)在1996年就提出了“可信任数字仓储”(Trusted Digital Repository,TDR)的概念,并在2002年发布的研究报告《可信任数字仓储:属性与责任》中对其进行了详细阐述[7]。2006年12月,德国Nestor项目组发布了《可信任数字仓储标准目录》,致力于保障数字信息存储的真实性、完整性、保密性、易获性[7]。2007年,美国国家文件与档案总署NARA与研究图书馆学会RLG联合发布了《可信任的馆藏审计和认证:标准和清单》(TRAC),提出3大类共计84项认证规则[7]。同年,欧盟的“数字欧洲保存项目”(DPE)发布了《基于风险评估的数字仓储审计方法》[7]。2011年,国际空间数据系统咨询委员会发布了题为《可信赖数字仓储的审计与认证》的技术报告[7]。2013年,国际标准化组织ISO发布了标准《ISO 16363可信任数字馆藏的审计与认证》,首次提出了国际通用的数字仓储认证标准[7]。 数字人文仓储作为数字仓储的典型应用,建设过程中可以参照可信任数字仓储认证的国际标准,结合我国文化信息资源共享的现实需求,制定数字人文数字仓储的建设规范。一般需要从以下几个角度进行考虑[8]:(1)组织体系。必须具有严密的组织体系和专业化的工作人员,在政策、资金、法律等方面能够提供长期而稳定的支持。(2)基础设施。数字仓储系统必须具有良好的软硬件配置并对存储过程中的各类风险有应对的措施和方法。(3)系统功能。数字仓储系统必须维护所保存的数字对象的完整性、真实性、可用性、保密性,确保数字对象在现在和未来可查找、可参考、可识别、可转换的能力。此外,考虑到数字人文仓储对领域知识专业性的要求,还需要在构建必要的数字对象鉴定机制,通过专家团队和用户群体相结合的方式对数字对象内容可信程度进行判定,以保障通过系统发布的各类信息资源具有可靠性和可信性。 4.2 数字人文仓储的技术架构 数字仓储源于机构保存其多样性数据的基本需求,其概念提出以后得到了学术界和企业界的广泛关注,全球多家研究机构都曾经开发过数字仓储领域的应用软件,例如商用数字仓储软件有ArchivalWare、CONTENTdm、DigiTool、VITAL等,开放源代码的数字仓储软件有DAITSS、DSpace、EPrints、Fedora、Greenstone、Keystone DLS等[9]。数字人文仓储构建过程中,需要结合人文实体对象应用需求进行程序模块开发,因而采用开放源代码软件较为适合。在开放源代码数字仓储软件系统当中,Dspace和Fedora的应用最为广泛。 (1)DSpace。DSpace(数字空间)是由美国麻省理工学院(MIT)和惠普(HP)公司联合开发的开放源代码数字对象存储系统,可以收集、存储、索引、保存、发布任何数字格式的永久性数字对象。DSpace可以接受的电子化材料包括:论文与预印稿(Articles and preprints)、技术报告(Technical reports)、雇用证书(Working papers)、会议论文(Conference papers)、电子论题(E-theses)、统计数据、地理信息数据、Mat lab文件、图像文件、声频文件(Audio files)、视频文件(Video files)、学习资源(Learning objects)等[10]。DSpace提供了“位存储”(Bit preservation)和“功能存储”(Functional preservation)两种不同的数字对象存储方式,位存储保证提交的数字材料没有任何改变;功能存储是随着时间的变化改变存储内容的格式,以保证数字对象可以通过最新的应用软件进行读取和利用。DSpace中设定了很多数字空间群,工作人员被设定为提交者(Submitters)、审核者(Reviewers)、终审者(Coordinator)等角色,可以分派给不同的人去承担从而组成角色群或称“电子工作组”(e-Person group)。DSpace系统是一个开放源代码的软件平台,可以从其网站上免费下载,可以自由使用、复制和修改。 (2)Fedora。Fedora即灵活可扩展数字对象仓储架构(Flexible Extensible Digital Object Repository Architecture)[10],是由美国康奈尔大学(Cornell University)和弗吉尼亚大学(Virginia University)合作开发的数字对象存储系统。数字对象(Digital Object)和仓储架构(Repository Architecture)是Fedora的两大核心概念,通过数据流将文本、图像、期刊、数据集、多媒体数据等数字对象及其操作封装起来。仓储框架是Fedora系统的整体结构,主要提供系统维护、访问、存储、安全、服务等模块。Fedora广泛适用于图书馆、档案馆和博物馆的数字内容管理领域。 参照DSpace和Fedora的技术架构,数字人文仓储的技术实现可以通过数据存储层、业务逻辑层和Web服务层三个层面来完成。其中,数据存储层主要是实现数字对象和保存并实现读、写、删等操作;业务逻辑层是对数字对象仓储相关的安全管理、工作流管理、内容管理、存取管理等功能进行界定和支持;Web服务层是仓储功能的最终体现,需要围绕数字人文仓储实体对象的类型设计不同的应用形式,在领域范围内实现数字图书馆、数字档案馆、数字博物馆和数字出版社等功能的有机融合。根据数字人文仓储的定位,系统在实现过程中要基于知识管理理念和技术,发挥领域本体在数据处理和数字对象组织过程中的作用。 4.3 数字人文仓储的推进策略 数字人文仓储是“国家文化信息资源共享工程”升级和创新的重要方向,可以有效解决层级文化信息资源库服务模式存在的信息量少、缺少深度关联、与用户群体互动少等问题,提高我国公益性数字文化服务的质量。根据数字人文仓储的特征,对于我国文化信息资源共享工程当中的应用和发展提出如下建议: (1)适应社会“智慧化”潮流,在“国家文化信息资源共享工程”基础上,策划和实施“国家数字人文基础设施建设工程”。从国家战略层面上分析数字人文仓储体系开发的重要意义,完成“国家数字人文基础设施建设工程”的顶层设计,通过数字化手段实现国家优秀文化资源在互联网上的全面记录和保存,为文化创新和传播奠定基础。建议在我国“文化信息资源共享工程”体系架构的基础上,规划建设若干体现我国特色文化资源的数字人文仓储,形成各类数字人文仓储资源相互补充、互相联系、交相辉映的格局。为此,需要对我国数字人文领域知识本体模型的构建做出统一规划,确定顶层本体模型的结构,各领域本体在参考顶层本体模型的基础上,由各领域数字人文仓储建设机构进行深度开发。 (2)调动社会力量参与数字人文仓储开发,构建文化行政部门提供规划,公共文化服务机构提供平台,各类社会组织协同参与的新机制。目前我国文化信息资源共享工程主要由分布在全国各地的分站点负责进行文化信息资源库建设,缺乏领域专业化人才的参与,同时缺乏对用户需求的深入了解,部分地区的文化信息资源共享工程站点资源少,访问量不够,整体绩效差。建议变革各分站点全面负责信息资源库建设的做法,改由政府推动,社会力量建设,按照项目制推动数字人文仓储开发,调动社会各界参与数字人文仓储的积极性,充分发挥高等院校、研究所等专业化机构的优势和潜力。政府文化行政部门可以对区域内的数字人文仓储开发进行规划,通过向社会招标或者对机构选题进行筛选等方式,鼓励对特定主题有长期研究积累的机构负责该领域数字人文仓储建设,以提高文化信息资源库的专业性和权威性。 (3)构建我国数字人文仓储的评估和认证体系。参照国际组织制定的可信数字仓储审计和认证准则,制定我国数字人文仓储评估的标准体系,开展我国数字人文仓储的认证工作。发挥数字人文仓储认证体系在仓储建设当中的方向引导、内部评估和外部评价等方面的作用,引导我国数字人文仓储建设向着规范、可靠和长期服务的方向发展。 5 结语 数字人文仓储是人文社会科学领域特定主题领域内,基于研究对象知识本体进行相关数字对象的采集、加工、组织和保存,并为对应用户群体提供集成性、专业性、互动性、精确化、智能化服务的信息系统及相关资源的总和。数字人文仓储是图书馆、档案馆和博物馆资源水平整合策略的体现,也是推动“国家文化信息资源共享工程”升级和创新的动力源泉,其体系架构主要分为:人文实体界定、领域本体建模、人文实体数字化采集与归档、跨库信息资源搜集和导入、多源信息资源的知识组织和存储、多维度聚合服务等功能模块。数字人文仓储的实现可以参照国际组织制度的可信任数字仓储认证标准,推动DSpace、Fedora等开源软件的应用和开发。为了适应社会智慧化潮流,我国数字人文仓储建设需要策划实施“国家数字人文基础设施建设工程”,整合各方力量,发挥各类社会组织的优势,通过评估和认证保障数字人文仓储的可持续发展。数字化人性化仓储的构建与实现_数字图书馆论文
数字化人性化仓储的构建与实现_数字图书馆论文
下载Doc文档