网络书目资源描述规范--BibEx及其应用_图书馆论文

网络书目资源描述规范SchemaBibEx及其应用,本文主要内容关键词为:及其应用论文,书目论文,资源论文,网络论文,SchemaBibEx论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       书目数据是图书馆最重要的信息资源,是图书馆建设文献资源,服务读者用户的基础。互联网使信息的发现和获取无时无处不在发生,而以传统MARC数据格式存储的书目信息被禁锢在图书馆系统中,无法被以搜索引擎为代表的网络服务应用获取和揭示,使图书馆不禁发出了“我们的用户在哪?”的感叹[1]。以传统数据格式存储的书目数据已经到达了效率和功能的极限。图书馆欲成为语义网络时代的网络数据中心和信息服务中心,必须应用网络原生性的数据格式将书目信息融入网络,集成到用户日常所使用的Google、维基百科、社交网络等网络服务应用中,从而增强图书馆在整个网络信息资源生态系统中的相关性,最终吸引用户从其他的信息资源返回图书馆信息系统。

       1 背景和历史

       在开放网络时代,用户对信息资源检索方式的选择发生了显著变化[2]。一般用户越来越倾向于使用搜索引擎作为检索起点,已经没有兴趣访问图书馆网站。从2003年7月到2004年6月,用户通过FirstSearch对WorldCat书目执行了3470万次检索,而同期全球搜索引擎的月检索总量在近40亿次。以传统MARC数据格式存储的书目信息无法被以搜索引擎为代表的网络应用服务获取和揭示,如何使网络用户从网络服务应用中回流图书馆成为图书馆面临的巨大问题。

       为适应用户检索习惯的变化,OCLC在2004年初启动Open WorldCat计划,将WorldCat的馆藏数据陆续加入Google及Yahoo等主要搜索引擎中,以便让用户更加便利地使用WorldCat。然而这并不能够使书目数据真正成为互联网开放资源。书目资源与用户使用的网络服务应用之间的信息鸿沟依然存在。

       2011年6月3日,全球三大搜索引擎Google、Bing、Yahoo!以及后来加入的Yandex联合发起Schema.org,其目的在于创建一种主要搜索引擎都支持的结构化数据标记架构,以便为用户提供更好的网络体验。网页结构化数据标记可以帮助搜索引擎理解网页上的信息,从而提供更丰富的搜索结果。

       OCLC注意到搜索领域的这一重要发展,意识到它可能是有效地描述图书馆馆藏数据的重要工具。同时OCLC内部关联数据实验研究正在慢慢变得成熟,结合这种新的技术发布图书馆书目关联数据似乎变得非常理想。OCLC关注提供适合广泛领域信息的结构化数据的努力最早可以追溯到1995年其所发起的都柏林核心元数据(Dublin Core Metadata,DC)研究。在1997年,随着OCLC加入世界万维网联盟(W3C),OCLC研究人员开始积极参与W3C关于网络描述图书馆书目数据的研究。之后的14年见证了OCLC所尝试一系列关联数据实验性项目,OCLC陆续以关联数据形式发表了杜威十进制分类法(Dewey Decimal Classification,DDC)、虚拟国际规范文档(Virtual International Authority File,VIAF)及其FOAF增强版、主题分面应用(Faceted Application of Subject Terminology,FAST)。Schema.org提供了一个在网络范围内整合OCLC丰富的关联数据研究成果和实现WorldCat.org数据开放目标的机会。

       OCLC关联数据小组对以Schema.org作为书目数据模型基础进行了数月的实验书目模型研发,力图在图书馆整体层面上解决传统书目数据格式存在的缺点。该模型连接现有的实验性关联数据项目(如VIAF、FAST、美国国会图书馆标题表(Library of Congress Subject Headings,LCSH)、DDC),并针对Schema.org制定了最初的面向图书馆领域的library:扩展。该扩展力图实现内容与载体的明确区分,添加相关实体和属性,如OCLC控制号、馆藏等。

       2012年6月OCLC以Schema.org及其library扩展为基础的书目数据实验模型将WorldCat书目数据发布为关联数据[3],发布版权采用ODC(Open Data Commons)许可,允许教学与研究使用。OCLC强调该模型是实验项目,意在接受反馈及获取使用结果,未来会随外界反馈而变化。

       2012年8月13日OCLC研究人员Richard Wallis在IFLA赫尔辛基年会报告[4]中宣布WorldCat关联数据提供一个子集下载,同时说明WorldCat采用Schema.org及其图书馆扩展的原因,提出“图书馆标准巴别塔”之说,认为“Schema.org将图书馆链接到Web”。

       2012年10月,Schema.org书目模型多次讨论促成Richard Wallis在W3C的帮助下创建W3C Schema书目扩展小组(Schema Bib Extend Community Group)。小组的任务是讨论与准备扩展Schema.org规范的建议,寻求向W3C Web Schemas小组提出建议的共享与支持,以改进书目信息标记与共享。小组本身不产生技术规范。W3C相信来自兴趣方的小组建议会比个人带有更多分量。从此对于Scheme.org书目资源描述的研究发生分化,Schema书目扩展小组重点关注词汇表修订和扩展,而OCLC着重于书目模型的研究。

       Schema书目扩展小组最初花费大量精力识别Schema.org中空缺的书目词汇术语,后期改为对Schema.org原有词汇做书目资源描述测试试验。测试实验的成果是认识到Schema.org已经非常适合于描述图书馆资源并识别了Schema.org的概念缺口,比如没有有声书类。有些案例,最初推测需要新类或新属性,后来清楚只要有建议、文档或样例就够了;另外一些案例,所需的只是微调Schema.org原有词汇文档描述。

       Schema书目扩展小组的成果又促使OCLC研究人员重新审视最初对使用Schema.org建立书目数据模型所做的假设和推理的正确性,意识到图书馆需要审慎对Schema.org做出正式修改,并着手重新设计数据模型。重新设计的主要目的是提升对使用Schema.org已有词汇类表现FRBR层次结构的能力。OCLC研究认为Schema.org目前已有的本体对象,特别是2012年11月8日在GoodRelations被导入Schema.org后,已经对于描述大多数图书馆资源和事件具有足够的技术深度。

       与此同时,在2012年11月美国国会图书馆联合语义技术专业公司Zepheira开发的下一代书目框架BIBFRAME发布了所用的关联数据模型草案[5],与OCLC书目数据实验模型描述同一类资源,存在竞争关系。鉴于国会图书馆巨大的影响力,OCLC立即开始两者兼容性和互操作研究。

       在BRBRFRME发布几个月后,OCLC发布了新的Schema.org书目扩展模型。新版模型相对于一年前的在WorldCat.org发布的关联数据模型有了显著的改进和提升,其中最重要的就是定义了表达FRBR关系的规则以及明确区分了内容表达和载体形式。这种区分无需扩展定义赘余的library:扩展,而在前面的模型中是必需的。

       2014年2月14日Richard Wallis宣布[6]OCLC将发布1.94亿关联数据“作品”本体。发布的“作品”本体URI是永久性的,标志OCLC关联书目数据模型走向成熟。

       2 什么是SchemaBibEx

       Schema.org是由Google、Bing和Yahoo!以及后来加入的Yandex共同发起的网络资源描述规范[7]。Schema.org为网络资源描述提供主要搜索引擎都支持的统一词汇表和标记语法。使用Schema.org意味着网站无需对搜索引擎支持的标记类型做出取舍,而搜索引擎则可以获得结构化信息从而提高搜索结果的质量,最后用户会获得更令人满意的搜索结果和更好的网络体验。Google等搜索引擎在排名时不会考虑网站所使用的标记,但丰富网页摘要可让网站更突出地显示在搜索结果中,因此网站的访问流量会相应增加。在发布一年后,以Schema.org标记的网页已经在Google和Bing索引的网页中占到7%[8]。在信息用户搜索和信息查找回馈之间复杂的信息交换环境中,Schema.org提供了一种理想的工具来协调连接用户和他们渴望的信息资源所导致复杂性和高效率之间的平衡关系。

       SchemaBibEx是由OCLC主导开发的基于Schema.org的书目资源描述扩展。作为Schema.org的具体领域应用,SchemaBibEx可用于图书馆在网络上发布书目资源的语义数据,也可以作为语义时代的书目数据格式使用。作为一种语义数据格式,SchemaBibEx包括两个主要部分:实体模型和术语词表。实体模型由OCLC以Schema.org为基础主导开发,称之为OCLCSchema模型,简称OCLC模型;术语词表由Schema书目扩展小组主导制定,主要包括对Schema.org已有术语词汇进行修订和增加相应扩展词汇。

       2.1 OCLC Schema模型

       实体模型描述现实世界概念结构模型的实体类型、属性和联系。对于书目数据格式,实现FRBR层次结构是书目数据实体模型的基本要求。由于Schema.org不具备FRBR实体概念,OCLC采用的方式是以Schema.org现有的实体概念入手,为其加入图书馆领域涵义,并且只有在完全必要的条件下才增加相应扩展。FRBR第一组实体在OCLC模型中可以通过schema:CreativeWork类和schema:Product类以多类型分配方式完成描述(如图1、图2所示)。

       (1)schema:CreativeWork描述FRBR中的“作品”实体和“内容表达”实体。如果只描述题名、主题和创作者,描述类型为“作品”;如果描述包括版权日期和出版物类型等信息,那么描述类型相当于“内容表达”。

       (2)schema:CreativeWork+schema:ProductModel描述FRBR中的“载体表现”实体。作为schema:CreativeWork实体,馆藏资源是智慧创造的成果,具有题名和主题内容,而不一定具有特定的物理性质。但是作为schema:Product实体,图书是商业中实实在在的实物,具有出版日期、产品标识码,能够被买卖和管理。

       (3)schema:CreativeWork+schema:IndividualProduct描述FRBR中的“单件”实体。schema:IndividualProduct实体是单一的,可识别的产品实例。

      

       图1 SchemaBibEX核心模型

      

       图2 SchemaBibEX与FRBR的映射关系

       多类型分配方式是Schema.org标准模型的核心特性。在信息系统中,本体是领域知识的概念化和结构化的明确表示和描述。作为全领域数据描述规范,Schema.org描述全部领域知识概念的静态状态、动态运动过程及概念间语义关系,需要克服全领域知识本体构建的巨大的系统复杂性。Schema.org采用的方式是构建上层本体和最小化的标准本体概念模型,优先以已有的实体概念采用多类型分配方式描述具体领域概念,只有在完全明确概念缺口的情况下才扩展标准本体模型。OCLC模型继承Schema.org多类型分配性质,同时认识到Schema.org只能覆盖图书馆领域核心概念本体,无法满足专业领域所要求的领域深度和细节颗粒度,因此对多类型分配性质采取更为开放的态度,OCLC模型可以开放性地混合引用其他相关标准和本体模型。从这一点上来讲,Schema.org更适合作为构建专业领域本体模型的基础,而不是作为具体领域直接应用的标准。

       OCLC模型定义了表达FRBR关系的规则,明确区分了内容表达和载体形式,良好地实现了载体表现和单件,但仍无法严格区分FRBR“作品”与“内容表达”两个概念。带有Schema:CreativeWork标签的描述无法避免混淆“作品”和具有细节的FRBR其他层次实体。而Schema.org描述书目资源的角度与图书馆领域存在分歧,区分“作品”和“内容表达”对于Schema.org实现书目资源描述功能并不重要。OCLC和Schema书目扩展小组正在考虑其他可供选择的方法[9]19,具体包括定义“Superwork”表达“作品”概念,或通过多类型分配对FRBR第一组实体分配附加的FRBR命名空间的rdf:type语句解决,如frbr:Expression。但可以明确的是这种区分只能由图书馆通过Schema.org扩展机制实现。OCLC仍然在寻找以Schema.org为基础明确地表达FRBR概念的方法。

       OCLC模型没有定义规范数据类或通用的规范文档属性,而是采用了一种非常灵活的方式实现数据规范处理:在OCLC模型中,首要的概念是人物、地点、组织、实物以及主题,像VIAF或LCSH等规范文档被作为是关于这些概念信息来源的创作性作品。这样做的好处就是OCLC模型能够描述在规范文档中不存在人物或事物。具体做法是去掉rdf:about,使之成为一个空白节点;其次,OCLC模型可以对同一资源本体同时引用不同的规范文档,并且多规范文档引用可以通过“sameAs”属性做出特殊偏向,如词汇扩展中定义的schemap:sameThingA属性;最后,OCLC模型中可以随时引用新的规范文档。只要规范文档可以使用,就可以在“about”和“sameAs”中使用新规范文档的URI。

       2.2 术语词表

       术语词表定义领域相关的实体类和相关属性,是提供规范控制的基础。OCLC模型所使用的词表主要包含四个部分:Schema.org词表、OCLC早期提出的library:扩展及其后期演变的Schema.org词汇书目扩展、外部术语词表。

       Schema.org词表是由W3C Web Schemas小组根据应用需求,经过一系列讨论流程发布和修订的开放性词表。目前OCLC模型所使用的Schema.org词汇[10]包括12个类、13个属性和10个关系属性以及2个枚举类型。

       由于明确单一通用词汇表难以覆盖全部领域的多样性和丰富细节,Schema.org提供词汇扩展机制[11]。具体领域通过一定方式和规则扩展已有词汇,可以使搜索引擎或第三方应用部分地理解标记数据。OCLC早期认为Schema.org难以满足书目数据标记需要,因而在purl.org发布了实验性的library:扩展[10]。随着对Schema.org理解的变化,特别是在导入GoodRelations之后,这一扩展将被从模型中移除。Schema书目扩展小组提出的词汇扩展同早期相比减少了很多,更多的是对已有词汇定义的修订。除部分词汇扩展已经被采纳外,大多数还处于草案状态[12]。从Schema.org的视角来看,书目扩展词汇变得精简小巧,已经被建议完全合并入Schema.org标准模型当中,而不是松散地存在于独立的命名空间。

       OCLC模型对术语词表采取开放态度,致力于与外部组织共同合作,最大限度复用已有的术语规范和词表。典型的例子就是使用了维基百科商品类型本体词表(Product Types Ontology,PTO),而没有定义和维护自己的内容类型和载体类型。PTO基本覆盖了图书馆资源所属的内容种类和载体形式种类,如电影、图书、精装、DVD、CD等,而维基与图书馆领域良好的合作传统使共同致力于解决概念空白和模糊成为可能。

       2.3 样例、工具、服务与演示

       Schema书目扩展小组官方网站提供SchemaBibEx实践指南,内容包括标记方法、序列化方法和一个虚拟图书馆样例。虚拟图书馆样例包括11种类型作品的实践标记样例和方法指引。样例来源于Schema书目扩展小组对词汇扩展的讨论和建议。作为特定情况的说明,被描述的资源可能跟真实案例并不完全相同,但被精心设计满足用户真实环境。当前书目扩展小组主要任务就是创建更多的实践指南。

       Schema.org作为网络资源描述规范,主要的标记方式为使用HTML标记属性(常为〈span〉或〈div〉)嵌入简要的描述性名称。Schema.org词汇表早期集中实现支持微数据格式(Microdata),长期目标实现对广泛的编码格式的支持。微数据作为W3C HTML5标准的组成部分,同时兼有RDFa的扩展性和微格式(microformats)的简洁性。单一格式有利于提高搜索引擎间的一致性,而无需网站在几种格式间做出取舍,但这并不妨碍SchemaBibEx采用其他RDF序列化方式。目前,OCLC在WorldCat网站上提供已发布书目数据的5种数据序列化形式:Turtle、JSON-LD、RDF/XML、N-TRIPLES、HTML+RDFa。

       Google提供面向Schema.org的结构化数据测试工具和结构化数据标记辅助工具[13]。Google结构化数据测试工具用于测试网页结构化标记结果,目前仅支持嵌入式打包方式。用户可以通过网址和HTML代码两种方式使用该测试工具。结构化数据标记辅助工具同样支持通过网址和HTML代码两种形式以鼠标点击的方式向原页面添加以微数据或JSON-LD编码的Schema标记。由于SchemaBibEx还没有正式发布,目前结构化数据标记辅助工具还不支持书目数据的转换。

       OCLC WorldCat同时是OCLC模型的实验研究平台和功能演示平台。WorldCat除已经实验性地发布的“作品”本体外,将陆续发布其他核心本体。目前,WorldCat书目关联数据提供机器和人工阅读两种数据接口[14]。人工阅读数据以“WorldCat关联数据探索”(WorldCat Linked Data Explorer)界面提供。OCLC标示符和关联数据URI,如OCLC书目控制号、VIAFID或WorldCat作品URI,完全独立于所标记数据或信息,处于开放访问状态,能够为任何数据访问机制或服务应用所连接使用。网络应用可以通过OCLC xID、xOCLCNum或xLCCN等服务API获取永久性的作品ID[15]。同时OCLC提供WoddCat关联数据采用ODC(Open Data Commons)许可的一个120万条子集批量下载,允许研究人员下载后通过SPARQL做教学与研究使用。除OCLC的WorldCat之外,开源图书馆系统如Evergreen和Koha已在其用户界面添加Schema.org标记。

       2.4 书目扩展示例

       图3为SchemaBibEx标记格式的编码示例。示例以弗兰克·赫伯特的小说Dune为内容的两种独立作品为例,以Turtle格式编码,简洁易读。为了便于理解SchemaBibEx描述架构以及多类型分配性质,示例所描述资源与真实案例可能并不相同。

      

       图3 SchemaBibEX的编码示例[9]33-35

       按照Turtle规则,每个三元组的主语、谓语、宾语同行书写,由空格分割,以句点结尾。每段陈述以“a”开始,“a”是RDF/XML中的rdf:type的缩略简写,用于声明陈述主语类型。陈述段从1到5描述了SchemaBibEx实体模型中的某种类型本体资源:段1描述“作品”类型的电影;段2描述“作品”类型的小说;段3描述“内容表达”类型的版权年为“1965”的图书;段4描述“载体表现”类型的ISBN为0801950775的精装书;段5描述“单件”类型的条码号为71176的状态为破损的精装书。类型声明中schema:Movie、Schema:Book是schema:Creativework的下位类。Schema书目扩展定义的schemap:hasInstance属性和schemap:isInstanceOf属性描述同一作品不同层次实体之间的关系。另一个扩展属性schemap:commonEndeavor定义内容来源于相同创作行为的不同作品实体之间的关系。段3中为了明确类型为“内容表达”,以多类型分配方式分配了附加命名空间的frbr:Expression类型。frbr是在vocab.org建立的FRBR核心实体关系词表;段4和段5同时声明该资源是PTO本体中的“hatdcover”产品类型,描述其为精装书。

       示例还包括两条个人名称规范和一条主题规范数据。在第一个个人名称规范中,规范文档使用虚拟国际规范文档VIAF,同时使用mads:isIdentifiedByAuthority指向美国国会图书馆名称规范记录以强化名称规范。由于“Dune”作为一个虚拟的地名,是一个论题性词语,这种标记深度已经超出了SchemaBibEx的标记深度,所以在主题规范中引用书目框架计划(The Bibliographic Framework Initiative,BIBFRAME)模型中bf:Topic,声明其为论题性主题规范。schemap:samThingAs的作用与mads:isIdentifiedByAuthority相同。

       3 SchemaBibEx的特点

       国际图联1998年出版的《书目记录的功能需求》(FRBR)报告[16]提出书目格式应满足“查找”(Find)、“标识”(Identify)、“搜索”(Select)和“获取”(Obtain)四个方面的基本需求。图书馆领域专家Karen Coyle在2004年认为[17]未来书目格式除满足FRBR的基本需求之外,还应具备的“描述”、“定位”、“发现”、“购买”、“保存”、“推广”等功能。新一代的书目数据格式被赋予更高的要求和功能实现。

       SchemaBibEx作为以Schema.org为基础的书目数据格式,具有以下特点:

       (1)直接接触最终用户

       网络原生性是网络时代的书目数据格式的基本要求。为网络资源描述而生的Schema.org已经被W3C所接纳成为网络资源描述标准。SchemaBihEx继承Schema.org原生网络属性,通过使用URI标识书目资源的一切实体、概念、实例、规范数据,直接与广泛的网络应用服务相整合,无障碍地接近最终信息用户,使书目资源真正成为原生网络资源。

       (2)开放性地整合和兼容已有成果

       SchemaBibEx在设计模式上以开放性地整合书目资源描述相关标准为目标,最大限度地复用和兼容已有标准和模式。例如,OCLC模型继承的Schema.org多类型分配特性是模型设计最重要的特征,从而使混合引用其他相关标准甚至是竞争性标准成为可能;Schema书目扩展小组提倡研究集中于有助于增加外部词汇类应用的建议;开放性地引用PTO在原则上避免了定义和维护一系列内容种类和物理载体类要求。正因为SchemaBibEx有效地整合了书目数据相关标准,最大限度地实现了对已有标准和成果的包容,Richard Wallis称之为“图书馆标准巴比塔”。

       (3)全局统一的书目资源描述格式

       Schema.org是全领域的通用网络结构化数据规范,几乎能够描述所有主题类别内容资源,并不断覆盖越来越多的专业领域,最终将完成覆盖网络中所有资源类型的目标。SchemaBibEx以Schema.org为基础,使书目资源描述从设计理念到具体方法与语义网络中其他类型数据资源相统一,从而使书目资源真正融合入网络中。当然,由此带来的问题是图书馆领域必然要与其他领域争夺信息描述资源。相对于面向专业领域的词表,SchemaBibEx在词汇和属性上必须做出一定的妥协。例如,图书馆领域图书题名使用“title”,但是在Schema.org中只能使用“name”。此外,与专业词表相比较,SchemaBibEx在领域细节颗粒度上同样需要妥协,专业领域的深度细节会使Schema.org设计过于复杂。

       (4)低技术门槛、经济型的标记模式

       Schema.org作为搜索引擎提出的网络资源描述标准,以简洁、高效、经济、低技术门槛为目标。SchemaBibEx在领域细节颗粒度上只提供稍优于都柏林核心元数据的描述级别,但是覆盖了书目数据的关键核心内容,提供了足够多的细节,从而保证了较低的标记成本和较高的易用性。Richard Wallis指出[18]“你永远无法将Schema作为图书馆运行使用专业领域词汇表。它不会达到MARC数据所要求领域深度和技术细节。它所能做的就是帮助前端搜索引擎,以搜索引擎能够理解和使用的方式标记书目数据。”

       4 与BIBFRAME的关系

       BIBFRAME全称为“书目框架计划”(The Bibliographic Framework Initiative),它是由美国国会图书馆主导开发的下一代书目数据格式。BIBFIRAME应用语义信息技术,致力成为下一代的书目数据格式标准。由于两者描述相同的资源类型,BIBFRAME与SchemaBihEx存在竞争关系。

       综合分析两者不同的设计目标和已有实现模型,可以判定BIBFRAME和SchemaBibEx是互补关系。这种互补关系主要体现在两个方面:一是功能互补。BIBFRAME面向图书馆领域的书目信息资源建设和管理,能够深入领域细节描述书目资源,使书目资源置身于丰富的上下文环境之中;而以Schema.org为基础的书目数据扩展主要目标是实现通用搜索引擎对于书目资源的检索和发现。用户通过搜索引擎搜索以Schema.org标记的书目数据进入图书馆网站,再通过BIBFRAME格式的书目数据深入关联数据环境。Schema.org将会成为联系图书馆书目资源与最终用户的纽带。二是技术层面互补。BIBFRAME与Schema书目模型具有高度的相似性,至少在描述相同资源时,一种模型描述可以在信息损失极少的情况下自动转换为另一种模型。Schema.org支持多类型分配,在实际应用中对两者的混合引用和匹配可以解决Schema.org书目模型中的概念不明确以及缺乏足够的领域深度细节等问题,如2.4节所示。可以预见会有越来越多的BIBFRAME语句添加到SchemaBibEx标记中。同时两个模型都会受益于另一模型的技术发展和应用环境提升。

       目前来看,两者词汇表部分已经是互补的。Schema.org书目扩展从模型发布之初到现在已经变得越来越精简。从BIBFRAME的角度来看,Schema.org词汇扩展的发展变化意味OCLC已经放弃了最初创建标准级别的图书馆专业领域数据描述格式的目标。Schema.org词汇表,SchemaBibEx扩展词汇表以及BIBFRAME词汇表相互关系已经是完全互补的,如图4所示。而在模型部分,两者还存在核心概念定义不统一、设计模式不兼容等问题。由于两者模型都处于设计测试阶段,OCLC呼吁两者共同开发,相互兼容发展并已经着手两者兼容性和互操作研究。长期来看,两者模型的兼容和统一还有很长的路要走。

      

       图4 Schema.org、SchemaBibEx以及BIBFRAME书目描述能力关系[19]

       5 总结

       作为主要搜索引擎共同支持的网络资源结构化数据标准,Schema.org将成为网络资源描述的行业标准和事实标准。在未来可预见的时间内,受限于机器运算能力、系统设计复杂度、标记成本等因素,通用搜索引擎所支持的资源描述标准将远远无法达到专业领域数据格式标准和规范所要求的领域深度和细节颗粒度。SchemaBibEx在长远的时间内都会成为网络用户直接接触的书目数据格式。目前来看,SchemaBibEx从实体模型到术语词汇表还存在各种各样的问题,但是研究和应用SchemaBibEx是图书馆发展的现实选择。SchemaBibEx与下一代图书馆书目数据格式标准的共同协调发展,相互兼容和协作是图书馆作为未来的网络数据中心和网络应用服务中心的有效途径。

标签:;  ;  ;  ;  ;  

网络书目资源描述规范--BibEx及其应用_图书馆论文
下载Doc文档

猜你喜欢