MARC的未来_元数据论文

Marc的未来，本文主要内容关键词为：未来论文,Marc论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

[文章编号]1004-325X(2008)05-0029-04

1 历史与光荣

1 历史光荣

Machine-Readable Cataloging简称MARC，中文简称为机读目录，是利用计算机识读和处理的目录。它是文献编目内容(数据)经过计算机处理，以代码形式记载在一定载体上而形成的一种目录。机读目录是描述文献著录项目的国际标准格式，是实现计算机处理书目信息及资源共享的基础。

1963年，美国G.W.金等人发表关于美国国会图书馆书目系统自动化的报告，1965年1月提交了关于机读目录的初步报告。1966年1月，美国国会图书馆开始实施MARC试验计划，吸收了16个图书馆参加，制订了MARC I 格式，试编了机读目录，同年9月，生产出机读目录试验磁带。参加馆用这种磁带试验生产目录卡片、书本目录、新书通报等，取得了较好的效果。经过两年多的试验，又设计了适合书目信息交换用的MARCⅡ格式，扩充了字符集，调整和改进了加工系统，1968年7月开始了正式的MARC计划。1969年3月向全国发行MARCⅡ格式的英文图书机读目录磁带。机读目录的出现，有力地推动了图书馆技术的自动化和标准化。1977年，国际图书馆协会和机构联合会还主持制定了《国际机读目录格式》(UNIMARC)，促进全世界范围内MARC的规范与标准。世界各国图书馆界也都加强了这方面的研究与实施。到80年代末，已有英国、联邦德国、法国、加拿大、丹麦、意大利、挪威、瑞典、澳大利亚、日本、中国以及拉丁美洲和非洲共20多个国家和地区进行了机读目录的研究和开发，建立了机读目录系统，生产和发行机读目录产品。此后，MARC已成为世界上最普遍采用的目录格式，促进国际间和国内书目机构、图书馆、情报部门之间的资源共享和交流。

机读目录是图书馆书目数据处理自动化的基础。它可以用来辅助图书馆的文献采集、编目、流通等工作；编制和生产目录卡片、联合目录、新书通报及其他目录索引；开展书目信息检索和参考咨询服务；还可以进行地区间和国际间的书目信息交换，实现资源共享。MARC取得了巨大的成就，OCLC(Online Computer Library Center，联机计算机图书馆中心)的WorldCat作为世界上最大的书目数据库不仅包括一些国家的国家图书馆、公共图书馆、大学图书馆的馆藏，还包括来自一些小的公共图书馆、博物馆的馆藏。它覆盖了400多种语言和人类4 000年来有记录的知识，每10秒就有一个图书馆增加1条新数据到WorldCat。目前，WorldCat包括近亿种图书和其他资料的书目，以及这些资料的13亿多个馆藏地点。

2 困境与挑战

MARC自60年代产生于美国国会图书馆以来，已经历了40多年的时间。这期间，由于书目数据的制作和应用环境发生了很大的变化，比如数据库技术、计算机技术和网络技术的高速发展，文献数量的迅速增加以及网上资源的大量出现，图书馆的文献组织方式与服务手段都发生了根本性的变化，使MARC在实际运行过程中，遭遇了来自同行不同的声音。如“MARC已经过时”、“继续采用MARC标准，将阻碍图书馆事业的发展”之类的观点。在图书馆专业BLOG中也出现了“愿MARC永垂不朽”、“MARC must die”、“Murdering MARC”等观点。MARC自诞生以来，遇到了最大的挑战。那么是什么原因使MARC站在发展的十字路口呢？

2.1 受制于卡片目录的思维

从时间上来说，先有卡片目录，后有机读目录。始于上世纪60年代的机读目录的编制是以卡片目录为基础而发展起来的，文献的目录组织大多采用卡片式，机读目录的最终效应是打印卡片。因此在编制机读目录格式时，首先考虑的是如何保证文献目录的卡片格式。由于这一原因，导致MARC编制从一开始就深深地打上了卡片目录的烙印。如200字段(以下引例都采用中文MARC字段)的编制，完全是为了打印卡片目录格式和如实反映文献题名页而设计的。从实际效果来看存在着重复与臃肿。

2.2 规定繁杂，有些近似苛刻。

MARC繁杂的规定在实际运用时导致理解上的差异，反而削弱了MARC详尽编目的优势。我国目前两大MARC数据制作中心CALIS编目中心和国图，各家有各家的道理与说法，标准极不统一，这正是由于对MARC字段理解各异造成的，严重影响了著录的规范化。由于规范化工作是环环相扣的，只要有一个环节出了问题，就可能导致整个规范化工作前功尽弃。繁杂的规定还要求图书馆系统的编程人员必须是MARC专家，必须精通MARC中每一个位置上的字符的不同含义，才能发挥MARC的检索与显示功能，这就把编程工作的重心转换到程序员对MARC复杂格式的理解、熟悉上。可想而知，程序员对MARC的理解也各有差异，这一差异更加削弱了MARC详尽编目的优势。以CALIS联机编目软件为例，就缺少了091统一书刊号检索点，而我国出版的大部分行业标准、部门标准类图书都只有统一书刊号而没有ISBN号，缺少091统一书刊号检索点导致行业标准、部门标准类图书失去了最简便、快捷的标准号检索点。

2.3 MARC的传统编码格式的局限性

由于MARC始创时受当时计算机功能的限制，其编码格式遵循国际标准ISO2709磁带格式，规定了头标区、目次区、数据区和记录分隔符等，这种头标区、目次区、数据区的三段式设计结构造成了存储数据空间的极大浪费。虽然MARC数据区的字段长为不定长，但是MARC记录容量最大不能超出10万字符，而许多现存的其它数据库检索目录都比它大，因而MARC不能实现对这些检索目录的转化，而成为阻碍MARC发展的“瓶颈”。

2.4 MARC是封闭的而不是开放的

受习惯性思维影响，MARC自诞生起就是图书馆内使用的，目录检索服务不可能延伸到图书馆之外，鉴于当时制定的时代，图书馆专家们也根本不可能想到计算机与网络技术发展到现今的程度，因此，MARC只能是图书馆系统的专用格式，是无法与外部数据库系统相互操作的封闭性系统。MARC必须在图书馆专门的软件中著录，MARC数据的管理与检索也必须在图书馆专有软件中进行，用户只能进入图书馆系统的OPAC或Z39.50客户端才能进行MARC记录查询，MARC资源无法直接面向WWW(万维网)开放，无法通过搜索引擎向因特网用户提供链接。此外，MARC只是对纸质文献编制的，当时没有预测到电子产物的出现，更没有联想纸质文献与其电子版之间交互式链接。此外，MARC字段也是封闭的，在所规定的字段和字节外，不可能随意添加字段与内容。

2.5 编目对象的单一化

最早的MARC是单机保存并通过磁带或者打印出卡片向其它馆进行传递的。尽管受到基本条件的限制，但在近代图书馆的现代化过程中树立了不可争议的里程碑。随着计算机的存贮空间的提高与互联网的出现，图书馆进入了大发展阶段。图书馆的MARC不需要经过磁带或卡片进行传递与规范，而是通过互联网就可以适时传递。1981年美国图书馆界开展了“连接系统计划(Linking System Project，简称LSP)”，再后来的图书馆联机联合编目的实现，都说明了这一点，MARC的实现已经步入了一个崭新的时代。

3 机遇与挑战

新的时代里，网络已深入人们的生活中，图书馆已不是人们唯一的去处，你可以通过专业的网络搜索引擎(Google、百度等)查询到自己所需的信息，网络无所不能，无所不在。虽然，图书馆的文献信息组织与服务手段已发生一些变化。人们也可以不到图书馆就能借阅到自己所需的图书，不到图书馆也能咨询到自己所需要的信息，人们甚至只要点点鼠标就能看到自己所要看的图书，但是，受阻于文献信息的组织手段，其中最大的阻力来源于MARC局限，图书馆的文献信息服务手段还不能像网络搜索引擎一样方便与实用。然而，图书馆已经在努力。

3.1 OPAC的发展

MARC最终是通过OPAC来显示结果的。伴随着信息技术的不断发展，图书馆OPAC呈现着新的发展趋势：增加任意关键词搜索入口，为用户提供更多的检索途径；提供相关度分级及确切的题目匹配，提高检索结果的准确性；提供多种浏览方式，用户可以自行定制搜索结果的显示方式；提供个性化服务功能；可以解决多语种输出；可以通过掌上电脑、手机等来使用，等等。OPAC的发展必然推动着MARC的改进。

3.2 FRBR对MARC的冲击

国际图联于1998年正式推出FRBR(Function Requirements for Bibliographic Records，《书目记录的功能需求》)报告，是国际编目原则和编目思维模式上的重大突破。FRBR认为编目对象不能停留在传统的平面层次上，应根据用户的需求将编目对象分成若干层次。它揭示了隐匿在编目对象中的深层次关系，形成一个立体的元数据模型，已经成为人们设计、考察和评估元数据的一个研究框架。MARC数据区虽然设置并定义46-多层次字段来反映条目等级关系的连接，但这种连接是线性的、平面的，虽然MARC本身的结构复杂，但对复杂的层级关系的适应性却较弱，MARC只是描述性元数据，难以适应FRBR的多层次等级立体型框架，FRBR的提出将使MARC面临巨大挑战，其冲击将是深远的。

3.3 元数据的冲击

MARC本身就是元数据，这是不容置疑的，但应用于网络系统的元数据更具有灵活性、方便性和易操作性，与MARC相比更易于被用户所接受和掌握，因此，在图书馆实践中，元数据的应用在近年来取得很大的进步。图书馆数字化、数字化图书馆、网络导航等文献信息组织方案中大量使用元数据，甚至很多图书馆学专家和图书馆在进行MARC数据向元数据转换研究与实践。MARC运用的空间进一步缩水，其运用的前景堪忧。

3.4 网络图书搜索的冲击

各商业性图书贸易公司为了扩大更多的营销途径，利用网络的优势，在网络上不仅发布该书的MARC数据，而且还提供图书的封面信息，并将有关图书的作者信息、书评信息、读者反馈信息、购买信息等一并发布在网络上，便于图书馆进行选购。采用和谐的平台、友好的交互界面展示给读者，使读者在了解该图书信息时，还能与公司进行互动。而图书馆的OPAC受限于MARC数据的不完整或不开放性，决定了图书馆的OPAC展示的不和谐性和不友好。

3.5 电子图书的冲击

2004年末，全球最大的搜索引擎Google宣布，将在互联网上建立数字图书馆，准备以扫描的方式将哈佛、牛津、斯坦福、密歇根大学和纽约公共图书馆的藏书，以及各大出版商发行的图书数字化，互联网用户在登录后即可对感兴趣的书目进行检索。该计划不仅提供书目的检索，而且还提供每本书的章节进行检索，甚至提供全文检索。中国目前也有自己的数字图书，经营数字图书的企业有4个：书生、超星、北大方正和中国数字化图书有限公司，在图书馆文献服务过程中，担当着越来越重要的角色。毫无疑问，传统图书馆的管理模式，已不能满足现在人们对知识的渴求，而对图书馆最大的挑战是来自它们的搜索新概念，即不仅提供目录检索，而且还提供章节甚至是全文的检索。这对MARC提出新的挑战。

4 现实与未来

MARC经过多年的发展，其自身的数据量我们且不论，就论其对自身规则的调整。从91条到字典式目录规则，到柳别茨基的编目规则与原则，再到巴黎原则到书目记录功能需求，无不是顺应时代与技术的变化而变化的，从简单的目录编制到联机联合编目，无不是为图书馆及用户的需求而不断地调整着自身的基因，这就说明了一条，也是最重要的一条，MARC的存在不是固步自封而是在不断地创新。一个不断创新的东西说明其生命力是极其旺盛的。

4.1 自身的完善

1991年美国图书馆界开始实施USMARC书目格式一体系(Format Integration)。USMARC中增加了006字段，它包含了008字段的主要内容，并有与008字段7种类型相并行的7种006字段。至此，USMARC可以从容地囊括图书(BK)、连续出版物(SE)、档案与手稿(AM)、计算机文档(CF)、地图(MP)、音乐(MU)、视觉资料(VM)等7种类型文献。为适应网络发展的需要，已经在原有的基础上增加538字段(系统需求和存取注释)、516字段(计算机文件类型或数据注释)、256字段(计算机文件特征)。满足网上资源的著录要求，1992年美国国会图书馆(The Library ofCongress，简称LC)、美国“书目信息机读格式委员会”、美国图书馆协会(American Library Associan，简称ALA)通过了联机联合编目中心(OCLC)的专家提出的增设856字段的建议。856字段被命名为电子文件地址与检索字段，著录网上电子数据资源的地址信息及相应地读取该字段所要求的软件环境。856字段的设定基本解决了网络信息资源的著录问题，同时也标志着MARC已逐步走向成熟。

4.2 元数据与MARC的互操作

在因特网环境下，越来越多的Web应用通过网络能够交换数据来实现互操作，这都得益于可扩展标记语言(XML)的出现与发展。目前，XML与元数据概念在数字图书馆建设中已经占据极为重要的地位，在数字图书馆模式中，MARC数据的共享与交换不再局限于图书馆自动化系统以及系统与系统之间进行，而需要在数字图书馆模式中通过互联网来实现MARC数据的互操作。为适应新的环境，美国国会图书馆的网络发展与MARC标准办公室(network development and marc standands office)率先对MARC进行了发展，开发出了MARCXML Schema和MODS以适应HTML和XML环境和数字图书馆环境。国际与国内很多图书馆专家都进行了MARC与元数据的互转换研究，为图书馆的发展做了很大的贡献，但贡献还是有限的，因为元数据相对于MARC来说，也存在着自身的不足。

4.3 增减字段或著录内容

正如前文所说，MARC中存在着很多不合理的字段，对于这些字段，我们应该减少或进行合并。在FRBR中，编目进行适时的更新与调整，对责任者项、主题项等增加新修改。与其相适应，MARC也应做一些适当的调整，反映在具体的著录时，如200字段的$f字段的内容与7—字段重复，应该合二为一，225字段与41-字段也可以合并，等等，本文在这不一一列举。相反，有些字段确实要著录详细或者是增加著录字段。如7—字段的责任者项就应该著录完全，鉴于中外学者都存在着重名现象，这一字段可作为甄别依据。210字段也应该著录完整，比如邮政编码、E-mail、电话等，对于期刊的著录，可作为投稿指南。图书的章节应该在相应的字段著录完整，这样即使不能提供全文检索，也能提供章节检索，为读者多提供一种检索途径。还有主题词的著录应该尽量完整、专业、规范。

4.4 载体形态项的著录

《资源描述与检索》(Resource Description and Access，简称RDA)设计的关键因素之一就是要在数据著录与数据表示之间设置清楚的分界线，为反映与FRBR与FRAR(Functional Requirements for Authority Records，《规范记录的功能需求》)模型中定义的实体的属性与关系有关的记录数据提供指导，这些数据能独立地应用于任何数据存储或显示的特定结构或句法。其实质意义就是要分清楚作品、内容表达、载体表现和单件的取得之间的关系。MARC与OPAC必定要适应这一原则。因此，对MARC中相应字段的调整与修改势在必行。例如：OPAC2.0为图书馆的检索界面提供了美好的前景，将是一个集图书、磁带、乐谱、论文、期刊、音像、图表、网络资源等各种文献信息为一体的检索界面，并表达文献实体与文献相关信息的联系，对文献载体形态项的著录将会提高到一个新的高度。

5 结语

未来的MARC将是一个完整的文献信息组织的最好方式。未来的OPAC将进一步具有开放性、聚合性、易操作性、可扩展性、可控性等，将是一个搜索引擎式的检索界面，将是一个图文合排的结果显示方式。读者可以自行定制自己喜欢的风格，读者可以与图书馆进行交流，读者不仅可以通过题名、责任者、主题、关键词、章节、分类等途径检索文献，进行适当的调整与组合，可以实现出版物地名搜索(address search)、专家学者搜索(scholar search)、主题搜索(title search)、图片搜索(map search)、乐谱搜索(song search)等具有网络搜索引擎的功能。而这一切都依赖于MARC的完善。歌德曾经说：我是一条蛇，正在蜕皮，获得新生。Marc的未来正是如此。

标签：元数据论文; 图书馆论文; 文献检索论文;

MARC的未来_元数据论文

猜你喜欢