从知识管理到知识服务:学术信息数据库的发展转型,本文主要内容关键词为:知识管理论文,学术论文,数据库论文,知识论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数据库的发展经历了从“题录库”到“全文库”、从“单机版”到“网络版”、从“文献管理”到“知识管理”的阶段,学术信息数据库(以下均简称为“数据库”)也逐渐成为知识传播和知识服务的主要载体。由于知识在经济建设和社会发展中所起到的巨大作用,使得数据库自身发展得到了各国政府及国际组织的大力支持,大多数国家的知识产权保护法均包含适用于数据库产品的产权保护条款,欧盟制定的《数据库指令》以及美国提出的《数据库投资和知识产权反盗用法案》还对数据库实施了“特殊权利保护”,以至于数据库的垄断特性逐步显现,并呈现出不断增强的趋势:数据库垄断权滥用现象普遍、数字出版过分依赖数据库的传播方式、数据库独有的信息资源和各自独立的管理方式限制了高层次知识服务的有效开展、高昂的数据库垄断价格阻碍了数据库应用范围的进一步扩展等一系列的问题亟待解决。 针对以上问题,法商界、图情界均开展了对策研究,如“开放存取”、“买断服务”、“资助开放出版”、“知识服务联盟”、“建设机构知识库”以及“反垄断规制”等,但这些对策只是对知识供应链的某一个环节有限的知识获取援助,均不能从根本上解决上述问题[1],数据库的发展面临着发展转型的机遇期。 1 数据库转型的必要性 数据库作为网络时代学术信息资源主要的传播方式和知识服务的重要平台,借助于其合法的“知识产权”垄断权,已经处于信息产业链中的绝对优势地位。学术出版物要依赖数据库进行数字信息的网络传播,以提升其学术影响力;文献信息机构要依赖数据库来构建其完备的数字信息资源;知识用户则需要通过数据库来满足其知识服务需求。数据库一方面依靠其自身的垄断地位,攫取了高额的垄断利润,另一方面又会通过对学术出版物资源的独家拥有限制对方的发展。更为不利的是,数据库之间相互限制严重阻碍了高层次知识服务的有效开展。这些问题依靠数据库现有运营模式的自身力量是无法解决的,必须谋求转型发展。 1.1 转型是知识经济时代社会发展的需要 未来学家托夫勒在《力量转移——邻近21世纪时的知识、财富和暴力》一书中指出,当今世界有三种基本力量:“暴力、金钱和知识”。而暴力在不断升华为法律,金钱变得不再万能,而知识正在成为这三大力量中“质量最高”的力量[2]。知识是知识经济时代首要的生产要素,推动社会发展最革命的动力是“知本力”,掌握丰富知识的精英将成为“知本家”,“知本力”将决定21世纪组织的变革和国家的竞争力[3]。因此,提升公共知识服务的质量和效率将是世界各国共同面临的重大课题,而现有数据库的运营模式已不能很好适应社会发展对知识信息的需求,探寻偏重传播的数据库运营模式是社会发展的迫切需要。 1.2 转型是知识组织的需要 知识组织(Knowledge Organization)是做好知识服务的前提,是通过“知识表示”、“知识重组”、“知识聚类”、“知识存检”、“知识编辑”、“知识布局”和“知识监控”等方法对知识单元进行揭示、挖掘、关联的过程或行为。知识经济时代,急剧增加的海量知识信息对知识组织的方式方法提出了更高的要求,知识组织的客体从文献单元深入到知识单元,从单篇文献的内容揭示朝向文献之间知识单元的关联方向发展。这种知识组织的方式要求知识信息资源之间的无障碍链接和互见性揭示,这是现有数据库运营模式难以实现的。 1.3 转型是知识服务的需要 知识服务(Knowledge Sèrvices)是指从各种知识资源中按照人们的需要有针对性地提炼知识,并用来解决用户问题的高级阶段的信息服务过程。这种服务其特点就在于,它是一种面向知识内容和解决方案的服务。它通过智能化技术手段,对经过整合以及有效组织的海量数据进行“挖掘”和“分析”,从而满足用户对知识发现和知识创新等高层次的知识服务需求。所有这些以数据为样本进行的高层次知识服务,其必要条件就是数据的海量积聚,因此,样本数据是否齐全至关重要。以文献相似度检测为例,目前的几大检测系统中,没有哪个检测系统的样本数据是齐全的,如果不打破现有数据库的运营模式,实现数据的高度共享,相似度检测的可靠性只能是一种随机测度。 1.4 转型是科学研究新范式的需要 随着知识产出率的不断提升以及处理数据能力的不断增强,人类正在迎接大数据时代的到来。大数据所具有的在区域之间、行业之间和企业部门之间的穿透性,正在颠覆传统的、线性的、自上而下的精英决策模型[4]。2007年,计算机图灵奖得主吉姆·格雷(Jim Grey)在美国国家研究理事会计算机科学和远程通讯委员会(NRC-CSTB)的演讲报告中提出了科学研究“第四范式”,即以数据密集型计算为基础的科学研究范式[5]。这种以大数据为研究对象的科研模式,对关联数据的大量汇聚有着极高的需求,因此,新的科学研究模式要求数据库必须打破彼此之间的技术和协议壁垒,采取统一元数据标准的开放式的数据架构。 2 数据库转型的可行性 数据库的转型是否可行,关键问题是数据库的“资源独占”和“捆绑销售”相结合的模式从技术上是否能够被打破、数据库之间的互操作是否可行以及对数据库作为整体获得版权保护制度的挑战。 2.1 数据库作为整体的历史阶段性 以《化学题录》和《医学索引》出现为标志的早期数据库一开始就是以数据与软件绑定的形式出现的,数据库最初的绑定方式是数据库软件技术本身的局限性造成的。在计算机用于数据管理的初期,数据与程序是不能分开的,数据不具有独立性。从20世纪50年代后期到60年代中期,因有些数据需要长期多次重复使用,才有了独立的数据文件,但数据并不能共享。到了60年代后期,随着DBMS系统的不断发展,才实现了数据的独立性与数据的共享访问[6]。进入21世纪,数据库已成为经济和社会发展的支柱产业,数据和软件集成为一体的方式已经不是数据库软件技术的局限,而是由数据库最初的生产环境所造成的。首先是对大量传统原始文献信息的数字化工程巨大,需要投入较大的劳动;其次,对于传统文献进行数字化尚需解决原始文献以数字形式进行复制和传播的版权问题,这又需要较大的资金投入;最后是软件开发商对利润最大化的追求。随着信息技术的不断发展,数据库建库更加方便快捷,元数据仓储、学术搜索等各种数据库管理平台不断推出,并呈现出功能分化的趋势。未来,数据库的发展必将顺应人类社会发展对信息规模化及互联共享的需求趋势,朝向以“云计算”和“云存储”为技术支撑的分布式、综合化、协同、共享及关联的管理模式发展。 2.2 数据库之间已有互惠合作的趋势 任何一个图书馆都不可能收集齐全所有的文献信息,同样的,任何一个数据库都不可能涵盖全部的知识信息。数据库从题录库、文摘库、全文库正在朝向以元数据仓储为基础的综合性知识服务平台方向发展。数据库对元数据广泛收集,提供全文获取链接,对没有订购的数据库中的文献全文能够通过“微支付”方式获得,表现出数据库之间的互惠合作趋势[7]。美国ExLibis公司2000年推出的“SFX”资源整合平台,遵循OpenURL协议,引入第三方管理机制和单点管理机制,可实现不同类型、不同格式的数字资源无缝链接。通过图书馆员的参与,对链接知识库(关系数据库)的配置直接参与对资源链接的管理,起到了帮助用户获得更合适链接的作用,其旗舰产品alpha500已在44个国家的560个图书馆投入使用[8]。一些著名的数据库提供商如ISI、CSA、OVID、UMI、EBSCO、Elsevier、High-Wire等已在其数据库中内置SFX。读秀学术搜索、google学术搜索、万方数据、清华CNKI等知识服务平台也都提供对其他全文数据库收录文献的揭示和超链接,用户可以通过“微支付”方式获取原始文献。 2.3 知识产权授权方式的不合理性 数据库作为整体获得特殊权利保护这一制度设计一开始就饱受争议,创作与传播是发展科学和文化事业不可分割的两个方面,没有合法的垄断就不会有足够的信息产生,但有了合法的垄断又不会有太多的信息被使用,这种特殊权利保护在本质上过于维护数据库厂商的利益[8]。在欧洲各国的司法实践中,对数据库的特殊权利保护力度已开始逐步弱化,数据库是否能够得到司法保护,已不仅仅视其是否有实质性的投入和“血汗”劳动,而且还必须包含创作者的创新程度[10-11]。数据库(以全文数据库为例)的构成要件分别是:“数字出版物”、“元数据”以及“软件系统”。其中“数字出版物”在数字出版模式下对数据库商来说仅仅是格式转换和引入,“元数据”中的全文索引主要是通过软件“自动抽词”功能完成的,只有建立全文索引所需要的主题词库需要人工维护,其余数据均可由原始文献出版者提供,而主题词表也是有专门的生产和维护机构。可见,对于数据库来讲,其创新点主要体现在“软件平台”各项功能的设计上,如:数据库结构设计、数据处理方法、数据分析以及数据挖掘等。若以保护和激励创新的立法理念来考虑数据库的授权问题,则知识产权理应授予数据库的“软件平台”,虽然“数字化原始文献”和“元数据”也是数据库的有机组成部分,但其本身具有独立的产权。数据库保护指令虽然也声明授予数据库的特殊权利保护权并不延及数据库所收录的数据本身,但把数据库作为整体给予保护的授权方式显然存在不合理因素。 3 数据库转型的途径 根据以上分析可以看出,困扰数据库发展的关键问题是其自身垄断性,而造成数据库垄断的根本原因是各个数据库商对数字化信息资源的“独家占有”模式与“捆绑销售”模式的结合。因此,要想使数据库更好地适应新形势下社会发展对知识服务的高层次需求,其根本途径就是朝向“元数据与全文数据库分开经营”的方向转型。依照对数据库转型可行性分析,有以下三种数据转型途径可以选择。 3.1 作为过渡的“销售模式”转型 数据库作为整体的历史阶段性说明,在数据库垄断程度尚未达到政府实施反垄断规制措施之前,数据库仍然会继续顽固地保持现有的垄断优势地位。作为过渡性的数据库转型建议是:首先从数据库销售方案开始着手,要求其制定更加灵活的销售方式,给用户提供更多的购买选择。既然数据库垄断的主要手段是“独家授权”及“捆绑销售”的结合,那么将两者之中的任何一个方式予以分解,即可起到立竿见影的效果。一种方案是叫停“独家授权”,数据库可以购买出版商的版权授权,但不能剥夺出版商选择其他销售和传播渠道的权力;另一种方案是要求数据库商不能“捆绑销售”,必须制订更加灵活的销售政策,如分专辑、分种类、分单册的销售政策。 3.2 顺应数据库之间互惠合作趋势的“服务模式”转型 元数据仓储实质上是一种由多数据库元数据的资源整合得来的,这种将不同数据库导入一个新的集成数据库中的服务方式,检索速度快、效率高,不会因为某一数据库访问失败而影响整体检索效率,而且在二次检索、高级检索、年代、学科聚类、多种文献同时检索等数据处理技术上,也有无可比拟的优势[12]。但这种整合资源面临最大的问题就是原始文献的获取问题。“中国知网”正在加速与国外数据库的整合,目前签约合作的国外数据库有Springer、大英百科、Taylor等。合作方式是将这些数据库的元数据安装在“中国知网”中心网站,与“中国知网”的有关数据库进行跨库统一检索和“知网节”链接,读者可以从各厂家站点获取全文[13]。目前这种信息资源之间互惠合作的趋势表明,原始文献的数据内容是可以脱离元数据仓储而独立存在的。如果顺应这种趋势,因势利导,将数据库为个人用户提供的针对单篇文献下载的“微支付”方式转化为一种独立的营销产品,并将其扩展到集团用户,则可较好地解决未购买数据库全文的集团用户对原始文献获取以及文献传递业务传递数量受限等问题,同时,也可以解决众多元数据仓储因自身没有原始文献而面临的广泛应用问题。 3.3 挑战不合理授权方式的“建库模式”转型 知识产权授权方式的不合理性主要是指把数据库的软件平台与其收录的原始文献作为整体给予保护的授权方式。数据库之所以能够作为整体获得知识产权法的保护,其主要原因是其对知识信息的有效管理和方便检索利用的经济价值,同时也有数据库商的广泛游说的因素[14]。近20年来的实践证明,对数据库实施的“特殊权利保护”确实有效保障了数据库商的利益,但同时也使得知识信息的广泛传播受到了限制,更为严重的是,这种特权正在被越来越多的数据库商所滥用。因此要想实现消除数据库垄断所造成的消极影响,就要挑战这种知识产权的不合理授权方式,将元数据仓储的建设交由数据库商、图书馆、情报机构共同建设维护,而原始文献数据库的建设和维护则可以交由出版集团或者数字文献长期保存机构来经营,两者之间的连接和调用可通过数字出版物唯一标识符建立其对应关系,从而实现一种“搭建专业检索平台,实现基本元数据的集成共享,元数据与全文数据库分开经营的新模式”[15]。 4 数据库转型发展的科学性分析 数据库朝向知识服务平台的转型意味着更加注重软件平台的建设,淡化或取消对原始文献的捆绑模式,这种模式的最显著效果就是消除了垄断。因此必将在激励创新、提高知识传播效率和提升知识服务水平诸方面都有较好的促进作用。 4.1 转型能够更好地激励竞争 数据库的转型是朝着不同的数据库细分业务方向发展:编程实力较强的公司可以研制以元数据仓储为基础的综合性知识服务平台;而资金雄厚的数据库商可以投资原始文献长期保存业务并可兼做数字出版物的发行业务;元数据仓储的建库工作则正是图书馆这种知识服务机构传统的职能所在;现有的出版社和杂志社要逐步实现出版发行业务的数字化及网络化,并朝向集团化方向发展。转型后,多样化的原始文献提供方式(如“机构知识库”、“数字文献长期保存机构”、“出版机构”、“作者自存储”等)具备了公平竞争的条件,软件商以独家资源为垄断砝码的优势不在,他们之间的竞争将更加激烈。 4.2 转型能够提高知识传播效率 在现有的模式下,知识传播效率取决于原始文献出版者和数据库商之间的利益博弈。原始文献出版商在提升知识传播的效率诉求方面表现出一种矛盾的心态,一方面他们想通过数据库快速发布出版内容,让文献更快地被发现和利用,从而提升出版物的影响力;另一方面,他们又担心这种快速的传播会冲击传统纸质文献的销售量。数据库转型以后,原始文献经营权重新归属出版商,这将进一步激发出版者对加快知识传播的积极性,出版者的利益诉求得到了保障,“优先出版”、“开放存取”等先进的出版理念将会被更多的出版商所接受,知识传播的效率将会得到进一步提高。 4.3 转型能够提升知识服务水平 数据库转型以后,提供知识服务的软件平台将转变成为功能单一的商业化软件,软件商将更加关注用户的需求。在知识加工、数据标引、文献检索、全文浏览、全文下载、知识发现以及数据挖掘等方面的实现方式都将会成为用户评价软件优劣时要考虑的因素;而标准化、方便性、易用性、准确性、高效率等都会成为软件商们努力的方向,同时,基于元数据仓储的大型数据库可为高层次知识服务提供更加全面的信息来源。这种来自用户需求和软件商自身发展的原动力将推进知识服务水平的不断提升。 5 结语 数据库转型涉及知识生产者、知识管理者和知识利用者等多个利益相关者之间的利益诉求,不可能一蹴而就,但人类对知识自由的不懈追求及社会发展对高水平知识服务的需要又将会不断推动着数据库运营模式的转型发展。随着知识在经济和社会发展中地位的不断提升,数据库垄断问题必将引起国际社会的高度关注。即使现有数据库运营模式的垄断问题暂时不被规制,它也必将被更加先进的知识服务模式所取代。内容是知识服务的基础,平台是知识服务的依托,数据库必将实现从重资源建设的“知识管理”阶段向重平台建设的“知识服务”阶段转型发展。从知识管理到知识服务:学术信息数据库的发展与变革_元数据论文
从知识管理到知识服务:学术信息数据库的发展与变革_元数据论文
下载Doc文档