论网络中文学术信息资源的组织与整合--以图书馆为视角_知识地图论文

论网络中文学术信息资源的组织与整合--以图书馆为视角_知识地图论文

论网络中文学术信息资源的组织与整合——从图书馆的视角审视,本文主要内容关键词为:信息资源论文,中文论文,视角论文,图书馆论文,学术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

以Internet为代表的计算机信息网络的迅猛发展,为人们及时、方便、快速地获取信息提供了技术保障和资源保障。但是,面对浩如烟海的信息资源,科研人员在开展科学研究时仍难从中得到资源上的便利和充分的保障,甚至还有不少人处于信息匮乏的艰难境地。这种现象的产生,反映出网络中文学术信息资源在整个资源系统当中存在着某些急待解决的问题,它需要我们从利于用户利用的角度出发,针对现实问题探寻出组织与整合网络中文学术信息资源的有效模式。

1 网络中文学术信息资源存在的现实问题

1.1 网络信息资源的迅猛增长影响了学术信息资源的可用性

随着信息资源的不断生产,社会信息资源量急剧增长,社会信息资源关系日趋复杂,使社会信息资源活动中的矛盾和冲突不断增加。信息资源的生产量远远超出了人类和社会能够处理和利用的限度,充斥于互联网络的失去控制的、无组织的信息造成信息污染而成为一种负担和灾害。在信息的汪洋大海中,科研人员往往陷入找不到可用的学术信息的困境中。信息的增长速度在中国学术期刊网可见一斑,它有时一天所增加的文献就达5000余篇。再如,20世纪60年代世界信息资源总量约为了0万亿字符,80年代约为500万亿字符,到1998年,世界信息资源总量已是1988年的2700倍。面对如此海量的信息资源,其可用性却在低位徘徊,即使在信息技术发达的美国和日本,其信息资源的吸收率也一直在10%左右。信息资源产量的迅猛增长,信息资源的泛滥成灾,已然导致大量的信息资源得不到组织和控制,加重了用户选择、获取急需资源的负担,使用户利用学术信息资源的成本大大提高,从而降低了学术信息资源的可用性。

1.2 网络信息的异化降低了网络信息资源的平均质量和学术信息的浓度

信息无处、无时不在同化和异化的过程中生成、传递、变换、再生。在网络环境中,信息更容易受到各种干扰因素的影响,干扰因素的异化活动必然引起信息的结构和状态发生变化。网络信息异化的表现是信息污染严重。众多虚假信息、冗余信息、垃圾信息以及垃圾邮件“堆积”在网络上,特定的需求者却难以获取到精确度高、针对性强、稳定安全的信息。对此某些图书情报学家形象而尖锐地指出:“Internet上的信息如果有一英里宽,则只有一英寸深”。因而,广大科研用户虽然面对的是一个浩如烟海的资源宝库,但是又因难于找到所需的学术信息而面临信息资源短缺的威胁。正如约翰·奈斯比特在《大趋势》中所言,“我们淹没在信息中,却渴望知识。”由此可见,网络信息异化的结果是使少量有用的信息被大量无用的信息垃圾所淹没,增加了用户对学术信息的吸收与利用的难度,使人们可能陷入“接触信息的机会越多,实际获得的知识却越少”的尴尬局面,造成了广大科研用户为了获得学术信息不得不花大量的时间去阅读那些无关的信息,甚至形成无功而返的后果。

1.3 网络信息的无序状态导致利用上的困难

其一是网络信息的发布处于无序状态。开放性与自由性是网络所具有的鲜明特征,任何人任何时候都可以在网络上发布信息,因而网络信息的质量参差不齐、准确性有待验证,其结果必然增加用户鉴别信息的成本,为用户利用网络学术信息资源增添了障碍,导致利用上的困难。其二是网络信息的组织处于无序状态。不同网站有不同的信息组织方式,类目的设置也不甚相同并且时有变化。如对四大门户网站的调查统计可知,“随着时间进程,分类引擎大类类名和类序都发生了变化”(注:陈耀盛.四大门户网站分类引擎体系初探(一).图书馆学、信息科学、资料工作,2004(1):150),某一特定主题在不同的网站也可能归入不同的类目,如“共青团组织”在“搜狐”的分类体系中归入“搜狐首页>>政法军事>>政党与社团组织>>共产主义青年团(共青团)”,而“雅虎中国”的分类体系则将其归入“雅虎中国首页>>政府与政治>>政治>>中国共产主义青年团”(注:据2004年9月14日网站分类体系)。同一主题在不同网站处于不同“位置”的情形无疑会使用户在使用网络信息资源中产生极大的不便。其三是网络信息的维护处于无序状态。各网站依靠自身的力量对网络信息资源进行维护,用户难以掌握其维护规律。目前多数学术网站能及时更新网页信息,追踪最新研究成果和热点问题,但也有不少站点长时间不能更新内容而成为“死网”。网站对信息的保存没有统一的标准,随意性较大,很多信息瞬息即逝。这些问题的出现,常使用户感到无所适从,对信息资源的利用困难重重。

2 知识整合:组织整合网络中文学术信息资源的有效模式

从社会系统上看,网络信息资源管理的目的是要解决信息的效率与效用的问题,也即是必须实现:①最大程度地满足用户的网络信息需求,使用户充分发现并有效利用网络信息资源;②最大程度地发挥网络信息资源的效用,促使网络信息资源转化为现实生产力。在网络环境下,信息资源不均衡和信息获取困难得到极大改善,图书馆传统的关键性服务——文献检索与传递服务在用户需求中正在逐步弱化。缘此,依靠搜索引擎和简单的超级链接来组织管理网络信息资源并不能得到用户的青睐,也不能有效发挥网络中文学术信息资源的效用。图书馆唯有寻找一种更为高效的网络信息知识管理模式,以达到为用户提供能直接解决问题的知识信息服务。在这种情况下,知识整合便应运而生了。

2.1 知识整合的含义

所谓知识整合,就是根据本馆的特定需求将网络上处于无序状态的、质量参差不齐的和动态变化着的信息资源加以过滤和筛选、归纳和整合,最终形成高质量的、可供系统利用的知识信息,从而有效地服务于用户的过程。相对于互联网上信息(内容)提供商的信息服务,知识整合关注的是资源对象,表现出针对性、系统性和特色性更强的特点,主要目标是揭示相关学科高质量的知识资源,满足用户对特定知识的需求。

2.2 知识整合的层次

根据组织信息资源的复杂程度,我们可以将知识整合分为三个层次。第一层次是知识组合。网上存有大量事实性、数据性、参考性、凭证性的信息,这些信息的知识含量很高,不但具有极大的使用或实用价值,而且几乎不需要任何二次加工就能利用。图书馆利用自己对网络的熟悉和长期训练形成的知识组织能力和判断能力,能够迅速、准确地从网上搜索到此类信息。这一层次的知识组织只是对网上信息进行物理上的汇聚,信息资源的组织工作并不复杂,关键是要善于发现知识信息资源,并将所寻获的资源下载、存储起来以供用户利用。第二层次是知识综合。网络上绝大部分的信息资源质量参差不齐、良莠混杂,需要我们将其中能满足用户需求的特定主题的知识信息挑选出来供用户利用。这一层次的知识整合不仅要全面搜寻特定主题的知识信息资源,而且还要对所获取的信息进行“有机综合”,这种有机综合整理包括两个方面内容,一是要对查寻到的信息进行取舍和挑选,二是更要对信息进行提炼,从信息中析出知识,增加信息产品的知识含量。第三层次是知识重组。这是智力投入最大的知识整合,属于知识的再造、实现知识的增值。它要求我们要对所查寻到的网络信息进行智力开发,通过分析、比较和甄别,不仅要提炼出蕴涵在信息资源中的各种知识,而且还要通过各种技术手段使知识因子建立各种新的联系,形成一个按知识信息的逻辑关系组织成立体网状、相互联系的知识资源系统,并通过知识优化和知识激活手段,使知识的功能放大,实现更大的效用。

2.3 知识整合的机制

面对众多看似有用的信息或知识,用户在理解这些信息的内在联系和实际效用时存在某些不足,图书馆利用自身的优势对网络信息资源进行有限但是有效的知识整合,将倍增信息的使用价值,能够让用户受益无穷。知识整合的机制是:信息工作者将经过挑选、甄别后的网络中文学术信息资源下载到本地服务器,组成本馆的知识仓库,并通过一定的途径与方法揭示知识仓库内的知识信息的关联,最终将有序化的知识体系提供给用户利用。

2.3.1 创建知识仓库

(1)确定主题。对于组织管理活动来说,在一定时间范围内,不可能把所有的网络信息资源都列为目标对象。因此有必要对选题、内容、领域等进行鉴定和确认。我们应该随时根据特定用户需求系统地收集学科研究领域的专题资料,为研究人员提供快捷准确的学术信息支持。

(2)资源发现。在明确收集的主题以后,应广泛利用各种搜索引擎、专业信息资源导航系统等对拥有相关信息资源的网站进行分析研究,依据所含信息的重要程度、更新频率、知识含量、网站开发者的权威性等调查下载资源的分布情况,掌握相关资源。

(3)智能获取。根据主题有选择地下载获取知识信息资源是创建知识仓库并使知识仓库得以运行的基础工作。获取信息必须事先制定标准,有选择地将最确切的、高质量的信息过滤进来,避免造成二次信息污染。

(4)组织整序。信息下载到本机之后,就进入到了最重要的知识整理阶段。一般情况下,我们对下载的信息都要进行鉴别,将那些与主题相关性不是很大的信息删除,对来自非权威网站的信息必要时要追踪溯源加以考证,最后将一些有价值的、有代表性的信息积累储存起来。

(5)积累贮存。我们要把经过组织整序后的网络学术信息资源积累存贮起来,进行标引、排序,最终形成全文或文摘或题录的知识仓库。经过知识的积累和沉淀,不同主题的知识仓库组合在一起,便形成了可供用户检索利用、能够输出知识信息网络学术信息资源的知识体系。

(6)信息处置。图书馆知识仓库要根据知识服务工作的目标和任务及时做好信息的淘汰、更新和备份等信息处置工作,以减轻系统的负荷和提高信息资源共享的效率,以保证其信息资源的质量和使用价值。

2.3.2 揭示知识信息的关联

为了充分发挥知识仓库的效用,方便用户全面系统地利用知识仓库的知识资源,需要用一定的方法揭示知识仓库内知识信息之间的内在联系。为此,我们可以借鉴“知识地图”的原理与技术。“知识地图”是由企业界提出来的,它是指将企业各种知识资源的入口集成起来,以统一的方式将知识资源介绍给用户,并帮助通过浏览方式搜索信息的员工高效率地寻找所需的资源。“知识地图”对揭示知识仓库内知识信息之间的关联能发挥出其独有的效用。

从技术层次上讲,知识地图的实质就是利用现代化信息技术制作的图书馆知识仓库内部知识资源的总目录及各种知识款目之间关系的知识集成系统。换句话说,一份知识地图包括两方面的内容:一是注入知识仓库的知识资源目录;二是目录内各款目之间的关系。此外,一份完整的知识地图还必须清楚地揭示知识仓库内部与外部相关知识资源的类型、特征及知识之间的相互关系。相对应于传统图书馆目录的揭示,知识仓库知识资源的目录由元数据(Metadata)揭示。目前比较常用的、并得到普遍认可的元数据格式是都柏林元数据集(DC),它是一种由图书馆界(OCLC组织发起的)为主建立起来的元数据系统,以代替MARC用来描述网络环境中的数字化信息的基本特征。运用DC,知识地图能较好地解决网络资源的发现、控制和管理问题,高效地揭示知识资源的主题及其关系。相对应于传统图书馆中的文献信息,知识仓库知识资源的对象数据库采用了SGML(Standard for Generalized Markup Language通用标识语言标准)。作为一种描述和标识文档结构和格式的方式,SGML提供了一种标引结构的框架,一个元素可以说明与它关联的数据,当用户查询某一特定内容时,借助于支持SGML的查询引擎,就可以将多个平台、站点中的相关信息一并呈现给用户。SGML为具体应用提供的功能有:辨别信息内容中各个组成部分,描述文档的基本成份及其相互间的关系,用于区别内容的形式,判定文档结构等。在知识地图中采用这一技术对资源内容进行置标,是实现知识仓库跨库检索的重要基础。

知识地图作为对知识目录描述的知识资源进行组织、浏览和形象化,它可根据需要设置不同级别的类目。但与传统的文献分类类目设置不同的是,知识地图类目的划分没有局限于单一标准的逻辑划分,而是同时使用若干标准进行划分,建立若干个从属于母类的平行子系统;类目的划分也没有拘泥于逻辑的层次划分,它可以根据信息量和访问频率突出某些重要信息的级位,以增强知识信息的易用性。知识地图通过大量使用类目参见的方法揭示知识之间的相关关系,用超级链接的方法建立关联,使用户可通过不同的窗口浏览被参见的类目,以作出取舍的判断。经过这样一个多维的知识地图揭示,知识仓库的知识信息变得井然有序,使用户可以多途径、多视角地检索利用知识信息,实现发挥知识仓库效用的初衷。

3 知识整合的特点与意义

3.1 知识整合的特点

与传统的组织管理模式相比,知识整合在组织管理网络知识信息时表现出如下特点:

(1)它以知识对象为组织单元。与以网站(网页)或文件为对象的组织模式相比,这种组织模式更为深入,可以实现对知识内容的标引而不仅限于文件标题或关键词。

(2)它能够整合多种媒体多种渠道的学术信息,不仅包括文字信息,还包括图像、音频、视频等不同载体、不同介质的学术信息,建立起科学研究所需核心资源和相关资源间的整合与链接关系。

(3)知识整合形成的知识仓库不是简单的“库集合”和“库链接”,而是剔除冗余、重复和劣质信息,对网络学术资源内容与结构进行新的类聚和重组,形成一个获取便捷、利用率高的学术信息资源体系。

(4)它实现了各种数据、知识模块之间的自由、灵活链接。知识仓库是能够根据检索指令自动生成数据链接,以组合成知识或由知识单元构成的基于解决问题的知识系统。

3.2 知识整合的作用与意义

知识整合作为知识管理的创新模式,它在网络学术信息资源的开发利用中具有重要作用。

——它拓展了知识的功能,充分挖掘知识的潜在价值,使潜在的知识得以显在,固化的知识得以活化。

——它使无序的知识变为有序,分散的知识得以集中,加强了知识的有机联系,使之成为有明确目标指向的序列化知识系统,促成知识资源与用户之间快捷、便利、有效的联系,解决或缓解知识无限性、不确定性与用户选择性需求之间的矛盾,节省了用户的时间和精力。

——它实现了对知识信息进行有效筛选和过滤,剔除了知识冗余,摒弃知识信息垃圾,为知识创新需求提供可靠性强的纯知识信息,保证能及时、正确地吸收和运用有价值的知识。

——它保持了知识体系的整体性和关联性,通过知识因子的有序化和知识关联的网状化,沟通相互隔绝的学科领域,使之成为相互渗透、相互作用的有机体,发挥科学知识的整体功能。

——它使知识信息得以有序化存贮与积累,避免了知识存在的散乱状态,使知识流得到优控。

——它有助于建立更为合理的组织知识基础结构。知识仓库可以担当起某领域知识体系的纲目的功能,是知识体系提纲挈领的部分。在知识仓库的作用下,可以形成一个脉络清晰、层次分明的知识布局,使用户可以根据自己的知识需求、需求来源以及所喜好的获取方式便捷地加以利用。

收稿日期:2004-06-15

标签:;  

论网络中文学术信息资源的组织与整合--以图书馆为视角_知识地图论文
下载Doc文档

猜你喜欢