民族学学科信息门户的资源组织的实现方式探析,本文主要内容关键词为:民族学论文,探析论文,学科论文,组织论文,方式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
学科信息门户(Subject Information Gateway,SIG)是指把某学科(专题)网络资源、工具与服务进行整合,并在一个可定制个性化服务的界面,为用户提供一个同一协作的学术交流环境。在国外,这种组织模式几乎覆盖了所有的学科。中国学科信息门户研究与建设始于2001年,从涵盖的学科来看,主要涉及自然科学的基础学科和应用学科,而有关社会科学的学科门类却很少。目前中国国家数字图书馆等多家单位建设了民族文化和研究数据库50多个,在因特网上还有大量的介绍一个或多个民族文化和民族研究信息的网站以及一些商用数据库中也有大量的民族研究资料。这些数据库、网站由于是使用不同的硬件系统、平台与软件建设,致使:一是用户在使用这些数据库时,面临着各种规模的数据库、多媒体和分布式体系结构的选择。检索过程中的权限要求与IP验证,检索结果中出现的死链、大量无用或重复信息等障碍,使民族科研用户难以在一个集成化信息检索平台上一站式获取和处理自己所需信息。二是这些数据库与数据库之间、网站与网站之间没有互联互通,无法进行资源共享和综合利用,实际上形成了一个个信息孤岛。[1] 欲解决这些问题就需要把民族研究数据库以及民族网站信息资源进行集成化,以利于广泛的利用。而民族学学科信息门户的资源集成正是学科专家和专业馆员利用门户重新组织网络上的本学科信息,对这些资源进行详细的元数据描述并提供指向资源的链接,可以说民族学学科信息门户的资源组织是民族学数字信息集成的最好实现形式。本文试对民族学学科信息门户的资源组织的实现方式作一分析。
一、构建合理的民族学学科信息资源分类体系
分类体系既是对民族学学科信息门户收集的资源实施组织,也是便于用户基于学科分类进行资源浏览与检索的有效途径。从国内外已建设的学科信息门户看,大型的学科信息门户网站都通过使用合理的分类体系和词表提供高质量的服务。国外用于组织资源的分类法有DDC、UDC、LCC、EI、NLM以及自编的分类类目;国内使用的分类法有《中图法》、《科图法》、DDC以及参照相关的国际标准建立的分类体系。对于民族学学科门户资源组织的分类类目的设定,使用国内的分类法设置较为合理,且《中图法》的使用有广泛的基础。但直接把《中图法》的民族学类目作为学科信息门户的类目,又不利于资源组织。在《中图法》中,总论民族学的类目设置在“社会科学总论”大类下,其他专论各民族的有关学科均入相关学科类,作为信息门户资源组织的学科分类需要对类目进行调整。根据《中图法》的列类原则、参考教育部《学科分类与代码》(GB/T13745-92),结合民族学的学科发展和研究文献的分布、数据库建设的种类,并考虑用户的使用习惯,把民族学分成下列类目:
在二级类目下再根据信息量的多少细分,这样就形成一个10个大类、50几个二级类目和若干小类的类目体系。
二、构建民族学学科叙词表
受控词表的运用既可以保证资源描述的准确性,又利于实现本学科或专题的深入检索。国内外大部份学科信息门户大都使用了受控词表来描述资源,也有的用自编词表。民族学领域目前没有专门的受控词表。就我国的学科信息门户建设而言,把《中国分类主题词表》[2] (以下简称《中分表》)作为受控词表有较高的参考价值。但由于《中分表》是面向所有学科使用的,直接用于民族学学科信息门户的资源组织有一定的困难。需要采取:一是要增设民族学科主题词。大量的民族学学科主题词,在《中分表》中没有体现。例如,在《中分表》中有侗族的“侗戏”主题词,无侗族的“侗族大歌”主题词,侗族大歌和侗戏都是侗民族喜闻乐见的艺术形式,但侗族大歌更有影响力;再如,“口承文化”是无文字民族甚至是有文字民族传承文化的一种形式,《中分表》缺少这样的主题词。在进行资源组织时需增设民族学学科主题词。二是不断添加民族学新词汇。《中分表》作为一种先组式和后组式语言兼容的分类主题一体化词表,是不能随时插入学科主题词的,且《中分表》修订周期过长,词汇更新滞后。学科发展又在不断增加新的词汇,在民族研究领域就出现了大量的学科新词,诸如非物质文化遗产、游牧文化、无字文化、文化植被、濒危语言、虚拟博物馆等。对于“非物质文化遗产”这类的词,可以说是民族学研究领域的高频词,在《中分表》中就没有体现。学科信息门户是一个学科信息的集成平台,信息门户资源组织需要及时增加本学科领域的新词汇,反映学科研究动态。所以在民族学学科信息门户建设中需组织本领域的专家以《中分表》为基表,从中抽取所有有关民族学以及相关学科的词汇;增补民族学领域中专业词汇和学科新词;增加自然语言的检索词,增大检索入口,使用相关和参照关系等体现主题词与自然语言检索词,编制《民族学学科叙词表》作为受控词表,以实现本专业的深入检索。同时要关注和引入本体论等语义相关技术,构建民族学领域本体,更好地解决门户间的互操作、知识整合、个性化服务等问题。
三、创建民族学领域本体
为适应门户的发展,多层次、多功能地表现民族学概念之间的关系,便于用户进行联想和可视化检索,使民族信息资源能够在用户与用户之间以及各种异构系统之间进行广泛的交流与知识共享,可利用民族叙词表和本体(Ontology)在表达知识概念结构上的关系,创建民族学领域本体。目前在国际上已有通用的本体描述语言,如W3C工作组于2004年正式推荐的标准网络本体描述语言(Web Ontology Language,简称OWL);有实现本体构建的工具WebODE、Prote' ge'、Ontosaurus等以及构建本体的方法;有本体运用于艺术和农业信息系统的范例,这些对民族学本体构建均有借鉴意义。民族学领域本体的构建是需要实现民族学领域的叙词表到知识本体进行转化的过程,但其转换不是一个直接的大规模词表转换,而是需要把一个领域分成若干的概念类,逐个类目的建立。例如,以流传于甘、青、宁、新部分地区独特的民间艺术“花儿”为例。使用本体构建工具,建立概念(类):“花儿”概念,其下位类为“河州型花儿”、“洮岷型花儿”[3];建立属性,且是每一个下位类都具有的属性。使用“句”、“令(曲调)”、“衬词”[4];然后分别建立实例;同时还需设置等同与相关关系,因“花儿”民歌涉及民间诗学、民间音乐、民俗学、社会学、语言学、历史学、民族学、人类学[4],所以可使用“别类”,把上述概念进行相关关系的显示。这样在语义系统中就构成了一个可视的“花儿”概念(类)完整意义的本体。
民族学本体的构建是一个系统工程,涉及民族学领域专家对本领域知识概念及概念词之间关系的确定、信息管理人员对知识概念的组织和计算机软件工程人员在本领域内的开发,这里只是作一个引子,以期引起民族学学科信息门户建设者的关注。
四、把元数据描述作为基本方法
要使民族学信息资源实现科学的知识组织,在提供民族学学科信息的检索、浏览、链接的方便性和相关性的同时,保证其个性化信息服务得以充分体现。需通过元数据描述以下方式实现。
元数据是描述、组织和发现因特网上信息资源的有效工具,它通过描述数据的内容和本质特征,存储相应的检索路径,便于识别资源、评价资源,追踪资源在使用过程中的变化,实现简单高效地管理大量网络化数据,实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。元数据作为学科信息门户的基本信息组织方法,是每一个学科信息门户建设中都须面临的选择。目前国际上很多门户使用通用简单的DC(都柏林核心元数据)。我国多家单位在民族学数字资源建设中使用的元数据标准有很多,其中电子图书、期刊论文、会议文献、学位论文、地方志等数据库绝大部分是等同采用国家科技部科技基础平台工作重点项目《我国数字图书馆标准规范建设》子项目《专门数字对象描述元数据规范》,但对视频、音频、照片等类型的数字资源组织,采用了不同的元数据标准。要建立民族学学科信息门户首要的是选择合适的通用的标准元数据格式,民族学学科信息门户的元数据可以参照《专门数字对象描述元数据规范》,作为基本的元数据。但在视频、音频标准上,需要选择符合民族学学科信息的元数据。例如,在责任主体元数据项,须增加少数民族文化传承方式的“口述”、“传承”等元数据元素。同时在民族学学科信息门户中要建立包含元数据以及实现门户元数据格式的转换和网络中不同元数据的互操作的功能库。只有这样,才能保证民族信息在不同结构的信息源中传输不失真。
五、要注重民族学学科的个性化信息资源的知识挖掘
在国外,门户建设已有十几年的历史,门户已趋于成熟,为各自的学科发挥着重要的作用。国内学科信息门户建设近几年发展也很快,但建设的门户普遍存在资源的可用性和易用性差。多数门户是封闭的,无法实现用户的交互性和用户资源的共享,门户资源利用率低。而用户呼唤门户朝“5C化”发展,即用户化(Customization),适应不同用户对信息获取的不同需求和兴趣;商业化(Commerce),为用户提供商务方面的服务;沟通化(Communication),用电子邮件,网上会议等通讯工具在网站和用户之间、用户与用户之间架起信息沟通的桥梁;社区化(Community),为用户提供彼此可以互相交流,互相学习和互相帮助的虚拟空间;兼容化(Compatibility),即能够让一个虚拟图书馆系统和使用不同平台的相关技术和服务实现无缝对接,为用户创造一个完整、友好的界面[5]。用户的需求是门户建设的源动力,也促使民族学学科信息门户建设者思考其门户资源的组织模式,以适应民族学学科信息门户快速发展。
民族学学科信息门户建立的最终目的是通过建立知识社区和知识网络,使民族学科研用户实现无阻碍的知识共享和学术交流,个性化信息组织是门户的基础。目前建立的各个聚合了不同内容的门户构件,可使民族学学科信息门户实现个性化和可定制地呈现网页内容。同时基于Web2.0开发的学科门户也有较为成熟的设计[6],可作为民族学学科信息门户的借鉴。Web2.0的开发其核心理念就是“个性化”,强调用户的体验和集体参与;Web2.0技术最本质的特征是互动性,即通过使用互动技术,使每个人都成为信息的提供者,并通过动态方式将信息组织起来,使信息有序化。信息资源组织的过程也是围绕着更深层次上揭示人类知识的整体和关联而不断进行创新的过程。民族学学科信息门户个性化的信息资源组织,就是借助民族学学科信息门户,通过对民族科研用户的反馈信息处理,动态地调整用户个人数据库,根据用户的个性信息需求,来组织和开发信息资源[7]。个性化信息资源组织即个性化知识挖掘。个性化知识挖掘是通过门户系统、依据知识挖掘技术自动处理用户数据库中大量的原始数据,从中挖掘、抽取出必然、有价值的知识元。这些知识元可以是用户定义要发现的、也可以是用户需求表现出来的,然后系统对这些知识元进行关联、对比、评价,形成知识库,将隐性知识显性化以提供用户利用。个性化信息资源的知识挖掘是信息组织的发展趋势,也是对民族学学科信息门户资源组织的必然要求。
民族学学科信息门户资源组织方式的实现,还需依赖很多条件。需借助民族学科信息门户的技术条件、门户平台的资源整合功能、平台的建设资金和门户后续维护,所以门户网站需要有一个实力雄厚的组建组织进行建设,在实际建设中,应由国家一级机构(中国社会科学院或国家民委等)联合各民族机构以及各图书馆,采用成员馆的管理形式进行管理,才能确保资金、资源和后续维护。这样才能保证民族学学科信息门户资源组织功能得以实现,使其资源得到有效利用。
收稿日期:2007-09-20