国内学科信息门户发展现状分析,本文主要内容关键词为:学科论文,现状分析论文,国内论文,门户论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G250.73文献标识码:A文章编号:1007-7634(2008)06-0882-06
1 国内学科信息门户发展现状
学科信息门户是目前网络信息组织的一种模式,它整合某学科领域的资源、工具和服务,依托因特网为用户提供学科专业信息和服务。国外学科信息门户的建设始于20世纪90年代中期,到目前已达到稳定与成熟的状态。相比之下,我国的学科信息门户建设才刚刚起步,但在国外学科信息门户蓬勃发展的影响下,国内的学科信息门户也逐渐发展。
1.1 CSDL学科信息门户群
中国科学院国家科学数字图书馆(简称CSDL)是中国科学院知识创新工程的重大项目,该项目于2001年12月正式启动,其建设目标是为全院科研人员提供远程访问的信息资源和服务体系。
CSDL学科信息门户建设分为两个层次:第一层次是按学科大类组建的学科信息门户,由国家科学数字图书馆项目管理中心规划组织,已经有化学、生命科学、资源环境、物理数学、图书情报5个门户建成并投入使用,并初步形成了资源选择和标引组织的规范;第二层次是针对具体的专业领域或跨专业、跨学科领域的专业信息门户,提供深入、具体的专业信息资源的选择、组织和服务[1]。
目前中国科学院国家科学数字图书馆已建成微生物、科技政策与科研管理、青藏高原研究、长江流域生态环境、天然产物和天然药物、海洋科学、中国种子植物、新生性传染疾病、专利信息等10个特色门户。
1.2 NSTL热点门户
2004年由国家科技图书文献中心(简称NSTL)资助的科技热点信息门户项目开始建设。已建成纳米科技、认知科学、食物与营养、艾滋病预防与控制4个热点门户,目标是向科研人员提供权威、可靠的精品信息资源导航。
1.3 武汉理工大学图书馆门户
2002年12月,武汉理工大学图书馆利用自主软件建设自己的数字图书馆分布式学科信息门户体系,已先后建成了材料复合新技术信息门户及交通运输工程信息门户,其服务对象是该学科领域的科研、教学和实验人员。其中材料复合新技术信息门户得到了材料复合新技术国家重点实验室的资助。
1.4 中国科学院武汉文献情报中心门户
中国科学院武汉文献情报中心也建立了一系列工程技术类学科门户。如食品安全信息门户、光电子信息门户、纳米技术信息门户、燃料技术信息门户、石油工程信息门户、先进制造信息门户、生物工程信息门户、汽车工程信息门户、海洋与水下技术信息门户、农业工程信息门户、自然灾害信息门户、矿业工程信息门户、空间技术信息门户、计算机与网络技术信息门户等。
1.5 中国林业科学研究院科技信息所门户
中国林业科学研究院科技信息所建设了林业学科信息门户,按照林学等学科用户的需求对网络中相关的信息资源进行了更有针对性、更深入的揭示。
2 国内学科信息门户特点
笔者通过登陆国内各学科信息门户网站,从中选取学科信息门户15个,从承建机构、学科覆盖范围、资源组织、元数据描述、管理系统、附加服务、互操作性等方面对其进行分析研究。通过对这些学科信息门户的了解,发现目前国内学科信息门户发展水平参差不齐,CSDL五大门户、NSTL热点门户、武汉理工大学图书馆的两大门户质量较好,中科院武汉文献情报中心的系列工程技术门户质量较差。现将国内部分学科信息门户的基本情况概括见表1。
2.1 承建机构
学科信息门户一般是由具有科研实力的研究机构来承担,这些机构是学科信息门户资金的来源及工作人员的提供者。从表1可以看出,国内学科信息门户的建设主体主要是:中国科学院系统的信息机构、国家科技图书文献中心以及个别高校图书馆,地域分布以北京、上海、兰州、武汉为主。其中,中科院系统所建立的学科信息门户在数量、规模、管理运行机制等方面都明显处于同行业的领先地位,生命科学、资源环境、图书情报、化学、数学物理五大门户更是其重点建设的对象。
2.2 学科覆盖范围
国内学科信息门户以向科研工作者提供权威、可靠的网络学科资源导航为目标,所覆盖的学科范围以单一学科为主,大多只包含一到两个学科领域或专题,主要集中在自然科学的数、理、化、生物、地理及部分工程领域,对于人文社会科学领域几乎为空白,多学科、多主题的综合性学科信息门户甚为少见。
2.3 资源组织
2.3.1 分类法
分类法是学科信息门户信息组织的重要方法之一。分类法是按照学科或主题将不同的信息资源进行分类和集中,通过等级和层次的显示,为用户使用信息提供良好的知识向导体系[2]。分类法在学科信息门户中的基本功能是建立分类浏览结构,满足用户按学科系统检索浏览的要求。国内学科信息门户利用分类法构建浏览结构主要有以下两种情况:一是采用现有的国际单学科分类法或国内外通用分类法组织信息。如物理数学信息门户采用《国际物理分类法》及《数学主题分类法》,资源环境学科信息门户采用RESC和DDC两种分类体系,图书情报学科信息门户选用《中图法》等。二是根据本学科的特色,参照相关的国内外标准、国内外重要的文献分类体系,再结合本门户的特点构建分类体系。如生命科学信息门户、认知科学门户、食物与营养信息门户在参照国家标准GB/13745-92《学科分类与代码》、《科图法》第三版、《中图法》第四版、DDC21的基础上,再结合近年来这些学科领域的研究热点和发展趋势提出自己的分类体系。
2.3.2 资源类型组织法
资源类型组织法是国内学科信息门户组织信息的另一重要方法。资源类型组织法将网络资源按其内容特征和种类进行组织,为用户提供按资源类型浏览和检索的服务[3]。在本论文调查的15个学科信息门户中,15个门户网站都提供按资源类型浏览或检索的功能,占调查总数的100%。
资源类型词汇表是资源类型组织的基础,其作用在于科学划分资源类型和规范类型术语。国内学科信息门户一般参照DCMI(都柏林核心元数据促进会)类型表和现有的一些编目规则,再根据各门户信息资源的特点、网站建设需要和用户需求制定自己的专用资源类型表。如材料复合新技术门户与交通运输工程门户参照DCMI Type Vocabulary的格式和内容编写资源类型表,用于上述两门户网站按资源类型分类的一级分类,其资源类型分为数据库、软件、期刊、图书、专利与成果、图书馆、新闻讨论组等22大类。
2.4 元数据描述
元数据是网络资源描述的主要技术,其功能包括描述、定位、搜寻、评估和选择。采用标准的元数据框架作为信息资源描述和管理是学科信息门户实现质量控制和高效信息服务的一个重要方面。国内学科信息门户在元数据描述方面呈以下几个特点。
2.4.1 基于DC并进行选择、扩展
国内学科信息门户大都采用国际上通用的DC(Dublin Core)元数据描述资源。一般采用DC元数据提供的15个元素和现行的修饰属性Qualifiers作为核心集,建立资源描述框架,再结合本学科信息资源特点对元数据元素进行选择、限定及扩展。
2.4.2 采用元数据量大
一般而言,元数据项使用得越多,对网络信息的揭示就越详尽。国内学科信息门户采用的元数据项普遍多于国外,如资源环境信息门户采用了36项,图书情报信息门户采用了14项,生命科学信息门户采用24项,认知科学信息门户采用了14项,食物与营养信息门户采用12项,汽车工程信息门户采用27项等。而国外的学科信息门户采用的元数据项一般不超过10项。
2.4.3 使用特色元数据项
特色元数据项的使用可以增强用户选择信息的目的性和针对性。国内学科信息门户除采用国际上通用的DC元数据描述信息外,不同的门户还增添了特色元数据项。如化学学科信息门户增加了“收费情况”数据项,图书情报和生命科学信息门户增加了“网页快照”和“主页菜单”。
2.5 软件系统
SPT是美国威斯康星——麦迪逊大学的ISP项目的成果之一,是源代码开放的免费软件。SPT提供了学科信息门户建设的各种基本功能,如基于学科或资源类型的资源组织、浏览和导航功能,基于字段的检索,支持Web方式的元数据加工制作和系统管理维护,也支持各种扩展功能的实现[4]。中国科学院的CSDL学科信息门户群、NSTL热点门户选用了SPT软件包,在SPT现有软件的基础上,结合自身的建设要求,对SPT进行本地化改造,包括汉化、OAI和RSS的支持,替换原有社区论坛等。材料复合新技术信息门户和交通运输工程信息门户采用武汉理工大学图书馆自主开发的QSIGsystem软件包,该系统支持pif、jpg、doc、pdf、vip、zip、caj、kdf、htm等任意格式的资源整合、发布与管理,能实现网络地址自动检测和资源类型定制,并能广泛地应用于其它学科信息门户建设。
2.6 附加服务
学科信息门户除了提供强大的浏览和检索功能之外,还提供一些附加服务,以提高信息门户的服务能力,改善门户的访问率。国内学科信息门户的附加服务主要有:信息订阅、学科论坛、最新资源通报、推荐资源、个人收藏夹等。武汉理工大学图书馆的材料复合新技术信息门户及交通运输工程信息门户推出RSS推送服务,后又增加了RSS推送栏目订阅个性化推送频道服务,对科研和教学起到了积极的促进作用。CSDL的几个门户都在不同程度上支持信息的推送服务,但其功能还比较薄弱。
3 国内学科信息门户建设中存在的主要问题
在对国内学科信息门户的调查中了解到,国内学科信息门户的建设和研究起步较晚,同国外优秀的学科信息门户相比还存在一些问题与不足,主要表现在如下几个方面。
3.1 学科信息门户资源组织体系不够完善
3.1.1 学科分类体系存在的问题
(1)缺乏对现有分类体系的调整与拓展。国内学科信息门户一般采用现有的国际单学科分类法或国内、外通用分类法组织信息,如CSDL的化学、物理数学、资源环境及图书情报信息门户。虽然这些分类法具有较高的稳定性和互操作性,但由于缺乏对现有分类体系的调整与拓展,因而很难及时对新的研究领域作出反应并更新术语。
(2)自创分类体系的建立带有很大的随意性,类目的设置、体系框架缺乏严密性。国内学科信息门户自创分类体系的建立带有很大的随意性,类目设置随心所欲,多等级类目应用不合理,逻辑隶属关系混乱,缺乏对于信息组织的科学规划,不利于门户之间的互操作。如材料复合新技术门户根据该领域的新技术专题以及动态相关信息作为学科分类浏览入口;天然药物门户按天然药物研究方向、药物疗效提供分类浏览入口;微生物特色门户将资源类型分类与学科分类混在一起;交通运输工程信息门户“综合运输”这一重要类目没有列出等。
3.1.2 资源类型组织体系存在的问题
(1)资源类型的划分无统一标准。资源类型表是资源类型组织的基础。虽然DCMI类型词表提供了一组通用的、跨领域的术语,但由于DCMI资源类型表中的类型概念过于笼统和宽泛,造成学科信息门户对资源类型的划分无统一标准,随意性较强。大部分学科信息门户都制定了自己专用的资源类型表,如数理学科信息门户将资源类型分为14大类,资源环境学科信息门户收录的资源类型有10大类,天然药物门户9大类,新生传染性疾病门户有7大类等。资源类型的划分无统一的标准会影响类型组织的效用,并给跨门户的合作带来许多问题。
(2)资源类型名称不规范。由于不同的学科信息门户都有自己的资源类型表,调查发现资源类型名称不规范较为普遍。资源类型名称不规范主要表现在两个方面:一是对资源的称谓不确切,同一资源往往有着不同的名称。如对于组织机构,化学门户称“机构信息”,资源环境门户称“机构网站”,生命科学、物理数学门户称“组织机构”,认知科学、食物与营养门户称“机构信息”;二是同一称谓其内涵与外延也有所不同。如对于“事件”这一资源类型,资源环境门户该类下包含:会议、专题讨论会、学术研讨会、新闻。天然药物门户该类下包含:会议、展览、学术研讨会。汽车工程门户该类下包含:会议、展览、其它。资源类型名称不规范直接影响到用户对资源的检索与利用,削弱类型组织信息的优势。
3.2 检索功能单一,对检索缺乏相关主题词表的支持
国内学科信息门户检索功能单一,所提供的检索方式仅有简单检索和高级检索,而少有门户能提供基于词表的检索以及特色检索。此外,在一些门户的高级检索项中无法从资源发布时间、资源格式、语种、显示顺序、显示数量等方面限制其检索的结果[13],这些十分不利于提高信息的查全率与查准率。
3.3 学科信息门户之间缺乏互操作
互操作指学科信息门户之间交换和共享文档、查询和服务的能力,实现在相似或不同的学科范围、一种或多种语言之间交叉浏览和交叉检索。互操作的实现需要一系列相互支持的技术、方法和系统,并要求相关标准的一致性应用。国内学科信息门户使用的两大软件平台功能不够完善,SPT只提供了学科信息门户建设的各种基本功能,实现门户之间的简单链接;QSIGsystem在元数据的处理和互操作等方面开发不足。此外,门户之间的合作程度低,缺少协调和沟通,在技术标准、数据共享等方面很难达成一致。这些都影响了门户之间互操作的实现,目前还没有看到门户之间互操作的实际例子。
3.4 缺少个性化的附加服务
国内学科信息门户在建设过程中没有注重对用户附加服务的建设。一些门户对于定制服务、用户推荐资源、学科论坛、虚拟咨询等只是设置了空栏目,有的甚至找不到网页。而个别能提供一系列附加服务的门户主要还停留在信息的拉取上,功能缺乏主动性,不能很好体现服务的个性化。4对国内学科信息门户建设的建议
4.1 学科信息门户资源组织体系的完善
4.1.1 学科分类浏览体系的完善
(1)现有分类法的调整以及自创分类体系的完善。由于利用传统的体系分类法或者直接采用现行的学科分类规范存在明显的滞后性等问题,国内学科信息门户在使用现有的分类法组织信息时,应结合自身的学科领域以及目标用户群进行适当的调整
和拓展,保证分类体系的质量、可维护性和互操作性。如适当删除和本学科不相关的类目;根据学科体系和用户习惯科学地调整类目结构设置,如增设二级子目录,合并同类项;标题重命名,使用更容易被用户理解的类目名称;控制类目深度,类目展开层次一般在2-3层;拓展分类法等。
采用自创分类体系应注意以下几个重要问题:遵循基本的逻辑规则,大类设置科学、合理,类名应正确反映类目的内涵和外延,有效揭示类目之间的多维关系等。
(2)不同分类体系的对应转换。不同分类体系和浏览结构之间的交叉浏览是一个比交叉检索更难达到的目标。由于不同的学科信息门户的学科分类体系不尽相同,交叉浏览可以通过建立不同分类法之间的对应关系来实现,如两个或多个体系之间的相互对应,还可以将多个体系都向一个通用的体系(比如中图法、DDC)转换,从而保证不同的门户进行广泛的互操作,适应未来的发展趋势。
4.1.2 资源类型浏览体系的完善
(1)建立统一的资源类型划分标准。要建立统一的资源类型划分标准,可参照已有的成熟的资源类型研究成果,如DCMI类型表、编目规则等,在现有的学科信息门户资源类型的基础上,提供一个科学的、包容性强的类型框架,该资源类型划分标准集中各门户资源,充分反映各种资源类型之间的类属关系,并进行层级揭示[5],为学科信息门户按资源类型组织提供标准参照。
(2)规范资源类型术语。规范资源类型术语,可以采用比较通行的术语称谓,如文本、机构组织、交互性资源、参考工具等。明确定义各种类型术语的概念和外延,准确体现其实质内容,如专题讨论会与学术讨论会,目录和书目数据库,电子图书和小说等。使用户能对各种资源类型有一个准确的认识,提高从类型组织信息的效率。
4.2 优化学科信息门户的检索功能
4.2.1 提供基于词表的检索
主题词表主要用于检索时的后控制和标引时的自动或辅助选择索引词,是提高查全率与查准率,实现多语种检索和智能化概念检索的重要途径。国外一些大型的学科信息门户一般都利用成熟的词表来组织信息,国内学科信息门户可充分借鉴国外成功的经验,采用现有词表(包括叙词表和标题表)甚至自定义词表进行信息标引,如《汉语主题词表》、《国会图书馆标题表》、《地理科学叙词表》、《环境科学叙词表》等等。提供自然语词向主题词转换的检索界面或利用主题词表构建浏览体系结构,从而提高用户检索用词的专指度,以及进行相关的扩展与转换。
4.2.2 提供对网络资源检索的检索工具
国内学科信息门户除了具备传统的检索功能外,也应重视对网上资源检索功能的开发,为用户提供方便实用的检索工具。门户可将检索工具分为两类:一类是对本门户内部资源的检索,如对本门户内部目录、自建数据库的检索[6];另一类是对Internet资源的检索。因此国内学科信息门户应提供多种搜索工具,如常用搜索引擎、元搜索引擎、新闻搜索引擎等,方便用户在所收集资源和站点以外的网络资源中分别检索或同时进行交叉检索。
4.3 在完善已有服务的基础上,开展具有本门户特色的个性化服务
国内学科信息门户在开展个性化服务方面较为落后,现有的服务项目没有很好地运作起来。要加强附加服务的建设,学科信息门户应在完善已有服务功能如学科信息发布、用户反馈处理、学科论坛、信息推送等的基础上,转变服务理念,充分利用各种智能化技术,针对用户特点开展个性化服务。个性化信息服务主要包括用户研究、个性化定制和个人资源管理。
用户研究主要是通过获取用户偏好、行为等信息,建立用户模型,为后续的个性化定制、信息推送打下基础。获取用户信息的方法通常有:直接调查、跟踪用户系统使用行为并预测其兴趣所在。
个性化定制服务是了解用户信息需求、研究用户利用数字化资源的得力助手。个性化定制服务应是多样的,它分为:用户注册;个性化页面定制,包括页面风格、栏目定制;专题信息服务定制,根据用户提供的关键词、学科范围和文献类型等要求,对最新资源提供主动信息推送服务;附加服务定制,包括日历、记事本、天气预报、学术论坛定制。
个人资源管理能为用户提供一个很好的个性化信息共享环境,而且能极大地丰富学科信息门户的资源,使学科信息门户走向动态、交互的良性发展轨道。用户可以上传、分类和标引自己的,文本、图片、视频文件以及收藏的网址等,并能任意共享、修改和删除。而对于用户的个人资源,门户可以生成拷贝、分类和提交编审。
4.4 加强门户之间的合作,实现互操作
国内学科信息门户在建设过程中应寻求更多合作机构的参与和支持,从而为门户的发展提供更多的资金和技术支持,获取更多相关的信息[6]。同时,应联合各信息机构在全国范围内建立一个网络信息资源管理中心,做好总体规划,统一协调,指导和约束各个具体系统的建设,避免各自为政。中心根据实际情况,制定门户资源选择标准、资源搜寻策略、资源描述标准、学科分类体系与资源类型标准等,采用统一软件平台,统一检索协议,在建设共同标准规范的基础上实现门户之间互操作,并通过和不同地区或不同国家的学科信息门户的合作,扩大服务对象,增强服务能力。