Factiva新闻分类指标体系及其对我国的启示_标准行业分类法论文

Factiva新闻分类指标体系及其对我国的启示_标准行业分类法论文

Factiva新闻分类标引体系及其对我国的启示,本文主要内容关键词为:启示论文,体系论文,我国论文,新闻论文,Factiva论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

人们研究分类法由来已久。国外的杜威十进分类法、美国国会图书馆分类法,国内的中国图书馆分类法等,都是分类系统的集大成者。但是,这些分类法都是针对图书馆和情报信息机构的图书资料编制的,对于专业信息,应编制专业分类法,适应工作所需。例如档案界“为了建立统一规范的档案检索方法,实现我国档案分类检索体系的标准化”①,编制了《中国档案分类法》。新闻信息作为独特的信息资源,有简短性、时效性和多样性等特点,不同于图书资料的性质,因而也应该建立统一规范的检索标准和体系。遗憾的是,目前我国还没有统一的新闻信息分类标准,各个新闻单位各自为政,利用自己的体系对信息进行加工处理,这样的弊端显而易见:首先,新闻系统各单位标准不一,信息重复建设,造成了较大的经济浪费;其次,新闻信息软件商不得不对大量同一新闻信息反复标引和分类,不利于新闻信息的发展利用和自动分类标引软件的研制开发;第三,各系统之间兼容性小,用户没有统一的标准可以参考利用,检索的盲目性会影响信息的查全率和查准率。因此,制订统一的新闻信息分类标引体系是当前必要的和紧迫的工作之一。本文对国外比较成熟的系统之一——Factiva数据库和它的分类标引体系进行介绍,并结合自己的认识提出该体系对我国新闻分类法编制工作的启示。

一、Factiva介绍

Factiva是道琼斯和路透社联合成立的公司,是一家全球新闻和商业信息的提供商,通过其门户网站或集成解决方案提供齐集来自道琼斯、路透社新闻网络及《华尔街日报》等的世界主要环球化新闻及信息内容,并设有多个不同语言的用户接口及内容选择。目前Factiva有超过150万的企业级用户,其中全球500强企业中85%已经采用了Factiva的信息服务,信息内容涵盖咨询、金融、媒体、医药、教育、高科技,汽车、能源等众多行业。Factiva.com是Factiva公司第二代在线商业信息服务系统,是原Factiva公司道琼斯数据库和路透商业快讯合并而成的升级产品。它的内容包括来自118个国家近8000个区域性和全球性的信息源。具体内容包括:

1)1000多家在线报纸的当日最新内容和历史资料,如华尔街日报、南华早报、先驱论坛报等;

2)6500多家杂志包括一般商业以及行业必读的杂志,如经济学家、哈佛商业评论、远东经济评论等;

3)270个新闻专线,160多家媒体节目(如BBC,CNN,ABC,CBS,NBC,Fox等),9000多个网站;

4)3万多个公司报告及全球各地的公司档案,公司报告包括全球55个行业的36500万的公司②。

最近,Factiva与微软公司达成协议,将在微软Office2003系列中加入Factiva新闻检索内容③。

二、Factiva新闻信息分类标引(Factiva Intelligent Indexing[tm])体系介绍

Factiva拥有极其庞大的信息资源。为使用户快速、便捷,准确地查找自己所需信息,Factiva在2002年末发布了内容增强工具Factiva Fusion,用于对企业关键内容集进行分类,并创建各内容集之间的联系。更重要的是,Factiva推出了Factiva智能标引体系(Factiva Intelligent Indexing④,以下简称FII),FII对现有的门户、企业Intranet和内容管理系统等知识库的内容进行一致的组织,可以增强这些系统的性能。实际上,FII是由几份大型分类表和词表组成的网络体系,为Factiva数据库新闻信息的统一分类、标引提供支持,为用户检索提供指导和依据。FII允许用户通过4种范畴(即公司Company、产业Indus-try、地区Region、主题Subject)进行结构化检索(其中公司通过“公司代码表Company Codes faetsheet”进行检索),或者与自由文本结合进行检索。在扩展检索中用户可以限定日期、语言、检索词位置、排序标准等条件⑥,并可根据反馈信息再次制定检索策略,查找到比较准确的数据。另外,检索策略能够被保存并且检索结果能够被跟踪和更新。

FII在标引和检索体系中起着极为重要的作用,FII自制订之初到现在一直在不断的修订和完善中。1999年10月28日出版FII1.0。2003年5月6日出版的FII2.2是FII第11个修订版,是对FII2.1的修订。在每一版本修改后,都会注明对前一版本的修改之处。一般注明修改的类号、号码状态(是否是新号码),其直接上位类号、类号类型、类目名称、类目描述等。FII2.2对FII2.1有12处修改,其中新增类目9个,改动类目3个。现以FII2.2为例介绍整个体系。

FII体系主要由几大表格组成。每一表格就是一个分面分类表,或者说一种检索途径。每一表格的类目按照类级排列,电子版的FII是以:Microsoft Excel的形式出现的,以不同的颜色和“+”、“-”区分类级。大红色显示的为第一级类目。黑色、深绿色、浅蓝色和深紫色显示的分别是第二、三、四、五级类目。上位类用旁边的“+”、“-”可展开或紧缩其下位类。每一分类表基本由以下几项组成:Factiva代号,Factiva类目名称,Factiva类目描述,直接上位类。

Factiva分类法分面组织合理,类目详尽,以下分别介绍各分面分类表。

1、地区分类表(Geographical Areas)

FII2.2地区分类共有5级,525个类目。一级大类为15个类目,并没有严格按照7大洲的地理区域来分类,而是根据地理集中度和经济区域设置类目,分别为非洲国家、亚洲国家、澳大利亚和新西兰、加勒比海国家、中美洲国家、欧洲国家、北美国家、环太平洋岛屿国家、南美国家、南极洲、新兴市场国家(Emerging Market Countries)、独联体国家、拉丁美洲国家、地中海国家、中东国家。每个大类下设类目详简不一,其中北美国家的类目最为详细,为5级,“美国”类目下一直扩展到州甚至城市。经济区域设置体现在设置30多个经济区域类目,例如“三国经济联盟”(Benelux Countries)将比利时、荷兰、卢森堡三国设为下位类;“欧盟”类目的下位类包括欧盟各国等。

2、产业分类表(Industries)

FII2.2产业分类表按照经济中各行业进行划分,通过这个分类表,可以达到族性检索的目的。此表极为详尽,分为30个一级大类,6级子类目,共有大小类目872个,将国民经济各行业所属分支和各自关系列举和表述得极为清楚。同级类目按照类目名称的字母顺序排列,如一级大类中,Accounting(会计)列为第一大类,Transportation(交通)排在最后大类。其他类级中也如此。由于产业分类表比较庞大,在此对每一类目不作详细介绍。

3、新闻主题分类表(News subiects)

产业分类表只涉及到经济类的行业信息,Facti-va另有主题分类表。FII新闻主题分类表是按照内容主题进行编制的分类表,通过这个分类表,可以达到特性检索的目的。此表也比较详尽,为6级类目,共大小类目563个。有8个一级大类,分别为公司/产业新闻、经济新闻、日用品/金融市场信息、政治新闻、体育/娱乐新闻、国际政经组织、内容类型(Content Types)、产业走势/分析等。每个类目下又按其所属子概念和层次关系划分,系统性很强。最后一类即新闻内容类型,指的是新闻体裁分类,如分析、历史评论、人物侧记等。FII将新闻体裁归在主题表里,是它的特别之处。

4、语言分类表(Language)

语言分类表和地区分类表一样,相当于图书分类法中的地区、国别、语言、民族等复分类表。该分类表没有下位类,都是一级类目。共列有22种语言。语言分类表为多语言检索提供了便利。

FII在编制之初结合人类商业知识和自动机检经验,充分了解了用户的习惯、思想,并根据不断的反馈结果加以完善,类目详尽,对新闻分类提供了统一的标准。FII目前尚无中文版本。尽管有以上优点,依笔者认识,Factira分类体系还有以下不足或不适合中国实际情况之处:

第一,类号设计不十分科学。FII类号采用字母数字混合制,以字母缩写或者字母缩写和数字混合作为类号。例如产业分类表(Industries)中,所有类号都以I开头,一级类目“广告业”(Advertising)类号为iadv,其下位类市场咨询(Marketing Consulting)类号为i8395401;一级类目“农林”(Agriculture/Forestry)类号为iO,下位类“农用化学品”(Agrochemicals)类号为iagro。何时使用数字,何时使用单词缩写字母,何时使用两者混合,并没有详细说明,也没有很多规律可循。这样的类号设计规律性不强,不便于扩展、联想和记忆。

第二,科学性不明显。尽管FII类目完善,但产业分类表中一级类目并没有按照经济、政治、科学等科学体系归类,而是按照类名字母顺序排列,可能符合英美国家的习惯,但学科系统性不强。

第三,某些类目设置并不恰当。涉及到意识形态方面的问题,例如法轮功的归类,Factiva归到宗教类下,在中国应归到政治问题类下;某些行业类目的设置,符合美国的行业习惯,但是与中国的行业分类标准有一些出入;行政区域的划分,“中国”大类下没有细分,将“台湾”设置为与“中国”并列的类级,另外将西藏作为与香港和澳门并行的行政单位等等都不符实际情况。

三、对我国的启示

目前,我国还没有全国或全行业统一的中文新闻分类标准。如何学习国际新闻传媒,制订中国统一的新闻信息分类和标引标准,成为当务之急。目前,新华社正在与经济日报、人民日报等多家权威新闻单位联手,进行中文信息分类法的研究和编制工作。在此,笔者就自己对Factiva、新闻行业和分类体系的理解提出以下几点认识,供同行参考:

1、充分重视新闻信息分类法的制定工作

FII制订之初,吸收了路透社等多家新闻机构的稿件分类和编辑标引的多年经验,由专家队伍共同研究编制,编制完成后用1300多个FII类名标引新闻稿件,并推广给了Factiva出版商⑦。可见,FII的编制,汇集多个专家的经验和意见,经过统一论证、协调,最后才正式出版和应用。目前在我国,制定新闻行业统一规范的分类标准是一项国家性的基础工程,单靠一两家新闻单位是很难完成的,需要在国家层面上的政策引导、组织和协调,并由多家权威新闻机构和分类领域的专家组成领导小组共同研究,全面规划,统一协调。在有关标准出台后,国家还应监督标准规范的实施。

2、编制有中国特色的新闻信息分类法

编制的分类法要达到国际化、标准化、科学化,必须积极吸取国外经验,并结合中国国情。Factiva分类法是传统印刷媒体与网络服务结合的例子,类目详尽,类名完整,上下位类目明确合理,逻辑关系强,对我国有极大的借鉴和参考价值。特别是它的产业分类表和新闻主题表,类名、类目设置、各类之间的联系和区别以及分类表的详尽程度和规模都十分值得我们深入研究,但同时FII也存在一些不合理或者不适合中国国情的地方。我国新闻分类法的编制过程中,需要借鉴和研究Factiva分类体系,以及其他国际大型媒体机构的相关经验,但并不能完全照搬照抄,更要结合我国新闻行业多年来的实践经验和稿件数量分布情况来统一设计分类表各类的名称、内容、相关关系和整个分类表的规模。

3、提供多途径检索

Factiva同时提供地区、产业、主题等多个层面的信息;语言复分表有利于多语言检索和数据库兼容的实现。多途径检索主要是为用户考虑的。信息社会,大量信息以数字化形式存在,信息资源的物理存储空间只有一个,但是逻辑存储空间可以有多个,这就为提供多途径检索创造了条件。提供多途径检索,一方面可以使用户从多种角度查找信息,另一方面也可以通过语词的逻辑组合和概念的交叉组配,提高所需信息的精确度。新闻信息分类法在考虑体系结构和规模的同时也应考虑尽量多的检索途径,即分面分类层面。

4、修改完善,与时俱进

Factiva从开始的投入使用到现在的日臻完善,经过了近4年的时间,而这期间,Factiva已经修改到第11个版本。FII1.8修订于2002年6月FII1.9修订于2002年8月,仅两个月就修订一次,这种根据信息量和用户反馈不断调整类目的做法是Factiva数据库与时俱进的表现,这种修改会一直进行下去。这也给我国新闻分类法的编制工作一个启示,即编制完成后,需要专职人员维护,定期根据用户调查、跟踪反馈和标引者的反映进行类目的修订工作,不断完善分类标引体系,这样才能适应时代所需。

标签:;  

Factiva新闻分类指标体系及其对我国的启示_标准行业分类法论文
下载Doc文档

猜你喜欢