论信息组织_语义分析论文

论信息组织_语义分析论文

信息组织论要,本文主要内容关键词为:组织论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

信息组织是信息资源管理的基本范畴之一,是信息资源建设的中心环节,是建立信息系统的重要条件,是信息检索与咨询的基础,是开展用户服务的有力保证。因此,探讨信息组织的理论和方法是构架和完善信息资源管理理论体系的迫切要求。

1 信息组织的涵义

信息组织是随着社会信息化而出现的一个趋于规范的术语。人类的生存与发展离不开信息,早期的信息获取主要靠人与人的直接交往,有了文字以后,主要靠文献获取信息。随着文献的大量出现和急剧增长,便有了文献的整理加工——国内习惯称作情报组织,它为人们索取特定文献信息提供了方便。文献形式的多样化,使情报组织的方式也逐步多样化。在现代社会,人们获取和利用信息不再限于文献形式,客观存在的各种事物都蕴含着信息,各类事物也有着自身的特定组织管理方式。社会信息化要求人们寻求各种事物、各类信息形式的信息组织方式。信息组织就是指采用一定的方式,将某一方面大量的、分散的、杂乱的信息经过整序、优化,形成一个便于有效利用系统的过程。

2 信息组织在信息资源建设中的地位与作用

信息资源建设的基本内容与环节包括信息的采集、组织、开发和利用。信息组织在其中属于关键因素,处于关节点的地位。它既是一个相对独立的环节,又广泛渗透到其它环节,即信息采集中有信息的优选,信息的开发与利用中有对信息的分析、比较、信息重组,等等。

现代社会信息的基本特征是庞杂分散性,人们信息需求的特点是专业的高度选择性、内容的精良性、时间的紧迫性。两者之间的联系及其矛盾的调解就靠信息组织。

信息组织是一个信息增值过程。在这个过程中,杂乱无章的原始信息变成一个有序精良的信息系统,一个相对“粗放”型的信息贫集转化为一个“集约”型的信息富集,并为信息的进一步增值(如信息的分析研究)打下基础。

信息像其它产品一样,也有自己的生命周期。信息组织是信息生命周期管理思想的最积极、最活跃的因素。做好信息组织工作,会促进信息流通,发挥信息效用,使信息流形成良性循环,使信息在时间上更快速地传播,在空间上更广泛地传播,满足人们尽快、尽早地获得“地球村”各处的信息。

信息组织是信息检索利用的基础。没有它,就不会有信息检索系统,也不会有信息检索,从而也就谈不上信息的有效利用。信息组织为人们获取信息提供了方法和工具。

3 信息组织的原理

信息组织是由来已久的一种人类社会实践活动,在其发展过程中,不断从相关学科的理论和方法中汲取营养,使自身逐渐得到充实和完善。系统论、耗散结构理论和协同论使信息组织有了理论基础。

系统论认为,系统内部各要素是相互关联地有机地结合在一起的,它们之间的关系不是一种简单的结合,正是由于系统要素间这种有机的相互关联关系,系统的整体功能才产生了质的飞跃,远远超出各单个要素的功能之总和。这就是系统论的“整体大于部分之和”的原理。在信息组织中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联性,那么,信息系统的整体功能将大于各个信息单元的功能之总和。也就是说,这将能充分发挥信息资源的价值与作用。基于这一原理,信息组织的目标是要建立信息系统。

本世纪60年代,比利时学者I.普里高津提出了一个著名论断:在开放系统中,系统不断与外界进行物质和能量的交换,熵趋于最小值,能量远离平衡,混乱度最小,从原来无序结构转为一种时间、空间和功能上的有序结构。这就是适于一切开放系统的耗散结构理论。普里高津找到了非平衡、开放系统是有序之源。这一原理给信息组织的启迪是:所要建立的信息系统应该是一个开放系统。现实存在的包括信息组织和信息检索在内的信息系统正是这样一个开放系统,它与外界进行着信息的交换,既采集信息也输出信息。

一个信息系统是由多个子系统构成的,建立各子系统之间的协同作用机制是非常重要的,这正是来自协同论的指导思想:无论什么系统从无序向有序的演化,都是大量子系统之间相互作用而又协同一致的结果。

语言学、逻辑学、知识分类是信息组织的方法基础。

——要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统。有了这种符号系统,信息系统的有序特征才能体现,信息单元的个体特征才能被揭示出来,各种信息单元才能对号入座,纳入到这种符号系统的框架之中,形成一个便于检索的序化信息集合。尽管各种信息组织符号系统的形式不同,但都和自然语言一样,有着共同特征:有语词、有词汇、有语法。这就是信息组织的语言学基础。

——形式逻辑是关于思维规律的科学。信息组织是一种思维活动,它必须遵循科学的思维方法。也就是说,进行信息组织工作必然用到形式逻辑的一些方法,信息组织的行为只有符合逻辑思维规律,才能保证信息组织的优化序化质量。

——分类是人们认识事物的一种最为基本的方法。知识分类是一门研究知识体系结构的学问。信息的主体是知识,信息组织活动必须建立在人们对知识体系认识的基础之上。

4 信息序化的基本方法

信息序化靠的是符号系统。从符号学的理论来认识,各种符号系统所能表达的信息有语法信息、语义信息和语用信息。它们是信息序化的三种基本类型。

4.1 语法信息序化法 这是根据信息的外在特征, 使用一套形式化的符号系统来组织信息的方法,序化符号不揭示所组织信息的内容特征。这类序化法有号码法、物名法、专门代码法、引证关系法、时序法、地序法等。

·号码法:如用邮政编码组织信件,用身份证号、学号组织人群信息,用地址码(门牌号)组织住户信息,等等。文献编号,如专利号、报告号、标准号、档号,在组织各类文献信息中有着重要作用。号码法一般具有明确、简便、唯一、标准的特点。

·物名法:是利用事物名称的字顺特征来序化信息。用这一方法组织的信息系统多种多样,如人名录、机构名录、地名词典、产品目录、货物清单等。在文献工作方面有题名系统、著者系统、机构系统等。任何事物总有其名,所以这是一种常用的信息序化组织法。

·专门代码:是指在某一专业领域采用的有一定专业含义又形式化了的编码系统,如化合物的分子式、环状化合物的环状代码等。利用这类代码组织信息,形成专用的信息系统,如分子式索引、环系索引。这类序化法在特定的专业领域是专业信息组织的重要方法。

·引证关系法:是利用信息之间的引证与被引证关系来组织信息。例如,利用法院判案之间的引证关系所组织的《谢泼德引文》系统;利用文献之间的引证关系所组织的各种引文索引系统。引证关系序化法不仅是组织信息的一种独特方法,而且还是进行各种评价研究的基础。

·时序法:以信息的形成时间为序化符号,按时间顺序组织信息。大事记、传记资料、生平事迹多以时间为线索组织信息。这种方法能揭示信息内容的发展变化过程。

·地序法:以信息的形成地区或信息内容所反映的地区为序化符号,按行政区划排列法来组织信息。这种方法能反映有隶属关系和横向联系地区的信息。

4.2 语义信息序化法 任何信息除了外在特征之外, 更重要的是其内在特征。语义信息序化法就是根据信息的内容特征,使用一套含有语义的符号系统来组织信息。信息的内在特征表现为信息的知识范畴、主题内容、概念属性。所以,语义信息序化法有分类法和主题法两种基本类型(概念属性归于主题法)。

人们的分类对象可概括为三种,一是实物,如商品;二是概念,如知识;三是概念与实物的结合体,如文献。于是有三种不同的分类方法。在信息组织的实践中,它们可以结合使用。知识分类是人类认识客观世界的科学方法,对其它两种分类有着指导意义。文献分类以知识分类为基础,结合文献实体属性和信息利用的实际。实物分类带有更多的专业(或行业)特性和效用原则。

主题法是建立在自然语言基础上的一类方法,它用自然语词作符号系统,并在某种控制下使用。从某种角度看,主题法的发展走过了自然语言——规范语言——自然语言的历史过程,似乎存在着有控制与无控制之别,实际上只是有着前控与后控之分。主题组织法的具体排序方法是按语词的字顺,但从组织符号的性质上看,则完全不同于物名法。主题法的语词是信息内涵的揭示,物名法的事物名称是信息的外在表象。

4.3 语用信息序化法

这是根据信息的实用价值来组织信息的方法,主要有权值序化法和逻辑序化法。

·权值序化法:就是按信息的重要性来组织信息,比如,报纸在版面安排上,总是把最重要的信息放在头版头条的位置。电视节目的安排,总是把重要节目放在黄金时间播出。

·逻辑序化法:就是按某种逻辑关系来组织信息。比如,一部书在内容编排上,或从总论到分论,或从绪论到正论,都是根据各章节的逻辑关系。体育比赛中,各种球队阵容的组织,都是根据各队员的职责及相互关系。

上述两种序化法的特点是没有明确的序化符号,信息个体之间没有十分明确的排列次序,是一种模糊序化法。

此外,前述的语法信息序化法和语义信息序化法都具有语用信息序化之功效。因为,从信息传播的角度来看,语法信息、语义信息、语用信息是信息的三个层次。同一事物的状态与变异可以从这三个层次来揭示其信息。语法信息是事物状态与变异的形式化表征,语义信息是事物状态与变异的意义,语用信息是事物状态与变异对传播对象来说所具有的效用。所以,语法信息是语义信息和语用信息的基础。语法信息是形式化的,但又是承载着语义的。语法信息对理解者来说是语义信息,语义信息对特定传播对象来说是语用信息。

5 信息优化的基本方法

信息的优化主要包括信息的优选、浓缩、重新表述及三者的综合运用。

信息的优选正是实现社会信息由相对贫集向信息富集转化的优化过程。优选活动是文明社会的一种必然产物。因为人类社会本身就是一个大系统,人们需求高质量的信息,随之便有信息的优选活动。特别是随着信息的迅猛增长,出现“信息爆炸”之后,信息优选更显得必要。当代社会存在着多种形式、多种层次的优选体系:征文优选、演讲比赛、文艺大奖赛、物品展评、成果评奖、民间评优、政府部门审评,等等。

信息的浓缩是使社会信息由博而约、由粗而精的一个信息加工过程。信息浓缩的主要形式有文摘、题录、目录、词条。文摘是对原始文献信息的主要内容简略而准确的摘述。题录是对原始文献外部特征的记录,通常由文献题名、著者名称、原文出处等项组成。目录是对单独出版物外部特征的系统化记载及内容提要。词条则是对文献形式以外的原有事物信息或概念信息的简要描述或表述。信息浓缩将一次信息转化为二次信息。

信息的重新表述是使某些信息由不便利用向便于利用转化的创作加工过程,有改写、编译、翻译等方式。改写主要是文体形式的转换,比如把广告稿改写成经济信息,以使人们由小见大、由局部见全局、由表及里地认识客观事物。编译是一种语言转换和语义加工(诠释、提炼、阐发等)的综合过程,它不仅可跨跃信息传播中的语言障碍,还可跨跃思维障碍。翻译则是用不同语言文字进行信息交流的桥梁,它是一种跨时空、联异族的信息通道。

信息的综合优化是前述三种基本优化方法的结合运用,其主要形式是信息综述和信息述评。信息综述是对某一领域或课题一定时期的有关信息进行归纳、整理、分析、加工后所形成的一种信息产品,它可以使信息用户用较少的精力和较短的时间对有关领域或课题的内容、意义、历史、现状及发展趋势有一个完整、系统、明确的了解。信息述评是针对某一领域、研究课题或成果的水平、现状、发展动向及影响进行全面而系统的分析评价或明确提出建议。它能帮助研究人员确定研究方向,提供完成既定任务的合理方案。质量高的述评,常常是决策管理部门制定方针政策的重要依据。信息的综合优化过程,既是信息的加工过程,又是信息的分析研究过程。所以,综述和述评虽常被看作三次信息,实际上它们有着一次信息的属性。

应当指出,信息的优化方法和序化方法并没有明显的界限,优化中有序化、序化中有优化。这里分开论述只是就其方法的侧重点来说的。各种方法都是信息组织方法。

6 集约化信息系统

将经过优化的二次信息组织成一个有序的整体,便成为集约化信息系统。这种组织工作可以按信息的学科、专业内容、负载形式等特点进行。信息集约化的形式可以是手工使用的信息检索咨询工具,也可以是计算机化的信息数据库。

集约化信息系统按其功能有参考型和检索型两种基本类型。前者如人名录、公司名录、地名辞典、术语库、理化手册、百科全书等,这类信息系统可使人们直接索得具体信息。后者如文献检索工具、商品目录、货物库存清单等,一般来说这类信息系统只给人们提供原始信息的线索。

信息组织使原始信息转化为一种有序精良的信息系统或集约化信息系统,这为人们利用信息提供了有利条件,人们可以在组织化的信息系统中快速、准确、方便地索得所需要的信息。

标签:;  

论信息组织_语义分析论文
下载Doc文档

猜你喜欢