社会科学信息组织的特点_信息组织论文

社会科学信息组织的特点_信息组织论文

社会科学信息组织的特点,本文主要内容关键词为:社会科学论文,组织论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

社科信息组织的特点有多个研究角度,一般来说常常从传统分类法的角度去研究不同的分类法的信息组织的特点,也有的从组织加工程度的不同如一次文献、二次文献,三次文献等去比较其特点。现在信息组织的趋势正从文献组织向知识单元组织发展,本文尝试从符号学的角度阐述社科信息组织的特点。

1 社会科学信息的构成

社科信息从内容上可以分为:狭义的社会科学信息是理性信息即社会科学研究活动产生的信息。包括理论性信息和应用性信息。广义的社会科学信息除理性信息外,还包括与研究客体有关的尚未经过抽象逻辑思维加工、上升为科学信息的感性信息即社会现象记述信息。

也有学者把社会科学信息资源分为六类:信息广告社科信息、现象描述社科信息、文艺想象社科信息、经验知识社科信息、法规标准社科信息、理论认识社科信息,这种分法虽然有失严谨,但有助于我们理解社会科学信息的构成。

2 语义组织的广泛性

这是由社会科学情报的内容综合性特点决定的。社会科学研究的对象是人和整个人类社会这个多要素、多层次的复合动态的有机体,包含有经济、政治、法律、道德、历史、民族风情、文化传统等相互联系、作用的多种方面。反映某一方面的信息对认识其他各个方面都有现实的或潜在的价值;研究某一方面,除需要本方面的信息外,还要掌握关于其他方面的信息。而且不仅社会信息各种各样,随着社会信息意识的加强,社会信息的需求也越来越多。网络用户对社科信息的需求程度,据CNNIC最近一次(2001年7月)调查统计,用户在网上最主要获得的前10项信息中有7项属于社科信息,还有两项也包含有社科信息。用户对社科信息需求的范围正在不断扩展,主要表现在适应市场经济发展需要的社会动态、经济管理、法律政策、金融证券、商贸行情、求职求学、交通旅游、休闲娱乐等方面信息的需求大量增加。为适应这种需求,社科信息工作者要尽可能系统地搜集、组织社会科学各学科、各门类的信息以满足用户的需要。

不仅如此,社科信息的语义组织与自然科学信息组织不同的是,社科信息组织除了包括狭义的社科信息组织即理论信息和应用性信息外,更应注重组织社会现象记述信息。因为这部分信息既是社会科学研究的对象,也是社会科学研究中必不可少的事实论据,并且能给社会科学家以进行科学研究的灵感和启发。国外数据库中一次信息(全文型、数值型、图形、图像型信息)约占总数的71.8%,二次信息(目录、文摘)占28.2%,而我国数据库多数为二次信息,约占49.44%。数据库一次信息的建设必须加强。

3 语义组织的多义性

语义是研究语言的单位内容,从解释学的角度来说,人文社会科学是超文本的认识流,每个时代都对前一个时代的文本做出本时代的理解者个人的解释,创造出新的解释理解体系,而这种理解连同前代的文本又将成为下一个时代新的理解的基础,并将在此基础上产生新的解释文本。这样,不仅每个时代都形成自己的独特的话语体系,并且由于语言词汇的约定俗成性,语义组织的多义性由此产生。比如,从历时性上看,哲学上对“道”的理解,儒家和道家的理解是相去甚远的。再如,历史上对秦始皇、武则天、雍正帝,对陈胜吴广起义、太平天国等历史人物和历史事件的看法也是颇有争议的。从共时性上看,对当时社会的事实、现象的描述性社科信息是一种最基本,相对客观的信息,而理性信息就不同了,社会科学各学科可以从本学科出发对同一社会现象记述信息作出各自的解释,甚至同一学科里的社会科学家之间的差异也会相去甚远。

4 语法组织的多维性与非系统性

语法组织是根据信息的外在特性,使用一套形式化的符号系统来组织信息的方法。就目前来说,还没有一种语法组织的方法能很好地组织整个人文社科信息系统或者某一门类的社科信息。这是因为社科信息无论从形式、内容而言都有很强的主观性。可以这样说,社会有多广阔,社科信息就有多广阔;人的思想有多深远,社科信息就有多丰富。因而,社科信息知识单元之间的关联呈显出纷繁复杂、纵横交错的关系,这不是哪一种语法组织方法所能涵盖的了的。

因此,既然存在如此错综复杂的社科信息语义关系,那么社科信息的组织更应该具有多维性和非系统性。从历时性上看,社科信息组织是多维的。社科信息的基本单位是知识单元组成的知识团而非知识单元。知识单元是知识中不可再分解的独立单位,而知识团是同一时代每一学科最基本的具有内在联系的概念群。社科信息组织应该通过把各学科中属于同一时代话语的重要概念组织在一起,来区分同一知识单元的多义性,并在概念之间建立起链接,从而形成一个真正的社科信息网状立体空间。从共时性上看,社科信息的组织是非系统的。我国的社科信息组织是比较落后的,就信息资源的核心数据库资源为例:据统计,社科库容量在100MB以上的比例为24%,10MB以下的比例为29%,而美国1975年数据库平均容量已达175MB,我国数据库建设因处于“无主管部门、无主导领域、无主要方向”的三无状态,而大型数据库较少;另一方面,由于我国的经济力量不足,国家不可能拿出足够的资金来进行社科信息数据库的建设,这就要面向用户,以市场为导向,加快数据库的商品化进程,走“以库养库”的发展路子,有重点地选择具有市场前景的资源建设数据库。比如,可以从选择现在需求量较大的应用性科技信息、金融信息、娱乐信息等作起,运行起来后再回溯充实,然后再利用相关的技术进行深层次的信息资源开发,调整数据库的结构,形成能够覆盖整个社科信息的资源网络。

5 语法组织的文本性与数字化的统一

一般来说,自然科学信息的表达语言比较简练,所用的术语比较统一,常常采用形式化的表达手段(公式,代用符,图表等)。自然科学家多用论文的形式来表达自己的研究成果。而在社会科学中对新的理论结论需要进行详细的论证,论证常常又具有辩论甚至论战的性质,需要利用较多的资料、引证;不仅要阐明新的结论,还要叙述问题的历史演变、研究现状,介绍不同的观点、作者的研究过程、研究的思路、逻辑等等,需要较大的篇幅,因而,社会科学的新思路新理论多以专著形式发表。这种情况一般适合于较成熟的,处于平稳发展阶段的学科。当然,新兴学科,处于迅速发展中的学科,其成果往往更多的是首先用期刊论文的形式发表。因而总的来说,社科信息组织既要重视收集以专著形式出现的文本,又要收集期刊论文。我国20世纪90年代以前的较有影响的专著多以纸质的形式出现,还没有转化成数字化资源,而近几年来的信息资源有代替纸质载体的趋势。这要求处理好信息组织中纸质信息和数字化信息的关系。

在当今的信息化社会中,社科信息的语法组织应较多地体现在信息技术的运用上。

(1)对象——关系数据库。数据库技术所研究的问题就是如何科学地组织和储存数据,如何高效地获取和处理数据。近几年,面向对象数据库与关系数据库在应用中各有其优劣势,二者的结合技术是未来的发展方向,美国专家Mic Rael J Carrey就在第22届超大型数据库国际会议(VLDB96)的报告中认为,在面向对象技术和数据库技术相结合的几种方法中,对象——关系数据库是当前的优胜者和今后的发展趋势。

(2)数据仓库技术。所谓数据仓库(Data Warehouse),就是将分布在企业网络中不同信息岛上的商业数据搜集到一起,存储在一个单一的集成关系数据库中。利用这种集合信息,可方便用户访问信息,更可方便决策人员对历史数据进行分析,以确定事物发展趋势。数据仓库规模都十分庞大,容量都在几百个GB以上。数据库与因特网的结合是引人注目的发展方向。因特网迄今为止还只能提供许多宽泛而肤浅的信息,而如果与各种关系数据库相连,它的数据就将成为广阔而深刻的信息了。

(3)非结构化数据库技术。非结构化数据库就是字段数据及字段长度可变的数据库。非结构化数据库观点认为信息大体上可分为两类:一类信息能够用数据或统一的结构加以表示,称为结构化数据,如数字、符号;而另一类信息根本无法用数字或者统一的结构表示,例如文本、图像、声音乃至网页等,称为非结构化数据。非结构化数据库最大的特点在于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构信息(重复数据和变长数据)中有着传统关系型数据库所无数据库技术与数字图书馆中的信息组织无法比拟的优势。在信息检索方面,非结构化数据库技术不仅能满足传统的按整字段和子字段进行逻辑组配查询的需求,而且还能进行全文任意词的单项及组配检索,检索速度快且不受文献量的影响。在多媒体信息的处理方面,非结构化数据库存储各种信息,如文字、图像、视听资料等,很轻松地处理多媒体信息。

6 语境组织的时代性与个体性的并重

语境又称“情景语境”,指使用语言时所处的实际环境,包括语言之内和语言之外的。包括三层含义,一是上下文,即口语中的前言和后语,书面语中的上句和下句,上段和下段。二是发生言语行为时的实际语境。三是某个言语社团的社会文化,即使用某种语言的人特有的文化背景、社会规范和习俗。信息是指根据信息的实用价值来组织信息。信息组织的最终目的从用户角度看是为了信息检索的;从组织的角度看是为了信息服务的。研究社科信息的语用组织特点有利于作好信息服务工作。在1995年12月召开的社会科学信息学会第三次全国代表大会上,就指出了社会科学信息工作要突破只为科研、教学服务的单一服务格局,应充分发挥其多元化的服务功能,为社会提供经济、政治、文化等方面的信息,尤其应更加面向经济建设战场,为企业经营管理和决策及参与市场竞争提供适用信息,帮助企业信息部门规范工作程序,指导业务发展。

其实,这是符合社科信息组织的发展规律的。比如社科信息组织的最重要的组织形式之一数据库的发展趋势就是如此。从世界范围看,数据库主题由科技型逐渐向经济型、社会型倾斜。商贸数据库从20世纪80年代末期至今,在各类型数据库中一直占最大比例,目前大概占31%;科技、工程数据库占整个数据库产品的18%;法律数据库占12%。以科技数据库为主发展起来的美国洛克希德公司的DIALOG系统,20世纪80年代在世界联机服务系统中独占鳌头,但是进入20世纪90年代后,有迹象表明,其霸主地位已被以经济、社会信息为主的Compu Serve、America On line和Prodigy所动摇。

另外,社科信息中有一个很重要的组成部分——决策性信息,这部分信息的时代性很强,是在特定的历史背景、社会环境下产生的。并且与其他类型的社科信息比起来,决策性信息具有专指性,常只为某一特定的人群所需要,比较适合建立专门的数据库。美国的信息化程度是世界上最高的。其中他的二次信息系统的发展模式有以目标为导向的模式,该系统具有极强的目的性、时间性和实效性,能够直接为政府的决策需求服务。

社科信息的语用组织的个体性比起自然科学来更突出,这主要因为不仅研究对象,研究领域具有个体性,而且社会科学家个人有不同的爱好、性格、志趣、阅历等,这些主观因素又给研究行为、研究结果打上深深的烙印,这在自然科学研究中是不允许的,在人文社会科学研究中却是可贵的。因而,在社科信息领域更迫切地要求进行个性化信息组织和人工智能信息组织系统。

收稿日期:2002-09-03

标签:;  

社会科学信息组织的特点_信息组织论文
下载Doc文档

猜你喜欢