关于信息与信息科学的研究,本文主要内容关键词为:信息论文,科学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 信息的普遍性
信息依其来源(信源)大致可以分为自然信息(包括无机界信息和生物信息)、社会信息和知识信息三大类。获取自然信息的主要工具是传感器(有时也称敏感器)和传感设备,其种类主要有:物理型(热、光、磁、电、声、力)传感器、化学型传感器和生物型(神经、感觉、嗅觉、视觉、听觉、触觉等)传感器。采集社会信息主要靠社会调查。而研究知识的获取、表示以及应用,则构成了所谓知识工程。利用自然信息来研究自然界运动着的物质、物体,如银河系、太阳、地球、海洋、生物、遗传基因、分子、原子、电子等等就是所谓的自然科学的范畴,而利用社会信息研究人类社会的科学体系也有许多分支学科。因此,从不同的角度看或在不同的范畴内,对信息可以有不同的解释。
哲学家研究信息的最一般特性,认为信息是物质存在的普遍形式,是与“原型世界”对应的“信息世界”。社会语言学家对“信息”作词语解释,将“信息”与“音讯”、“消息”一样看待。计算机语言的研究者们研究信息语义形式化问题,即对符号表达式与它的内涵之间关系作研究。所以在研究信息处理的语言学专家眼中信息是“符号”,而所谓“语义学”就是对符号表达式与它的内涵之间关系的研究。以社会学的观点考虑信息的传递(比如大众传播)通常把“信息”说成“消息”。而通信专家则对信息的度量、量化以及编码进行论述,在描述过程中,常以“信号”代表“信息”。
关于“物质”(实际上是物质运动)的研究已建立了许多的科学门类,同样关于“信息”的研究也不可能只由某一个所谓的“信息科学”包揽得了的,因为“信息”充满着广漠的宇宙,它涉及的科学领域太广泛了。关于“信息”的学问至少涉及到以下一系列的学科,它们是控制论、系统工程、运筹学、仿生学、自动学、遥控、通信、测量技术、计算技术以及数学、哲学、经济学、社会学、管理学、物理学、化学、生物学、心理学、医学、教育学和语言学等。对控制论来说,它要从事对信息过程(信息的取得、传输、处理、存贮与显示)最佳控制、反馈的研究;而系统工程的基础是信息系统;通信的目的就在于传送信息,等等,不再累述。
2 信息科学
关于“信息”的学问横跨人文、社会、自然三大科学领域,因而形成各种各样的“信息科学”门类,这是不足为怪的,必然的现象。在“信息科学”的研究历史上,已经形成至少3种“信息科学”, 它们是以计算机为基础的“信息科学”、以信息论为基础的“信息科学”和以文献学为基础的“信息科学”。
2.1 以计算机为基础的“信息科学”
作为“计算机和信息科学”的“信息科学”,实际上取名为“信息科学”是为了用一个比“计算机和信息科学”短一些的表达方式。这类“信息科学”主要是研究符号表达式及其变换,所以,甚至有人认为此“信息学”是符号学学科。因为要计算机去解决某个问题,首先要把问题形式化——必须把问题表示为符号变换,即确定一些符号,以及符号与现实世界或某种抽象对象领域的关系,然后把要解决的问题,变成形式化的问题。形式化以后,就要找到问题的算法——设计出一个算法,即实现某种信息处理过程所遵循的方法、准则和步骤。这类“信息科学”可分为以下几个主要范畴:
计算理论:作为各种运用演绎推理学科的产物,其范围包括自动装置和形式语言的各种理论,以及对算法上的复杂性、程序检验和可自动计算性的限度等问题的研究。
符号关系学、语义学和说明“程序”的语用学:研究程序语言的结构,研究向计算机说明任务的各种方法,以及这种说明的翻译(解释)和这种说明所制订的各执行过程等问题。研究的发展正从使用有序指令语言转变为使用较为生动的描述性语言。研究的目标是要在对任务作出说明的人和计算机之间的语义学鸿沟上架一座桥梁,而这座桥梁的水平应适合于说明者语义学方面的水平。
信息处理的结构:对于创造令人满意的计算条件所必需的硬件、软件和通讯系统三者有效结合的研究,从集中处理信息向分散处理信息转变的研究,分散的程度的理论与实践的研究。
对信息的表述:数据结构的研究(数据在计算机存贮器中高效率的编排)。
人工智能:“信息科学”研究的一个分支,涉及的主要问题是建立一种基于信息处理范型的智能理论,研究的目标,是要设计出各种以计算机为基础的工作系统,以便服务于被普遍认为需要运用人类智力的某些工作。由于进行了这些研究,“将有可能把思想概念当作具体事物来加以控制”。
知识工程学:“信息科学”研究的另一个重要分支。知识工程学借助于计算机中的信息结构去描述知识,这个原理早就为人们所认识,并已引起人们在人工智能、自然语言翻译和信息检索等方面的研究应用。知识工程学的现有观点更为广泛,因为它包括了建立知识结构以帮助人理解的内容。为了便于人类利用而对现有知识加以重新组织,这不仅仅是把图书馆这种储藏库的现有知识输入计算机,再通过信息检索系统索取它们;而是要求重新组织现有知识,以便能够根据不同的使用条件以不同的程式灵活地将知识显示出来。这将使我们管理、学习和利用知识的方法发生根本性的变化。
2.2 以信息论为基础的“信息科学”
这类“信息科学”是在通信理论的基础上发展起来的,但它的应用更为广泛。建立在通信理论基础上的信息理论主要是研究信息的产生、获取、度量、变换、传输、识别以及应用的一门科学。
信息的获取或产生主要依赖于信息源,简称信源。信源的核心问题是它包含的信息到底有多少,怎样把信息定量地表示出来,即如何确定信息量。信宿的问题是能够收到或提取多少信息。信道的问题是它能够传送多少信息的问题,即信道的容量的大小。信道的容量问题是解决它无错误地(可靠地)以最大传送率传送信息,而证明最大信息率可能达到或可逼近的,最好能指出如何实现,这就是信息编码问题。编码定理就是解决达到这个最大值的可能性。所谓编码,就是用符号(数字形式)来表示信息。编码的目的是为了更有效和更可靠的利用传输系统。因此,编码也可以理解为把信息变换成便于在给定信道中传输的形式。
用户使用信息,总是与信息从信源产生后,将其在空间和时间上进行传输有关。这两种形式的传输有很多共性,并且在实现的过程中,往往用类似的方法——抗干扰编码、调制及其他等。用一定的方法,来改变物理过程的某些参量、状态、连接以及元件的组合等,则能将信息标志在物质载体上。为此,常常利用振荡、或者脉冲序列等物理过程的参量变化,象这样的处理称为调制,而恢复因调制引起参量变化的相反处理则称为解调。在任何一个物理过程中,信号的使命是将信息(事件、数值和函数)反映出来。为了形成信号,可用表征物理特性的振荡或者脉冲序列,而这些就是我们所要研究的信息载体。在原始状态情况下,这些载体就象清洁的白纸一样,已经准备好了可供调制,即标上所需的数据。调制就是按照被传递的信息来改变载体的一个或几个参量,这些参量就称为信息。
信息的识别是按照一定目的检测和分析有关某一信息对象或信息过程的过程。最简单的识别形式,是区分两种相反的状态——“是”与“否”,较复杂的识别形式是测量,更为复杂的识别过程,有搜索、分析、情况估计、事件与状态的汇报。在各种不同的识别过程中,有很多是共同的东西,特别是方法上的统一性,如,识别的整个程序可归结为:确定某些标准,取得外部信息,以及将该信息与标准比较,并根据某些准则来估计这一比较的结果。
2.3 以文献学为基础的“信息科学”
一方面,任何一门学科的内容都是由科学对象的客观规律所决定的,离开了作为认识客体的科学对象,科学认识就成了无源之水、无本之木,根本不能进行;另一方面,随着社会的前进、实践的发展,人们对科学对象以及科学活动认识的深度和广度不断扩展。
由于图书馆学对象的发展,和人们对它认识的不断深化,原有的图书馆学理论已不能给予正确的反映,这时,必然要产生出新的科学理论来进行概括。因而,计算机技术应用于文献工作而发展起来的“信息科学”由此出现了。这类“信息科学”形成的外力主要是二次世界大战期间和战后的研究成果累起来的科技报告的不断增加和计算机的应用。这类“信息科学”实质上是用计算机技术在图书馆学的土壤上被武装起来的文献处理自动化科学。主要研究以下几个方面:
计算机应用技术包括计算机及其网络、信息系统与信息检索、联机与联机检索、数据库与数据传输、专家系统等;图书馆学、文献学包括图书馆与信息服务、图书馆信息系统与图书馆网络、引文、文献、文献计量、标引、分类、分布、流通、用户研究等;信息科学理论包括信息、信息特性、系统、知识、传播以及其它方面。
实际上,这类“信息科学”过去所做的主要研究是信息检索自动化和文献学。
3 结论
信息是一种普遍存在的现象。一方面,科学研究各领域的专家们出自学科需要进行了与“信息”有关的各种研究,他们都是从各自不同角度去研究、探讨“信息”的,都有各自研究的重点、特点。另一方面,在某一领域的研究范围内不可能探讨和研究宇宙中的一切信息现象和信息过程,也不可能用某一领域的理论完全解决其它领域所研究的问题,尽管各领域的研究均与“信息”有关。因此,笔者建议,不必继续在目前已称为“信息科学”的那些学科上都冠以“信息科学”的名称,最好是以各自领域研究的重点(对象)特点来取一个更为突出自己学科特色的名称。