资料:定义、起源和演变*_编码论文

信息:定义、起源和进化*,本文主要内容关键词为:起源论文,定义论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

内容提要 信息是在场、能量和物质的基础上进化出来的宇宙的四种基本要素。信息是通讯系统中信宿收到而信源并未失去的某种东西,它消除了信宿相对于信源的存在、属性和动态的某种不确定性。我们现在知道的最早的、最简单的通讯系统是生物细胞自复制过程中生物遗传信息的通讯系统,所以信息的起点就是生命的起点,生命的起点就是信息的起点。我们发现可能有这样一条进化规律:语法信息→语法信息+语用信息→语法信息+语用信息+语义信息=全信息。

关键词 信息;定义;起源;进化

本文1996年8月2日收到。

在我提出的一种新形而上学——进化的多元论当中[1],场→能量→物质→信息→意识是依次进化出来的宇宙的元素。本文就以它为背景来讨论信息和信息的进化。

一 信息的定义

在我们的概念系统中,信息属于最高一级的类概念,因此不可能用“种加属差”的方法定义,只能用“描述法”定义,即描述它的特殊属性和功能,以区别于跟它并列的那些类概念——场、能量、物质和意识。

信息是在场、能量、物质的基础之上进化出来的,它只能存在于能量的或物质的编码结构当中;因此,它不可能是一种完全独立的、绝对的自存,也不可能有单一的、独立的进化。这是信息相对性的第一点。

人们在讨论信息时往往忘记了一个最基本的事实:信息只能出现在通讯系统当中。图1为通讯系统的最简模型。图1中信源的信息记为U;信息经过编码变换以后成为信号,记为X;信号在信道中传输,并受到噪声N的干扰,在信道输出端得到Y,它与X相应而又有区别,相应与区别的程度取决于噪声N实际产生了多大影响;解码反变换得到信息V,要尽可能消除噪声N的影响,但即使这样信宿最后收到的信息V同U是一致的,但又不可能完全一样。

图1 最简通讯系统模型

这个模型告诉我们,在现实当中,哪里有这样一个完整的通讯系统,在其中发生了完整的通讯过程,哪里就有信息。是不是信息?是什么样的信息?有多大信息量?都不取决于信源发出了什么,而取决于信宿收到了什么。这是信息相对性的第二点。

信源发出的同一信息源,不同的几个信宿,由于各自的目标和先验信息不同,各自收到的信息及其信息量是不一样的。这是信息相对性的第三点。

信息区别于能量和物质的最突出的特点是不守恒:信宿收到了,而信源并未失去。因此,信源发出的任何信息,原则上都可以由无限多的信宿同时分享。信息不守恒的另外一方面是,它一旦消失,就永远消失。

但信息又有相对于不同形式的编码结构是守恒的这样一条特性。这就是说,信息可以被变换、传递、转录、翻译、感知和存储,在这些过程中,信息相对于不同的编码形式保持不变。

信息可以离开它赖以产生的通讯系统以某种编码结构的形式被存储,成为一种相对独立的自在的存在;但是,严格地说,在这种情况下它已不是真实信息,而是潜在信息。

任何一条信息都是三位一体的:语法信息、语用信息和语义信息。换句话说,任何一条信息都有概率统计意义、同信宿的某种目的相关的意义和逻辑意义这样三个方面。

信息最基本的功能就是消除信宿相对于信源的某种不确定性,具体地说,就是消除信宿相对于信源的存在、属性和动态的某种不确定性。

关于最后这一点要做一个简要的补充说明。

大家知道,乔姆斯基有一个思想,就是要寻找语言的共同的深层结构。这对我们研究信息颇富启发价值。笔者认为,人类的几千种语言,尽管语音、词汇、语法有千奇百怪的差异,但它们的所有句子都服从一个共同的基本结构:每个句子都有主语和谓语两部分,主语正是通迅系统的信源,谓语正是句子要传递的关于信源的信息。而担任谓语的只能是实词——名词、形容词和动词,它们分别携带关于信源的存在、属性和动态的信息,担任其它成份的虚词则是有语法上的功能而无实在意义,因此并不携带关于信源的信息。受这一点的启发,我才说信息消除的是“信宿相对于信源的存在、属性和动态的某种不确定性。”

若将信息的上述特性都综合到一起,我们就得到这样一个定义:信息是通讯系统中信宿收到而信源并未失去的某种东西,它消除了信宿相对于信源的存在、属性和动态的某种不确定性。

二 信息的起源

场、能量、物质都是守恒的,没有自复制能力,唯有信息不守恒,有自复制能力。生命系统最根本的特点是自复制,所以信息是同生命紧紧联系在一起的:生命的起点就是信息的起点,最原始、最简单的生命系统就是最原始、最简单的通讯系统,因为通讯系统中信宿有相对于信源的自复制行为。

据我所知,已获实证的最原始、最简单的通讯过程正是生物细胞的生物遗传信息的传递过程,它同时就是细胞的自复制过程。换句话说,我认为,无机界无信息,因为无机界无完整的通讯过程。我们在现代的天文学、物理学和化学中都找不到通讯过程,亦找不到信息,甚至在当代的自组织理论——I·普利高津的耗散结构理论、H·哈肯的协同学和M·艾根的超循环理论(就其纯理论而言)中,也没有信息的位置。我把信息进化的起点定在单细胞生物体内,但是如果谁能在宇宙进化的更低层次上证实一种完整的通讯过程,我愿接受他的发现,将信息的起点前移。

现代分子生物学告诉我们,细胞的结构、性状和行为的信息都保存在细胞内的脱氧核糖核酸(DNA)大分子内核苷酚分子的碱基的线性顺序中。一共是四种碱基,即腺嘌呤(A)、胸腺密啶(T)、鸟嘌呤(G)和胞密啶(C)。每三个碱基构成一个记录信息的密码子,一共是64个三联密码子。每个三联密码子同一种氨基酸配位,总共有20种氨基酸。若干种氨基酸排列在一起构成一种蛋白质,总共有10万种蛋白质。不同的蛋白质有不同的生命功能。

如果我们将F·H·C·克里克在1957年提出的细胞内遗传信息传递的中心法则,DNA→RNA→蛋白质,加以扩展,一个完整的通讯过程应当是如图2所示。这个生命系统的通讯系统模型的各部分同图1的各部分是一一对应的。

图2 生命系统的通讯系统模型

左边的“细胞”相当于“信源”,它的结构、性状和行为的信息(U)要“编码”成为"DNA"中用核苷酸的4个字母的碱基语言(ATGC)记录的信息(X),然后转录到RNA上面。"RNA"包括mRNA、tRNA和rRNA,它们将信息逐步翻译成20个字母的氨基酸语言编码的信息(Y),相当于“信道”。最后“蛋白质”记录的信息(V)要“解码”,反变换,还原,生成一个“新细胞”,它相当于“信宿”。通过这个通讯过程,最简单的生命系统细胞完成了自复制。

值得注意的是,在最简生命系统细胞内传递的生物遗传信息仅仅是语法信息,它消除的是复制的新细胞对20种氨基酸的选择和排列顺序的不确定性。语用信息和语义信息都是潜在的,因为作为信宿的新细胞没有这两方面的接收和解读功能。这就告诉我们,最早进化出来的信息是最基本的信息——语法信息。

作为最简单的完整的生命系统,细菌及其通讯系统一定经历过漫长而复杂的进化过程。科学至今无法把这个过程完全搞清楚,也不大可能重演这个过程。可是,如果我们将现存的比细菌更简单的不完整的系统排列在一起,似乎可以看出这个进化过程的蛛丝马迹。

类病毒是最小的病原体,它只有裸露的RNA,没有蛋白质外壳。病毒既有核酸又有蛋白质,但没有复制、转录和翻译的那套通讯设备。衣原体既有DNA和RNA两种核酸,又有细胞壁,还有复杂的酶系统因而能有某些代谢活动,可是仍然没有完整的通讯系统。它们单独存在的时候,是死寂的非生物;只有当他们附着和进入寄主细胞之后,利用后者的全套通讯系统进行自复制活动时,才表现出真正的生命行为。枝原体有了通讯系统,能在无细胞培养基内独立进行自复制繁殖活动,可是没有细胞壁。它们似乎代表着从无生命的有机大分子到细菌这种最简单的完整的生命系统逐步进化的某些阶梯。由此可以看出,生命的最本质的特征是利用通讯系统进行自复制活动。

值得注意的是,作为原核生物主要代表的细菌和蓝藻,虽然是完整的生命系统,但它们内部的通讯系统就是功能系统,功能系统就是通讯系统,二者还没有分开。这又更进一步印证了我们的上述结论。直到进化出了真核生物,在它们的细胞里有了双层膜的细胞核,才把位于核内的遗传物质(通讯系统)和核外的细胞质(功能系统)完全分开了。

三 信息的进化

研究信息的进化遇到的困难是,信息不是一种独立的实存,所以讨论信息的进化难免变成了讨论通讯系统的进化,或信道的进化,或编码的进化,或存储的进化。

就通讯系统的进化而言,我们发现有从生物遗传信息通讯系统,到动物化学信息通讯系统,到动物神经信息通讯系统,到人类文化遗传通讯系统,到人工信息通讯系统,最后到全球信息高速公路网络的进化。这是通讯系统规模逐步扩大的过程。

就信道的进化而言,我们发现有从短距离和慢速度的化学信道,到近距离和中速度的声信道,到近距离和高速度的电信道,到远距离和高速度的电信道,最后到超远距离和超高速度的光信道的进化历程。从中我们看到信息在传播距离和传播速度方面的进步,并且这其中还包含有一个信道的载波能力的提高。

就编码的进化而言,我们发现有从一种生物分子语言,到多种动物信号语言,到人类的多种自然语言,到多种符号语言,最后到一种人工语言的进化。由此可以看出,做为信息编码的语言似乎有从一到多再到一的进化规律。

就存储的进化而言,我们发现有从生物细胞内存储,到动物—人的中枢神经存储,到社会系统的文化信息库存储,最后到电脑微缩存储的进化过程。由此可以看出,信息存储方式有由微到宏再回到微的进化规律。

然而,所有这些似乎都是信息的外在形式的进化,而不是信息本身的进化。如果一定要研究信息本身的进化,我发现它不可避免地是同信宿,即认知主体的进化联系在一起的;因为,如前所述,信息的存在、性质和信息量皆取决于信宿。

在这方面,我发现可能有这样一条进化规律:语法信息→语用信息→语义信息。或许更正确的表述应当是:语法信息→语法信息+语用信息→语法信息+语用信息+语义信息=全信息,因为它能体现出后者对前者的“扬弃”。

语法信息(syntactic information)这个术语是从语言学中借用过来的。在语言学中,语法学(syntactics)只研究句中词与词之间的形式关系,不研究这些词的词义和效用。我们可以尝试将信息科学中的语法信息定义为:消除信宿相对于信源的概率不确定性的信息。

单纯语法信息的信宿是无记忆的,混乱的。语法信息的功能是将信源的某种秩序传递给信宿,减少或消除了信宿的概率熵,帮助信宿建立起某种相应的秩序。语法信息是最原始、最简单的信息,因而也是最抽象的信息,但它是最基本的信息。语法信息的描述工具是概率论。申农信息论讨论的,申农信息量公式计算的正是这种信息。

生物遗传信息就是语法信息。三联密码子相当于“单词”,若干个线性排列的“单词”相当于一个“句子”(基因),记录一种蛋白质的结构。我们可以想象,作为信宿的20种氨基酸分子是混乱的,从信源细胞传递过来的遗传信息消除了这种混乱,使它们按一定的秩序排列起来,完成了对信源细胞的复制。

语用信息(pragmatic information)这个术语也是从语言学中借用的。在语言学中,语用学(pragmatics)不仅要研究句中词与词之间的形式关系,而且还要研究它们对于主体的效用。我们可以尝试在信息科学中将语用信息定义为:消除信宿相对于目标(信源)的行为的不确定性的信息。

语用信息的信宿是有记忆的,并且是目标定向的。它可以利用自己存储的先验信息达到目标,可是成功的概率很小;因此,它需要获得来自目标的后验信息,将二者进行比较,获得实得信息,用以决定自己的行为,提高获得成功的概率。行为的结果(输出)再反馈回来(输入)同预期结果比较,得出偏差值,用以修正自己的行为,以期进一步提高成功的概率。因此,语用信息的传递有闭合的环路,其信宿有初步的自学习能力。在N·维纳等人创立的控制论中讨论的就是动物、人和机器都采用的语用信息。

在高等动物的内分泌系统和自主神经系统(植物性神经系统)中传递的是语用信息,它们共同帮助生命系统实现稳态目标。更典型的语用信息是在动物的神经系统和外分泌系统(分泌信息素)同环境的通讯过程中传递的信息,它们帮助动物达到外环境的目标。在这方面典型的例子有蝙蝠夜视避开障碍物,眼镜蛇捕获猎物,猫鼬战胜毒蛇[N.Wiener,1961]以及老鼠学会顺利走出迷宫。

语义信息(semantic information)这个术语也是从语言学中借用的。在语言学中,语义学(semantics)不仅要关心句中词与词之间形式化的语法关系,而且还要研究它们的逻辑含义。在信息科学中,我们可以尝试将语义信息定义为:消除作为信宿的主体相对于作为信源的客体的某种认知不确定性的信息。

语义信息是在使用同一种语言的共同体内个体之间进行通讯所传递的信息。语言是共同体成员们集体创造的符号系统。每个符号均是概念和语音的结合;前者为能指,后者为所指。它们的结合带有任意性,可是所有能指和所指的一一对应关系都是成员们世世代代约定俗成的结果。在进行通讯时,作为信源的子体将自己要传递的信息用语音符号编码,构成一个一个有完整意义的句子,然后借助语音信道传递给作为信宿的另一个体。后者凭借同一语言中能指和所指的对应关系解码,获得了信息,从而消除了自己知识结构中的某种不确定性。语义信息量的大小是个人知识结构中有关的先验信息同获得的后验信息之差。

在创造出记录语音符号的文字符号之后,人类的语言就有了三种形式:内部语言、口头语言和书面语言。任一语义信息均可在这三种形式中转录而保持不变,但三种形式的实际效用却不同。内部语言用于思考和建立个人的知识结构,口头语言用于个体之间的信息交流,书面语言用物质形式记录信息,以便长期保存和做超越时空的交流。特别重要的是,人类用书面语言建立起文化信息库,信息就成为相对独立的实存,社会系统有了文化遗传机制。

语义信息的描述工具是逻辑。一方面它能够判定命题(句子的语义)在我们的知识结构中的真伪,去伪存真;另一方面,又能通过一定的推理形式得出新的命题,即生产出新的语义信息。于是,作为语义信息的信宿的认知主体有了自创造能力。

用语言符号构成的句子包含三种信息——哪些符号按什么顺序排列,这是语法信息;消除了接收主体追求具体目标或抽象目标(价值)的行为的某种不确定性,这是语用信息;消除了接收主体知识结构中的某种不确定性,这是语义信息——所以,它是全信息。

*此文为作者的一篇英文论文的中文原稿,该文曾在1996年6月11日~15日在维也纳技术大学召开的“统一的信息科学基础”第二次学术大会上宣读。

Information:the Defination,Origin and Evolution

Min Jiayin

(Academy of Social Sciences of China)

Abstract

In a non-living-world there is no information,even thoughin a dissipative structure which has a self-organizationabili-ty.The negaentropy is merely potential information.Thestartingpoint of life is also the starting point ofinformation becau-se we find the earliest communicationsystem there (DNA→RNA→AMINO→ACID→PROTEIN).

Key words information;defination;origin;evolution

标签:;  

资料:定义、起源和演变*_编码论文
下载Doc文档

猜你喜欢