编码的方法论意义,本文主要内容关键词为:方法论论文,意义论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
编码不仅是一项技术,而且是一种具有普遍意义的方法。它涉及人的心智活动、认识活动以至人类社会的各种文化活动。编码方法是一种普遍的认识方法和研究方法,应该从一般方法论的意义上来研究编码问题。
1 编码的含义和实质
(1)编码的普遍性
编码的历史可以追溯到人类文明产生的遥远古代。从人类意识和语言产生时开始,每当人们作语言表达时就是对自己的思想进行编码,每一个写下的词(文字符号)就是所说出的词(声音)的编码(这是从“声音”到“文字”的编码)。古代常用来传递信息的烟信号,拿破仑时期具有重大意义的光学电报(灯语),现代的电传打字机、电子计算机,没有编码的原理是无法实现的。我们用语言、文字来表达一定的思想内容,这些都是编码。通过编码可以建立表达思想内容的语言与音素或字母之间的确定联系,即把思想内容用一段话或文字表现出来。话音可以以空气为信道来传递,而文字则可以借助报刊杂志和书籍来传递。在所有这些情况中,一个符号库的各个符号和另一个符号库的各个符号之间按一定规则的对应,起着决定性的作用。
编码是人类的一种基本的心智活动。凡是有人类智力活动的地方,就有编码,或者说,甚至几乎人类活动的一切领域中都存在编码。“编码是人类心理中一个极为重要的过程,应比以往得到更多的重视。尤其是人的言语编码,在我看来似乎正是思维过程的关键。”〔1〕没有编码就没有思维,就没有认识,就没有科学和文化。编码是人类认识活动和文化行为的内在机制。
(2)编码的实质
从认识论的角度来看,信息是事物属性、内在联系和运动状态的表征,所以,信息的根本特征就是它的表意性,即表征。〔2〕所谓“表征”就是用一种东西去表示、指称另一种东西,这就是编码。信息本身就是编码的产物。一般地说,把一种信息形式转换为另一种信息形式,叫编码;把后一种信息形式还原(逆转换)为原来的信息形式,叫译码。编码和译码是两个互逆的过程。信息有语形、语义、语用三个方面。语形是信息的表现方式即编码方式,语义是信息的内容。通过编码与译码,只是改变了一个信息的表示形式,所表达的意义(语义),即信息本身的内容,并没有改变(在没有外在干扰和人为歪曲的情况下)。〔3〕
从逻辑上说,信息的语形和语义之间不是唯一对应的,同一信息语义可以用不同的信息语形来表示。因此,信息的表示形式具有多样性,即同一信息I,可以用不同的形式来表示,例如
这些不同的表示形式之间,在逻辑语义上是等价的,它们具有同一的语义内容,可以相互转化(通过编码和译码)。同一信息可以用不同的表示形式来表示,也就是说,对同一信息可以有不同的编码方式。〔4〕采用哪种表示形式,取决于技术条件、加工处理方法和实际需要。
人类运用的信息主要是符号信息。符号信息也叫编码信息,它依据一定的规则,把一些事物用一定的对应代号表示出来。表征事物的信息与被表征的事物和现象在内容(语义)上是一致的,两者具有同等的情报意义;但两者在形式上并没有必然的联系,同一个客观内容既可以用这种符号来表示,也可以用另一种符号来表示。人类社会所进行的信息活动,都是利用各种符号信息。一种信息形式与另一种符号信息之间需要经常进行转换。这些转换是严格按照人们事先约定的变换规则进行的,这些变换规则能够保证符号信息履行自己传送情报的职能。各种信息之间是怎样进行转换和传递呢?具体说来,是通过“编码——译码”和“调制——解调”。“编码——译码”是符号信息之间的符号变换;“调制——解调”是便于信息传递、接收的物理技术手段,是各种物理信号之间的转换,它的实质也是编码和译码。〔5〕符号信息编码的目的是为了使经过变换后的符合信息适合于传输、保存或处理,有时还为了保密、安全。译码是把编码信息翻译成原来的符号信息形式,以便使接收者能够识别,达到有效传达情报的目的。编码和译码必须遵循同一的、准确的编译规则——严谨的文法和语法规则。
综上所述,我们认为,编码的实质就是把一种形式的信息变换成另一种形式的信息,其目的是把信息变换成便于传递和加工处理的形式。
(3)编码的类型
从编码内容来看,我们可以把人工编码分为:①对象编码:用特定符号表示(指称)特定个体事物或一类对象;②特征编码:用特定符号表示事物的某种性质;③关系编码:用特定符号表示事物之间的某种关系;④操作编码:操作规则的符号化,即用一定的符号或符号的组合形式表示一定的操作规则,形成操作算子。
2 编码方法的意义和原则
(1)编码方法的意义
编码的最终目的,不仅在于把一种信息形式转换为另一种信息形式,而且在于转换后的信息形式更便于加工处理,从而能得到新的、有意义的信息。具体而言,编码方法的意义是:第一,使不能直接处理的信息变为可处理的信息;第二,提高信息处理的准确性和效率。〔6〕
对编码方法的意义,我们认为,可以从以下阐述中获得深刻认识。
人脑不能对事物及现象进行直接加工,即人在思维时不是把事物本身搬进头脑进行加工处理,而是对事物的代码——思维形象(形象思维)和语言符号(抽象思维)进行加工处理。没有编码就没有思维。编码是人类智力活动、思维特别是抽象思维发展的前提。语言符号是抽象思维产生的必要条件,语言和思维不可分,语言就是一种代码。有了编码能力,人的思维也就产生了;编码能力的提高是人类认识能力和思维能力发展的前提。人脑也不能对事物的原始信息(由感官感知到的声、光、电等形式的信息)进行加工处理,而必须把这种原始信息经过编码转换为另一种信息形式——语言符号,才能加工处理。感觉器官实质上是一个编码器。在认识活动中,编码就是一种抽象、指代过程。所以,人的认识过程中始终贯穿着编码活动。
经过编码后得到的是代码系统,或符号系统,这个系统由基本元素(码元)及其相互关系构成。广义的符号概念是:用A事物表示B事物,A就是B的符号,A可以是实物、文字、图象等。符号的最基本性质是, 它把事物的特征赋予符号,也就是说,使符号表示某种对象。符号不是与对象相分离的,符号是作为对象的符号,而不是抽象的、空洞的东西。符号按一定的联系方式组合起来,构成符号系统。符号系统不是固定的、既成的,而是能够进一步产生、复制新的符号以及新的符号组合的能动系统。符号系统具有一般智能活动的特点,是能够产生新的符号结构的系统,它能够完成符号的操作处理过程。符号操作系统实质上是信息处理系统。符号结构能够用来表示客观环境。我们(以及计算机)不是随意进行符号操作的,我们头脑里进行的符号操作过程,是力图使符号结构表示我们所处的客观环境。符号系统是这样一部“机器”,它产生符号结构,并对它进行动态操作。对象的符号系统是适应性系统,它具有同外在环境相联系的能力和手段,它能获得环境信息,生成反作用于环境的符号,用符号来表示或指定面临的对象(事物)、对象之间的关系及系统动作。符号系统具有输入信息、存贮信息、输出信息、复制信息、取出信息、生成信息等功能。这些信息由一定的符号或符号组合方式所携带。
从一定意义上说,数学是一门编码的科学。没有编码就没有数学。符号化就是编码。数学研究事物的数量关系和空间形式,是用各种符号(包括图形符号)及符号关系来表示的。中国古代就有数学(算术、算学),但没有发展成为近代、现代数学,直接原因之一就是没有符号化,即没有采用编码方法。符号公式在不同情况下可作不同变换,具有多种运用,而文字(自然语言)表达却无法作到这一点。把事物的数量关系和空间形式编码后,就便于进行各种运算(信息加工)。从广义上说,数学是一门形式信息学。
在人的认知过程中,表征和处理是两个最重要的概念。表征是指能把某种实体或某几类信息表达清楚的一种形式化系统,以及说明该系统如何行使其职能的若干规则。表征实质上就是编码。通过建立某个事物的表征,就可了解该事物的特性。处理是指某种操作,它使事物或事物状态的转换以符号形式的转换表现出来。通过处理,事物的一种状态的符号形式就可转换为另一种状态的符号形式。再从符号的结构推导到现实世界的结构,人们就获得了对世界的新认识。恰当的表征有利于处理的进行,一定的表征方式(即编码方式)与一定的处理方式是相对应的。对于同一种处理方式,同样的信息,用一种方式表征可以处理,而用另一种方式表征也许就不能处理。信息的表征方式(编码方式)和处理方式之间具有内在的对应关系。不同的信息表征方式,就是不同的编码方式。
(2)编码方法的原则
编码是以一定的符号序列表示一定的信息内容的。因此,编码首先要有一套基本符号,然后利用这些基本符号按照一定规则组成一定符号序列,最后,用一定符号序列表示一定的信息。编码中所用一套基本符号称为字母表,符号序列的组合规则称为编码规则,所形成的符号序列称为码。
编码的总原则是保证信息能够正确、有效地传递和便于处理。除此之外,还有以下一些具体原则。
①编码要完全、准确地反映事物信息的内容。这是对编码的基本要求。编码的完全性是指其所反映的信息不应有遗漏,而准确性是指其所反映的信息不应有多余。不恰当的编码会造成信息的多余或遗漏。〔7〕
②保证编码有唯一的理解。信息传递至少要涉及两方面——信源与信宿。因此,在信息传递中,编码必须保证信源与信宿对信息的理解是完全一致的。换言之,信源利用编码发出的信号被信宿接受,对此编码进行解码后能得到与信源同样的信息。为此,要求所设计的编码必定是能够解码的,不能解码则信宿就不能由接收到的码中取出信息。不仅如此,编码与解码还必须是一一对应的,即一个码只能对应一个解法。如果一个码可以有多个解或者多个码有一个解,就会造成信源与信宿对同一信息产生不同的理解,这就会造成信息传递中信息的丢失或信息的混乱。
③码位应尽可能短。码位即编码所用符号序列的长度。很显然,若同一个信息所占码位短,则其传输或存贮都比较有利。在“人—人”通信中,人们已经积累了不少经验以取得较短的码位。如用词的精练,对常用词进行压缩,改为缩写等等。码位长短与编码字母符号的多少有关。同一信息,不同的编码的码位是会不同的。〔8〕
④要有抗干扰能力。编码的抗干扰能力是指码在传递和处理过程中防止干扰信号影响信息失真的能力。一般说来信息传递过程中不免会受到各种干扰。好的编码应该具有一定的抗干扰能力,以便在有干扰的情况下保证信息不失真,或者至少保证能发现由干扰引起的失真,以便信息系统得以采取措施纠正干扰的影响。
⑤对变化有一定适应能力。客观世界是在不断变化的,因而信息也就随之发生变化。作为信息的编码必须要能适应这种变化,不至于发生由于信息变化使编码无法确切表示新信息的问题。〔9〕
⑥根据编码的定义,对于一个信息源可以有许多不同的编码方案。编码方案的选择一方面取决于研究的目的和需要,另一方面也取决于信息传递渠道的性质和信息处理装置的处理功能。
⑦编码不仅是用特定符号表示特定对象的指代过程,还要制定、设计一套科学的符号结构规则。这套结构规则必须反映事物之间的基本联系并且能运用这套规则进行符号操作,这样才有助于进行科学有效的分析处理,从而得到对事物的新认识。
(3)编码方法在现代科学研究中的地位
我们认为,从方法论的角度看,现代科学有三个基本特征,即高度抽象化、信息化和模拟(仿真)化。这三个基本特征都与编码方法有关。
①高度抽象化。这与数学方法的普遍运用有关。抽象化是数学的一个基本特征。数学方法本质上是一种编码方法,它对客观世界的基本的数量关系和空间形式进行符号编码,建立起可以进行操作转换(数学演算)的代码系统,通过对这个代码系统的操作处理,得出一系列定理。这些定理在更深的层次上、在更多的方面反映客观世界的数量关系和空间形式。从认识机制上看,编码本身实质上是一种抽象过程。在编码过程中,总要舍弃很多与特定研究目的无关的东西,根据研究的需要,只对事物某些方面的特征和关系进行编码,而舍弃其他方面的属性。抽象化程度越高,越需要精巧的、科学的编码方法。
②信息化。科学研究的信息化是现代科学的一个突出的方法论特征。信息科学理论的发展和信息处理技术的巨大进步是当代科学革命的核心过程,信息方法和信息处理技术已广泛渗透于各种科学研究领域。信息方法的基本思想,就是完全撇开对象系统的物质和能量的具体运动形式,把对象系统的有目的的运动抽象为一个信息变换过程,用信息这一中心概念分析和处理问题。〔10〕信息方法的实质,就是对事物的原始信息进行编码,建立一个信息系统,对这个信息系统进行加工处理,从而得到对事物的更多方面的新认识。
③模拟化。在科学研究中,对许多事物本身(原型)是无法直接进行操作处理和分析研究的,而只能通过对事物的模型进行操作和分析研究来认识事物本身。通过对模型的研究来认识原型,这就是模拟方法。由于研究对象的日益复杂化、认识范围的扩大、认识层次的深入,使人们难以对事物本身进行直接的研究,因而模拟方法在现代科学研究中起着越来越重要的作用。模拟方法也是通过编码来实现的,可表示如下:
模拟方法是理解和预测系统行为的一种手段和途径。科学研究中的许多实验,可看作是对真实世界的模拟。模拟之所以成为一种可行的研究方法。是因为事物之间存在着许多相似性。模拟方法包括两个基本阶段:首先对研究对象(原型)的某些性质和关系进行抽象刻画(编码),建立模型系统;然后对模型进行分析研究,去推演研究对象某一方面的未知的属性和动态变化的细节。模型有实物模型和符号模型两类,这两类模型都是对原型信息进行编码后得到的。模拟方法要求对实物模型进行具体的运转实验(科学实验),对符号模型进行操作转换(符号演算、数学计算),从而得到对研究对象的新的认识。模拟方法不仅能告诉我们已知的东西,它还是获得新知识的一个有力手段,它帮助我们获得新的发现,有时甚至是创造性的发现。
编码方法也有一定的局限性,在一定条件下,由于认识能力和研究手段的限制,人们对某些事物的原始信息无法识别提取,因而难以进行编码;另外,对某些定量研究程度较低的学科,特别是人文社会科学,无法应用编码方法。
3 不同阶段认识活动中的编码方法
(1)从感性认识上升到理性认识过程中的编码活动
人们将感性认识中的表象转变为代表概念的符号,就是在进行一种编码活动。人们的感性认识要上升到理性认识,必须经过编码活动才能达到,因为只有通过编码,用符号替换了对象的感性印象,人们才能转入由符号所代表的抽象概念,从而转入抽象地、本质地反映对象的理性认识领域。这就是说,由感性认识上升到理性认识是伴随着编码活动而进行的。即使是从感觉到感性认识,也是一种编码活动,即事物的原始信息通过感觉器官这种编码器,转换为感性信息(感觉、知觉、表象)。
在人的认识活动中,编码的种类有两大类型:一类是将不是符号的东西转化为符号,这就是将表象转变为概念(从感性认识到理性认识)时所伴随的那种编码活动,这种编码所形成或使用的符号形式,通常就是自然语言或文字。另一种类型的编码,就是将一种形式的符号转变为另一种形式的符号,用“符号的符号”来代替原来的符号——通常是代替了语言文字的符号,这种符号形式就是科学研究中常用的人工语言或形式化语言。前者使认识在质上发生了变化,使感性认识上升到理性认识;后者则没有使认识内容在质上发生变化,只是改变了认识内容的信息形式。当然,这种改变也许会有利于认识内容的进一步发展,但在其直接现实性上,它还只是保留了认识的原有内容,是“原文”的另一种“翻版”。
(2)逻辑学中的形式化方法与编码问题〔11〕
形式化方法的程序包括三个步骤:①预备性研究:编码,即构造形式语言;②演算、推理:构造形式系统;③译码:对形式系统进行解释。形式化实际上是将特制的人工符号(形式语言)应用于演算体系,以使其严格化的一套程序或方法。形式化总是使某一理论形式化,而把某一理论形式化就是把理论中的概念转换为形式语言中的符号,命题转换为符号公式,定理的推演转换为符号公式的变换,并把一个证明转换成符号公式的有穷系列,从而把对理论中概念、命题、推理的研究,转换为由符号表达式所组成的形式系统的研究。上述这些“转换”都是编码过程。
形式化表现为一系列连续的操作,鲍亨斯基指出:“形式化系统总是按如下顺序形成的:先确定有意义的符号,然后从符号中抽象掉意义,并用形式化方法构成系统,最后对这个构成的系统作一种新的诠释。”〔12〕形式化方法的实质是,完全撇开所使用的符号的意义,撇开该符号系统所适用的对象范围,只凭借明确给出的与符号的字形(结构)相关的语法规则构造形式系统。所谓形式系统,就是一个形式语言加上一套演绎装置,形式语言包括字母表、形成规则(项的形成规则和公式的形成规则)、定义,演绎装置包括公理、变形规则、推理规则。形式化方法不仅是现代逻辑的一个基本方法,在现代科学研究的许多领域中也把形式化方法作为一种基本理论研究手段。
(3)哥德尔编码方法〔13〕〔14〕
在证明不完全性定理时,哥德尔创造了一个基本技巧,就是对形式系统中的符号、项、公式及证明等都以自然数编码。这个思想已经发展成了逻辑学和其他一些学科中的一个标准做法。一般来说,信息可以呈现在英语、汉语等自然语言中,或者也可呈现在一个抽象的形式语言中。为了讨论、传递或处理信息,把它转换成数值形式具有实质性的意义。哥德尔对一阶系统N就做了这样的工作。对于N中的每一个符号、项和合式公式(符号串)、合式公式串(证明),都指派一个自然数,现在称为哥德尔码数(配数)。指派数的方法是可以不同的。
通过哥德尔编码,能够把关于形式系统N 的陈述转变为自然数算术解释N中的陈述,即把关于符号、符号串、 符号串的有限序列的陈述转变为关于自然数的陈述(这实质上是编码的过程)。这是一个关键步骤。通过递归和可表示性,又可将关于自然数的陈述再转换到形式系统N 中去加以陈述(这是译码的过程)。这是又一关键步骤。实施了这两个关键步骤,形式系统N成了它自身的元系统,也就是N既作为对象语言被研究,也作为元语言而成了研究工具。
哥德尔建造这种编码的目的,是为了把关于形式系统内的对象的断定,转换为关于自然数的断定。也就是说,通过编码,使得对象理论的一些性质都能够在自然数中反映出来,尤其是,有关对象理论的元定理也都可以表示为自然数的定理。然后,再通过递归性、可表达性,使得能在形式系统内去表示这些断定,试图把系统(至少部分地)当作自身的元系统。用数字表示信息(编码),对数字进行一定的加工处理就得到一些新的数字,对这些新数字进行译码,就得到新的信息。这就是哥德尔编码方法的实质意义。