论语言表达形式与信息熵和冗余的关系_信息熵论文

论语言表达形式与信息熵和冗余的关系_信息熵论文

论语言表达形式与信息熵、冗余度的关系,本文主要内容关键词为:论语论文,冗余论文,言表论文,形式论文,关系论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:H08 文献标识码:A 文章编号:1004-3926(2004)10-0293-04

一、信息熵与冗余度

何谓信息熵?“熵”是热力学第二定律中的一个物理量,是从统计概率的角度对一个系 统混乱无序程度的量度。这个概念是由德国物理学家鲁道尔夫.克劳修斯1868年首次引 入物理学中的。热力学第二定律可以叙述为:热自发地从高温流向低温,这个过程是不 可逆的。从分子运动的观点来看,一个系统的热运动是和它的无序程度有关的,在没有 外界条件干预的情况下,一个系统总是自发地沿着从有序到无序的方向发展,并且这个 方向是不可逆的。熵就是系统无序状态的量。热力学第二定律表明:物质和能量只能沿 着一个方向转换,即从可利用到不可利用,从有效到无效,从有秩序到无秩序。宇宙万 物从一定的价值与结构开始,不可挽回地朝着混乱和荒废发展!当系统处于有序状态时 ,熵最小;当系统处于无序状态时,熵最大。因此,熵就是系统无序、混乱状态的同义 语。

信息熵是从信源角度考虑的信息量,它表示信源整体不确定性的量。信息熵与热力学 第二定律中的“熵”所反映的系统运动过程和方向正好相反。用信息来描写物质系统的 过程,都是朝着有序化的方向发展的。在信息传递的过程中,系统信息量的增加总是表 明不确定性的减少。信息系统的运动过程是由无序性、不确定性(高熵值)向有序性、确 定性(低熵值)方向发展的。因此,信息在系统运动过程中,可以看作是负熵,是消除系 统混乱,从而达到信息有序的量。信息熵越大,无序性和不确定性就越大,包含的信息 量也越多,而信息熵的大小又与随机事件发生的概率成反比。

信息量是从信宿的角度考虑的量,是由消除信宿不确定性的多少来确定的。如果信宿 接受信息后,能消除接受信息前的不确定性,即能获得新的知识,该信息的信息量就大 ;反之,不能消除信宿的不确定性,则信息量为零。消除的不确定性越多,信息量就越 大。信宿的信息量也与随机事件发生的概率有关,概率小,信宿的不确定性大,消除的 不确定性也大;概率大,信宿的不确定性小,消除的不确定性也小。同时,信宿信息量 的大小还与随机事件的价值相对性有关,也与信宿接受信息的条件和素质有关。后两者 是一个动态的因素,在实际情况中是因人而异的。

信息熵值高的信息一般具有“新”和“奇”的特点,对信宿有很大的刺激性,因此, 高熵值信息具有引起信宿“注意”的功能。

何谓信息的冗余度?“冗余”一般的理解是多余,无用的意思,在语言表达中,“冗余 ”就是废话,罗嗦。下面有一则电文:

代表团共10人于29号即星期六1287班机下午14点到达派车到机场来接。

电报的特点是高度突出主要信息,同时也要求信息准确、扼要、不引起歧义。但是上 述电文却废话太多,不符合电文高效、准确、精练的原则,其中“共”“于”“即”完 全是废话,而“下午”“机场”也是多余,既然是“14点”,那肯定是下午,既然是“ 班机”,那无疑是到机场。

信息学上的“冗余”与汉语常用的语义不太一样,信息学上的冗余在许多情况下是运 用语言、文字形式传输信息时不可缺少的。如介绍姓氏“我姓覃,西早覃。”后面的部 分是冗余信息,但不是多余信息,而是对主要信息的补充。

“冗余度”是对信息的确定性、有序性和可预见程度的计量。它与信源的熵成反比, 信源的熵值越高,冗余度越小,反之,信源熵值越小,冗余度越大。再以介绍姓氏为例 ,如“我姓王”,信息熵值很小,冗余度大。而“我姓覃”,信息熵值很高,冗余度很 小。请看与上例相同的一条电文另发为:

a.代表团10人29号1287班机到达。

b.代表团10人29号星期六1287班机14点到达派车接。

a式简明扼要,毫无赘词。然而人们更喜欢b式,因为b式适当地使用了冗余信息,表达 明白无误,传递效果更佳。我们试做一分析:首先29日与星期六语义重复,构成了冗余 信息,但在实际生活中,有一些人喜欢记“星期几”来安排每周中每天的工作,而有些 人则不太注意“星期几”而喜欢记“多少号”,将这一信息用两种表达方式重复一下, 既兼顾了记忆习惯,又重复了关键信息。其次,1287班机与14点也是重复的,如果收电 人对航班时间很陌生的话,这一信息对他就很方便了。最后,“派车接”可起到提醒作 用。

由此可见,冗余信息是指超过传递需要量的信息。从信宿的角度看,冗余信息是对信 息的确定性、有序性的可预见程度的计量。冗余信息是对信息熵的一种缓冲,熵值太高 的信息往往“曲高和寡”,会使接受者感到与以往的经验不相符,产生感情上的疏远态 度,增加传递的难度。冗余信息使信源保持在一种既陌生又熟悉的状态之中,既能唤起 人们对新鲜的注意又有消除不确定性的愉快。所以,信息冗余度是信宿对信息的确定性 、有序性的可预见程度的比例。例如当我们向某人传递一种与期望相反的信息时,在说 正式的消息以前,总要先说一些与此无关的话,如“我现在要告诉你一件事,你听了之 后要冷静一些……”,这些话并不是废话,而是冗余信息,它能冲淡高熵值信息的刺激 性,预见后边信息的确定性,增强受者的心理承受能力,这样的表达形式就有一定的冗 余度。

信息冗余度具有抗干扰的作用,有助于克服信息传递中的噪声干扰。如环境的嘈杂或 听话人听觉器官有毛病或词语的同音现象等,都能使信道产生干扰,造成信息折耗。要 克服这些干扰,就不得不把关键信息重复一遍或加以必要的解释,以增加信息的冗余度 。例如,在人多的地方告知对方“明天下午4点的飞机”,常用的形式是“明天下午的 点的飞机,下午4点。”后面的部分正是冗余信息,因为“4点”可能理解为“凌晨4点 ”,重复这个关键信息让对方确认。介绍姓氏时常说“我姓张,弓长张。”因为“

zhāng”音有很多同音字,为了克服同音的干扰,有必要增加信息的冗余,以确保 信息畅通。

信息冗余度具有缓解熵值的作用。高熵值的信息具有信息量大的优势,但是,高熵值 信息又带有一定的滞阻功能。由于高熵值信息的新颖性和独特性,容易使接受者感到太 陌生,从而产生感情上的疏远态度,影响信道的通畅。冗余信息能使高熵值信息源处于 既陌生又熟悉的状态,使接受者既觉得新鲜刺激又能理解。

信息冗余度还具有传递感情信息的作用。通常,人与人之间的习俗性交际行为,大多 是高冗余度的信息,尤其是寒暄语。寒暄语都是高冗余度的,它不传递理性信息,只传 递感情信息。如“吃了吗?”“买东西呢?”“洗衣服呢?”“去哪儿?”等,这种习俗性 的礼貌问候,只是传递双方的感情通道畅通的信息。如果从消除不确定性的量来说,寒暄语完全是一些“废话”,但是正是由于这种传播行为,才使一个社会或团体凝聚在一起。外国留学生对这种高冗余度的寒暄语,一开始很难认同,总认为中国人好打探别人的隐私,或喜欢“明知故问”。但是,这种高冗余度的问候习俗,却是连接中国人情感的纽带。

二、语言表达形式与信息熵、冗余度的关系

(一)什么样的语言表达形式信息熵值高?

故意违反语法、逻辑、习惯,具有新奇作用的语言表达形式信息熵值高

人们在用语言传递信息时,常常故意使用一种违反常情、逻辑、习惯的表达方式,使 信息熵值增加。因为这种违反常规的表达方式,平时出现的概率很低,接受者对这种语 言表达形式的预见和估计容易发生很大的偏差,因此不确定性增加,信息量增大,具有 新奇的作用,这种表达形式往往能取得意外的表达效果。广告语言多使用这种违反常情 常理的语言表达形式。如新加坡航空公司某航班的一则广告:首航于1947,年龄仅为两 岁。这是明显的违背常理:1947年至今至少50多年,怎么年龄仅两岁呢?实际意思是该 航线虽然通航仅两年,但公司历史却很悠久,经验丰富,航班先进。这是故意造成语言 的能指与所指相分离的新颖形式。再如上海《新民晚报》刊一短文:

画家刘海粟的家和我近在咫尺,我没有见过他,但他却给我留下一个极深的印象。不 是他的音容笑貌,也不是他技艺高超的国画,而是在他画面署名上,往往有“年方八十 五”五个并不耀眼的小字。

文中的“方”意思是“刚”,常用于强调时间短或数量少。在习惯表达中都用于正处 于妙龄的年轻人身上,如“年方十八”“年方二十”等。可是大画家已是髦耋之年,应 该用“时年八十有六”或“年八十六”。如此大年龄怎能说是“方”呢?这正是突破常 规的新奇的语言形式,透过这个“方”字,读者可以获得这样一些冗余信息:大画家不 承认“八十六”是年龄大,而认为正处于焕发青春的大好时光;大画家老骥伏枥,意气 风发、斗志昂扬。一个“年方八十六”承载了如此多的信息量!

再如明代无名氏《时尚笑话》中有一个嘲弄学官贪赃的故事:

昔一秀才送鹅与学官,学官曰:“我受你的鹅,又无食与它吃,可不饿死?欲待不受, 又失一节,如何是好?”秀才云:“请师傅收下,饿死事小,失节事大。”

众所周知,“饿死事小,失节事大”是一句古语,有其特定的含义,是说一个人的性 命固然要紧,但与节气相比,后者更重要。但在这个特定的上下文里,这句老话的内涵 却故意突破了惯常的语义规约,意思是鹅不吃饭饿死了不要紧,但失却了节仪节礼就是 要命的事了。这句话化严肃为幽默,在增添语言活力的同时,不着痕迹地暗含了莫大的 讽刺意味,使解读者获得了大量的信息。

不过对语言表达形式的高熵值问题,我们不能把它绝对化。不能认为,越是背离习惯 的表达形式,其熵值越高,就片面追求生僻、怪诞、晦涩的表达形式。有一个笑话,讲 的是一个穷秀才想买一个樵夫的柴火,他对樵夫说:“荷柴者,过来。”然后问:“价 几何?”那秀才伸手摸了摸柴火,故意挑毛病:“外实而内虚,烟多而焰少,请损之。 ”樵夫实在听不懂酸秀才的“之乎也者”,于是挑着柴火走了。秀才使用的言语表达形 式对于樵夫来说是完全陌生的,没有一点冗余度,造成了信道的阻塞,秀才表达的意思 在樵夫那儿没有转化成信息,双方的交际活动失败了。

2、在信息传递中具有注意功用的语言表达形式信息熵值高。

“注意”是人们的意识对特定对象的指向和集中,以保证对对象获得特别清晰的反映 ,是顺利地获得知识,消除信息不确定性的必要前提。高熵值的信息具有“危言耸听” 的效果,可以唤起人们的兴趣,强化人们的注意力。因此具有注意功用的语言表达形式 能使接受者分出客体,将注意力集中于客体,同时离开无关刺激物。例如“夸张”的表 达形式具有极高注意功用,有一则民谣是这样说的:

小小大同县,三爿豆腐点,城里打屁股,城外听得见。

这则民谣极言县城的狭小和市面萧条,但在语言形式上采用了违反常情的夸张方式。 事实上,一个县城萧条到只有“三爿豆腐店”,小到“城里打屁股,城外听得见”的程 度,在现实生活中几乎没有,出现的概率很低,因此,这种表达形式的信息熵值很高, 具有“危言耸听”的效果,很容易抓住信宿的注意力。除了夸张之外,语言表达形式中 能抓住听读者注意力的形式很多,如设问、倒装、仿词等修辞格式都是这种表达形式。

(二)什么样的语言表达形式信息冗余度高?

1、感性的语言表达形式信息冗余度高

感性的语言表达形式是指如见其貌、如闻其声的具体生动的表达方式。这种表达形式 因其常见,所以对语言环境的依赖性很小,解读者可以凭借自身的生活经验或审美经验 进行解码,而不必太多地依赖语境就能获得超过传递需要量的信息。在文学创作中感性 的语言表达形式能传递出“言外之意”,具有意大于言的表达效果,信息冗余度很高。 如唐诗名句“夕阳无限好,只是近黄昏”,据考证作者意欲传递的是“爱惜光阴”“忧 唐之衰”的信息,但历代的人们对此的理解都是根据自己的心境、处境、情感特点来消 除信息的不确定性,而不是一定要根据李商隐所处的时代背景来解码。“夕阳无限好, 只是近黄昏”是感性的表达形式,“夕阳”“黄昏”是常见的事物,具有很大的普遍性 ,诗句描写的景象是生活中出现概率很高的常见事物,就消除理性信息的不确定性来说 几乎没有,但是听读者根据自身的经验获得信息却因人而异,大大超过了作者想传递的 信息。再如余光中的诗《乡愁》:

小时侯,乡愁是一枚小小的邮票,

我在这头,母亲在那头:

长大后,乡愁是一张窄窄的船票,

我在这头,新娘在那头:

后来啊,乡愁是一方矮矮的坟墓,

我在外头,母亲啊在里头:

而现在,乡愁是一湾浅浅的海峡,

我在这头,大陆在那头。

“乡愁”是一种人们普遍体验却难以捕捉的情绪,是抽象的事物,而“乡愁是一枚小 小的邮票”“乡愁是一张窄窄的船票”“乡愁是一方矮矮的坟墓”“乡愁是一湾浅浅的 海峡”是感性的语言表达方式,它将抽象的事物形象化具体化,读者从“邮票”“船票 ”“坟墓”“海峡”等感性的事物中可以对“乡愁”产生不同的情感体验。

2、“重复”的表达形式冗余度高。

这里的重复不是罗嗦,而是对信息中的关键部分给予适当的复说,可以起到重复刺激 的作用,加深信宿对接受到的主要信息的印象。生活中我们有这样的经验:当顾客用现 金付款时,卖方常说的一句话是:“您这是一百块(或五十块),找您XX块。”从交易情 景上看,“您这是一百块”是十足的废话,顾客给了一百块钱,卖主又重复一遍。但在 维持信息通道的畅通上却起到了提醒对方的作用,加深了双方对钞票面额的印象,因为 顾客在购物时周围的干扰是很大的,如果没有这个冗余信息,顾客就有可能对钞票面额 产生错觉。事实上,生活中买卖双方为钞票面额的信息误差而争吵的事是常常发生的。 因此,在现实生活中对信息中的关键部分给予适当的反复,往往是必须的。

3、符合常规的或熟悉的表现形式冗余度高

当信息的熵值很高的时候,适当地用人们熟悉的表达形式来传递,可以缓解人们对不 确定性信息的紧张度,避免信宿产生感情上的疏远,给信宿提供一个既熟悉又陌生的信 息通道,在新奇的刺激中又有能获得解读成功的愉快。上面列举的书生买柴火的一则笑 话,就是信息通道没有一点冗余度情况,致使信源发出的信息不能传递到信宿一方,使 信息交流失败。再如我们熟悉的格律诗,在意境、意象方面具有较高的熵值,并且格律 诗中大量的用典更增加了信息的熵。但格律诗在表现形式上却有严格的规定性,如律诗 绝句在字数、句式上有严格的规定,在字音的韵律、声调的平仄、诗句之间的黏联上更 有严格的要求。这种形式上的整齐划一,千古不变,造成了格律诗体裁、形式上的高冗 余度。所以,对大多数人来说,格律诗的解读并不难,甚至连不谙事的孩童都能摇头晃 脑地欣赏它的韵味,因为格律诗的节奏、韵律、平仄都是人们耳熟能详的,同时格律诗 的音乐性也与人体内的碱基排列顺序吻合,这种高冗余度的形式,使格律诗易上口易记 诵。可以这样说,格律诗的艺术效果,很大一部分是体现在高冗余度的体裁与形式上的 。音乐形式也是如此。笔者有一次在峨眉山的金顶听和尚唱经,笔者是红尘之人,经文 的内容根本不懂,但是给经文配乐的旋律却让人产生一种心灵上的震撼,笔者当时的感 觉是呼吸好像停止,脚下不能动步,思想似乎被旋律带得很远很远,在超乎理性经验的 直觉中完全理解了经文的内容。究其原因,是因为音乐旋律与人体内的碱基序列、心跳 节奏、生命运动的气息发生了共振,这个旋律是高冗余度的音乐表达形式,它对语境的 依赖性较小,笔者完全是用自己的音乐修养和经验去进行解码的。也许笔者获得的信息 并非经文的原意,但这种高冗余度的形式能传递超过需要量的信息。

4、口语中的重读音节和书面语中的黑体字也是冗余度很高的表现形式。重读音节和黑 体字可以使主要信息与次要信息形成反差,起到提醒和强调的作用。如“我知道你会唱 歌”一句,重音在不同的词上,包含的冗余信息不同:如果重音在“我”上,意思是“ 别人不知道你会唱歌”,重音在“知道”上,意思是“你瞒不了我”……书面语中的黑 体字则有“强调”的冗余信息,如“冗余信息在信息传递中既有积极作用也有消极作用 ”一句,如果用黑体字“冗余信息在信息传递中既有积极作用也有消极作用”表现,就 有强调、突出“消极作用”的冗余信息。

收稿日期:2004-08-18

标签:;  ;  ;  ;  

论语言表达形式与信息熵和冗余的关系_信息熵论文
下载Doc文档

猜你喜欢