情报学中的符号语言学_科学论文

情报科学中的符号语言学，本文主要内容关键词为：语言学论文,符号论文,情报论文,科学论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

主题标引过程由许多步骤组成，可以把这些步骤看成解释。D.Benediktsson指出了标引过程的解释本质和认识解释的重要性。他认为可以把任何一种书目描述看成是描述性的。当要加以解释时，应该遵循像教规那样的方法或标准，这些方法或标准使解释成为可能[1]。换句话说，主题标引过程实际上由多个解释组成。若果真如此，就需要一个能从这个观点解释该过程本质的理论。C.S.Peirce建议把符号和符号语言学（Semiotics或Semeiotic）作为研究和理解主题标引过程解释本质的理论。他的符号语言学对这个问题确实起到了作用，因为它包含了一种解释，即符号的含义是怎样产生、解释和表示的。

图书情报学领域的一些学者发现符号语言学是一个有用的理论框架。B.Cronin建议把符号语言学作为理解引文和文献计量学的框架[2]。R.P.Smiraglia用符号语言学分析作品的概念[3]。M.K.Buckland则用它分析文献的概念[4]。S.Brier认为，符号语言学同第二秩序控制论（Second Order Cybernetics）和实用语言哲学一起可以形成这个领域的理论基础[5]。M.Karamuftuoglu用符号语言学分析信息检索过程”[6]。G.Wangner在用它分析公共图书馆的交流过程时指出，在符号语言学与图书情报学之间存在着概念的交叉，迄今为止，还没有对这种交叉进行彻底研究[7]。在美国国家科学基金会资助的一项研究课题中，C.Person和V.Slamecka用符号语言学建立了信息系统编程和理解实用方法的基础[8]。

图书情报学领域对符号语言学的最著名的讨论并对当前研究最有重要意义的，也许是D.Blair1990年的《信息检索中的语言和表示》一书，他指出，标引与检索理论必须包括明确的语言理论及其基础的含义，并从实用语言哲学来理解信息检索[9]。该书的主要部分是分析语言在标引和表达中的重要性。他认为，对于理解文献标引和表达来说，实用语言哲学具有重要意义。但是，他反对把符号语言学作为理解标引和信息检索的基础。他指出，“符号语言学从某些词或表达的角度开始，而这些词或表达需要加以解释。”[9]这对于符号学或许是正确的，但对符号语言学却并非如此。

按照C.S.Peirce的理解，可将符号语言学定义成用符号表示含义的研究，即含义是什么？它是怎样和在哪里形成的？如何转换和结合？符号语言学不关注某一特定现象的含义，而关注含义为什么和怎样存在。作为符号语言学的替代，D·Blair认为，后期的实用语言哲学理论对于理解如何为检索而表示文献是有用的。然而，C.S.Peirce的符号语言学和实用语言哲学是十分相象的。

1 符号语言学

符号语言学一般被定义为对符号的研究，分为欧洲和美国两大流派。前者通常被称为符号学（Semiology）。后者通常被称为符号语言学。尽管人们试图定义一个统一的符号语言学，但这两大流派还是有区别的：前者是关于如何从词中抽取含义的理论，把符号定义成两个形式实体（表达要素和内容要素）之间的固有结合。简言之，欧洲流派运用符号的双重概念，提出词不仅仅表达事物的名称，也表达某种内容。据此，把词和词的内容分开，反对词具有内在本质的观点。

与此相反，后者是关于符号如何表示含义的理论，并且符号不仅仅是词，把符号看成表示过程中的一个要素。美国流派的代表C.S.Peirce把符号定义为3个实体之间的联系，这3个实体是符号本身、符号的指示物以及从符号得出的含义。他所关心的是如何从符号中得出含义和如何将其转换为其他符号。他运用符号的三面的或三元的概念，定义如下[10]：符号或“表示法”是某物，该物在某一方面或某一能力上支持某人做某事。也就是说，它指明某人在其头脑中创建了一个等价的符号，或许是一个更发展的符号。它创建的这个符号可称之为第一个符号的“解释”。这个符号代表某物，即它的“客体”。它不是代表这个客体的各个方面，而是关于某种思想。Peirce区别了物理实体（如词）、这些词所指的思想和从这些词中取出的含义。如图1所示，把符号概念表示成一个三角形。

图1 符号语言学三角形

表示法是表示符号的方法，通常以某种物理实体的形式表示，或者至少以某种形式出现。换句话说，表示法是符号关系的实体，符号关系被感知并通常表示成“符号”。表示法表示某一客体。但在表示法和客体之间不存在一对一的关系。客体不是某种可辨认的独立于符号而存在的实体。

Peirce对客体做了如下说明[10]：每个客体（一个符号可能有许多客体）可能是单一的已知的现存的事物，或者是先前认为已经存在或期望存在的事物，或者是这类事物的集合，或者已知质量、关系或事实，那个单个客体可能是一个集合或部分的整体，或者它有某种存在的模式，如某一允许的行为，该行为的存在不妨碍它否定同样允许的存在，或者是期望的一般性质的事物，或在某种普通环境下总是不变的某种事物。符号只能表示客体并告知客体的有关情况，它不能提供对客体的熟悉或对客体的认识。因此，客体不是存在的客观实体，但可通过符号知晓和认识。客体是“符号预示熟悉的东西，以传递有关它的某些进一步信息”。应该把符号看成人们理解符号所必需的背景知识，或者是能被制作出来的关于符号的一系列可能有意义的表述。表示法可能是另外表述或代表某物的任何事项，这就是说，Peirce的符号概念没有局限在词或语言上，而是把文献看作符号。

表示法与其客体之间的联系由解释做出，它是符号关系中的第三个实体。解释不是解释符号的人，而是从表示法中产生出来的符号。换句话说，当把表示法看成符号时，在表示法的基础上，创造出一个新的和更具发展性的符号。解释这个符号的人在所见到的事物（即表示法）与其背景知识（即客体）之间建立一种联系，从而创造出一种对符号的理解或含义（即解释）。这一过程被称作指号过程（Semiosis）（在逻辑学中，指语言或非语言起记号指代作用的过程），即解释符号的行为。

图2 Y型腿模型

在图2的符号Y型腿模型中，强调了表示法与把解释作为一种指号过程而创造的客体之间的联系作为指号的一个过程。从表示法到客体的连线强调了初始符号（表示法）及其指示物（客体）之间的联系。这两个实体之间的联系是表示法的含义，即表示成解释。这种想法在Y型腿模型中得以强化，但在符号语言学三角形中就不特别清楚。Peirce的符号语言学理论中的一个关键要素是“无限指号过程”的概念.这个概念被看成符号的关联或一个符号产生另一个符号的过程。无限指号过程以指号过程的基本思想为基础：一个符号（b）是在另一个符号（a）的基础上产生的。当一个新符号（c）在第二个符号（b）的基础上产生时，第二个指号过程也就发生了。由于新符号仍会产生更多的符号，这个过程将无限期地继续下去，因此是无限的，故使用“无限指号过程”这个词。

图3表示无限指号过程。该过程中第一个符号的解释转变成第二个符号的表示法。它们之间存在着某种关系，但每一框中的客体对表示法和解释是独立的。客体将会改

图3 无限指号过程

变整个过程。无限指号过程中的每个客体关系对于这个符号关系是惟一的。无限指号过程中的单个客体是相互独立的。图3中的三角形将继续产生新三角形。应当这样来理解：在它们之前有三角形，在它们之后也有三角形。这意味着对某一事物的理解通常是以对其他事物的理解为基础的，并且它将会继续产生另一种理解。这里阐述两个重要思想：①不同的符号关系有不同的实体，每一实体依赖于创造这个解释的人，不同客体之间没有必然联系。②每一表示法以解释为基础，解释又以表示法为基础。

2 符号的类别

Peirce把符号分成许多类别，以说明它们的不同种类。符号类别通常由图标、索引和标记组成。这种分类方法是以符号与其指示物和客体的关系为基础而将符号分成组的。图标符号以形似物为基础（如浴室门上的符号），索引符号指向符号所指的事物（如烟指向火），标记符号指示习惯（如语言）。划分成图标、索引和标记简单表示了Peirce的符号全部分类。为此，他定义了符号的每个实体的3种模式（解释、表示法和实体），均以其现象学为基础，他在现象学中论证了把世界划分成3种现象模式或3种存在模式。在符号分类之前，他作了比较全面的探讨，因此必须引进他的现象学。

2.1 三种存在模式

Peirce论及了世界上的每一事物，包括感觉、想法和思想，它们均属于3种基本存在模式中的一种：肯定性质可能性的存在模式、实际事实的存在模式和规律（或惯例）的存在模式。他把这些模式分别命名为第一模式，第二模式和第三模式。

第一模式是单细胞生物的存在模式，这种模式由现象的品质种类构成，如红色的、苦味的和坚硬的。这种存在既不依赖于某些人头脑中的存在（不管以感觉的形式，还是以思想的形式），也不依赖于某种物质的东西处理品质的形式存在[10]。

第二模式是存在的双值模式，这种模式告知有关其他客体的一些事情。第二模式是事物之间的联系；Peirce把第二模式进一步描述成事实。它是事物之间的直接联系，例如，火车鸣笛和对鸣笛的感知之间的联系。

第三模式是第一模式事物和第二模式事物之间的三元组的关系，这种关系揭示了有关第三模式事物的情况。它一般被定义为含义。含义不是符号的固有性质，而是人们从符号中制作出的某种东西。Peirce把第三模式说成是规律类[10]；据此，他意指第三模式是由人类建立的两个事物之间的一种联系。

2.2 三分法

每个符号由3个实体组成：表示法、客体和解释，它们都必须出现，以便形成符号。符号的这3个实体有3个要素，反映了3种存在模式：第一模式、第二模式和第三模式。对于Peirce的符号语言学来说，符号的三分法及其构成的进一步三分是基本的。三分法之三分如图4所示。3个内层类别（表位、图标和定性符号）代表第一模式。中层类别（二元符号、索引和一元符号）代表第二模式。外层类别（论证、标记和多元符号）代表第三模式。任一符号由图4中3条引线上各一个要素组成，这一符号要素组合构成了所有符号的各个类别。换句话说，Peirce不仅把符号分成3种要素，而且每个要素也被进一步分成3种要素。

图4 符号的三个一组分类法

根据符号本身是否是单纯性质（定性符号）、实际存在（一元符号）或习惯（多元符号），表示法被划分为：

·定性符号是一种性质，也是一个符号。

·一元符号是实际存在的事物、各个客体、行动或事件。换句话说，一元符号是代表特定客体、行为或事件的意义上的个体性。

·多元符号是普通类型、规律、习惯或惯例，它是由人建立的。

例如，符号“A”可能被认为是：①黑色线条或黑色墨水在纸上的性质（即性质符号）；②字母“A”类的一个好例子，它是实际存在的（即一元符号）；③表示对学术论文的满意程度，也就是惯例（即多元符号）。

客体的划分依据符号与其所表示的客体之间的关系。

符号或者具有其客体（图标）的共同特性，即同这些客体（索引）的现有关系，或者只具有同其客体（标记）有代表性的关系。

·图标是一种符号，它与该图标所代表的那个符号共同具有某种相似性。

·索引是一种符号，它通过受到这个客体的影响来指向其客体，同样指出其客体。

·标记是一种符号，它通过规律、习惯或惯例来指向其客体。这往往通过思想联系发生。借助于这种联系解释该标记，就像指向其客体一样。

象形字是图标的例子，在象形字中，符号类似客体。足迹是索引的例子，它指向一个人。标记的例子是基于所产生的背景的符号，例如，街道上符号字母P，意指“允许停车”。解释把符号表示成可能符号（表位）、事实符号（二元符号）或原因符号（论证）。

·表位被理解成表示某种可能的客体。表位的意思很容易理解。

·二元符号比表位复杂，意指解释二元符号比解释表位需要更多的知识。

·论证是原因或规律的符号，被理解成用字符将其客体表示成符号。应当把论证“预测成一种符号，这个符号可以被证实或否定[10]。

上述三者的例子是：表位是名词（如房子、汽车），一元符号是命题（如房子是绿色的，汽车是快的），多元符号是论证，即命题的有意义连接（如琼斯有一幢绿色的房子和一辆汽车。另一方面，史密斯不喜欢驾车愿意骑车……）。

以上例子都缺乏说服力，因为任何符号被定义为该符号的所有因素组合，就像每个符号由3个三分法中的每一个的一个要素组成。这个符号的各个方面的例子是不全面的，因为这个符号中的两个要素被忽略了。一个符号总是由3个要素组成，而每个例子都依赖于另外两个被忽略的要素。

2.3 符号类别

通过以上各种符号要素的组合，Peirce提出可以列举3[10]个或59049个符号，但他仅定义了10种符号[10]：①定性符号是“一种感受，一种感觉，例如，‘蓝色’的含义取决于一个受蓝色客体支配的人的存在”。②图标式一元符号是任何“经验的客体，以至于客体的某些性质使其确定对某一客体的想法”。③表位索引式一元符号是任何“直接经验客体，以至于它直接注意到某一客体，而它的存在正是由自己引起的”。④二元式一元符号是“任何直接经验客体，以至于它是一个符号，同样提供有关其客体的信息”。⑤图标式多元符号是“符号的任何一般规律或类型，其范围是它制造出一些与自身不同的相似物”。⑥表位索引式多元符号是“符号的任何一般类型或规律，一旦建立起来，就要求它的每个事例实际上受到其客体的影响”。⑦二元索引式多元符号是“任何一般类型或规律，一旦建立起来，就要求它的每个事例受到其客体的实际影响，以提供有关这个客体的信息的方式”。⑧表位标记是“通过思想结合与其客体相关联的符号”。⑨二元标记“或常规命题，是通过思想结合与其客体相联系的符号，起到表位标记的作用，除非为了适应它所指的东西，其扩展的解释表示二元标记，就像受到其客体的实际影响那样”。⑩论证是一种符号，“这个符号的解释将其客体通过某一定律表示成一个隐蔽的符号，这个定律就是从所有这些假设到这些结论往往都是真理”。

这10个符号类别是基本的，从不同种类的符号要求不同种类的解释这个意义上说，为不同种类的解释提供了一个框架（见图5）。

图5 10种符号

应当指出，每天使用的符号概念的范围是十分有限的。实际上有许多不同种类的符号，差别在于归纳符号含义的方式以及解释符号的方式。还应指出，解释的种类也不同。解释有时纯粹是把符号转化成行动，而在其他时候，解释需要广泛理解所用符号的社会背景。如前所述，主题标引过程由许多步骤或解释组成。这些步骤或解释相互联系的方式是按照无限指号过程和符号类别的思想进行解释。

3 符号语言学与情报科学

情报检索系统是为表达和检索文献而构建和使用的，其中心问题之一是如何捕捉和表达文献的主题内容。尽管技术的进步可能为文献提供快速存取方式，但表示文献主题内容的问题仍然是人们在解释和理解文献主题内容过程中的第一位和最重要的问题。这个问题的核心是如何理解文献主题内容以及如何对文献主题内容的解释进行表达，以便其他人能获取这篇文献。因此，标引与含义及语言有关，任何标引理论都或明或暗地包括语言和含义理论。

3.1 主题标引的步骤与要素

关于主题标引的步骤有两步法、三步法、四步法之说，本文以大多数人的三分法为例。所谓三步法是指，第一步确定文献的主题内容；第二步把从第一步中找出的主题内容重新用一种自然语言表示；第三步把较为正规表示的主题内容进一步转换成某一标引语言的词语。

划分主题标引的步骤不是目的，目的是看看这些步骤是如何实现的。更确切地说，标引过程由4个要素和3个步骤组成，即一个要素由一个被作用的客体和作用于这个客体的一个步骤组成。要素和步骤的顺序如下：要素1——步骤1——要素2——步骤2——要素3——步骤3——要素4。

上述要素和步骤的顺序可以重新表述如下：文献（要素1）——文献分析过程（步骤1）——主题（要素2）——主题描述过程（步骤2）——主题描述（要素3）——主题分析过程（步骤3）——主题款目（要素4）。

由此可见，主题标引过程由4个要素（文献、主题、主题描述和主题款目）和3个步骤（文献分析、主题描述和主题分析）组成。这些要素和步骤可按Peirce的解释方式相互联系起来。

为了详细说明主题标引过程各要素之间的差异，可把每个要素归入Peirce的符号类别。这是因为Peirce的分类强调解释的不同类型，任何特定的符号可能涉及这些解释，而这些解释的差异实际上与符号的不同类别有关。换句话说，尽管主题标引过程中的4个要素都是符号，但每个要素的符号不同，这就在如何描述这些要素上造成很大差异。为了使主题标引过程中的要素与最适合的Peirce符号类别相匹配，主题标引过程每一步所需要的解释种类将显得更为突出。

表面上看，把要素与Peirce符号类别相匹配比较简单，但实际上却很复杂。其原因在于，Peirce的10种符号类别很像3种包含模型的三分法，每一种对应Peirce的第一、第二、第三种思想。因此，匹配必须是确定10种符号类别中哪一种适合主题标引过程中的哪一个要素。

3.2 要素1——文献

文献在主题标引过程中是初始要素，因而也是最先被分析的要素。一篇文献表达了思想和含义的范围，标引员的任务就是首先在较为正规的主题描述和最后在主题款目中选择和捕捉到这些想法和含义。文献是复杂的实体，它包括许多不同的表述。为此，把它看作等同于符号分类中的“论证”（图5中的符号类别X）。

论证在10种符号类别中最为复杂，也最具发展性，它在其结果中包含了为数众多的解释和不确定性。出现这种现象的原因是符号的解释是以某一社会和文化背景为基础的，论证的解释基于特定社会或文化背景中广泛一致的实践或惯例的约定。因此，文献被看成某一惯例的产品，它的含义要在一定的社会和文化背景中理解。确定文献内容不能离开这个背景，尽管在不同社会和文化背景之间确定主题内容可能会有重叠。但这种重叠就像借助于特定文献本身那样确定，在很大程度上以惯例的重叠为基础。为了判断文献的类别选择，可以借助于文献同每个符号实体之间的关系。

3.3 要素2——主题

主题通常体现在标引员心里，它是取自该文献的印象和想法的某种抽象的东西。在这一点上，标引员没有区分应该表达什么和不应该表达什么。无论主题是什么，标引员都把它同该篇文献联系起来，除了来自文献本身的数据以外，其范围还应该包括像标引员思考其他文献那样完全不同的东西，包括标引员同事可能利用的文献，或者标引员与一些朋友前一天的讨论。在这方面，主题不是必须与文献、与文献中的文本有联系的单独的某些东西。主题必须与阅读、查看和评价文献的人有关，同时也与文献本身有关。换句话说，从这一点上看，说文献有特定的主题，比说主题是给文献某种东西更缺乏道理。总之，文献的主题可能是任何东西。但在大多数情况下，文献主题内容可接受的和有用的解释数量很有限，因为文献将要用于的社会实践决定了用途、意义和文献的主题内容。

社会实践是标引状态的特定社会背景（包括领域、用户、组织等），它将限制标引员通常与文献联系的思想和含义范围。标引员意识到这个工作，又依次把思想和含义范围限制在少于可能的总数。标引职业特性的一个要素是知道文献应该被使用的特定背景。该主题被分类到Peirce的符号类别中的Ⅸ（图5），即二元标记类别。应当指出，类别是指二元标记，即Peirce指示的那个类别。该类别的名称叫二元标记，不应当同二元符号混淆，二元符号这个词用于指示符号与解释之间的关系。

3.4 要素3——主题描述

主题描述是主题印象的正规化抽象，这个抽象来自主题标引过程中的第二步。它可以是主题的书面说明或主题内容简单压缩的隐含形式。正规化的实质存在于有意识的努力，以便把主题抽象的各种要素简化为明确的说明。因此，在从主题向主题描述移动的第二步中，应当表示出与主题抽象中的文献有关的那个论题及其他要素，这些是由标引员决定的。很清楚，主题描述肯定比主题狭窄得多。因此，主题包括了标引员可能从文献推断的和与文献有关的每件事情，主题描述被限制在标引员总结出的有价值的或很重要的信息，以便用标引语言表示出来。标引员通常形成一系列描述主题的简要说明。用这种方法限制描述将帮助标引员区分主题的不同构成关系，在给定情况下，挑选最合适的关系。

所以，主题描述由一些句子或说明组成，给出这些句子或说明是为了更正规地表示文献内容。更具体地说，它表示标引员浏览的文献，反映标引员选出并强调的文献中的那些论题。根据Peirce的符号类别，主题描述是二元索引型多元符号（图5中的符号类别Ⅶ）。

3.5 要素4——主题款目

要素4是主题款目，它是口头标引词或分类系统中的概念，其准确形式取决于为其创建的系统。在Peirce符号类别中的主题款目的类别划分取决于解释主题款目的准确状态和谁解释主题款目。因此，在Peirce符号类别中主题款目的准确分类超出了本文的范围，本文的范围限于主题标引过程，在这个过程中，主题款目是最终产品。因此，主题款目的分析属于信息查询研究。但是，这里对主题款目类别划分的简短讨论，对于说明可能的类别划分范围是有价值的。

对主题款目的解释依赖于许多因素，例如，解释者对标引系统和用户的了解，以及系统和文献的领域等。如果标引系统的用户对它十分熟悉，那么就很少涉及解释，而解释就是表位，因为主题款目就像一个名词那样很容易被解释，并且对于相同状态下的所有用户来说，几乎都是相同的。在这种情况下，客体是索引，索引简单地指出主题款目的客体、与客体相关的思想或含义的范围。例如，对于在特定标引系统中工作多年的职业图书馆员来说，情况就是如此。另外，标引系统的新用户将以不同方式来解释这个主题款目。在这种情况下，主题款目的解释可能会更复杂。解释是二元符号，因为用户必须把主题款目解释成某一类或标引词内容的说明或句子。客体（即与这个主题款目相关的思想和含义范围）是标记，因为主题款目是基于主题款目的社会和文化背景的惯例。

把Peirce的符号语言学应用到主题标引过程，可能得出一个明显结论：证明该过程是可解释的和可变的。以这种方式描述该过程，并提出“它是有用的结论”的论点，不应当被看成把该过程看成某些因素的努力，这些因素本身将不产生准确性。更确切地说，它表明该过程是深远的和人文的。的确，主题标引过程的深远的人性在于，一方面，使它不受单独采用定量经验方法加以分析的影响；另一方面，使它过分要求采用定性的和人文的方法来理解。

主题标引过程的符号语言学分析证明：第一步，即文献分析，包括各种解释，高度依赖于标引员和标引过程的社会和文化背景。尽管这种依赖性在本文前面讨论过，但文献的解释是无法避免的。不仅初始解释不可避免，而且整个标引过程都是由多个不可避免的解释组成。从这个意义上说，对标引的研究就是对文献的研究和对如何利用文献的研究。此外，由于文献的表述在一系列的活动中是第一位的，这些活动向用户提供所需文献，清晰地理解这个过程的本质，对于图书情报学中的许多活动和研究来说是很重要的。换句话说，信息查找、信息检索、信息系统评价等的任何研究都应该考虑主题标引过程的基本的和不可避免的解释本质。

标签：科学论文; 二元关系论文; 语言学论文;

情报学中的符号语言学_科学论文

猜你喜欢