网络信息资源的分众分类研究,本文主要内容关键词为:信息资源论文,分众论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[分类号]G254.1
随着社会性软件的发展,分众分类作为一种新型的网络信息资源的分类组织方法,被应用到越来越多的网络系统中。分众分类采取用户参与和协同分类的方式实现网络信息资源的组织和检索,将网络话语权赋予了网络个体,从根本上转变了网络用户的角色,为普通网络用户进行知识组织和知识发现提供了契机。
1 分众分类概述
分众分类(folksonomy)是个人用户为方便检索对信息或对象进行自由标注的结果。它的主要机制是基于“开放元数据标准”和“自然语言社群聚类”。分类的原理是向用户提供一种协同构建与共享标签的开放式平台,用户通过自己制定的分类标准提交标签,由用户群体定义标签的频率决定信息的组织方式。
1.1 分众分类的结构模型
VanderWal认为分众分类包括3个基本元素:资源、用户和标签。资源是指系统收录的各种类型信息;用户是指各种资源的发布者和使用者;标签是指用户赋予特定资源的标识。标签系统可以用〈资源,标签,用户〉的三元组来表示。
图1 标签系统的结构模型
图1形象地描述了标签系统中资源、标签、用户三者之间的关系。在标签系统中,用户的信息空间不是封闭孤立的,而是开放共享的。用户在给资源赋予标签的过程中,可以查看其他用户添加的标签,使用相同标签的用户,特别是对相似资源使用相同标签的用户,他们的知识体系具有某种重合,这些具有“共同语言”的用户就形成了网络环境下的虚拟社区,图1中用户间的虚线就代表了虚拟社区中用户间的关联。分众分类允许用户给资源任意添加标签,因而同一资源可以被不同的标签标引,同一标签也可以标引不同的资源,这样不同的资源就可以关联起来,图1中资源间的虚线就代表了资源间的关联。用户为资源添加标签的行为建立了用户与资源间的关联,即图1中的实线。标签使得用户间建立了社会网络关系,资源间建立了一定的概念关系,反过来用户标签的使用习惯和分布特征形成了标签间潜在的语义关系。
1.2 分众分类的应用模式
目前,分众分类有两种应用模式:一种是面向网络大众的应用模式,即宽分众分类模式(见图2);另一种是面向某一团体的应用模式,即窄分众分类模式(见图3)。
①宽分众分类(broad folksonomy)拥有大量异质的用户,这些用户在知识结构和兴趣领域上具有很大的差异性,这样的系统中存在大量规模较大的用户集合对同一对象进行标注的现象。虽然这些用户可能拥有不同的知识结构和兴趣领域,他们的标签反映的都是个人词汇,但是不同的标签能够聚集形成不同的群体。在这种情况下,宽分众分类能够反映不同个人、不同群体对同一事物的不同认识。
图2 宽分众分类示意图
图3 窄分众分类示意图
宽分众分类的目的是建立内容广阔的平台,使得用户可以在一个比较大的信息或知识范围内浏览查询。宽分众分类可以通过对热点信息做出反应为社区吸收更多的用户,用户的增多可以反过来促进社区对热点信息的反应。由于分众分类的思想建立在大众参与分类体系构建的基础上,只有对同一内容存在大量不同的标签,系统才可能通过同义词控制等方式得出最优化的分类结构,一旦参与的人数不足,分类的片面性就很容易暴露出来。
②窄分众分类(narrow folksonomy)与宽分众分类最大的不同在于用户特质。窄分众分类并不需要拥有数量庞大的用户也无需异质,通常用户在知识结构和兴趣领域上具有很大的同质性。在这样的系统中,只有一个规模相对较小的用户群体对同一对象进行标注,而他们的词汇往往很相似,不具有宽分众分类中词汇的丰富性和多样性。
窄分众分类的目的是为某一领域、专业的信息或知识提供共享平台。社区成员基于对同一领域或专业的兴趣加入,内容的提供者有时候就是社区的某个成员,他赋予自己提供的内容一个标签,期望在社区中存在和自己具有共同兴趣,可以共享相关信息或知识的其他成员。在这里,窄分众分类已经不再是一个构建大众分类体系的平台,而是在较窄范围用户中共享专业化信息或知识的平台。
2 分众分类与传统分类的关系
在情报检索系统中,以分类法、主题法为代表的传统分类是对信息资源进行标识、组织和检索的重要工具。分类法是对资源的学科特征进行区分和类聚,建立类目体系,并将资源分门别类地归入相应类目,主要用于文献分类排架和编制分类检索工具;主题法则使用表达资源主题的若干词汇来标识资源,通常不用于组织文献的排架方式,而用于信息资源的标引和检索。
分类法和主题法的共同特点是由专业人员编撰和控制,在标引资源时由专业人员使用,检索工具的用户也需要经过一定培训,因此编制和使用成本都较高。作为资源标识和检索途径,分类法和主题法中的语言经过了规范化处理,保证了语义的准确性,消除了自然语言中的歧义,并由人工预先建立科学严谨的体系结构,为类目或词汇之间定义特定关系,例如等级关系、相关关系等。以上工作的目的是为了保证情报检索中的检全率和检准率。
与传统分类相比,分众分类由普通网络用户产生和使用,它的目的是用于标引和检索网络环境下海量分布、动态变化的信息资源,揭示资源的内外部特征。分众分类完全使用自然语言,它的词汇来源于一个平面的命名空间,没有任何预先制定的词汇间关系。
文献保证原则和用户保证原则是制定信息组织方法的依据,这两点也是形成传统分类与分众分类不同机制、特点的根源。传统的分类法和主题法主要应用于图书馆馆藏和情报检索系统,这类环境中的信息资源在一定意义上具有同质性,并且集中分布、规模有限、增长速度可控;用户具有一定的知识背景,对信息检索的检全率和检准率有较高的要求。在这种情况下,分类法和主题法可以通过较为复杂的机制来保证用户需求的满足。而对于网络环境下由用户产生的海量、分布、异质、动态的信息资源,由一个系统集中控制和组织的难度加大,需要将这一工作交给广大用户。由于用户文化层次参差不齐且具有“自私”的心理,运行于这种环境下的信息组织方法必须能够为用户带来收益,且仅需很低的学习和使用成本。
分众分类恰好迎合了这种要求,它的简单易用虽然牺牲了传统分类中的准确性、高检全率和高检准率,但使用户能够方便地发现和共享资源。对接受和采用分众分类的用户来说,他们是在对收益和损失进行权衡后,认同了分众分类的有效性。因此,分众分类和传统分类之间并不是替代关系,而是各自存在于不同目的的信息系统中,服务于不同的用户需求。
更进一步地将分众分类与传统的文献分类法、主题法分别比较,可以发现它们在基本构成单元和结构形态上的差异。
传统的文献分类法以学科聚类,类目的等级结构是文献分类法的重要特征。等级列举式分类法和分面组配式分类法是文献分类法的两种基本形式。前者具有固定的类目等级结构,仅支持单一的检索途径,不能进行多角度的检索,难以增加新的类目;后者可以调整分面的组配次序,支持多途径、多角度的检索,也容易通过分面组配表达新产生的概念。根据以上特征,文献分类法的结构可以被比喻成一棵树,拥有枝干和树叶,等级列举式分类法具有稳定的分支,分面组配式分类法的每条枝干则能够动态地移植、嫁接;与之相对,分众分类中的标签离散地分布在一个平面中,则可以被视为一堆树叶。
此外,文献分类法在标引资源时采用特定的符号系统,而分众分类却是直接使用词汇,因此分众分类也可以被看做是一个词汇的集合,在这一点上它与主题法更加相似。当然,分众分类与主题法中的词汇在语法控制、语义控制和词间关系建立上也存在着较大的差异。
最后,与分类法的类目和主题法的词汇相比,分众分类的标签具有两项新的特征:使用人数与生命周期。这两项特征在分众分类的运行中具有关键意义,同时也显示出用户对这种信息组织方式的重要影响。
3 分众分类在数字图书馆中的应用
分众分类在广大用户和信息资源之间建立了一个更加个性化和多元化的桥梁,随着数字图书馆的兴起,分众分类被广泛应用于数字图书馆服务领域。数字图书馆利用Web2.0的理念、技术及其提供的服务,让用户进一步通过双向互动机制,为原有的内容增值,并创造可供利用的新内容。
3.1 OPAC(WebPAC)
20世纪70年代,各个大学图书馆开始将各自独立分离的联机公共检索目录(OPAC,Online Public Access Catalog)相互连接形成网络,形成网络环境联机公共检索目录,称为WebOPAC,或WebPAC。而在当前的Web2.0网络环境下,因理念和技术的发展,WebPAC有了新的变革的可能性。
美国宾夕法尼亚大学图书馆率先提供了Tagging服务,可以由用户对OPAC添加标签,目前对设置次数大于57次的标签呈现标签云图,并提供RSS定制功能,可按主题方案、标签标注者和标签分别聚合浏览。这样就使得学生能够通过他们信任的网络找到他们原本不会去看的资源;教授则可以指定书目,并用课程代码作标签;图书馆员则很容易创建在线的各类主题书目指南。
美国北卡罗来纳州大学图书馆在保持原有的主题目录功能的同时,将用户所键入的关键词像flickr一样分群,提高OPAC的功能和效果。
美国新泽西理工学院图书馆的OPAC能直接与del.icio.us进行链接。
厦门大学图书馆提供了一个与图书馆管理系统相结合的标签系统,能够对OPAC进行标注。
3.2 数字资源库/机构知识库
各类数字图书馆项目,或者一些数字资源库、机构知识库建设或建成后,可以由用户使用标签来标注。标签也是一种元数据,从用户使用角度进行的元数据标引,更符合用户的理解和检索需求。
如上海图书馆2005年启动的“上海年华”数字图书馆项目,虽然采用的是基于DC以及DCMI元数据纲要制定的元数据方案,但也吸收了标签思想,采用了一些Web2.0技术。在图片资源的语义标注时,允许标引人员自由地选取词汇设置标签,在资源呈现时应用了标签云图这一Web2.0网站最为常用的可视化模式。
3.3 图书编目
在图书编目领域,最古老的核心业务已不仅仅属于图书馆和外包公司。近年来,还出现了个人书目网站,被称为社会编目网站,藏书者成了编目员。通过个人对图书进行评论,并加以标注,可以实现一种“社会化阅读”。通过标签可以找到喜欢的同类书籍,也可借此找到相同爱好的爱书之人,相互交流。图书馆的图书编目也可以吸引这样的个人编目员,或与之进行链接。
Library Thing就像这样一个书籍共享网站,它不仅集合了美国国会图书馆的书目和一些地区性图书馆的OPAC,还集合了全球最大的网络书店Amazon的书目。它的首要功能是图书目录,是个人的图书阅读记录,描述内容并使用标签进行归类整理评价。
3.4 My Library
My Library是针对个人信息服务的集合,能够按照个人的研究需要和兴趣定制,如个人搜集、组织的网络资源工具;个人收藏夹;由图书馆按照用户定制的特殊研究需求和个人兴趣爱好推送的各类信息等。
对于My Library的各项功能集合,用户也可自行为之添加标签,创建、组织并随时记录自己的信息分类与标注微内容的需求,并能借此寻求“共享”与构建兴趣相近用户的社会网络。
分众分类使得传统分类摆脱了固化的现象,并且与用户的认知程度密切结合,能够真正体现标签用户的信息需求特征,为在用户参与框架下对网络信息资源进行统一规范提供了可能,在网络信息资源服务中得到了广泛的应用。同时,许多专业人员也在不断地对这种分类方法进行研究和改进,分众分类成为传统分类对信息进行组织和对检索结果进行排序的有力补充。我们相信,随着它的不断优化,将会给用户带来越来越多的方便和快捷。
(收稿日期:2010-02-02)
标签:用户研究论文;