论社会网络环境下信息组织的发展_rdf论文

论社会网络环境下信息组织的发展_rdf论文

论社会化网络环境下信息组织的发展,本文主要内容关键词为:组织论文,环境论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

国外学者用Social Web,Social Network或Social Networking等术语(后两者用得更多,以下简称SN)指突出开放共享和社会交往功能的社会化网络,“WebMine 2006”、“2009中国互联网大会”、“WWW2010”等国内外重要会议均将SN定位于互联网发展的高级阶段或下一代模式,Web2.0和Web3.0的提出都意指互联网发展的新阶段。社会化网络环境下,用户原创的内容(User-Generated Contents,UGC)不断增加、用户交互大量涌现、大量用户投入到网络信息的创建、组织和传播,网络信息组织的主体、内涵、方式和传播利用方式等方面发生了新的变化,本文拟对此进行研究。

1 信息组织主体多元化

随着社会信息化水平的提升、数字信息生产能力的提高和网络接入设备的普及,我们正走向全面和泛在的数字信息环境,各类科研、教育和文化对象日益信息化、数字化和网络化,主要的教育、科研、政府机构、商业机构几乎都建立了各自领域的网络信息系统[1],参与网络信息的组织与发布,构建社会公众主要使用和依赖的信息环境,网络信息的组织主体呈现出多元化的趋势。SN的出现则进一步强化了这一趋势,提供了更加便捷互动的网络信息发布与组织平台,图书情报机构、政府机构、IT公司等信息生产或组织主体纷纷将已有系统与SN融合,吸引用户参与网络信息组织,增强自身的影响力。

1.1 图书情报机构

图书情报机构历来是信息组织的主要力量。随着网络信息资源呈指数级增长及UGC的大量涌现,网络信息序化的要求更高,这就要求图书情报专业人员在对本机构信息资源进行组织的基础上,将工作范围延伸至实体机构之外(Librarians Outside Libraries),既将大量的网络资源整合到馆藏中使之成为虚拟资源,又广泛参与搜索引擎、开放网络目录等的信息组织。由原著名的“图书馆员因特网索引”(Librarians’Index to Internet)和“因特网公共图书馆”(Internet Public Library,简称IPL)合并升级而成的IPL2项目是图书情报人员参与网络信息组织的典范,它依靠图书情报从业人员和图书情报学院(系)的师生参与优质网络信息的采集、选择、评价和重组,提供用户浏览和检索可信赖的网络资源的通道。

1.2 政府机构的参与

电子政务的发展和政府信息公开的需要使各国、各级政府机构越来越重视利用包括社会化网络在内的公共媒体以开放自己的数据,并鼓励第三方机构对政府信息进行增值开发利用。美国政府建立了政府数据门户网站以组织发布各类政府信息,应用关联数据思想将64亿份政府数据转换为资源描述框架(Resource Description Framework,简称RDF)的三元组格式,既为其开放的政府信息提供关联数据的检索,又鼓励公民与政府一起创建关联数据应用[2]。鉴于Twitter、Facebook等社会性网站的影响与日俱增,包括白宫在内的许多美国政府组织积极利用上述工具及时组织发布最新信息。英国政府专门更新了公共部门信息(Public Sector Information,简称PSI)许可,为政府信息公开和有偿开发利用扫清障碍,将英国政府网站的信息发布为关联数据,提供交通、立法、教育与财政等领域RDF数据的SPARQL查询[3]。

1.3 IT公司

各类搜索引擎、电子商务服务商纷纷通过索引博客、维基、微博等网民原创资源、开发用户评论功能或加入社会性网站等方式,挖掘、重组社会性网站中有价值的信息,借助社会网络平台快速传播商务信息,扩展自身的影响力。Google结合社会化网络环境信息发布与用户使用特点推出了一系列新的网络信息采集、重组与挖掘服务,如允许用户瞬间纵览与检索各大主流报纸标题页的Fast Flip、可抓取和整理网络中的信息并为指定的任意类别信息自动构建信息表的Google Squared、分析Twitter上的公共社交圈信息从而找出用户可能希望关注的人的Follow Finder等。必应与Facebook合作,对其页面信息和用户评论过的内容编制索引,并在搜索结果中进行呈现。美国国际数据公司(IDC)分析师Hadley Reynolds认为此举将使必应在社交搜索业务方面超过谷歌,吸引用户在其检索结果页面上停留更长时间[4]。

1.4 用户

大众交流平台的普及加速了数字信息资源快速增长的趋势,海量的网络信息资源远远超出了图书馆员等传统信息组织专业人员的能力和精力范畴,而依赖于文本聚类、分类、机器学习等技术的自动或半自动信息组织方式尽管得到了长足发展,但大多仅停留在语料库试验阶段。因此,为了实现对网络资源的有效利用,必需鼓励用户参与网络信息组织,利用群体力量维持日益复杂的网络信息环境和有限的用户信息处理能力之间的平衡。SN环境中维基、博客、大众分类法等用户协同工具的出现,为用户参与网络信息组织提供了良好的平台和协作机制[5],用户参与网络信息组织凸显大众性、协同和自组织的特征,通过大量用户微观交互,实现网络信息的宏观序化。以大众标签为例,出于利他心理、社会身份认知、社会交互联结[6]和管理个人资源的需要,用户根据自己的认知为资源添加个性化标签,不同用户对同一资源的标注可以视为对资源的协同组织。同时,由于资源属性的多元和用户认知背景的差异,对同一资源的标注可能千差万别,使资源的组织处于一种非平衡状态。在这种情况下,系统通过标签统计和共性分析等功能,将用户选用最多的词汇以标签云团的形式呈现出来,作为系统的优先选择推荐给新的用户,使其在系统的后续使用和发展中获得更大的传播优势。在经用户的选择鉴别之后,保留那些得到大多数人认可的、能正确反映事物本质的标签,通过用户间协同与竞争并存的交互,实现网络信息自组织。照片标签系统Flickr、网络资源标签系统Delicious和博客标签系统Technorati都是众多用户信息参与信息组织的成果。

SN环境中,信息组织的参与主体日益宽泛,为适应不同主体组织多类型信息的需求,信息组织工具也应需而变。Claudio Gnoli指出分类法的使用已超越图书馆业务范畴,延伸到档案、博物馆和商品目录的组织,需要改变传统的基于学科或其他方面特征进行分类的思想,建立面向具体现象、处理不同情境和对象的分类方法[7]。IFLA于2010年6月通过的《主题规范数据的功能要求》[8]兼顾了元数据创建专家、公共服务馆员、为检索系统提供中介服务的其他信息专家、词表编制者、使用检索系统的最终用户等多种不同信息组织和利用主体的需求,力求设计出能满足不同用户目的的主题规范数据功能要求的概念模型,将不同用户的需求或目的联系起来。

2 信息组织对象的泛化和集成化

2.1 信息组织对象不断拓宽

SN环境中,博客、网络日志、用户标签、读者评介、维基、RSS列表、微博等用户原创大量涌现,网络信息组织对象的范围被进一步拓宽,不再局限于传统的商业数据库等结构化资源,涵盖了对上述半结构化或非结构化信息的组织。需要借助于搜索引擎、链接聚合或标签关联等组织工具或方式,将这些离散的微内容聚拢起来,形成独立于传统商业化手段制作内容之外的信息资源。日本知名的网络技术风险投资家Joi ito[9]早在2003年就预测:“动态关联的文本将取代通过商业化手段制作的单向内容产品”。

与此同时,传统垄断性的商业学术出版模式对学术交流的阻碍引起了社会各界的广泛关注和强烈反响。大量的学术信息通过个人博客、开放存取期刊、学科库、机构库等非正式或非商业化信息平台发布,愈加泛化了网络信息组织的范围。

为充分挖掘利用网络动态资源和用户原创数据,Google推出了具有博客标题、帖子标题与帖子作者限定检索功能的博客搜索引擎,能动态搜索和聚合新闻信息的“谷歌新闻”,基于Gmail的社交网络服务Google Buzz和具有微型博客元素的Google Profiles服务,拟推出大型社交项目Google Me,不断增强其网络服务的社交功能。

2.2 不同信息组织对象逐步得到整合

网络信息组织对象和组织主体泛化在丰富信息组织内涵、优化信息组织拟合度的同时,也不可避免地带来了不同信息源的整合问题。以更快速度增长的各类学术性和非学术性信息大量充斥于网络,加剧了用户的信息负载,用户查找信息时的最小努力需求体现得更加迫切。Marcia J Bates指出用户信息搜寻行为中最普遍的特征便是最小努力需求,因此图书馆等信息机构需要对社会化网络环境中的多类信息源加以整合利用[10]。SN环境下信息组织的整合对象已拓展到博客、维基、微博等半结构化或非结构化数据,整合的方式更显语义化特征,整合的标准突破“以资源为中心”的限制,开始建立在用户信息自组织的基础之上。

2.2.1 以开放式系统架构为基础的整合

开放性是SN环境中信息组织系统的主要特征,相应的信息共享和整合也可以建立在此基础之上,以小书签、用户脚本、浏览器插件、工具条等形式调用各信息系统的开放式应用程序接口(API)实现多源数据的混搭,将内容数据和用户终端应用完美结合,开发出颇具创新的应用。OCLC开发了xISBN书签工具,能动态获取用户在亚马逊网站上所浏览书籍的ISBN,然后在WorldCat中展开查询,并以FRBR化的形式,向用户展示该书籍的不同版本信息[11];OCLC还与Google、EBSCO等交换数据,把后者的图书、期刊等信息链接到WorldCat。厦门大学图书馆通过Mashup技术,实现了馆藏书目信息、数字资源和豆瓣、Google Books、百度图书等社会性网站信息的有效衔接和多元应用,当用户在Google Scholar中搜索文章时,查询结果会链回该馆SFX解析器,提示用户图书馆有无全文;而当用户在浏览馆藏书目或豆瓣网书目时,浏览器插件会分别调用馆藏数据库系统和豆瓣、Google Books等网站系统的API,向用户提示该书目的馆藏信息或呈现豆瓣、Google Books等社会性网站有关的评论、读者信息和内容介绍信息,实现社会化网络环境下多源数据的杂糅。

2.2.2 以用户信息自组织为基础的整合

开放的网络环境、广泛存在的用户之间及用户与信息系统间的交互为网络信息的自组织提供了可能,系统在持续不断地与用户和环境交互的过程中“学习知识”和“积累经验”,不断优化自身的信息结构,使系统内部的信息空间结构更符合用户的感知体验。社会化网络环境中的信息整合也开始建立在用户信息自组织的基础之上,体现出用户参与的特征,借助于对用户标签的统计分析或对用户评论、转载等信息行为的挖掘,形成资源间的关联聚合,在将用户个人信息行为社会化的过程中,实现信息碎片的多维度有效整合。例如,在博客内容聚合过程中,系统通过对用户间的转载、添加链接、个人标注和加入博客圈子等信息行为的分析挖掘,动态建立内容聚合页面,实现博客内容的微观聚合。此种方式的整合由用户参与决定信息之间的关联,建立在用户主观认知的基础之上,克服了纯粹的基于机器自动分类和聚类的客观信息集成之弊端,整合的结果更符合用户的认知习惯。但基于用户自组织的信息整合也会带来信息关联混乱的问题,需要借助嵌入后控词表等规范化机制,对用户的标注、引用和转载等行为加以区分、引导和规范。

2.2.3 以RDF描述框架为基础的语义整合

基于开放式系统架构和用户信息自组织的整合仅是一种系统层次或语法层次的整合,未能体现出网络资源的富语义特征,因而需要挖掘不同资源间的语义关联。为了实现基于语义的分布式查询,“加利福尼亚环境资源评估系统”(California Environmental Resources Evaluation System,简称CERES)项目专门开发了以RDF为基础的数据结构,利用RDF的容器概念组织管理叙词表等知识组织系统的等级机构,实现了分布式词表间的语义关联[12]。英国广播公司的“野生动物发现”网站利用RDF组织发布资源,通过资源的主题属性建立与其他开放RDF数据源的链接,动态抽取不同开放数据源中关于某一物种的图片、新闻和物种分类信息等关联资源,生成丰富多彩的结果页面[13]。

多源数据整合推动了各类信息组织工具的变革。英国标准协会(BSI)2005年修订颁布的《用于信息检索的结构化词表指南》(Structured vocabularies for information retrieval:Guide,简称BS8723)第四部分专门谈及受控词表之间的互操作及不同类型词表之间的映射。国际标准化组织“信息资源标识与描述分技术委员会”为了适应网络环境下社会化互操作的需求,以BS8723为基础,启动了“ISO25964:信息与文献工作——叙词表及与其他词表的互操作”标准的制定,旨在解决网络系统中多类型词表间的互操作问题。为了保障不同信息系统间的互操作和相互映射,规范不同类型信息组织工具的发展,Z39.19、BS8723、ISO25964等标准都相继扩大标准内涵,囊括分类表、本体、语义网络、主题规范系统、词单、同义词环等多种组织工具,从元概念模型上控制规范各类信息组织工具,为互操作和映射提供基础[14]。

目前已有的各类信息资源整合方式大多停留在系统整合或语法整合阶段,建立在开放式的标准协议、应用程序接口、关联链接挖掘或标签相似度匹配的原理之上,以RDF为基础的资源整合体现的也仅是一种弱语义关系,借助于对资源内容属性或形式属性的匹配实现资源间的关联,日后需借助于本体等知识组织系统,实现基于强语义的网络信息整合。

3 信息组织内容揭示的深入化和语义关联化

3.1 揭示的内容不断深化

伴随着生活节奏和信息生产速度的加快,用户的信息需求不断变更,希望快速了解、获得所需资源和对其进行评价。OCLC报告[15]显示,“用户在网络搜索经验的不断影响和塑造下,期望快速容易地获取和评价信息。对终端用户而言,信息的获取甚至比发现更为重要,他们期望通过用户友好型界面快速地评价和获取信息。”因此,SN环境中的信息组织应深化信息描述,深入对资源内容的揭示,在不增加信息组织成本的情况下,通过聚合或重用ONIX数据等多类元数据及集成社会性网站上的用户标注、评论、购买和浏览统计等信息,丰富信息组织的数据内容,帮助用户快速了解和选择资源。Google的图书搜索不仅允许用户检索关于某一主题的图书,而且,其“内部搜索”功能允许用户对某本书中的内容进行检索;Google试验中的项目Books Ngram Viewer不仅可深入检索某一词组在全世界1800-2000年历年出版的图书中出现的频率,还可动态绘制其变化趋势图。WorldCat通过对书目数据的深入挖掘,在检索结果页提供与搜索词相关的分面检索限定,方便用户根据资源的主题、资源类型、载体形态、著者、年份、语种、使用对象等特征进行资源过滤与选择。

3.2 内容之间的语义关联得到揭示

3.2.1 动态关联

信息组织通过数据挖掘和数据整合等手段建立不同资源间的关联,动态形成新的资源链接视图,便于用户对资源的追踪、发现和检索。美国国会图书馆利用MARC的856字段与某一资源的网址、目录、出版商等相关信息建立链接,丰富目录内容,为用户获取更多信息提供便利。但856字段实现的链接仅是一种静态链接,需要在书目记录中预先设定,由于资源网址的动态性强,在书目库中逐一维护856字段的成本相对较高。社会化网络环境为动态链接提供了可能,新泽西理工大学图书馆在馆藏书目检索结果页嵌入图书的目录信息,并动态建立相关书籍的可视化书架,同时链接到GoogleBooks,显示关于该书的介绍、评论和内容信息。清华大学图书馆通过重组、复用馆藏数据和网络数据,建立了多层次立体化的期刊导航系统,以期刊数据为线索,向下关联期刊的封面、文章数据,向外关联期刊的评价、出版变更等信息,向上关联期刊隶属的数据库和学科分类,其集成化检索工具——易搜不仅能检索本馆的OPAC、本馆订购的所有中外文数据库,还整合了免费的专利数据库、用户贡献内容的百度百科与互动百科等。

Google的试验项目Image Swirl可对图片搜索的各个结果从外观和语义等方面进行相似程度分析和比较,并在一个较直观的浏览界面中显示整理后的搜索结果。

3.2.2 多维关联

传统网络信息组织工具基本还停留在对单个实体资源的组织和揭示层面,以平级方式呈现资源,忽略了数字环境下信息形式的多元化、动态性和衍生性等特点,缺乏有效组织不同层次、不同颗粒度信息实体的组织模型,不利于用户的信息搜索与发现。社会化网络环境下信息资源的大量涌现必然要求改变这种缺乏语义关联的信息组织方式,需要建立以资源为节点、资源之间的关系为连线的立体网状关系模型,方便用户对信息的多维聚类和查找,循着知识节点不断深入发现,找到自己所需信息。FRBR的出现给人们带来了一线曙光,以实体为中心和实体间关联为纽带的资源呈现方式便于用户浏览查找关于同一作品或同一作者的相关资源,实现了以信息对象的形态关系为条件的序化,为基于信息对象关系的集中、区分和导航提供了基础[16]。但FRBR框架中所涉及的实体及实体关系有限,属性特征必须预先确定,并事先进行抽取和建立索引,不支持动态数据的特征提取和关系提取,语义推理和聚类能力不强。社会化网络环境中,面临着看似并不稀缺、却难以有效利用的信息资源,用户希望信息组织工具能深入揭示资源间的语义关联,依据资源间的语义关系动态组织生成结果页面,信息组织朝着语义关联化的方向发展,本体、概念地图等知识组织系统孕育而生并不断进化,但由于上述知识组织工具尚无法实现机器自动构建,所以并未大规模普及使用。

3.2.3 关联数据的广泛应用

关联数据(Linked Data)是语义网应用的重要发展趋势,关联数据以RDF框架为基础,赋予任何事物以全局唯一的URI[17]名称,通过实体间的文本映射、基于图相似度的映射和基于规则等方法构建资源关联[18],并以可视化的方式发布资源的RDF数据,形成无缝链接的资源网络,实现了从文献网向数据网的转化。用户可以任意数据为起点,在任一维度上扩展、寻踪发现资源,能满足用户的复杂检索需求。关联数据可操作性强,已引起包括图书馆在内的各类信息组织主体的关注,开展了一系列试验性的应用。万维网联盟(W3C)的“关联数据开放计划”(Linked Open Data,简称LOD)的统计显示,截至2011年8月,该计划的关联数据云图(Linked Data Cloud)已搜集到政府、生命科学和出版等诸多类型机构发布的313个关联数据集,数量较2009年7月份增长了两倍多,用RDF三元组表示的资源总量已超过300亿条[19]。德国电子商务和网络科技研究小组开发了电子商务网络本体GoodRelations,支持将商品数据发布为关联数据格式,提供能详细描述商品特征、价格和企业数据的属性元素,以适应用户的精准检索需求[20]。美国国会图书馆相继将《美国国会图书馆主题词表》(Library of Congress Subject Headings,简称LCSH)、《地理资料叙词表》(Thesaurus of Graphic Materials)等多种词表资源以关联数据的形式发布。“瑞典联合目录”以关联数据的方式开放其200多个成员馆超过650万条书目记录和20万条规范文档,集成了FRBR化显示和整合多源数据的优势,建立起书籍、作者、馆藏信息和外部信息之间的连接网络[21]。其中以书籍资源为起点,可以通过元数据连接到作者、主题、用户评注和馆藏信息,而作者信息节点又可以扩展到权威文档、dbpedia和wikipedia等社会性网站上有关该作者的信息,同时,还能扩展到该作者的其他书籍信息。主题节点也可以通过简单知识组织系统(Simple Knowledge Organization Systems,简称SKOS)和网络本体语言(Web Ontology Language,简称WOL)关联到相关主题和外部资源,提供了丰富的数据扩展与利用空间。

图书馆界对关联数据的积极响应已引起国际标准化组织的关注。为指导关联数据在图书馆中的发展,促进图书馆资源在网络上的共享利用,W3C专门成立了“图书馆关联数据孵化小组”(Library Linked Data Incubator Group),帮助图书馆规划未来的合作方向,提高图书馆数据在万维网上的全球互操作[22]。客观而言,关联数据仅是一种资源描述和关联标准,其语义功能的实现依赖于发布方对资源主题及不同主题间关联的详细描述,所以关联数据的语义关联能力仍然较弱,需与知识组织系统结合,对资源主题的语义进行规范和扩展,才能真正实现基于语义的多类型信息整合。

4 信息组织方式的人机智能综合化

4.1 利用自动化软件方便人工信息组织

传统的信息组织系统按照预先设定的算法或规则完成对资源的分类或聚类,形成系统内的资源网络,并在此基础上提供各类个性化信息服务。资源间关联的生成主要依靠机器的计算智能,用户参与因素体现不够。由于系统设计者与用户之间存在认知差异,机器分类难以符合用户理解的语义分类,建立在此基础上的个性化信息服务的效果也因此受到限制。社会化网络环境中,大量涌现的用户交互和标注等信息行为为信息组织系统提供了丰富的学习和训练数据,信息组织系统的适应性进一步增强,由纯粹的机器智能系统向人力智能和机器智能相结合的复杂社会系统方向发展,体现出用户参与式架构特征,把用户的行为、用户的自主决策机制和社会交互机制纳入系统设计,让人力智能和系统的计算智能有机结合起来。通过机器学习等智能技术挖掘用户的信息行为和社会关系,在用户使用过程中建立系统内信息的分类和关联,从而优化系统的各类智能信息服务。Dataharmony是方便用户用LCSH等受控词表进行标引的软件而非完全自动化的工具,它使用的工具有:分类法和词表构建与管理工具Thesaurus Master、机器辅助索引器(Machine Aided Indexer,MAI)以及把这两者组合起来以最大限度提高自动标引和分类法构建的MAIstro[TM][23]。

4.2 借助于个性化信息组织实现个性化信息服务

传统的个性化推送服务依靠机器智能,只注重对单个用户行为的统计分析,根据用户的注册资料或信息行为,洞悉用户的兴趣模式,从而将系统中的已有信息或最新信息动态地推送给用户,这种方式忽视了用户信息行为所处的社会情景和社会关系。社会化网络环境中的个性化推送服务则更多融入了用户特征,把用户作为算子纳入系统的计算,挖掘用户的信息行为和社会关系网络,凸显用户的判断、决策在用户关联和资源关联中的作用。综合利用传统的系统聚类算法和用户自身的识别、判断形成资源之间和用户之间的关联[24],在结合以用户自由表达个人兴趣爱好、选择加入用户群组为表征的显性协同和以机器挖掘用户关系和资源联系为表征的隐性协同的基础上,实现用户间的经验分享和信息协同过滤与推送。豆瓣网的个性化信息推送服务就是一个很好地融合机器智能和用户自主决策机制的典范。起初,用户按照自己的喜好和习惯对产品或资源进行个性化的组织标引与评论,系统通过对用户注册信息、个人标注、收藏或评论信息的分析,建立初始的用户兴趣模型,向用户推荐资源,并根据用户的反馈动态调整用户兴趣模型。而后以不断修正的用户模型为基础,依据相似度算法,动态地向用户推荐口味相似的潜在好友,经用户选择确定后,建立用户之间的关联,形成用户群组,最后将好友的行为数据和所藏资源经整合后推荐给用户,以资源为纽带连接用户,而后又以用户关系为纽带推荐资源,构建机器筛选和用户推荐相结合的个性化服务平台,实现资源的协调过滤、个性化推送与分享。

可见,与传统个性化信息组织相比,社会化网络环境中的个性化信息组织质量更高,资源数量也愈加丰富。用户的资源列表是用户根据自己的兴趣爱好和信息需求,经个人知识评估、过滤和优化后的结果,质量更加可靠,同时由于综合、重组了诸多兴趣相同用户的信息,信息源可以扩展至整个网络世界,包含不同语种、不同层次类型的信息,突破了传统的个性化信息组织系统中推送信息源仅限于系统内信息的局限。

5 信息组织结果利用的社会化

社会化网络环境下,为了给用户营造一个随时随地、无处不在的网络信息利用环境,信息组织结果的社会化首当其冲。图书馆应该信奉一种“外推”的哲学理念,扩展至用户所在的任何地方,实现从“资源驱动”向“基于用户”的转变[25]。OCLC报告《网络世界的共享、隐私与信任》(Sharing,Privacy and Trust in Our Networked World)显示,用户认为图书馆应该努力把自己嵌入用户社区中,包括网络虚拟社区和真实世界。《加州大学书目服务再思考》建议“传送书目服务到用户所在”[26]。信息组织系统应积极利用网络的开放和传播优势,嵌入用户的信息环境,创造泛在便捷的信息利用环境。文献[17]表明:用户希望图书馆在线目录可帮助其识别合适的资源,图书馆员则希望它更好地帮助其工作。这给信息组织结果的开放指明了方向。

5.1 MARC记录向图书情报人员开放

用户利用美国国会图书馆馆藏目录检索某一资源的“MARC Tags”可免费获得其MARC记录,WorldCat关于某资源检索结果的“详细书目”具有类似功能。这样,可大大缩短图书情报人员的编目时间。LCSH免费开放以方便图书馆员标引时检索某一术语对应的规范的主题词或推荐术语[27]。

5.2信息组织结果嵌入搜索引擎

由于网络信息总量激增和信息格式的异构性与多样性,能满足读者一站式检索需求的搜索引擎受到欢迎,成为众多用户查找信息的首选。OCLC《大学生对图书馆和信息资源的看法》(College Students' Perceptions of the Libraries and Information Resources)显示,搜索引擎是用户最熟悉的信息资源获取途径,89%的大学生检索信息时首选搜索引擎,93%的大学生在使用搜索引擎过程中感到满意,搜索引擎比物理或在线图书馆更适合大学生的生活方式。英国联合信息系统委员会(Joint Information System Committee,JISC)和不列颠图书馆联合委托伦敦大学CIBER小组开展的调查报告建议:学术图书馆应进一步在网络上开放自己的馆藏,通过向搜索引擎开放的方式提高馆藏的可见度[28]。社会化网络中的各类信息组织系统应积极向搜索引擎开放,融入其索引库,借助用户熟悉的搜索工具促进对网络资源的发现和利用。Google学术搜索推出了图书馆链接计划,参与的图书馆只需将馆藏资料信息提供给Google,并对资源链接解析器进行相应的配置,Google就能为该馆用户在学术搜索结果中提供指向图书馆资源的链接选项,使用户能轻松访问馆藏资源,并在此基础上进一步推出OpenURLs浏览器插件,用户只需下载安装该插件、配置本地图书馆的OpenURL链接解析器信息,Google学术搜索就能自动抽取检索结果中的标题、刊名等信息,提交给用户所在图书馆的OpenURL链接解析器查询,为用户动态提供全文链接[29]。此外,Google还积极与学术出版商合作,为其文献资源编制索引,使其能在Google和Google学术搜索上被检索。

5.3 信息组织结果嵌入移动网络平台

在社会化网络环境中,各种便携式移动网络设备频繁更新换代,用户接入网络的方式也日益多元化。摩根斯坦利2010年4月份的报告显示,在3G网络和社交网络等技术应用的推动下,未来5年内通过移动设备接入网络的用户将超过通过桌面设备访问互联网的用户[30]。2010年,59%的美国手机用户和无线便携设备用户通过无线网络接入互联网[31]。截至2011年6月底,我国手机网民用户在整体网民中占比攀升至65.5%[32]。移动互联网展现出了巨大的发展潜力,网络信息组织应及时关注这种应用,延伸自己的服务范围,嵌入到手机、PDA等移动网络平台中,真正营造无处不在、方便快捷、随时随地的使用环境,开发出更加丰富多彩且使用便捷的内容展示形式和资源获取路径。

对移动网络设备和社会网络的开发利用已经引起图书馆、数据库商等信息组织机构的重视。Library Connect的2009年“移动接入”专刊提出通过移动设备提升对图书馆资源的获取、考虑开发带有移动界面的新的数字计划、图书馆登陆Facebook和Tiwtter等社会性网络提供服务和资源、开发可定制的移动应用程序、确保全面无缝地获取图书馆所有资源和服务等五个学术图书馆最重要的移动策略[33]。EBSCOhost,IEEE Xplore等数据库商纷纷推出了手机等移动设备访问数据库界面的功能。OCLC开发了手机移动应用平台WorldCat Mobile,允许用户在图书馆定位器中输入邮政编码或位置查找附近的WorldCat图书馆;使用移动设备上已有的地图软件标出到某一WorldCat图书馆最快捷的路线[34]。我国国家图书馆、上海图书馆等主要公共图书馆及南京大学图书馆、华东师范大学图书馆等高校馆也已纷纷推出自己的手机图书馆网站,扩展图书馆资源的传播和使用范围,营造方便快捷的泛在利用环境。

5.4 信息组织结果嵌入社会性网站

社会性网站的兴起引起了人们的极大关注和广泛参与。Google旗下的Doubleclick Ad Planner 2011年7月份公布的全球网站访问量统计显示,Facebook的网页浏览量为1万亿次,独立访问用户数量为8.8亿,浏览量和用户数量均居全球首位,紧随其后的是Google旗下的Youtube,其网页浏览量和用户数也分别达到1千亿和8亿[35]。社会性网站激发并强化了用户的交流和创作热情,Facebook每月照片上传量多达25亿张。越来越多的用户通过维基、博客等“非正式”信息交流途径查找、交流、应用、传播和分享信息,社会化网络为各类信息组织系统提供了一个很好的传播和利用方式。加拿大Alberta大学图书馆在社会性网站Facebook上开设了“U of A Libraries”,提供图书馆目录检索服务。国会图书馆为适应Web2.0趋势,在flickr中展示自己馆藏中无版权争议、可以无限制地传播的老照片,吸引用户对这些照片上的信息予以标注。在其带动下,多个国家的图书馆和博物馆相继在flickr上开设账户,分享自己的照片档案。

社会化网络环境下,大众信息发布与交流平台和移动媒体的兴起,网络信息的组织正处于从传统的以少数专业信息人员为主向多方参与的去中心化的信息组织转型之中,更加体现出以用户参与为基础的信息自组织特征。以用户为中心、注重用户的感知体验将会是一条至上原则。将创新的技术平台与“以用户为导向”的理念相结合,把用户的社会关系融入网络信息组织,实现包括用户原创资源、OA资源和商业性资源在内的多源数据的融合,将会是新一代网络信息组织的重要发展方向。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

论社会网络环境下信息组织的发展_rdf论文
下载Doc文档

猜你喜欢