国际工业的发展_图书馆论文

国际业界动态，本文主要内容关键词为：业界论文,动态论文,国际论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1 学术图书馆与搜索引擎的新较量

美国拉瓜帝亚（LaGuardia）社区大学图书馆媒介资源中心的Jane Devine和Francine Egger-Sider在2004年6月发表文章：《超越Google：学术图书馆中“看不见的网”》。文章分析了“看不见的网”的概念以及它对学术型图书馆的意义。“看不见的网”（The Invisible Web）包含3W网上被一般的搜索引擎忽略了的所有可资利用的信息源，这些被忽略的资料绝大多数都在需要个性化查询的有特定主题的数据库中，或者是由于一种特别的查询而组成的动态信息集合，并给出了一些例子，如ERIC（科教资源信息中心），PubMed（注：PubMed是美国家医学图书馆（NLM）下属的国家生物技术信息中心（NCBI）开发的、基于WWW的查询系统。）等。作者还进一步讨论了某些搜索引擎所收集不到的内容，诸如数据库、PDF、视频流、实时信息、站点信息等。文章还列举了1998年以来的几篇探索性的文献，发现“看不见的网”比搜索引擎所能查找的范围要大500倍左右，而且95％的“看不见的网”是能被公众获取的信息，半数以上“看不见的网”在有确定主题的数据库中。既然这样，学术型图书馆馆员就能够把这种服务作为他们的日常工作来处理。

文章提出几点建议：一、所有馆员应该了解“看不见的网”，具备对其查找的基本知识素质；二、当馆员们给出参考目录或者是为教职员工准备研究材料的时候，要尽量提供“看不见的网”中的材料；三、图书馆员应该传授相关人员——比如管理领域的博士研究生——关于“看不见的网”的可信度而又系统化的检索技巧；四、图书馆可以开辟关于“看不见的网”与搜索引擎的比较类研究课题；五、为有兴趣的教师和同学开辟相关的主题讲授；六、在馆际时事通讯中写出相关研究心得，与其他大学或图书馆的同僚开展交流。

来源：Beyond Google：The Invisible Web in the Academic Library，The Journal of Academic Librarianship， Volume 30，Number 4，page 265-269学术图书馆期刊，第30卷，第4号，265-269页，2004年（叶希）

2 美国大学生利用图书馆的倾向

美国俄克拉荷马大学图书馆员Karen Antell在文章《为什么大学生使用公共图书馆？》中，披露了她于2002-2003年在一项调查中发现的奇怪现象：该大学的学生在完成作业任务的时候倾向于使用公共图书馆查找资料而不是学术型图书馆。经过与调查学生的访谈与分析，作者从中找出五点理由：1）查找公共图书馆比学术型图书馆更加方便；2）公共图书馆的资料更容易找到；3）公共图书馆使用起来便捷且熟悉；4）公共图书馆馆员的服务比学术型图书馆好；5）个人的选择偏好等。

作者利用这项结果给当地的图书馆提出针对性的建议：对于学术型图书馆而言，应该更加注重服务质量的提高和拉动赞助（提供辅助性便利）等方面；而大学附近的公共图书馆就应当把高校学生视作服务的一个特别的分支主体来重视，并且可以围绕学校课程扩充资料和书籍，应关注高校学生的阅读需求，同时降低服务的价格。这项研究仍将继续深入下去，并致力于促成公共图书馆与高校内学术型图书馆的互补互利。

来源：Why Do College Students Use Public Libraries？，Reference & User Services Quarterly，Vol.43，No.3，page 227-233，American Library Association参考与用户服务季刊，第43卷，第3号，227-233页，美国图书馆协会2004年出版（叶希）

3 图书馆2005年挑战性问题再出新作

OCLC最近向其会员出版了一部报道：《2003年OCLC环境审视：认知模式》。这篇报道被认为是围绕着研究、学习、未来的图书馆和其他知识性组织所在社区等等全球性重要问题做出的综合性回顾。

这部150页的专论基于与全球广泛的知识性组织中超过100位的知识专家的访谈，提供了在今天作为信息从业者所面临的主要问题。该报道分为五部分：社会、经济、科技、研究与学习、还有图书馆，覆盖面包含资金来源、组织合并、数字档案、电子化学习、数字版权管理、开放资源运动、图书教育的网络服务的兴起以及学术出版等等。OCLC市场部副总裁De Rosa在被问及报道中哪部分最重要的时候，列举了关于软件和内容供应商正向文件共享与信息共享——即我们说的合作科技领域的进军，认为各种类型的图书馆将因此会得到众多设备以使每个人都真正享受到信息科技的独特好处。

来源：OCLC Releases Review of Global Library Issues，American Libraries，March 2004，page 14，American Library Association美国图书馆，2004年3月号，第14页，美国图书馆协会出版（叶希）

4 KISTI与KERIS签订合作协定

2004年10月，韩国科学技术情报研究院（KISTI）与韩国教育学术情报院（KERIS）在汉城签订了有关共同利用及研究知识情报的协定。

KISTI与KERIS分别主导着国内学术情报与科学技术研究情报的流通。根据该协定，两家机构将彼此分享知识情报资源，并合作持续开展信息流通高效率化的工作，使其避免重复。

为此，KISTI将以专门图书馆及研究机构为中心，进行科学技术情报工作，KERIS将以大学图书馆为中心，进行教育学术情报工作。KISTI与KERIS将通过上述工作，建立彼此合作的体制。

来源：2004.10.26日[韩国]《联合新闻》（锦香）

5 面向语义检索的IRR方法

语义检索是建立在对文本语义理解的基础之上的一种信息检索。目前，国内外对语义检索的研究都还处于一个初级的阶段，能够实现的仅仅是通过概念匹配（概念检索）来实现简单层次上的语义检索。深层次语义检索的实现还有待于人工智能和自然语言理解技术的进一步发展与成熟。

潜语义索引（LSI）是目前应用比较广泛的基于向量空间的语义索引。其基本思想是：从文档集合中生成一个标引项——文档矩阵，该矩阵的每个分量为整数值，代表某个特定的标引项出现在某个特定文档中次数。然后将该矩阵进行奇异值分解，较小的奇异值被剔除。结果奇异向量以及奇异值矩阵用于将文档向量和查询向量映射到一个子空间中，在该空间中，来自标引项——文档矩阵的语义关系被保留，同时标引项用法的变异被抑制。最后，可以通过标准化的内积计算来计算向量之间的夹角余弦相似度，再将文档按与查询的相似度降序排列。

潜语义索引被证实是一种比传统向量空间技术性能更好的信息检索向量空间技术，因为它在一定程度上揭示了语义关系。但是，潜语义索引子空间的性能与文档集合中文档和所讨论主题的潜在分布有关，为了改进这种依赖，研究者提出了一种改进方法IRR（Iterative Residual Rescaling）。

IRR方法的基本思想是：文档集合存在一个潜在的主题集合，基于主题的相似是语义相似，是我们试图获得的真正的相似度。基于子空间算法的目的是选择一个子空间，将文档向量映射到子空间后生成的新的文档向量计算出的相似度接近于基于主题的相似度。当文档集合中主题-文档分布相对比较统一，即一篇文档只属于一个主题时，LSI子空间的性能比较好。但当主题-文档分布不统一时，LSI的性能就会降低。含有较少数量文档的主题容易被占优势的主题所掩盖。IRR算法在将文档向量映射到奇异向量上时，不断调整属于较小主题的文档向量与奇异向量之间的位置关系，从而克服了上面的问题。

来源：Proceedings of the 24th annual international ACM SIGIR conference on research and derelopment in information retrieval，September 2001，New Orlean（大千）

6 网页归档与存取

2001年美国国防部Goddard空间飞行中心（GAFC）图书馆开始调查与项目相关的内部信息获取和保存问题，以便发现用户感兴趣并需要长期保存的科学和技术信息。该调查与全面知识管理要求相一致，对录像、进展报告、预算报告、工业绘图和传统出版文献的存取、管理和保存进行调查。空间飞行项目信息可以在内部局域网任何站点查询和存取，但这些网站多没有长期保存和存取计划，信息缺乏稳定性。

该调查从用户信息查询过程中，识别具有长期保存价值的网站，并利用网络蜘蛛软件自动搜索信息，产生元数据索引，自动生成网络数据库。从2001到2002年，GAFC图书馆首先对内部网站的选择进行可行性研究。通过文献调研、网站考察等方式，确定用户感兴趣的文献主题和网站。调查通过对芬兰、瑞士和澳大利亚等国家类似项目的查询，长期跟踪和记录网站日常使用情况，最终确定在航空航天、飞行等领域中人们经常使用的科学和技术信息类型。

GAFC与国家图书馆或互联网档案不同。多数国家图书馆只保存档案和出版的文献或文化遗产，网络搜索算法建立在域名基础上。GAFC收集文献的类型广泛，包括进展报告、预算报告、工程绘图和设计评论、网站、录像、图形和传统出版资料，如期刊文章、手稿和技术报告都是获取对象。因此，系统需要更具有选择功能的软件，在复合系统的基础上获取信息。

调查的前期工作是在人工选择和评价基础上确定搜索对象，然后应用自动化技术，获取相应信息并产生元数据，再将信息归档保存并制定权限管理规则。网络蜘蛛软件能够获取静态存储信息，创造网站档案并保存网站，以便在网站拥有者或创造者不再维护网站时，图书馆能够对元数据和网站内容进行长期管理、存取和控制。

来源：Archiving and accessing web pages.By Alessandro Senserini.D-Lib Magazine.Nov.2004（李平）

7 信息查询和检索概念模型

信息查询和检索（IS&R）概念模型重点研究系统构成及各成份之间的关系。概念模型包括思想库、研究群体的原则、信仰和价值。概念模型构建要求做到准确、简单和通用。信息查询行为发生在认知空间和社会环境中，用户查询行为分为开始、链接、浏览、区分、验证和结束等6个阶段。用户与文献作者、中介机构和系统界面共同构成信息检索系统。

用户信息查询过程可以细分为：任务、工作及其相互联系。任务又可以分为“构思”（主观）任务与客观任务两种类型。在组织心理学中，任务构建包括多重目的，系统设计者和用户对任务的理解各不相同。只有采取通用表达方式，才能对用户的信息需求和行为方式做出客观解释。Jarvelin建议采取简化层面方式降低任务的复杂性。

信息检索系统设计需要从工作出发，确定优先任务，并对任务输出形式、过程和要求做出规定。系统评价标准包括可重复能力、分析能力、优先决策、选择数量和效果等。在专家系统设计中，信息分为三种类型：问题信息（PI）、主题域信息（DI）和解决问题的信息（PSI）。问题信息：指与问题结构、性能和要求相关的描述性信息，如在桥梁设计中，有关桥梁类型、建设目的等。这方面信息可以从不同的文献中获取。主题域信息：包括已知事实、概念，规则和理论。在桥梁构建中，有关钢铁的力度和热胀冷缩等方面的信息，属于主题域信息，可以从期刊、教材等相关文献中获得。解决问题的信息：包括问题的提出、处理和信息获取方式等多方面信息。在桥梁构建中，与工程师相关的信息，与桥梁类型相对应的优先因素等都可以构成解决问题的信息。这三类信息属于本体性信息，在问题处理过程中它们能够起到不同的作用。

来源：On conceptual models for information seeking and retrieval research.By Kalervo Jarvelin，Information Research，Vol.9 No.1，Oct.2003（李平）

8 利用语义推论模型动态产生多媒体信息显示方式

语义网络作为下一代互联网服务和应用的基础设施，能够自动收集和集成因特网信息。伴随着多媒体资源规模的不断扩大，档案馆、博物馆和图书馆正在将大量馆藏转换为多媒体信息，通过互联网传递到用户手中。多媒体信息处理与传输要求有标准化内容描述格式和语义网络基础设施，多媒体信息检索和集成正在成为研究者关注的重点。

语义网络的目的是通过定义和语义链接自动发现、集成和使用因特网信息资源。语义网络为信息资源描述框架（RDF）提供了共同支撑框架，能够通过丰富的语义描述、XML、元数据交互等方式交换信息。

在开放式档案初始计划（OAI）中，采用都柏林核心数据集描述信息，采用语义推论方式显示不同媒体对象的相关联系，再通过元数据的计算机处理产生新的知识，使用户能够更快、更方便地浏览、分析、解释和推论信息。OAI定义群交互操作框架的构建，有利于在不同系统间实现元数据共享，有利于人机交互操作的展开。数据提供者通过OAI提供多媒体馆藏，如美国国会图书馆的“美国记忆”。但多种媒体混合的信息资源之间还无法实现语义关联。为此，W3C将“同步多媒体集成语言”（SMIL）作为多媒体信息处理语言，集成录音、录像和图形信息，实现实时条件下的多媒体信息显示。该语言采用简化的XML语言，在不同的多媒体作者之间提供信息描述，并以超链接形式集成显示检索结果。这一语言独立于平台操作，具有网络和客户的兼容性、XML的简单性等优势。

OAI处理层次分为：（1）语义结构层：从显示外观和超链接导航结构出发，以较高层次的“语义”描述信息结构。（2）交流设施层：用已知术语描述空间、时间和超链接显示构成。交流设施之一是书架（bookshelf），可有效显示多媒体内容构成系列。如不同文化背景的用户可以从不同方向上确定图像系列的流动方式。（3）定性限制层：采用定性显示方式输出最后格式。（4）定量限制层：采用不同文献格式显示图像。（5）格式显示层：以文献格式编码显示，包括HTML等。其协议核心是SMIL，能够保证终端用户可以在离线条件下察看系统显示结果。

来源：Dynamic generation of intelligent multimedia presentations through semantic inferencing.By Suzanne Little，etc.http：//archive.dstc.edu.au/edl2002/ecdl2002.html（李平）

9 公共管理部门的信息管理战略

英国政府制定的信息自由法案将于2005年实施。这将影响到政府部门信息出版计划，即必须区分政府出版物的信息类型、出版方式以及如何为公众服务。政府咨询顾问Peter Blair提出，必须制定电子政府交互能力框架，制定电子服务类目表，以便在中央和地方不同的政府部门之间保证服务的一致性。

“政府在线书店”是一个新的政府网站，主要用于为政府出版物交易提供在线站点。网站具有三项主要任务：第一，成为公共服务的可靠信息源，第二，制定信息管理政策，第三，实施客户关系管理软件。知识管理系统从2005年开始将为英国社会管理提供重要的信息资源，并使地方政府职能转换为“智能组织”，通过知识管理系统改进公众服务质量。电子政务将成为社会管理的主要方式。公众数据不仅是业务证明，而且能够为法律和审计提供证据，并最终成为历史和文化遗产。对于记录保存要求具备真实、可靠、集成和可用能力。记录的结构必须建立在标准化的基础上。

信息管理不是信息技术本身，而是有关业务、人员、文化和广义的基础设施。伴随着互联网的发展，用户对政府信息服务的期待不断增加，他们要求有更快的速度、更多的服务渠道。用户在大多数情况下并不能区分服务由哪个部分提供，他们只是要求能够对自己的信息请求提供更好的回应，并且有更好的内部结构设计。因此，有效的信息检索结果取决于几个因素：记录管理、资源整合、电子文献管理、映射过程、电子邮件适用能力、系统交互能力等。信息技术解决方案是整个过程的最后阶段。因此，信息管理首先是文化问题。关键是企业领导、人员和服务领域。只有在充分交流的基础上分享观点和信息才能实现真正的资源共享。

信息管理政策的有效实施能够增加公众信心，并使政府管理更为开放，最终有效提高用户满意度，改进人力资源管理政策，为企业形成开放式社会环境，并提供学习与知识分享的环境。知识管理能够为知识的重复使用提供智力资本，扩大组织记忆功能，发展知识共享和学习文化环境，改进国家项目的知识管理。通过项目实施能够使人们知道现在社会正在发生什么和需要知道什么，使正确的信息能够在正确的时间传递给正确的人。

来源：Conference on“Information Management Strategies for the Public Sector”By Hugo Agius Muscat.January 2004（李平）

标签：图书馆论文; 语义分析论文; 文献回顾论文;

国际工业的发展_图书馆论文

猜你喜欢