一种成功的检索策略——结构检索,本文主要内容关键词为:策略论文,结构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
信息技术的迅猛发展,促进了令人晕眩的信息系统的发展。我们生活在全球信息系统时代,随着新千年来到,如何更好地利用英特网,就需要基本的知识和技能,懂得信息知识对我们来说是很重要的。
1998年美国海法大学的Hsieh—Yee教授发现参加她研究课题的63%的学生用搜索引擎开始检索。通过对学生在图书馆进行信息检索的情况的调查表明,大部分学生是“盲目搜索”。这种检索通常在WWW上用普通的检索引擎,象Alta Vista、Lycos等一种询问方式来进行。 这些检索结果往往一无所获,或者检索到成千上万个无用的令人头昏脑胀的信息,大部分没有价值。计算机技术使用户很不耐烦,用户得不到有用的信息,又迫切希望得到它。由于用户被不相关和无用信息堵塞或淹没,检索到大量无用的信息就不足为奇。
用户经常受挫,就产生了要根据理性的检索程序和技术发展系统的检索策略的真正需要。自从(1986年哈特;1989年马奇奥里利提出)把信息检索当作为一种解决问题的情况后,这种结果就不可避免。因为信息检索是个连续的相互联系的活动,检索过程的每一决定都影响它的最终结果。所以,检索者动机的出现是检索过程成功的关键。一般,检索者需要引导和控制检索,即在检索开始时提出正确的询问,然后开始检索,同时判断各自检索选择的效果,最后评价检索结果。如果必要,重新检索和修改检索步骤。对专家、学生和普通大众等所有用户来说,凭借电脑空间在虚拟世界里,用各种信息检索形式检索各种商业的、教育的和科学的信息,得以实现。
成功的结构检索策略,是1994年在对学生和图书馆馆员的深入会谈和观察后发展而来的,该策略发展成为学院全日制课程,由检索方针、检索形式、提示、详细说明和典型检索任务组成。1997年它为英特用户所接受(http://www.success.co.il)。分析这个成功策略原理,评价其基本构成,对用户教育、图书馆和信息科学教育及信息系统的发展都有深远的意义。
1 结构检索的基本原理
信息检索是个连续的相互联系的活动,目的在于完成检索任务。这也是个解决问题(Harter,1986年;Marchionini,1989 年提出)和决策的过程(Ammersbach,1992年提出)。一旦检索任务确定下来,检索者就开始行动。他或她能通过信息空间,用超文本链接、搜索引擎中的询问类型、发电子邮件、打电话、咨询他或她的隔壁邻居等等浏览,各种选择是无限的,然而,有些检索活动可能过渡或无效。
因为检索者的每一决定都影响检索过程,所以检索过程中检索者动机的出现是检索成功的关键因素。大多数情况下,理智的动机明显缩短检索过程并能更好地提高检索效果。一般来说,如果我们能识别使检索更有效的动机,就能确定指导系统检索的方针,这个方针会帮助提示和使专业检索者认识到信息需求并执行系统的检索。这样,根据信息需求确定检索任务,然后进行检索,同时考虑每个阶段的相互影响,最后评价检索结果,如果必要,重新检索并通过提炼以前的决定修改检索。
2 成功的结构检索策略的基本阶段和方针
2.1 5个基本阶段和7项方针
(1)任务(什么任务)
①确定检索任务
(2)资源(什么地方)
②找出资源的位置
(3)检索词(词)
③选择检索词
(4)方法(工作方法)
④选择适当的检索方法
⑤执行检索
(5)评价(评价结果)
⑥评估检索结果
⑦如果必要,通过精炼先前的决定重新检索
早期成功策略由4个阶段组成,经研究增加了第5个阶段即评价检索结果。修改了的成功策略由5个基本阶段即:任务、资源、检索词、 方法和评价。7个方针:(1)确定任务;(2)定位资源;(3)选择检索词;(4)选择方法;(5)实行检索;(6)评价结果;(7)必要的话,通过精炼以前的决定重新检索组成。我们所说的5 个阶段可称为“5W”,即:What、Where、Words、Work、Wow。
2.2 检索顺序
检索顺序一般为:任务—资源—词—方法—评价。这个顺序可以作改变,改变的三个标准为:第一,对检索者来说相关资源不知道时,先找出资源。第二,当检索面太广或定义错误时,集中检索。在这点上,确定检索词可帮助明确复杂的检索。第三,检索者的阅历。这是检索者经验创造的一部分,特别是当复杂检索时或对检索者来说主题不熟悉的情况下。对大部分人来说,先定位资源,后选择检索词。一般来说, 5个阶段对完成复杂检索是必不可少的,但对有经验的或熟悉专业的检索者来说,在日常检索和导航检索时省略某些检索阶段是可以的。因为他们使用了专业术语来代替检索词或凭借经验跳过某一阶段而使检索成功。
(1)陈述检索任务。
陈述检索任务的目的在于通过指定所需信息集中检索。陈述过程迫使检索者用清晰的检索任务词确定或精炼所需信息,这样能使检索者把复杂的检索任务分解成指定完成的以符合信息需要的全部的或部分的任务。尽管询问已经被陈述,但还应该陈述检索任务,在整个检索过程中陈述检索任务是最困难的。
方法:
①用尽可能精确的短语表达任务__________
②指定所需信息
主题(如:经济、保健)_________________
类型(如:医院、报纸、软件)_____________
目的(如:专利检索、科学著作、起草经济计划等)_________
地理位置(如:美国纽约的曼哈顿)___________
限制(如:公司大小、制造数据、出版地)________
指定最能代表所需信息的典型项目_____________
③预算和时间表
估计预算______________
资源类型(如:商业数据、免费网络资源、Medline)________
期限:________________
时间(用时间限制检索)________________
对专业检索者的附加方针:
④指定检索报告
说明的标准(详细说明、一般说明)_____________
格式(计算机磁盘、电子邮件、困难的复制)________________
⑤与顾客谈话
指定背景、客观检索、所需信息类型、以前的知识
(2)找出信息资源。
检索任务规定了潜在的资源,如:关于心脏病的医学科学报纸在Medline数据库中最好检索,而不在Atavista搜索引擎上。Altavista、Yahoo和MainPortals等英特普通检索工具对在网上查找Medline 数据库、CIA World Factbook以及新纽约城黄页还是很好的。错误地分配相关资源往往导致检索失败。
在英特网上和网外,可按以下步骤,列出相关资源
①第一步,列出你想到的所有资源
②第二部,按资源的相关性分类
③第三部,在英特网上或网外(如:图书馆、在线数据库、光盘)检索相关资源
(3)选择检索词。
检索词影响检索结果的精确性,它们使大量的结果即不太宽也不太窄,选择合适的词需要某些基本的知识和技能。检索者应该适当描述所需信息的特征,利用专业术语或计算机的桌面参考资源(如:地址、拼写检查、难字汇编和词典)等,此外,相关的有效信息还包含在专业词典的使用中,例如检索医学信息Medline的主题题头(MeSH), 检索教育信息的教育资源信息中心词典(ERIC),检索普通信息的图书馆协会主题标题(LCSH)等。
表1 填表
(4)选择检索方法。
依靠资源的特点和任务的本质选择检索方法,因为信息资源存在不同特点,对检索者来说,熟悉资源特点以及按检索任务利用它们是必要的。
超文本和超媒体信息资源允许二个信息检索模式:联想浏览和结构浏览。实际上,在电子信息环境中,有三个基本信息检索方法。它们是:联想浏览、结构浏览和询问类型。每个方法都有其优点和缺点,利用不同的方法会产生不同的检索结果。
联想浏览是超文本和超媒体资源常用的工具,它使用户实现了体现在文件中包含的偶然的联想链接,并反映了开发者的思想。
结构浏览常在分级与网络目录、分类地址中被利用,熟悉在多级和网络目录中反映意识的、专业的和商业思想的机构,一般为特殊用户设计。通常检索者熟悉在结构目录和分类地址中的机构,需要采用地址术语和了解分类大纲的原理。
询问检索由检索者选择的检索词构成,被用于搜索引擎中。某些特征上的不同,如:数据库的学科领域、检索范围、检索技术都会极大地影响检索的效果和精确性。
选择检索方法的标准是什么?联想浏览被推荐给那些明确在文本中相关的联想链接,或为那些用先前结构主题的联系来浏览、研究新领域的人。分类地址浏览推荐给检索一个好确定主题内容的信息检索。询问检索定义为4种情况:
①当信息与不同主题相关时
②对用户来说主题内容不清除时
③当检索者查找特殊项目(如:某个人、某个组织、某个出版社)时
④当主题太宽,检索者能用特殊的检索词使结果变窄时
一般:当检索独立的主题时用分类地址,当检索新的主题时用检索引擎。
询问检索
询问检索的功能在进一步研究,总的来说,Metaindex、 Mainportals和MetaCuawler特别有用。以下三种情况使用Metaindex:
①当不清楚去什么地方查找所需信息时
②当检索结果太少时
③当进行盲目导航检索时
以下三种情况使用免费原文检索
①当信息太特殊或检索词是唯一的时候
②如果用关键词检索结果太少时
③用导航检索目的在于发现不同的主题内容
当信息太宽或太模糊时用关键词检索最有效;在不相关的拥挤的信息中,使用免费检索是有效的。集中对特殊主题的检索,用领域检索更容易些。如:标题、作者、机构或检索数据、统计数据等。
(5)检索结果的评价。
评价标准:可靠性、正确性、相关性和有效性。
反馈:①用户教育。对非专业用户来说,成功结构检索策略是有用的,它引导用户用系统的方法去执行基本的检索。对用户教育来说,使检索结构化是必要的。②图书馆和信息科学(LIS)教育。
成功策略提供了专业信息检索基础,对图书馆和信息科学教育来说是重要的,该策略是专业检索技能A—B—C。
结构检索策略在混乱的信息领域如Internet和在结构性的信息领域检索同样有效。