网络信息采集技巧探讨_rss论文

网络信息搜集技能探析,本文主要内容关键词为:探析论文,技能论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G250.73 [文献标识码]A [文章编号]1008-0821(2009)06-0119-03

网络已日益成为情报研究工作获取信息的重要途径之一,因此研究在数字科研环境下如何提高网络信息搜集能力具有十分重要的意义。

网络信息搜集能力体现在网络信息搜集的协作性、准确性、方便性、及时性等方面,其中准确性主要与网络信息检索有关,现在讨论这方面的文章比较多,比如搜索引擎的信息检索技巧、检索策略的制定等,因此本文将主要介绍一些先进的可以帮助研究人员提高网络信息搜集协作性、方便性、及时性方面的技能,推荐给研究人员使用,从而在时间和精力有限、信息爆炸的情况下,帮助研究人员提高信息搜集和处理的能力,节省时间和精力。

1 提高网络信息搜集协作性的技能

现在人们经常需要与同事进行合作。而目前许多互联网工具(比如搜索引擎)是为单个人工作设立的。尽管人们通常会进行分工,但人们还是会常常发现我们在重复其他人检索过的工作,甚至没有发现别人已经知道的东西。

2008年4月底,微软在其网站上公布了Search Together工具来解决这一问题。SearchTogether需嵌入在IE7.0中,并且要求一个windows live ID才能合作。SearchTogether的功能如下:

1.1 协作检索

一旦所有合作的用户都安装了该软件,如果其中一人想进行网络检索,可以邀请其他人参加。

1.2 分头搜索(split search)

用户可以进行一次搜索,搜索到的结果将自动分配给合作项目中的其他合作者,并用高亮的形式标记出每个合作者需要处理的条目。

优点:合作者可以分头研究搜索结果,而无需进行重复的工作。

1.3 组查询历史

每一个合作项目的组查询历史菜单上会显示所有的合作者,以及他们的搜索和查询记录,并用不同的图标表示他们当时选择的搜索方式。

优点:避免用同一检索词多次检索,相互提醒修正检索策略,节省时间。

1.4 评级与评论、在线交流

用户可以对检索到的网页进行评价和书写评论,可以查看其他合作者浏览过的站点,并阅读他们有关这一站点的评论。SearchTogether软件界面还包括一个即时交流窗口,合作者们可以方便地发表意见。

优点:一是及时共享找到的重要信息,以前必须通过发邮件或通过其他即时通信工具实现;二是如果想中途更换或添加成员,只要加入该主题,新成员一样可以直接看到以前共享的结果,非常方便。

以下是使用SearchTogether的截图:

图1 使用Starchtogether的截图

2 提高网络信息搜集及时性的技能

要保证研究的质量,及时获取和分析国内外最新的消息是非常重要的。大多数情报研究人员都有自己特定的长期追踪的方向和网站,过去通常人工地定时或不定时地浏览这些网站,搜集相关信息。但是由于时间和精力有限,这样费时费力,而且难免会有所遗漏。现在有不少方法可以帮助我们比较智能方便且及时地搜集到最新信息。

2.1 利用RSS阅读器进行新闻定制

目前已经有不少人认识到利用RSS搜集信息的重要性。现在也有不少相关的离线RSS阅读软件,如著名的如周博通、看天下、鲜果、新浪点点通等,也有不少网站提供在线浏览,著名的如google reader、bloglines、抓虾等。

通过比较,google reader在性能方面具有一定的优势。Google reader是由google开发的,在市场份额上已经超过了bloglines等其他在线阅读器。除了具备一般RSS浏览器的订阅新闻频道、导出新闻频道等传统功能外,google reader还有其他一些非常方便、有用的功能:

(1)标记(star):看到有价值的消息,可以将其标记(Star)以便日后使用;

(2)共享(share)和添加备注:看到有价值的消息,可以将文章分享给其他人,还可以对该消息添加备注信息,让其他人知道为什么您要共享这条消息。

(3)分类:看到有价值的消息,可以对其增加tags(标签)以便日后组织管理。比如将相同主题的信息加上同一个标签,可查看该标签下的所有信息,非常方便。

需要注意有一些功能在google reader中文版中不能实现,因此建议使用google reader英文版。

但是RSS在带给我们方便的同时,也使我们失去了一些东西。比如通常一些重要的消息往往会放在网页的最上方或以更大的字体出现或者放在一些重要的栏目(比如“今日要闻”等)来区分,这样可以帮助我们判断一条消息的重要性。而RSS对于所有消息都一视同仁,传到我们的阅读器时都是同样的字体同样的格式,我们只有人工一条条浏览以确定其重要与否。希望以后RSS服务提供商能够解决这一问题。

3.2 监视没有提供RSS Feed的网站的更新

利用RSS接收最新消息是非常有效的方式,但是现在并不是所有的网站都提供RSS输出,我们通过调研发现有几种方式可以用来监视这些没有RSS输出的网站,表1对这些方式进行了比较分析。

通过表1比较可以发现:

从使用方便性来看,使用page2RSS网站可以为任何网页生成一个RSS,通过订阅这个RSS就可以知道网页是否有最新的更新以及更新的内容,使用最为方便简单;

而从判断信息重要程度来看,利用firefox的update scanner插件比较好,其最大优势在于其在网页有更新时,会自动弹出提示窗口,并在原始网页上用不同的颜色突出显示更新内容,可以很清楚地看到更新消息所处的栏目、在网页所处的位置,比较明确地了解一条消息的重要程度。因此对于使用firefox浏览器的用户,update scanner是用来监控更新消息不会太多并且区分了重要信息的网页(比如传统的报纸、杂志等)非常有效的工具。

3 提高网络信息搜索自动化的技能

对于长期追踪某个主题领域的人员来说,检索相关领域的消息是日常的重要工作。除了开展主动检索外,还可以利用搜索引擎提供的新闻定制功能,利用新闻定制,可以由服务提供商自动检索相关信息,扩大信息源,提高信息搜集的智能化和方便性。

笔者选择了搜索引擎方面的两大巨头提供的新闻定制服务进行了比较,如表2所示。

由表2可见,从检索方便性来看,百度定制的新闻可以通过RSS输出,在RSS阅读器上浏览,非常方便。Google的新闻定制则是使用mail提醒,如果不需要还要进行删除操作,相对要麻烦一些。

从检索效果来看,由于google可以通过google的高级检索来改进检索,一旦确定能获得满意结果的检索式,可将搜索框中的查询文字复制并粘贴至Google快讯主页上的搜索框中,因此google快讯在查准率方面优于百度,而在查询结果数量方面百度占优。

不过总的来说,每天有关的新闻数量不会太多,因此建议可以用同一关键词同时订阅google快讯和百度,作为信息搜集的一种补充方式。

4 结语

信息搜集是综合利用各种方法、途径获取和处理信息的过程。在这一过程中,所运用的技能是信息搜集者的电脑水平、文献检索能力和对新信息的敏锐的洞察力和嗅觉。以上只是介绍了可提高网络信息搜集及时性、自动化、协作性的部分技能,情报研究人员需将这些技能与制定合理、有效的网络信息检索策略结合起来,这样才能切实提高网络信息搜集的效率。

收稿日期:2008-12-10

标签:;  

网络信息采集技巧探讨_rss论文
下载Doc文档

猜你喜欢