谈因特网上对专题信息的查找,本文主要内容关键词为:因特网论文,专题论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
Internet是目前世界上资料最多、规模最大的信息库,是人们获取信息的一个重要来源。在Internet上,充斥着无法计算的各类信息资源。它在带给人们巨大信息资源的同时,也给广大用户带来利用上的困难。本文就如何比较全面的在网上查找某一专题的研究信息这一问题进行研究。
1 选用网上专题信息搜索的检索工具
1.1 利用搜索引擎检索
搜索引擎(Searching engine)是收集、整理网上信息资源并按一定的规则加以组织,提供人们按相应规则提取信息线索,并能直接链接到相关站点的网上信息搜索工具,相当于对网址或网上文献做的索引,按搜索信息的方式及提供信息的能力可分为主题检索和关键词检索两种。每个检索工具都有这两种检索方式。通过搜索引擎来查找自己想要的网址或信息是最快捷的方法,也是最佳途径。
1.1.1 主题分类检索工具
这类检索工具的特点是由分类专家按照主题或字顺建立一个结构化的从大类到小类的目录清单,在每个类别及子类别下分别将合适的Web网点地址罗列出来,Yahoo就是属于这类浏览工具。Yahoo有三种信息查询方式:1.归类信息方式:如最新消息、当前热点信息等。2.专题浏览方式:将所有普遍信息分为12类,每一大类又分多个小类,可用鼠标点击链接词进入相关专题。3.关键词检索方式:这是最快速、方便的检索方式,只需在Yahoo主页搜索框内键入要查找的信息主题词,然后点击Search按钮即可查找列出结果。
1.1.2 关键词检索工具
AltaVista是由DEC(Digital Equipment Corporation)公司在1995年中开始研制和建设的一个功能强大的搜索引擎,每天快速采集万维网和USENET的资源,并对这些资源的每一个词进行标引,形成了详细和全面的网络资源全文索引,允许众多网络用户来检索这些索引。1995年年底AltaVista开始上网服务,每天可搜寻600万个网页,它的索引数据库标引的网页迅速从1600万个增加到1.25亿,最繁忙时一天可处理1200万次查询请求,成为Internet网络上资源采集范围最广、功能最为强大和最受用户欢迎的检索工具之一。AltaVista分基本检索、高级检索和多语种检索,AltaVista还提供专题检索,允许对某一方面的信息进行专门检索。AltaVista主要包括AltaVista标志、检索输入框、AltaVista专题检索菜单、AltaVista资源目录、ABCNEWS提供的新闻报道、AltaVista最新要闻以及关于AltaVista自己的信息等内容。
1.1.3 Excite
Excite每天访问300万个网页,建立了一个收集有5500万个网页最近两个星期的Usenet新闻数据的全文索引。Excite还每天搜索300个新闻媒体,将有关内容组织到新闻文章索引数据库。个人化检索是Excite的一个重要特点。Excite在处理检索词时使用了“智能概念提取技术”。在标引网页时,Excite不仅对这个网页进行全文索引,而且还将它与其它讨论相同或相关问题的网页联系起来。在检索时,Excite不但能检索出直接用您输入检索词标引的网页,也能检索出那些虽然没包含您的检索词、但包含了与这些检索词相关的其它词汇的网页。当检索语不准确时用Excite。
2 专题信息的检索方法
Internet联结着成千上万个信息机构和数据库,但是任何信息机构和数据库都有其特定的收录范围,即特定的学科专业范围和时限范围。如果超出其范围,检索就是无效的。所以要全面了解熟悉各信息机构和数据库的收录范围、时限、更新周期以及熟悉地掌握各种不同的检索入口、列出恰当的检索式。
某一专题的研究信息包括论文、著作、引文、最新成果等等。论文又包括期刊论文、学位论文、会议论文。因此,要想全面地在网上查找某一专题的研究信息,就必须对这些研究信息的类型进行分析,选择合适的数据库。下面分别介绍它们的检索方法。
2.1 论文的检索
2.1.1 期刊论文的检索
(1)《中国学术期刊(光盘版)》(http://www.cnki.net)是一个全文、多功能的电子学术期刊。它择优收录了我国正式出版的核心期刊与专业特色期刊近3500种,分成理工A辑、理工B辑、理工C辑、农业、医药卫生、经济政治与法律、文史哲、教育与社会科学综合、电子与信息九个专辑。
(2)《中国学术期刊全文数据库》,它是中国学术期刊全文数据库提供Web网上检索方式,登录到其主页(Chinanet网上站点:http://www.cnki.net或CERNET网上站点:http://www.chinajournal.net.cn)后,单击数据库检索项,便可进行数据库检索期刊论文。
(3)《万方数据》的《万方数字化期刊子系统》(http://www.wanfangdate.cn)目前已经集纳了理、工、农、医、人文等5大类70多个类目的2000种科技期刊,并实现全文上网。
(4)《人大复印报刊资料》数据库光盘主要对人文科学的中文书报资料按学科整理、分类、复印,以飨读者。另外还出版有专题全文数据光盘。目前收录的中文报刊已达3500多种,设置100多个专题。收录了自1997年以来20余年的资料。其收录的期刊均有题录,一些重点文献有全文信息。
2.1.2 学位论文的检索
(1)《万方数据》的《中国学位论文库》(CDDB)涵盖我国自然科学领域各个专业的硕土、博士、博士后论文,收录了学位论文28万篇。每年更新一次,增补2万余条。
(2)中国科技论文与引文分析数据库(CSTPC)它是在中国科技信息研究所立年开展科技论文统计分析工作之基础上,由中信所信息分析研究中心和万方数据库中心共同开发的一个具有特殊功能的数据库。其数据来源于国内权威机构认定的1214种核心期刊,以及国家科技部年度发布的科技论文与引文的统计结果。
(3)ProQuest Digital Dissertations(PQDD,博士、硕士论文数据库)收录北美地区1000余所大学文、理、工、农、医等领域的博士、硕士论文文摘160多万篇,数据库每年新增47000篇博士论文和12000篇硕士论文。分人文社科卷、理工卷和文理合卷3种版本。
2.1.3 学术会议论文的检索
(1)中国学术会议论文数据库(CACP)CACP数据库光盘收入1986年以来国家级学术会议论文。数据库覆盖自然科学、工程技术、农林、医学等领域,每年涉及600余个重要的学术会议,数据库信息每年更新一次,增补论文15000余篇,该库是国内收集学科最全、数量最多的学术会议论文数据库,属国家重点数据库。
(2)OCLC(OnlineComputerLibraryCenter,http://www.oclc.org/)是世界上最大的为读者提供文献信息服务的机构。它是一个非赢利的、互相合作的成员组织,以推动更多的人检索世界上的信息、实现资源共享、并减少信息费用作为主要目的。目前,OCLC向读者提供了包括近60个数据库的联机信息检索系统First Search,可以方便地检索大量学术资源。其中的PapersFirst——国际学术会议论文索引可查找某一专题的研究信息的会议论文。
(3)Dialog数据库系统Dialog数据库系统(http://www.dialog.com)是目前世界上最大的联机数据库系统,系统已发展到600个数据库,几乎收集了所有领域的信息。它的各个专业的数据库来源于不同渠道的数据都可以在一个统一的用户界面下检索,而且数据量非常大、准确、全面。检索不同专题的信息需进入不同的数据库,但所有数据库的检索指令均相同,而且,在一个库使用的检索指令可以存盘,移到另一个库中使用,十分方便。
2.2 著作的检索
2.2.1 中国高等教育文献保障系统(CALlS)(http://www.calis.edu.cn)
CALLS(China Academic Library & Information System)利用CALIS可在网上查找全国性或地区性的书刊联合目录数据库,了解所需要文献是否有,以及在哪里收藏。也可以通过联机(或委托)检索CALIS国内外各种类型的文献数据库,得到某一学科或专题的详尽的文献线索乃至电子版全文。CALIS还有电子资源导航的功能,也就是说网上的电子资源(如研究进展报告、电子期刊论文、研究机构、专家学者等)按图书馆学的原理和方法进行收集、加工和整序,形成虚拟图书馆资源,补充和扩大CALlS的文献资源。我们可从这一节点查询网上电子资源。
2.2.2 中国国家图书馆(http://nlc.nlc.gov.cn/)
国家图书馆是综合性研究图书馆,是国家总书库,是全国的书目中心、图书馆信息网络中心它的中文检索数据库中的中国国家书目光盘数据库,收录了1988年以来中国大陆出版的所有图书。
2.2.3 WorldCat
据报道WorldCat是世界上最大的书目记录及馆藏信息数据库,它由4000万以上的USMARC格式构成的不重复的书目记录组成,还有7亿多条世界各国图书馆记录。
2.2.4 OPAC
联机公共目录检索系统OPAC 20世纪70年代中期最早出现在美国,目前在国内外图书馆中占主导地位的第二代OPAC增加了对信息实体主题内容的深度揭示,如:在记录中加入目次、索引、内容注释、文稿、图书评价等。
2.3 查找引文的检索
2.3.1 科学引文索引(Science Citation Index)、社会科学引文索引(Social Science Citation Index)、艺术与人文引文索引(Art & Humanities Citation Index)构成了ISI独具影响力的三大跨学科引文索引数据库
ISI的引文数据库的检索特点是:揭示文献之间的内在联系,可通过论文参考文献之间的链接关系,找到与研究课题相关的早期、当时和最近的文献,形成一个相关文献关系网。内容覆盖某项研究最初期的创建至最新的动态报道。它的相关记录检索——展示共同引用同一篇或几篇论文的所有文献,揭示论文题目之外的内涵,利用相关记录之间的关系,跨越时间和学科的限制对某一主题进行查询。
2.3.2 中国科技论文引文分析数据库(CSTY)
提供单位是中国科技信息研究所收录中国1200多种科技核心期刊,记录总数1411641条,范围:自然科学领域的各个专业。该数据库集文献检索与论文统计分析于一体,既是科技人员查找资料有关参考文献的重要依据,又是各级科技管理部门和各级研究机构、高等院校了解全国和各单位、各部门科技论文发表情报的重要工具,提供了发展科技论文的引文分析。
2.4 最新成果的查询
2.4.1 中国科学院技术成果数据库(CSTAD)
在科技界比较有影响力,收集了自1997年起经国家科委成果管理办公室登记的我国历年重大科技成果4万余项。该数据库是目前科技部指定的国内文献查新库。
2.4.2 WWW.LAS.AC.CN(西文)(中国科学院文献情报中心)
中科院实用科技成果数据库以收录中科院100多所研究所和300余家公司的实用科技成果,目前数据量为1万余条。
2.4.3 现刊题录(Current Contents)
Current Contents是全球学术界具有权威性和影响力的现刊题录快讯数据库,内容涵盖全球范围内7000多种学术期刊,2000多种最新出版的各类专业书籍。用户可以从Topic/subject,Title,Author,JournalTitle,Discipline,Address,Document Type等多途径对该库进行检索,检索结果包括文献题录、作者、作者单位来源期刊及文摘等。
2.5 查找某一专题的研究信息还可通过专家学者的个人主页、协会主页、网上的专题导航、机构主页、专题新闻、专业报刊、新闻组、联合国统计年鉴等等
可(1)利用学会主页获得重要的专题信息;(2)利用网络新闻组进行专题信息查询;(3)通过虚拟图书馆检索专题信息。
3 专题信息搜索工具的搜索技术
每个检索工具都各有特色,应根据实际需要选用。每个检索工具的检索语言各不相同,在网上进行专题信息查询时,要完成一个有效的搜索,应认真阅读其帮助文件以便使用正确的检索语言进行检索,使用搜索的基本技术来组织检索式。下面介绍一些主要的搜索技术:
(1)逻辑操作符的使用。搜索中常用的逻辑操作符是And、Or、Not。其中,And表示逻辑“与”,指搜索包含And联接的两个以上关键词的文档;Or表示“或”,指搜索Or联接的几个关键词中至少包含一个的文档;Not表示逻辑“非”,指排除Not后的关键词。
(2)+、-和通配符的使用。“+”在单词前,要求单词一定包含在检索文档中;“+”号和单词之间不能有空格。“-”在单词前,要求排除含特定单词的检索文档。“*”通配符加在单词的末尾,代替任意的字母组合。
(3)使用逗号、括号或引号。逗号作用:类似于Or;括号作用:使括号在其中的操作符先起作用;引号作用:将关键词或关键词的组合作为一个字符串进行搜索。
(4)大小写敏感性。若输入小写字母的词,则对大小写不敏感;而含大写字母的词,则对大小写敏感。
(5)避免使用一个词查询。输入的主题词尽可能多而且是精确词或词组,有利于缩小检索范围。
(6)灵活运用短语。只有正确使用短语,搜索工具才会把它作为一个整体去搜索。
(7)禁用词。一些非常普遍的词,却不能作检索词,成为禁用词。在编制检索策略时应予排除,不能出现在检索式中。
(8)扩大或缩小检索范围。某种策略方式都有可能产生多种检索结果,有时会出现命中文献太多,有时又可能出现检中文献太少,甚至检索结果出现零。所以在进行实际检索时,最好事先制定几种策略,以供随时调整运用,使检索得到最佳的效果。一般情况下,扩大检索范围的策略是去掉一些次要的、崭新的概念,以及专指度很高或没有把握的某些主题概念等。也可充分利用逻辑“或(OR)”将某些主题概念组配起来,以扩大检索范围。而缩小检索范围时,就得以增加一些主题概念加以限制,当然要用逻辑“与(AND)”进行组配。
(9)掌握不同引擎的搜索策略。充分利用不同引擎的优点,可以获得最佳最快的检索效果。