网络信息四大难题研究进展_搜索引擎论文

网络信息四大难题研究进展_搜索引擎论文

网络信息四大棘手问题研究近况,本文主要内容关键词为:棘手论文,近况论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

数字技术的迅速崛起和Internet的大规模发展,使信息源发生了根本性的改变,网络信息大量涌现。对传统载体信息而言,它具有无法比拟的优越性,突破了地理空间对信息传播的限制,能够快速地传输到世界的各个角落,极大地拓宽了人类信息的交流范围并且实现了瞬时交流。但与此同时,网络信息的广泛传播和利用也给我们带来了一些难题,这些问题的存在对人们有效地利用网络信息,促进社会发展和提高生活质量会产生一定的阻碍。本文就目前人们对这些难题的研究作一简要的小结。

1 网络信息的专业性检索

Internet展现给我们的是一个五彩斑斓的世界,网上信息的种类、形式和数量之多是人们无法想象的,且信息源分散、无序,呈动态。虽然无限增长的信息为共享提供了便利,但也为查找特定信息增加了困难,可以说这是一个困扰所有网民的大麻烦。目前解决的办法和研究的重点主要有:

1.1 充分利用网上搜索引擎

搜索引擎具有庞大的数据库记录网上信息源的地址,是用户查找相关站点网址的工具,它采用自动跟踪技术(如ROBOT )定期在网上漫游,查找新的(或改变了的)网站网址,并列入自己的数据库中。搜索引擎从内容范围看既有通用引擎也有专业引擎,查询途径一般都有分类和主题。搜索引擎是目前利用Internet信息的最常用的工具,因此各国都在这一技术的研制上投入了不少的力量,但是令人满意的高质量中文搜索引擎目前还比较少。此外搜索引擎也各有特色(如数据库大小、更新周期、检索途径等),需要在较为熟悉的情况才有良好的检索效果。

1.2 寻求专业信息资源指南系统的帮助

使用搜索引擎存在着非相关信息被检出较多的问题,而专业信息资源指南系统能克服这一弱点。它通过对网上某一领域信息资源的挖掘、采集、加工、整理和有序化重建,形成一个为专门用户服务的信息资源指南。与搜索引擎不同的是它集中了各种搜索引擎中的专业信息资源,并对信息资源进行重组、二次开发,使信息资源的检索更为系统和有序,用户可以节省网上漫游或在搜索引擎间来回穿梭的时间。

1.3 积累专业网站地址,直接进入专业网

由于Internet资源巨大,站点无以计数,目前搜索引擎能够提供的只是其中的一部分站点,相当数量的站点通过搜索引擎无法得到,因此要达到针对性、完整性的信息检索只有平时注意积累,将有意无意发现的有关专业站点随时记录下来,以备急时所需。

1.4 研制专业指引库

专业指引库类似于网上专业搜索引擎,它将Internet上有关某主题的相关站点集中,以用户熟悉的方法组织,用于指引用户到特定的地址获取所需的信息。它可以弥补Internet本身检索工具的不足,从被动使用到主动创造,更适应用户的需求。指引库中比较难以解决的技术问题是指引库的更新,网上站点的增加、更改时时发生,如果指引库没有自动跟踪和自动标引技术的支持,其价值和生命力就会丧失。目前主要的研究策略是参照搜索引擎的ROBOT建立自动跟踪程序。

1.5 创建虚拟图书馆

虚拟图书馆是搜索引擎和专业指南系统以及专业指引库的进一步发展和完善,在“收藏”和“集中”信息上与传统的图书馆类似,但它“收藏”、“集中”的信息在种类和数量上更多,并能给用户提供动态的网页信息,还可实现链接。

2 网络信息的真实性问题

Internet是全球最自由的媒体,它给人们提供了一个可以自由伸展、发挥的天地,可以不留痕迹地在网上虚拟自己或别人,以超越现实世界的局限,获得一份前所未有的满足和愉悦。但是这一优势一旦被那些心怀叵测之人利用,便产生极大的祸害。他们别有用心地篡改(增、删)或盗窃他人作品,匿名制作和传播虚假信息,网络的生命和价值在于保障人们快速地获取真实而完整的信息,信息失去真实性就只是一堆垃圾。这种篡改、假冒行为不仅对原作品作者产生侵权,而且破坏了公众信息源,降低了网络的可信度,如此无节制的“自由”若泛滥成灾,必将毁灭网络。

虽然意识到问题的严重性,但目前却很难有针对性的措施去防范。现在普遍认为解决问题主要可通过管理、技术、执法几条途径相结合进行限制。

2.1 对用户资格进行认定

对个人和单位成为用户进行法律界定。1996年的《计算机网络国际联网管理暂行规定》只对国际联网中的特殊用户作了规定,为了确保安全和发挥效益,对一般用户也应作界定。行业组织可对用户资格从技术性角度予以明确,网络子系统组建者则可根据特殊情况在不违反法律和行业规范的前提下,对用户作出特殊要求。

2.2 对上载信息进行规范

不仅对网络上载信息的格式作规定,而且对其内容也要制定统一的规范,如提供表示版权信息的版权标志、表示机密程度的密级标志,这样一方面可起警示作用,一方面为法律举证提供方便。

2.3 制定特殊的法案,加大违法的查处力度

在网络环境中,破坏者(侵权人)处于隐蔽状态,如果按一般民事侵权做法,权利人必须明确侵权人的身份并掌握侵权行为的证据,这对网络侵权的受害人来说是十分困难的。为此必须设立专门的法案或条款对调查的手段、机构、权力、取证等方面作出特别的规定,如由政府部门或行业组织进行调查取证、使用举证责任倒置的诉讼原则。

2.4 提倡作品署名

匿名或假名作品一般惯例是不受保护的,一旦作品被人篡改或窃取只有自认倒霉。如果采用署名法,作品作者通过署名向公众承诺其发布信息的可信性,一方面表示作者对公众负责的态度,一方面以真名署名将获得精神权利的保护,有法律作为后盾,对不法之徒将起到一定的抑制作用。

2.5 建立信息安全通道

交互性和可变性是网络信息的两大优势。为了既保持交互性和可变性,又保证关键性信息不被篡改、假冒,可采用建立网上信息通道的办法。在这一通道中,某些信息只能显示,不能复制。尽管这还只是目前人们的一个理想,但有朝一日将变为现实。

虽然上述的种种措施、建议有助于问题的部分解决,但未能从根本上彻底制止杜绝这种现象,真正有力、有效的对策还有待于人们的进一步研究。一般而言,技术上的防范措施是最为有效的。

3 网络信息版权保护

数字技术的发展引发了知识产权保护的一系列问题。网络环境下信息的存贮、传播、利用等与传统信息截然不同,知识产权的无形性更明显、地域性更淡化、时间性和专有性均受到冲击,因此知识产权问题引起了各国政府的重视,美国为此于1993年专门在“信息基础设施推进委员会”下设立了知识产权工作组,负责对有关知识产权问题的研究,提出修正法律的建议,其他各国也纷纷就此问题提出了适合本国的方针、政策及法律修改建议。我国由于网络技术发展较为落后,就知识产权问题的研究稍晚了一些,但近年来的研究势头也不弱,主要集中在版权方面。

3.1 数字化作品的版权归属

数字化作品,特别是多媒体作品具有集成性、协同性和交互性等特点,必须与传统印刷型作品分别对待,主要观点有二种:(1 )参照美国的做法将多媒体作品根据多媒体作品的不同类型归入视听作品; (2)参照台湾资策会的《多媒体节目著作权法修改建议》,将数字化作品作为一个特殊的类型独立成一类,“专款(条款)专用”。

3.2 拓宽数字信息的“复制”概念, 考虑引入“暂时复制”概念

网络环境下的复制行为很难控制,必须在立法上有统一的规定。对原有复制概念的内涵、外延应作进一步的调整,将“对作品进行单纯数字化处理或其反过程”列入复制范围,明文或隐含地在版权法中体现。“暂时复制”是指版权材料仅进入计算机内存,没有固定在任何有形媒体上的情形,那么在现有的技术条件下,所有的网络传输都是对作品的一次或多次复制。虽然由于发展中国家的广泛反对,世界知识产权组织的版权条约没有明确规定“暂时复制”,但间接的条文却给“暂时复制”留下了余地。随着我国国力的增强和版权保护水平的提高,“暂时复制”应该出现在我国的著作法中。

3.3 关于信息的网络传播与发行

美国版权法认为作品若在网络上传播即属于向公众发行,但并非所有传送作品复制品的行为都构成发行。受此启发,有研究者认为我们应该将网络传输作为发行的一种方法,但作品复制品在网上的传送并不必然构成发行,可以根据其传送的范围和限制划分为不同类型的发行,区别对待。

3.4 网络数据库的著作权保护

数据库制作者一方面应享有著作权人的一切权利,任何对数据库的非授权使用、非法套录、篡改等均应受到法律的惩处,另一方面数据库制作者在制作过程中必须同样尊重原作品著作权人的署名、修改等一系列相关权力,全方位地实现对著作权的保护。

3.5 版权保护的适度问题

版权保护既要避免因网络传输的发展造成的保护不足现象,也要防止因急于将网络传输纳入版权保护体系的过度保护现象。版权法的目的是促进作品的创作和传播,让公众从作者的智力劳动中获益。如果适度问题不能准确地把握,版权保护将走向反面。

3.6 网络信息知识产权立法

这是所有关注知识产权问题的人们所共有的行为。网络的发展是必然的,新技术带来的知识产权侵权问题如果无法可依,将时时困扰人们,影响会波及从社会生活到国民经济的各个方面。为此我们应该借鉴国际上网络知识产权立法的成功经验和通行惯例,加快网络环境的知识产权立法。

4 数字信息的保存

Internet的高度发展为数字图书馆发展提供了基础,数字图书馆的内涵是脱离传统图书馆的实体,以数字形式存贮和处理信息,以网络形式提供使用。它的优越性使越来越多的人热衷于在较短的时间内建立数字图书馆,人们的视觉焦点都聚集于制作数字信息或转化非数字信息,一时间大家轰轰烈烈地创建数字化信息源,至于对数字图书馆的管理特别是数字信息的长期管理、保存问题根本顾不上考虑,这将给数字图书馆的生存埋下深深的隐患。

现实中,用户对信息的查寻并不局限于最新信息,还有相当量的回溯性检索,为此传统图书馆或多或少地承担着保存文献的任务。数字图书馆作为一个网上信息源也必须将具有保存价值的数字信息存留起来,为用户提供全方位的信息服务,否则数字图书馆只提供最新信息,人类文化遗产保存的职能如何实现。目前有些较为谨慎的图书馆对网络出版物持保守策略,就不乏有由此问题产生顾虑的原因,更何况网络出版物比其他出版物易受损,对环境的要求更高,容易使人产生一种不安全感。为解除后顾之忧,数字图书馆必须瞻前顾后。

虽然数字图书馆是一个研究热点,但几乎没有对数字信息长期保存的研究,据说国外的研究者也未涉及此问题。目前对它较为系统的研究论文是武汉大学刘家真先生的文章。对这方面缺乏研究也并非完全是由于人们忽视所造成的,数字信息保存的高技术性也是制约的原因之一,它涉及到格式、媒体的转换以及随技术更新对保存的信息进行迁移等问题,只有在数字技术高度发展的前题下,这个难题才能攻破。

刘家真先生在文中提出应有一个具体部门负责数字信息的长存研究,建立一个比数字图书馆更具有长期保存职能的系统——数字信息归档系统,作为数字信息的资源库。此系统必须具有对数字信息的选择、鉴定、入藏、存贮、存取功能,该系统涉及的技术难点较多,如信息选择的策略和标准、入藏信息对象的版本形成和跟踪、信息随运行环境的改变而进行的迁移等,特别是多媒体信息的迁移技术目前国际上也未有成功的经验,需要集中力量攻关。

标签:;  ;  ;  ;  ;  

网络信息四大难题研究进展_搜索引擎论文
下载Doc文档

猜你喜欢