搜索引擎信息伦理研究,本文主要内容关键词为:伦理论文,搜索引擎论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G350;TP391 文献标识码:A 文章编号:1007-7634(2010)08-1258-05
1 国内外搜索引擎伦理研究文献分析
为了把握国内的搜索引擎伦理研究现状,本文利用《中国期刊全文数据库》(CNKI)(1990-2009),以“搜索引擎”与“伦理”作为检索词,进行题名检索,没有得到完全切题的研究论文。
本文利用Springer、ARL和EBSCOhost Web数据库,以“search engines”与“ethics”作为检索词,进行题名检索,得到完全切题的研究论文9篇,相关主题论文近30篇,论文发表年代集中于2005-2009年。著名电子杂志“信息伦理国际评论”的“搜索引擎伦理”(the ethics of search engines)专题系列论文以及“搜索伦理:搜索引擎在知识的构建和传播中的角色”(Hinman,2008)等论文,对搜索引擎所引起的社会问题从伦理学的角度进行了较深入的研究。
2 搜索引擎伦理的起因
因特网是自由的代表,那么从源头上控制这种自由就很困难。作为Web的入口,搜索引擎面临着无控制自由和有控制自由的两难选择。新的法律不能提供帮助,因为Web是没有国界、没有最高统治者的自由空间。当自由及其主题不能被法律控制时,就应借助伦理手段来解决问题[2]。
要深入分析搜索引擎所引起的伦理议题,首先必须明白搜索引擎的技术构成。搜索引擎指的是一种在Web上应用的软件系统,它以一定的策略在Web上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。根据此定义,搜索引擎可以区分为数据收集、索引、查询、结果显示四个概念层次。从技术上来说,构成搜索引擎四层次的各分系统互相嵌入,犹如人类社会的发展,更为专业的劳动分工构成了更为复杂的系统。
早期搜索引擎仅由十几条程序组成,被业界称为“黑色箱子”(black box),由于技术和合法门户的法律保护,尽管人们不能看清其内部,但仍然可以通过其输入和输出对其机制作出评价,搜索引擎给人感觉还是一种可触摸的实体。但是随着信息技术的发展和各种社会经济利益需求的增加,搜索引擎的质量不仅受到技术的影响,而且受到不断增长的内部和外部因素的控制,涉及多方参与者的政治和经济利益。这些参与者包括底端的开发商、系统设计者和信息科学家,顶端的用户以及中间的优化网页排名者、元搜索引擎的开发者、后端处理器和寄生接口等等。内部功能整体性的缺失和系统融合到更大的技术环境,搜索引擎给人的印象不再是“黑色箱子”,而是杂乱的团块聚集的“黑色泡沫”(black foam)[3]。
搜索引擎公司的商业性质,决定了其生存和发展主要依赖广告收入,所以搜索引擎要对其付费客户——广告客户负责。搜索引擎公司为了防备其算法被竞争对手窃取、被搜索引擎优化者或不法商人知晓从而操纵检索结果,已对算法申请了商业秘密法的保护。所以当用户提出请求时,到底有多少层次参与处理、经过多少子系统并且它们各自又增加了什么内容到结果中,无法给予明确答案,即使开发者也无法预测在某种情况下系统将如何运行[4]。
3 搜索引擎伦理议题
本文主要从搜索引擎对知识构建的控制和对信息资源的垄断、搜索引擎结果的相关性决定、检索结果的显示方式、个人信息搜索引起的隐私保护四方面进行论述。
3.1 搜索引擎对知识构建的控制
搜索引擎在控制信息的获取上起着决定性的作用,也就是说它对社会知识的构建起着至关重要的作用。搜索引擎已成为网络空间的“守门人”[5]。对信息获取、知识构建和传播的控制乃至对全球信息资源的控制是搜索引擎引起的第一个伦理议题。
3.1.1 搜索引擎改变了传统的知识构建结构
互联网的出现动摇了人类长期以来形成的传统的、合法的知识构建的基础。无论是古代文明的口语传播,还是近代书本知识的广泛传播,专业人士一直是知识的“守门人”。比如,学位授予、会议组织、刊物编辑、学术著作出版、奖学金和科研基金申请的批复均由专业人士通过权威的论证进行。但是几乎一夜之间浏览器对传统的认知权威发出了挑战。个人网页、博客、播客、知识合作进程、维基百科、开放源学科以前所未有的规模和速度传播着知识。知识的构建和传播不再依附于专业资格。
而搜索引擎对知识构建所起的作用更大。仅仅十年前,大学生从学校图书馆获取由专业机构出版的学术期刊和学术著作来开始其研究课题,但是现在他们更有可能转向网络,利用诸如Google等搜索引擎去搜索信息,即直接利用没有被专业机构处理过的知识。而Google通过检索结果排名,引导大众阅读按其算法排列的相关主题网页,而这又反过来影响大众进一步对此主题的思考,从而形成对这个主题进一步的认知。
也许有人认为搜索引擎仅仅控制了访问Web上的信息,人类积累的大部分知识不在网络上,而是在图书馆的传统出版物上。但是Google的“学术搜索”(Google Scholar)可能改变这种状况。Google计划将世界上几个主要图书馆的馆藏数字化。目前Google学术搜索的法律纠纷主要是版权和知识产权问题,但是这些问题相对于对世界主要图书馆资源的控制来说都是次要问题。假如Google成功实施该项计划,那么会导致两个结果的产生:第一,除了少数读者由于特殊需求要查阅纸质品外,大多数人将通过联机查阅这些图书馆的资料;第二,书籍和期刊将逐步被转移到偏远的地方存储,这样图书馆更多地将作为工作站而存在。
这样,信息的获取将被搜索引擎牢牢控制,知识被控制在私人手中程度在人类历史上将前所未有[6]。
3.1.2 搜索引擎对全球的信息资源的控制
(1)搜索引擎对全球的信息资源的控制程度。全世界浏览量最大的四家网站,有三家采用了被称为市场领导者的Google的搜索技术,80%的网络搜索是通过Google或使用Google的技术来完成的。Google实际上已经成为人类的一种公共事业,它控制着几乎所有的网络浏览资源。Google可以轻易地决定一个网站能否被别人找到,决定这个网站的浏览量,甚至决定着这个网站是否有存在的必要[7]。所以人类对信息的获取被强大的、越来越难以理解的搜索引擎所控制。
在一个民主的社会里,权力过于集中会引起一系列问题。尽管Google坚持技术至上的原则,但是程序是人工设计的,具有较强的主观性[8]。并且目前的搜索引擎更大程度上是为了商业利益。“行动的责任必须由各种参与者分担”,但是如前所述要做到明确链条中的各环节的责任已变得不可能。
(2)解决资源控制问题的对策。国外学者提出了解决此问题的理念、机制和方法。
Introna(2000)指出,网络是一种公共利益,而通过搜索引擎获取信息的商业化和集中化对作为民主和平等代言人的网络空间产生了危害。作者呼吁公正和克制的人道主义价值观,并且督促搜索引擎开发者保持平等的理念。
通过多种途径稀释开发商的权利,将更多的控制权转移给公众。Introna建议“建立更平等和更包容的检索机制”。督促搜索引擎开发者进行明确的公共服务,准许对其索引和服务器的接入[9]。Fallows(2005)提议以“信心对称性”原则来解决搜索引擎信息资源人口的垄断问题。用户可以将信任交付搜索引擎,那么这些搜索引擎企业也应该将信任归还给用户,让用户创建自己的搜索机制,这样公众就会去发展不注重商业利益的搜索算法。代表民主社会的开源运动有可能使理想得以实现[10]。
3.2 搜索引擎检索结果的相关性决定
搜索引擎所涉及的第二个伦理议题是“相关性”决定,即当搜索引擎按照用户的请求返回搜索结果时所涉及的网页内容的客观性问题。
计算机是操纵符号的机器,其处理的是并不理解其含义的数据,建立在计算机技术上的搜索引擎也是如此。利用搜索引擎的目的是为了获取信息,但是实际上用户获取的是数据。信息检索是查找“相关”信息,而相关性决定是一个物体包含另一个物体的信息的计算。由于无法理解文字的含义,所以其相关性决定不是基于理解,而是基于统计和计算,借助词频和网页的被链接的次数来决定的。
早期搜索引擎用十分简单的算法决定网页排序,例如网页访问量和其他网页对特定网页的链接数量。用户检索取决于像网页浏览量这样的客观标准,这些最初的检索就是对最受欢迎的网站进行排序,这里“受欢迎”有着技术的和客观的含义。第二代搜索引擎提供最能满足用户需求的网站,这并不总是包括最受欢迎的网站。总之,搜索引擎帮助用户找到的是满足用户信息需求的数据,传递的是没有经过阅读的文本的含义。这就与用户期望获取建立在概念理解上的信息而不是字面匹配的数据的愿望产生了背离。
著名计算机伦理学者Fry(2006)认为搜索引擎还不能明白或者近期做到明白其搜索和反映在其相关性决定中的内容的含义。虽然目前有通过语法匹配的技术来明确语义,但仍然有限。在目前的技术条件下,搜索引擎不能对信息内容作进一步的理解,实际上检索结果的相关性决定是比较主观的[11]。学者Hinman(2008)认为尽管搜索引擎直接篡改搜索结果很容易被发现,但是对严密的算法作微妙的调整导致搜索结果微妙的偏差实际上是不可能被发现的。
3.3 搜索引擎检索结果的显示方式
按照用户的请求,搜索引擎返回的结果列表的显要位置往往被付费的网站所占据,并且没有作出标识或没有作出明确的标识。这样在结果显示方式上发生了搜索引擎的第三个伦理议题:①购买结果排名本身就是一个引人注目的伦理问题,并且没有作出标注或者标注不明晰。研究表明,许多用户不知道付费排名的做法,这在某种程度上侵犯了用户的知情权。②即使作了明确标识,而这些付费的检索结果被放在用户眼睛最先到达的位置,带有明显的商业目的。
根据网站浏览视觉原理显示,用户浏览网页的视线运动轨迹呈“F”形状模式。F模式包括以下三方面的内容:①读者的眼睛首先是水平运动,常常是扫过网页内容的最上部分,形成了一条横向的运动轨迹。这是F字母的第一条横线。②读者的眼光略微下移,很典型地扫描比第一步范围较短的领域。这就画出了F字母中的第二条横线。③读者朝网页左边的部分进行垂直扫描。有时候,这个动作很慢且很有系统性,这样就画出了F字母中的一条竖线。网页的阅读模式和人们从学校里养成的读书习惯迥异,人们大多不由自主地以“F”字母形状的模式来阅读网页,并且读者的阅读行为在浏览不同性质的网站和肩负不同的阅读任务时都表现出恒定的习惯[12]。
宣称不影响结果公正性的搜索引擎的竞价排名,将结果放在搜索结果页的最顶端(如百度)和右边广告区(如谷歌)这些用户眼睛最先达到的地方,这种做法很明显是为了商业目的,这与前述的搜索引擎所承担的人类知识体系构建的社会责任不协调。
3.4 搜索引擎搜索个人信息所引起的隐私保护问题
搜索引擎作为网络信息定位工具,涉及的第四个伦理议题是个人信息隐私保护问题。通过搜索引擎人们很容易获取个人信息,这些个人信息有的是免费的公共记录,有的是存在商业数据库中通过搜索引擎定位要付少量费用才能得到的个人信息[13]。然而在很多情况下,这些信息的获取是没有经过被搜索人的同意的,被搜索者没有能力控制网络用户获取其个人信息。这就使得利用搜索引擎获取个人信息比获取其他主题信息更会引起个人隐私被侵犯的问题[14]。
3.4.1 公共领域个人信息的保护
尽管个人信息多种多样,但基本上可以将之划分为两种类型,即“非公共领域个人信息”(Non-Public Personal Information)和“公共领域个人信息”(Public Personal Information)。非公共领域个人信息是指敏感的(sensitive)或私密的(intimate)或两者兼而有之的信息,比如个人的财务和医疗历史记录,这类信息目前有政策和法律进行规范保护;公共领域个人信息在性质上是既不敏感也不私密的信息,如某人在哪上学和工作;其拥有的汽车的品牌;这些仅仅是作为特定的个人的信息,目前还没有像非公共领域信息那样受到保护,然而这些能在网上收集和交换的公共领域个人信息,引起了隐私权研究者的关注,并且认为这些信息应该享受比目前更多的法律和政策保护。Nissenbaum(1998)就指出人类面临着如何去保护公共领域的个人信息的挑战。
也许有人认为互联网上的个人信息是公共信息,不需要加以保护,但是从目前的多宗案例看出,借助于搜索引擎获取的个人信息引起了不少伦理问题甚至引发了刑事案件,尤其是一些信息经纪人(information brokers)在没有征得当事人同意的情况下,将网络深度搜索到的个人信息进行谋利,侵犯了当事人的隐私权[15]。所以探讨搜索引擎个人隐私保护问题是非常必要的,问题的关键是如何去保护的问题。正如著名的计算机伦理学家Moor(2004)指出的那样:“如果我们知道隐私领域(zones of privacy)和在什么情况下给哪些人提供哪些信息,那么我们就可以更好地保护我们的隐私”[16]。
3.4.2 搜索引擎搜索个人信息所引起的隐私问题
(1)搜索引擎搜索个人信息所引起的隐私担忧。对个人隐私的真正威胁可能更多地来自于企业而非政府,但是非政府机构对公众监视的行为常常被忽略。强大的经济力量正推动搜索引擎开发越来越复杂的用户跟踪工具。用户被跟踪是基于经济原因,利用个人资料,搜索引擎能够更好地预测特定用户感兴趣和将要购买的商品。
搜索引擎公司可以编辑出一幅幅详细得令人惊叹的个人活动图画!搜索历史(search history)是一个提供深度个人意愿的虚拟窗口。人们会小心谨慎地书写邮件和其他信息,但是在面对搜索引擎时,人们会尽可能真实地表达自己的信息需求。通过这些搜索记录,再结合其他信息源诸如信用卡购买记录、手机活动、e-mail、短信、汽车黑匣记录、政府和非政府的电视卫星通讯录像等等,就可以很容易地创建一个人一天的活动甚至大脑思考的详细画面。
(2)搜索引擎搜索个人信息的隐私保护对策。Moor的隐私理论可以为个人信息隐私保护政策的制定提供指导。Moor认为:“在个人免受他人入侵、干扰和信息获取的‘情况’(situation)下,个人隐私应该受保护”。Moor定义所指三种情况分别是:“入侵”(某人的个人事务)、“干扰”(某人的个人的决定)和“涉及获取某人信息”。那么利用计算机或网络“存储和获取个人信息”就符合Moor理论中的第三种情况。这三种情况构成了隐私的“区域”(zones),这也是规范意义上的私人区域。
根据Moor原则:“规范私人情况的条件和规则应该是明确并且对受他人影响的人来说是知晓的”,这就是隐私政策制定时“知情同意”原则的理论支持。即无论是搜索者还是被搜索者对个人信息的获取和被获取都必须是透明或者公开的。Moor的隐私理论可以为解决公共领域隐私问题提供指导,尤其适用于类似搜索引擎的网上活动。
综上所述,本文以搜索引擎的技术构成为基础,探讨了搜索引擎所引起的四个典型的伦理议题。搜索引擎作为知识新的“守门人”,动摇了人类长期以来形成的传统的知识构建的基础。搜索引擎对人类信息获取的控制,使得人类知识构建和传播被牢牢控制在私人手中,脱离了公众的视野和监督,这种情况会导致不同于以往任何历史时期的新的社会问题。搜索引擎检索结果相关性决定的客观性问题,且检索结果显示方式带有明显的商业目的,这些与其所承担的构建人类知识体系的社会责任不匹配,对此应该建立更加平等和更加包容的检索机制。搜索引擎搜索个人信息所引起的隐私保护问题,对此可以按照公共领域个人信息保护的原则来解决。