大数据时代开放GIS的机遇与障碍_gis论文

开放式GIS在大数据时代的机遇与障碍,本文主要内容关键词为:开放式论文,机遇论文,障碍论文,时代论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       中图分类号:P28; K90 文献标识码:A

       1 引言

       1968年,Roger Tomlinson第一次在文章中使用GIS(geographic information systems)这个术语(Star et al,1990);20年前,GIS研究团体在地理信息科学的旗帜下集结(Goodchild,1992);近10年来,GIS在各式各样的地理信息服务行业的应用经历了一个爆炸性的发展;如今GIS已走到了一个十字路口。不可否认,作为一个群体,GIS研究学者已经走了很长一段路,使GIS发展成为一门学科。用常规指标如学术期刊、教材、教学、研究资金、学术会议、专业机构等来衡量一个学科的发展,GIS正处于生机勃勃的良好时期,日益增长的跨学科研究人员正从理论和应用的角度在解决一系列挑战性的问题。我们的技术和制度环境在过去50年里经历了戏剧性的根本性变化,这对GIS发展起到了十分重要的作用。当然,在肯定成绩的同时,也应该看到未来发展还有很长的路要走。在2012夏季美国地理信息科学大学联盟(UCGIS)会上,Goodchild提到:“过去的只是开场白,所有已经发生的事情都只是为将要发生的搭建了一个舞台而已(Goodchild,2012)。”作为一个GIS研究群体,在过去50年里,我们已经为GIS搭建了一个新的舞台,在精心的策划下,在日益增长的全世界观众面前展示了自己。

       与Goodchild相呼应,Couclelis(2012)在2012年的演讲中指出,21世纪GIS的新里程到底是什么样的?GIS的应用和教学方面将会相应改变吗?在最近几年里,已有人广义地提出GIS在下一个发展阶段的多个期望:包括GIS 2.0/3.0、空间数据库GIS(Wright,2012a; Harvey,2013),实时GIS(Karnatak et al,2012; Richardson,2013),新地理学(Turner,2006),赛博GIS(Wang et al,2012),alt.GIS(Schuurman,2013),新阶段的数字地球(Goodchild et al,2012; Janowicz et a1,2012)及空间媒体(Elwood et al,2012),GIS平台(Dangermond,2013),地理网络和众包(众包的含义详见http://zh.wikipedia.org/wiki/%E4%BC%97%E5%8C%85)(Sui et al,2012),云GIS(Yang et al,2011),定性GIS(Cope et al,2009)和空间计算(CCC,2013; Duckham,2013)等。但是,GIS研究团体仍未阐明一个多维度的融合所有新成果的学科发展计划。我们仍然缺少一个升级的剧本来指导我们在这个有50年历史并且仍在不断壮大的舞台上继续表演。

       如果我们想保持进步的势头,并且让GIS在下一个50年中做到既智能又与我们的社会保持紧密联系,显然GIS科研与教育必须随着时代的变化而变化。本文的目的是讨论有关开放式GIS发展的前景,希望在多维度开放式GIS方面引发更进一步的讨论,将GIS融入更广阔的开放科学领域。作者认为,开放式GIS应当包含开放数据、软件、硬件、标准、研究合作、学术出版、资金援助以及教育学习。文章第1部分在通察开放式GIS整体框架的基础上,对GIS在不同方面的应用作一个总结,并且与下一阶段的开放式GIS发展相联系;第2部分将讨论新兴开放文化的组成元素和多维度的开放式GIS;第3部分会讨论开放式GIS给科研和教育带来的发展机遇;第4部分将对开放式GIS发展面临的障碍与挑战进行综合讨论;第5部分是总结和结论。

       2 新兴开放文化与开放式GIS的含义

       在软件开源和黑客的影响下(Levy,2001; Himanen,2001),过去20年里开放的含义已扩展得更为广泛(Aksulu et al,2010; Gobble,2012)。Willinsky(2005)指出,这些年我们见证了多个有关开放的尚未形成气候的举措,例如开源、开放存取和开放的科学。与开放相关的各种零散举措如今都在相互整合,形成新兴的开放文化(de Rosnay et al,2012)。更重要的是,新兴的开放文化正迅速从技术领域扩散到社会、政治和经济领域,表现为地区发展的透明化(openplans.org),商业公开(Huizingh,2011),行政公开(McDermott,2010; Nam,2012)以及点对点共享/共享消费(Botsman et al,2010)等。新兴的开放文化导致科学、商业、政治、教育甚至是娱乐的巨大变化与发展。

       开放并不是GIS研究团体新提出的概念。实际上,GIS研究团体在这个概念走红之前就已经开始实践开放式GIS(Hall et al,2008)。比如,GRASS GIS软件是根据source software development范式(范式的含义见http://zh.wikipedia.org/wiki/%E8%8C%83%E5%BC%8F)而开发的,尤其是在1997年之后(Jolma et al,2008; Rey,2009; Neteler et al,2008; Neteler et al,2012; http://grass.osgeo.org/history)。但是直到今天,GIS研究团体关于开放式GIS的承诺主要集中在开源软件的开发上。因为开源软件这一重要元素的加入,新兴的开放文化变得更为广义。关于开放式GIS的讨论不应仅仅局限在开源软件,而需要一个全面的框架,来迎接更为全面的GIS开放运动。本文通过结合关于“开放式GIS”的讨论与关于进一步拓展开放文化的倡议,来推进GIS在开放方向上的进步。

       开放科学的进步和推进开放范式所有相关的技术(Pordes et al,2008; Cribb et al,2010),已经大大丰富了开放对GIS的意义。综合最近关于开放方面举措的文献发现,开放的文化,尤其是开放的科学,都拥有丰富的含义,通常包括以下几个方面:开放的数据、软件、硬件、出版发行、研究、资金和教育学习。如果要把开放式GIS和开放文化的主题联系起来,开放式GIS将至少有如图1所示的8个维度。

      

       图1 开放GIS的8个维度

       Fig.1 Eight dimensions of Open GIS

       2.1 开放的数据

       数据不仅现在是,并且将长期是GIS科学发展遇到的瓶颈之一。开放数据的过程反映出人们在数据共享方面的努力,这当中一直强调要让数据变得可获得并且合法。然而,合法和可获得并不意味着数据就是可以使用的(除非是专业人员才能使用它),因此数据也往往没有得到真正的广泛应用。新的开放数据旨在让数据不仅仅合法、开放,而且可以提供开放的技术援助,从而让数据真正变得实用、可用、应用。

       虽然在科学界、政府和企业界的字典里,开放数据的确切含义也许并不相同,但是开放数据时,可建立两个通用的合理标准来规范我们的数据:易获得性(每一个小地区的数据都具备)和可评估性(数据质量和可靠性可进行评估)。让越来越多的时空数据(从地区到全球)做到对全世界开放,这将在极大的程度上促进GIS在研究领域、教育领域、应用程序开发领域的成功。G8会议签署了《开放数据法案》,这一举动的目标在于让官方数据变得易于获得,从而保证公开透明并且鼓励创新(Eaves,2013)。所有的G8国家都同意遵守下面的5项原则来保证开放数据的成功实现:①同意开放;②保证数量和质量;③可为所有用户使用;④以改善管理为目标;⑤以促进创新为目标。英国(www.theodi.org)和美国(www.opendatanow.com)对此都制定了详细的政策,一些商业和科研组织也制定了相应的协议(Hürlimann et al,2011)。

       2.2 开源软件

       开源软件或许是开放式GIS最成功的一个方面(Aksulu et al,2010)。开放文化最早的驱动力之一就来自于开源软件——针对任何领域的任何专业软件的源代码都可以公开。实际上,开源软件也是开放科学的驱动力以及方法论之一。Steiniger等(2012)指出,目前自由和开放的软件工具在空间数据处理方面的功能不亚于商业软件,尤其在其先进的空间分析功能方面(Bivand,2011)。在线地图也给GIS使用者提供了更多的灵活手段来实现地理信息可视化(Peterson,2012)。这不仅仅是自由软件和商业软件相竞争的问题,开源软件运动已被证实具有缩短开发周期从而满足用户需要的能力,因为人人可通过网上的交互参与软件改进,使得软件的改进速度变得相当快。

       2006年以来,地理空间开源自由软件(FOSS4G)会议一直致力于推广开源自由的软件(foss4g.org)。尽管开源和自由看起来相互联系而且有所相通,但实际上二者是两个不同的概念。Stallman(2009)甚至坚持认为,开源不是要点,比起开放,自由才是关键词。自由的软件里,用户可以改变、公开源代码。这方面目前已经有了多个许可协议,比如MPL,MIT,Apache,GPL和BSD。这些不同的许可协议规范着不同程度上的源代码开放、免税、义务共享以及使用者和开发者之间的商业利益问题(Gangadharan et al,2009; Walt et al,2012)。网络平台诸如RunMyCode.org已经极大地促进了软件开源运动。

       2.3 开放的硬件/计算平台

       开放硬件在开放GIS的情况下有两个特定的含义。首先,它指的是开源硬件装备的GIS用户可以下载需要的信息来建立他们自己的设备进行地理数据收集或处理。例如,安装在风筝上放飞到空中,用来收集空气质量信息的传感器(www.f-l-o-a-t.com)称为Arduino(http://www.arduino.cc)。其次,GIS操作不再局限于一个单独计算平台或硬件设备,相反,在精简客户机和庞大服务器的模式下,地理信息通过不同的计算平台来访问和处理问题,这些平台涵盖范围极广——从谷歌眼镜、智能手机、iPad、超级迷你机、传统笔记本/台式机,到当地服务器端局域网、工作站、电脑主机、超级云计算机(The Royal Society,2012; Yang et al,2013)等。

       开放的硬件也依赖于许可协议,正如开源软件需要开发协议一样。近年来,开放的科学网格(Pordes et al,2008)、开放云计算(Nelson,2009)、开放分布式处理(Dunfey et al,2006; Linington et al,2011)、开放存取网格(Sivaraman et al,2012)和开放系统架构(Walt et al,2012)有可能成为开放GIS的新计算平台。“开放计算项目”成本极低,因为它可以访问每一台个人电脑,从中利用巨大的云计算资源,并且可以控制不同程度的开放,进行最佳的高性能计算。综上所述,开放的硬件与开放的设计是密切相关的。

       2.4 开放的标准

       要做到数据开放,软硬件工作的无缝结合是一个必要前提,所有的供应商都应该执行同一套标准。建立于1994年的Open Geospatial财团(OGC)(曾经的开放式GIS财团),在实现数据、软件、硬件的互操作性空间数据处理上起到了一个关键的作用(OpenGeospatial.org)。在过去20年里,OGC在制定开放标准、促进实现跨平台互操作方面担任着领袖的角色。OGC一直在努力协调工业、政府、学术界联合起来,制定开放标准支持地理信息的研究、软件的开发以及一系列地理服务。OGC在制定开放标准方面已经创建了很多里程碑。例如,起草了开放式GIS软件的两个关键规则:①执行操作的规范,为共享和集成不同地理空间信息的特征数据和图片提供标准;②目录规范,为网络上地理空间数据的发掘和公开提供标准。2012年OGC公布了56条执行标准,以便在行业里实现互操作(Percivall,2010)。

       随着越来越多的电子数据由于各种各样的目的而被收集,人们对标准的需要也日益增加。但是这样的标准,应该是开放的、动态的,随时与技术的进步和用户的需求相同步。如果做不到及时跟进,那么GIS在访问、集成、开发方面根本不可能做到开放。OGC在城市方面的GML(地理标记语言)已经被用来指导柏林的城市开发。OGC的Water ML2.0(可理解为关于水的标准)作为GML 3.2.1的一个调试程序而开发出来,它是现场水文观测数据的真实反映,这一点已经得到证实。

       2.5 开放的科研

       开放文化的影响力正在日益扩大,在这样一种环境下,GIS科研也应该被开放科学的理念所引导。开放科研也被称为网络科研,正在变得越来越受欢迎(Nielsen,2012)。最近的开放科学峰会(opensciencesummit.com)显示,在不同的科学领域——从数学(the Polymath Project)、天文学(Galaxy Zoo,Sloan Digital Sky Survey)、地理学(the OneGeology Project),到环境科学(Water Keeper,Global Community Monitoring)、健康学、医药学(the HapMap Project,CURE Together)——激动人心的进步每天都在出现。

       在开放科学中,各学科之间的影响力日益加强,代表了一个广泛的、潜在的变革趋势。虽然开放科学的精确含义在不同科学的理论和实践中各不相同,但Gezelter(2009)认为,开放科学的两大本质特征分别为:学术合作在网络工具支持下不断增长和研究方法日趋透明公开(例如在收集、占有、分析、制图、可视化、数据监控等方面)。开放科学的范式作为当代科研事业的重要特征之一(Cribb et al,2010)一直受到推崇,它在多个学科上都有着极大的动力,尤其是物理学和通过制图与GIS来研究的地理学。开放科学实现之后,我们不仅可以披露科学数据和方法(包括算法,工具和软件版本等)的出处,也可以通过自己的重复验证,来检验其真伪。相反,短视利益驱动下的封闭研究方法,将会导致大量的资源浪费。

       2.6 开放的出版

       开放文化颠覆了传统出版流程。想要加快推进开放出版,就要让出版物能够进行公开审查,而且容易获得。不同于传统单盲或双盲的同行评审只有少数专业人士参与,开放审查意味着专业人士和对该领域有研究兴趣的非专业人士都可参与审查(Kriegeskorte,2009)。出版就像知识本身,需要不断地有强者加入,让出版物经过多次纠正淘汰。有学者提出一个更加雄心勃勃的提议——让研究数据、分析、结果、结论实时公开,让研究活起来,从而让相关团体内可以保持实时的对话合作(Ahlqvist et al,2011)。

       开放出版的另一个维度是开放获取,也就是让学术文献可以免费获得。在过去的岁月里,公众和学术界对大多数由公众资金资助、有偿订阅获得信息的研究表示无法忍受。开放存取被公认为一种黄金模式。想要把成果对公众公开,作者们可以选择在开放期刊上发表文章。出版商要求作者(以及他们的资助机构)支付文章的处理费用而让其文章免费向人们展示(Finch,2012)。自存档,又名绿色开放存取,指在一个机构或者主题库存储文章。计算机科学家们在20世纪80年代就开创了FTP本地档案,1994年Harnad首次提出开放地读取本地自存档,现已有超过50个机构管理开放出版的许可证和内容。在GIS领域,开放出版通常需要以允许数据公开被复制以及被持续研究为前提。Jiang(2011)的关于数据密集型地理空间计算的特刊实现了让所有的数据在线使用。

       2.7 开放的资金

       开放文化改变了科研的资金募集机制。开放资金,也就是众包集资,其实是一个很简单的原理——人人出资,积少成多。开放资金机制通过互联网号召,聚集一大群人出资,每个人贡献微小但积少成多,而不是像过去那样,通过撰写文书向一家赞助商要求大金额资助。奥巴马2008年的当选证明了群众集资在政治运动中的作用(Lawton et al,2012)。开放集资最初在艺术和商业界的成功给了人们很大的鼓舞,对其在科学上的应用充满了信心(Wheat et al,2012; Johnson,2013)。

       一般来说,开放资金拥有如下3个模型:①捐赠模型。捐赠者不图回报,不求功利地向一个项目进行捐助;②奖励模型。捐赠者将获得非物质的奖励和表彰;③股权模式。如果项目拥有发展的潜力并且确实获利,参股者将会得到相应的分红。

       各种网络平台被开发用来实现集资计划,其中有的是通用平台,如Indiegogo(www.indiegogo.com),Kickstarter(www.kickstarter.com),Rockethub(www.rockethub.com);也有专门为学术资金筹集而搭建的平台,如Microryza(www.microryza.com),Petridish(www.petridish.org),SciFund Challenge(www.scifundchallenge.org)等。

       对开放的集资机制仍处在探索中,近年在科研领域尤其是基础科学研究方面,群众集资仍将不能取代政府出资,但这肯定是一个有潜力的项目。GIS研究团体应努力探索群众集资机制,来弥补传统集资模式的不足。

       2.8 开放的教育学习

       开放式GIS同样需要我们努力开创开放教育模式来教育和训练下一代GIS研究者、开发者和了解空间信息的公民。随着麻省理工大学的开放课程和MOOCs(Massive Open Online Course,大规模开放教育网站)越来越受欢迎,开放教育风行一时。作为先例,在线教育的大学和中小学课程一应俱全(Hegarty et al,2012),供应量和需求量都极为巨大。同样,GIS技能和思维的普及也可以通过网络进行。Robinson在大规模开放教育网站上公开了“地图和地理空间的革命”课程,并通过“课程时代”网(https://www.coursera.org/#course/maps)演示了未来开放式GIS在线教育的巨大潜力。开放教育不只是在线上课(Peters,2009),它还意味着孕育一种新的学术氛围,看重开放的科学,注重开放的实践。要做到这些,我们必须建设新的网络基础设施,以便推进和无缝对接各种学术实践。更为重要的是学者个人和学术社交网站,如Open Scholar(openscholar.harvard.edu)、维基学院、大众百科等,它们可以推进基于开放科学和开放出版的进一步开放、共享和学者间协作。但公共知识分子是否能够在实时奖励(Burton,2009)的激励下进行开放式创新(Nam,2012),并成为普及教育的学者仍有待观察。

       3 开放式GIS的机遇

       新兴的开放文化将会急速地改变游戏规则,并对技术发展、科学研究、商业实践、政府决策,甚至是个人消费产生极其深远的影响。开放式GIS范式提供了解决GIS问题的最好答案之一,如在解决最优决策和智能功能方面。开放式GIS的机遇至少体现在以下4个方面(图2):①技术发展。技术的发展与突破可解决空间上的海量数据所带来的问题;②应用开发。主要是用于集体或个人决策的应用程序的开发;③好奇心驱使下全民参与的机会。地理科学可以发展成一种开放性的全民科学,人们将对我们日益变化的地球增进了解;④教育的机遇。将通过开放式GIS更好地实现在线教育。

      

       图2 开放式GIS的机遇与阻碍

       Fig.2 Opportunities and impediments for Open GIS

       3.1 开放式GIS和空间大数据

       随着数据数量、种类和更新速度的日益增长,大数据洪潮开始影响社会的每一个角落,而地理空间数据是数据洪流的重要组成部分。通用的地理空间信息和专用的自发地理空间信息(VGI,Volunteered Geographic Information)是讨论大数据时首先应考虑到的。众包和大数据极大地改变了GIS领域的现状。麦肯锡报告(Manyika et al,2011)指出,“个人位置数据”已成为5个主要大数据流之一,每天大约有6000亿个事项被处理,每年全球都会有各种移动设备传输大约1 PB(1024[2] GB)的数据。单个人位置数据就会给服务商带来1000亿美元的收入,而个人终端带来的总收入为7000亿美元(Manyika et al,2011)。其他4个大数据分别是:个人健康数据、公共管理数据、制造业数据、地理位点标记数据。地理空间数据不仅仅是大数据的一个重要组成部分,更在慢慢占据整个大数据而成为大数据本身。对地理空间研究者而言,大数据不仅仅代表着商机(Francica,2011),更代表着科技上的挑战,这将会是一项关系到人类(从个人到集体的水平)和环境(从地区到全球的尺度)的开创性研究(Hayes,2012)。

       最近的GIS会议和研习会讨论的关于大数据的问题包括:①哪种类型的大数据可以为GIS研究者和使用者所接受和评价;②如何评估大数据的质量,以及大数据的不确定性会带来怎样的问题;③要怎样的计算机基础设施来解决大数据问题;④大数据会给GIS带来什么样的问题,大数据时代的主导理论是什么;⑤怎样才能最好地加强大数据方面的研究。

       要高效地解决这些由大数据带来的具有挑战性的问题,开放式GIS范式的概念提供了最佳途径。开放数据和开放标准给了我们大数据的可访问性和质量标准的规范。虽然离目标仍然很远,但至少我们知道让大数据合法地公开是毋庸置疑的第一步,不这样做,所有设想都是空谈。在“V”(variety)原则的大数据中,分类也许是最困扰我们的问题,因为数据总是有着不同的类型(照片、视频、音频、文本、地图、野外测量、仿真模拟等),可以来自各种组织(政府、军队、非政府组织等),数据贡献者的目的也各不相同。大数据洪流如果符合开放标准,那么它将变得更为强大实用。解决大数据问题有3大力量——公众、社会和强大的地理方法,但一切都取决于开放(Goodchild,2012)。G8峰会对数据开放的倡议中提到,世界银行在其数据公开上首创性的努力(data.worldbank.org),以及白宫对各联邦机构开放数据的委托(OpenDataNow.com),都是解决大数据问题的重要步骤。

       开放大数据是十分必要的一步,此外,还需要新的计算机基础设施并且配备最好的软硬件。开放式GIS范式也是该问题的最佳解决办法。Wright(2012b)认为,针对大数据,大多数GIS算法需要重新编写。然而,开源和自由访问为软件开发提供了最有效率的途径,不必一切从头开始,而可通过改进大量自由和开放的软件工具实现(Steiniger et al,2012)。这些软件来自提供数据和图像的网络地图(如mapserver.org,geoserver.org)、能够获取数据的Web GIS(52north.org,zooproject.org)、数据储存系统DBMS(postgis.refractions.net,mysql.com)、注册元数据的软件(geonetwork-opensource.org,wiki.deegree.org)、获取和分析数据的桌面GIS端(qgis.org,openjump.org)、基于浏览器的Web GIS开发包(openlayers.org,openscales.org,mapbender.org)(

et al,2012),以及Geo-Linux(Brovelli et al,2012)等。

       此外,空间地理信息平台也是解决大数据问题的很重要环节(Linington et al,2011)。空间地理信息平台与联邦政府机构之间形成了基于公共数据、公共服务和应用程序的伙伴关系。从技术上来说,这些都是通过GeoCloud提议实现的,它让政府机构得以访问Amazon EC2云托管数据中心并获取开源或商业的地理空间服务。虽然目前仍处于早期开发阶段,但地理空间平台在它的架构上实现了合理的开放,能够促进大数据问题解决以及对分析功能和通信协议的需求。

       要想提升分析综合的能力,需跨越学科界限采用更全面的办法。新空间网络基础设施将进一步关注未来GIS研究上的合作性,这将在促进技术进步的同时衍生出严格的新理论。如2007年科学家发现生产数据的能力已超过储存能力(NRC,2009),近年来受DNA编码启发而开发的新编码方式已受到广泛关注(Hotz,2012)。未来应继续努力为开放式GIS范式开发新编码方式,以便为数据洪流创造一条诺亚方舟。奥巴马政府针对大数据洪流的新举措将会有利于促成其实现(http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_release.pdf)。

       3.2 开放式GIS和新应用程序在个人和集体决策中的应用

       Validating Peter Gould(1999)曾预测,即将有一个空间时代到来,空间大数据洪流不仅可使地理信息无所不在,也促使人们更加认可地理学,明白了它一直被忽视的重要地位。更胜于以往的是,地理空间信息在个体和集体决策中都将起到重大作用。过去20年间,全球定位系统、地理信息系统、遥感、基于位置的服务、射频识别等的使用让人类有能力用从基因水平到全球水平的眼光来了解事物。网络技术让空间信息能够被储存、访问和应用,数据的处理还可以通过各种云平台被分解。地理信息无所不在,通过网络、照片、视频、博客,人们做每一件事情的时候可以标记自己的位置,整个网络都成为了地理信息和地理知识的来源。同时,利用最先进的室内导航,GIS也终将在室内占据一席之地(人们有85%的时间在室内度过)。从个体水平来说,人们可以知道从家去上班走样走才合适,去哪里吃饭、购物比较划算。从集体水平来说,政策制定者要考虑到一些世界性问题,需要认识到空间和位置对于决策的重大意义。World Bank(2009)从地理的角度完全地否定了世界发展报告,认为减轻并最终解决贫困的首要举措是改变世界经济地理格局。Kaplan(2012)提醒美国的外交政策制定者,阿富汗和伊拉克问题上也要运用地理手段帮助决策,以免五角大楼的悲剧重演。

       实际上,我们见证了空间时代的到来,地理空间信息和观点在决策中不可或缺。许多全球挑战性问题如全球经济危机、贫困问题、全球气候变暖等,离开地理方法就得不到解决。从这个意义上说,空间时代的到来是一场革命(http://geospatialrevolution.psu.edu)。GIS的运用方面,只要敢想,就能做到。继街景地图(Sui et al,2012)的非凡成功以来,开放式GIS取得了很多激动人心的进步。特别值得注意的是在应急处理和减灾领域,已有Ushahidi、InRelief、Sahana和Crisis Commons这些重要的减灾软件,它们的运转都是基于自愿公开的地理信息、开放自由的软件工具、云平台以及专家和民间学者的合作(Hürlimann et al,2011; Karnatak et al,2012; Radinger et al,2013)。这些新的发展,某种程度上也鼓励着政府更加公开和透明;更多的地理信息编码数据可以在线获取(e.g.geo.data.gov),而政府后援的平台也在努力支持这一发展(www.geoplatform.gov)。

       3.3 让每个人了解地球的全民科学

       开放式GIS下一阶段的发展是全民科学,对不断变化的地球的研究将成为一门全民参与的学科,群众的兴趣和好奇心将给开放式GIS和地理学带来理论的更大发展。

       2010年美国国家研究委员会“了解我们不断改变的星球:地理科学的战略方向”的报道是精辟的总结。报道用11个战略问题给下一个阶段的地理科学以全新的定义(见表1)。

      

       如表1所示,11个战略方向中的9个与GIS密切相关,为开放式GIS尤其是其开放研究合作维度带来了发展机遇。开放式GIS在科学方向上的机遇极有可能促进开放科学和全民科普的完美结合,进而使全民地理科学的实践成为可能。

       工程学、社会学、人文学上的跨学科学者在其研究中正在越来越关注地理学(Scholten et al,2009)。近年来,数学家、物理学家、计算机科学家和生态学家加入了复杂网络分析、可视化分析和空间建模,给GIS研究者带来了一个与其他学科融合的黄金机会。地理空间的研究成为了各门学科相整合的研究主题,新兴的空间社会科学(www.csiss.org)就是极其有力的证据。经济学家Krugman因其在经济地理学的突出成就被授予2008年诺贝尔奖。人文科学方面的跨学科研究也成为GIS和空间分析研究方法的组成部分(Knowles,2008; Warf et al,2008; Bodenhamer et al,2010)。GIS带来了如何最广泛运用开放科学的架构。

       除了学者,近10年来地理空间技术的进步使未经专业培训的普通公民也能加入地理数据和知识的生产中,自己生成或自发采集地理信息。这样的举措包括开放街景,即通过拼接公民自愿贡献的数据构建全球地图;维基地图目的是建立一个总结世界各地特点的“世界目录”;在“让我们一起来描绘世界”这一宣言的号召下,成千上万的Google Earth插件被世界各地的个体用户开发出来;一款叫做Geonames的数据库能够让人们通过维基百科条目对空间信息进行访问。开放科学和全民科学导致大数据的产生,也彻底改变了我们看问题的方式,让我们对地球的变化有更好的理解(Dickinson et al,2012)。

       3.4 开放式GIS和空间思维教育的前景

       空间时代的到来对公众和决策者的空间思维和地理素养都提出了更高的要求。显然,提高全民科学素养,这是地理学科爱好者和GIS研究团体的责任,特别是推动地理科学的终身教育培训。大西洋两岸的教育者已经开始了一个开创性的工作(如http://www.visualspatial.org,http://www.spatial-literacy.org,http://teachingspatial.org)。更具雄心的是ESRI的“空间思维教育”项目,他们旨在让高等教育院校把空间思维教育当作一个关键的教育目标,并且最大化地挖掘地理空间数据的利用潜力。ESRI(2013)认为空间思维教育须具备以下4个特征:①贯穿课程的空间思维能力培养。空间思维正变得越来越重要,学生们需要更加重视才能让自己研究生阶段的学术更为成功。因此,空间思维需要与大学课程紧密相结合。②地理学人才培养。高等院校应该提供更高阶的、以实践为目标的本科生和研究生课程,让学生能够胜任地理科学方面的职业。③以地理为工具的研究。空间思维教育应该传授各个学科的知识并且跟进以地理空间技术为基础实现的跨学科研究。④基于GIS的智能校园。校园应当具备一些GIS基础设施来支持校园的规划、运行、维护和可持续发展。实际上,NRC报告和DOLETA的胜任力模型在推广宣传GIS和空间技术中起到了重大作用,很多年轻人才曾受此吸引。

       GIS领域和地理学在近年有了重大变化。一个具有战略意义的想法是,地理空间研究者应该继续思考一下GIS方面的教育,这不仅是为了提高今后地理产业的人才素养,更是为了让空间思维成为自由教育和公民科学素质中不可或缺的部分。开放式GIS范式将大大促进空间思维教育的实现,这方面的代表者有加州大学圣巴巴拉分校(spatial.ucsb.edu)和明尼苏达大学(uspatial.umn.edu; Harvey et al,2013)。

       4 开放式GIS的障碍

       新兴的开放文化和历史与其他很多有益的人类活动一样,突破层层阻挠并取得惊人发展,其潜能是不可被低估的。但这样的发展也有可能带来意想不到的后果,但可以通过开放准则来规范我们的研究与教育;同时也必须认识到开放规范在某些具体问题上有其局限性,仍然会在多个领域遇到很多亟待解决的问题和挑战。GIS研究团体需要针对这些挑战与障碍展开一次更为广泛的对话。

       4.1 学术文化和奖励制度

       对学者来说,学术文化的惯性和现有的奖励机制并不利于开放规范在个人或机构中的实行和发展。虽然很多人会默认开放的研究(Bailey et al,2013),但一些学者仍然不愿接受“开放科学”尤其是分享他们的数据,因为害怕被窃取和误用。Fernandez(2010)总结了学者们不愿分享研究的5大原因:①不会得到回报;②对将来的论文出版不利;③对手可能从中渔利;④需要时间储存、清理、管理;⑤要为用户处理问题。Thursby等(2009)调查了1694名生物科学家,以比较身处学术界和产业界的科学家的异同,并使用社会资本理论来解释为什么人与人之间倾向于选择有偿的交易而非共享。Thursby等(2009)发现共享的可能性随着信息价值的降低而降低,预期的互惠和科学家团体是否符合开放科学标准也影响了信息共享。开放和封闭的优缺点正如囚徒困境(囚徒困境是博弈论的一种模型)。在开放科学中,人与人之间的信任是异常重要的(de Laat,2010)。学者之间的信任危机或许来自于奖励体制所带来的激烈竞争,这是开放式GIS发展面临的一个重大障碍。

       对于学术界而言,当前的学术奖励机制是青睐应用科学的,而且又往往是针对个人成就,导致开放科学的精神经常受冷遇。因此需要有新的规章来测评和奖励开放研究合作。在GIS领域,Rey(2009)认为,软件开发并没有像刊物出版那样得到重视,尽管在很多学科(统计学、计算机科学)中人们普遍认为软件代码才是科研的核心,论文只是为其作介绍推广而已。Rey(2012)和Mitasova(2012)发现,正是贡献者和使用者之间的不公平,导致FOSS4G团体中大多数人都希望自己是使用者而非贡献者。

       显然开放科学并不适用于所有的学科和领域。开放科学中,集体合作、集思广益是相当重要的,还需要注意众包和开放科学的群体中个人的积极性和个性是否能保持,否则这可能成为另一个障碍(Lanier,2010)。为了推进开放科学,奖励机制亟待改革,也须反思怎样改进科研基础设施,以促进非传统的多样化科学的发展。这是集体一个人合作的新模式从纸上走向现实的唯一方法(von Hippel et al,2003)。

       4.2 现有的知识产权法律

       除了学术文化和奖励机制的问题,法律障碍也不可小觑。法律学者Lessig批判这个开创新的开放科学为知识产权共产主义,其实质就是非盈利版权和知识共享。事实上法律仍然更倾向于支持封闭而非开放。美国法律的知识产权条款有两个特权:①著作权。在一定时期内保护创作者对其原创作品的专有权;②专利法。针对他们发现发明的成果,给发明者以有限的专利权(Stodden,2014)。

       现存法律(主要是涉及版权和专利的法律)为保护科学的发展,禁止完整泄露数据和代码。现有的版权法给作者以及他的作品以专利权。那么,开放授权和广泛使用作为新出现的科学发展趋势,应该也予以立法。科学知识应该作为社会公益被推广。在共享科学方面,版权法可以通过这两个关键点入手打击侵权:①禁止彻头彻尾的学术抄袭;②对原有作品基础上的派生作品同样保护所有权。

       除版权法和专利法,商业机密法也一直保护着商业和工业机密。这些合法保护包括保密协议(NDA)和反垄断法。与版权法和专利法不同的是,版权法和专利法在一个特定的时间内保护所有权,而企业和个人要无限期地保存秘密。Stodden(2009,2014)一直提倡“可验证的研究标准”(reproducible research standards,RRS),鼓励在科学研究上撤销版权法,因为这妨碍了科学家分享重要成果。

       作为规模日益庞大的共享经济(又名点对点共享)不可分割的一部分,开放、开源成为了新的经济范式(Perens,2005),开放和封闭的界限也在一点点改变,这取决于多个因素,不能一概而论(Dahlander et al,2010; Simeth et al,2013)。公司往往在入站处理(通过采购和获取)和出站处理(通过分发和销售)方面做到一定的开放,各取所需。对商业人员来说,当“开放自由”这个新局面慢慢变成现实时,需要构想一个新的商业模式来赢得市场和利润(Bryce et al,2011)。Shirky(2011)发现,科学技术已经让消费者变得越来越像合作者了。

       4.3 社会/政治阻碍和变化的权利关系

       社会政治氛围和个人或组织对开放式GIS的执行程度将有可能是开放式GIS发展面临的重大障碍,尤其是处理一些与保密性和安全性有关的、有争议的敏感议题时(Crampton et al,2013)。早期的奥巴马政府主动提出了政要公开化的议程(Ginsberg et al,2012),造成了泄密网站的爆炸性增长(http://www.whistleblowers.org)。泄密网站中的大多数依靠Web 2.0技术作为平台。GlobaLeaks是一个开源的项目,目的在于建立一个全世界范围的匿名、抗审查分布式检举的平台。Julian Assange创办的维基解密(wikileaks),后来变成了OpenLeaks,一个公开泄密网站。受到wikileaks影响,奥巴马政府正在重新评估其政要开放计划,重新定义公开内容和机密之间的界限(Greenwald,2012)。这也引发了政治界和学界针对公开、保密孰优孰劣的一系列讨论(Birchall,2011)。鉴于斯诺登的案例,美国政府机构正在让更多的步骤和程序走向保密而非公开。事实上,美国政府把更多的钱都花在了保证安全(目的在于绝对的保密)而不是这方面的科学研究上(目的在于合适的公开)。

       斯诺登案例进一步揭示了社会权利结构的另一个微妙转变——私营部门究竟知道普通公民的多少秘密细节?这引发了关于个人隐私的新的讨论。但是,每天似乎都有数以百万计的消费者被大量免费开放的网络应用吸引,有意无意地通过这些应用“自愿地”泄露了自己的关键信息。重新受到重视的关于保护隐私的讨论并不一定会减慢信息公开化的脚步和缩小它的价值(Posner,2013),但是,在促进信息更加公开化从而提高经济效益、促进社会公平、保证可持续发展的方面,它们确实制造了意想不到的障碍。

       企业巨头常常使用开放范式提供免费的公共服务,因而具有收集大量数据的能力,有些大企业比政府掌握更多的公民信息。这是权力关系上的一个微妙转变,或许会带来网络被大公司割据而不是被交互平台控制的局面。

       4.4 环境威胁与可持续发展的目标

       探讨一下新兴的开放文化的环境影响,更具体地说,开放运动真的会是绿色的吗?如果不是,我们需要多作一些什么来普及开放科学并且让开放式GIS做到非常绿色环保呢?共享经济的新趋势包括有着日益增加的共享消费(Botsman et al,2010),一个利用Web2.0、智能手机和社会媒体实现高速增长的模式。共享经济的价值观和实践在经济衰退的发达国家更受到普遍欢迎。除了已十分完善的网站如易趣、Craigslist、阿里巴巴等,很多有信誉的新兴网上平台在发展,人们可在此进行全新或二手商品、服务等方面的交易。共享经济方面的领头羊——度假短租网站Airbnb、汽车共享网站RelayRides和差事服务网Task Rabbit等,都通过利用社会媒介打造社会关系和建立信誉从而获得了成功(Barros,2013)。

       在日益明显的共享消费趋势下,现有3个公认的观点:①对产品的使用权比实际拥有更重要。按照传统消费模式,产品的价值是在使用它而不是占它的时候体现的;②产品日益增加的接受程度,一部分归功于能够自由买卖产品的在线平台。超距离实现再利用,点对点实现回收深受消费者的认可;③更广泛地说,除了在商品生产和使用方面之外,人们也采用互相合作的生活方式,共享他们的热情、时间、空间和专业技术。

       作为新兴的开放文化的一部分,我们需要警惕GIS潜在的环境威胁,努力运用开放式GIS来实现持续发展目标。在了解清楚什么是潜在威胁之前,开放式GIS作为绿色实践所进行的任何推广都有可能是不成熟的。Barros(2013)认为,作为发展中国家的共享消费的结果,各行各业将出现一个全新的商业模式,金砖四国增长的人口和扩大的中产阶级将给环境带来压力。

       5 总结

       GIS经历了50年的发展,所取得的成就是有目共睹的,但社会环境和技术环境在过去50年中经历了巨大的变迁,GIS正走到了一个十字路口。在曾经的岁月里,集聚和分散的力量同时存在于改进GIS的过程中。未来5年将是GIS在下一个阶段发展的关键。本文讨论了传统的GIS应如何适应这个多元文化的世界。开放式GIS应成为GIS行业发展的驱动力。通过最大限度地融合多元文化,开放式GIS将包含开放的数据、软件,硬件、规范、研究合作、出版发行、资金支持、教育学习。开放式GIS为我们提供了最好的期望,让我们能够从容承担大数据的挑战——巨大的数据量,对地球变化的了解,全民科普的实现,并对空间思维教育的设想进行具体实施。此后这些与技术、程序应用、科学思想以及教育相关的机遇将会驱使GIS达到一个新的高度。但是我们也必须警惕GIS发展道路上直面的学术、法律、政治、环境上的各种障碍。

       虽为开放科学(尤其是开放式GIS)的追捧者,但我们认为开源和自由不是我们专业所面临的一切问题的灵丹妙药。和经济合作体类似,所有权(版权、专利,IP信息)和开放性的结合是我们发展道路上的重要任务,而单凭开放式GIS也无法解决GIS研究团体中存在的所有问题。随着开放GIS的进步,一个混合的模式——在商业、应用程序、科研方面既保证GIS的开放性又保证其所有性的模式,将是最实际的选择。尽管两者的联系与平衡极大地取决于社会、政治和技术条件,但开放式GIS必定是一条前途光明的道路,能够让GIS经历一次解放,最终成为一门自由开放的技术(Diamond et al,2012)。

       致谢:本文主体内容以英文形式发表于Transaction in GIS 2014年第1期(Sui,2014),为了中文读者的需要,进行了大幅度调整和修订:同时,从原出版商Wiley公司取得了在《地理科学进展》发表本文的授权。感谢Bo Zhao、Xining Yang、Samuel Kay和Shelly Li等对本文的贡献。

       收稿日期:2014-05;修订日期:2014-05。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

大数据时代开放GIS的机遇与障碍_gis论文
下载Doc文档

猜你喜欢