杨斌
济南市规划设计研究院 250000
摘要:大数据在生态环境领域的应用尚在起步阶段,还存在诸多挑战,如何合理地开发、利用和保护大数据这一紧要的战略资源,从中挖掘出有价值的信息,提高生态环境领域的科学研究水平,需要人们探索认知的空间还很大,需要不断地探索发现。通过促进大数据在生态环境领域的应用,最终实现生态环境决策管理定量化、精细化,生态环境信息服务多样化、专业化和智能化,为中国社会经济可持续发展和生态文明建设奠定基础。
关键词:大数据;生态环境领域;应用;展望
1大数据概述
虽然各国都在积极准备迎接大数据时代的到来,但国内外关于大数据的定义、内涵和标准还没有达成统一认识。根据对大数据定义不同的侧重点,我们可以将其分为三类:第一类定义主要突出“大”,例如麦肯锡、IDC、亚马逊、维基百科等,“大”只是大数据的重要标志之一,但并不是全部。第二类定义主要是突出其“作用”,认为大数据是在多样或者大量数据中,迅速获取信息的能力,与第一类只从数据本身出发不同,该类定义强调大数据的功能和作用。第三类定义主要突出其“价值观和方法论”,认为大数据是用崭新的思维和技术对海量数据进行整合分析,从中发现新的知识和价值,带来“大知识”、“大科技”、“大利润”和“大发展”。但随着全球数据的飞速增长,除了包含传统的结构化数据,还产生大量非结构化数据和半结构化数据,这就需要大量处理技术来处理这些不同结构的数据,并将它们应用在实践中。因此,大数据不仅仅包含海量数据,还应包括各种大数据技术的集合和大数据在各种领域的应用。综合以上信息,我们认为大数据是为决策问题提供服务的大数据集、大数据技术和大数据应用的总称。
目前对大数据普遍认可的是其具有以下“5V”特点。第一,数据量巨大(Volume)。通过各种设备产生的海量数据,规模庞大,数据量从TB级别跳跃到PB级别。第二,数据种类繁多(Variety)。数据来源种类多样化,不仅包括传统结构化数据,还包括各种非结构化数据和半结构化数据,而且非结构化数据所占比例越来越高。第三,大数据的“快”(Velocity),包括数据产生快和具备快速实时的数据处理能力两个层面。第一层面是数据产生的快。目前有的数据是爆发式产生,例如,欧洲核子研究中心的大型强子对撞机在工作状态下每秒产生PB级的数据;有的数据是涓涓细流式产生,但是由于用户众多,短时间内产生的数据量依然非常庞大,例如,点击流、日志、射频识别数据、GPS(全球定位系统)位置信息。第二层面是对数据快速、实时处理的能力高。大数据技术通过发展不同于传统的快速处理的算法,对海量动态数据进行处理分析,使它们变为可使用的有价值数据。因此,大数据对实时处理有着较高的要求,数据的处理效率就决定着获得信息的能力。第四,数据价值密度低、应用价值高(Value)。大量不同数据集组成大数据集,这些数据集的价值密度的高低与数据集总量的大小成反比。在大数据应用中,数据量大的数据并不一定有很大的价值,不能被及时有效处理分析的数据也没有很大的应用价值。第五,真实性低(Veracity)。随着社交数据、企业内容、交易与应用数据等新数据源的兴起,我们能获得的数据源逐渐多样化,这使得获得的数据中有些具有模糊性。真实性将促使人们利用数据融合和先进的数学方法进一步提升数据的质量,从而创造更高价值。例如,社交网络中的视频、语音、日志等获得的原始数据真实性差,需要我们对其过滤和处理才能挑出有用的数据。
2大数据在生态环境领域的应用进展
2.1全球气候变化预测
进入20世纪以来,随着生产力爆发式的提高,温室气体排放增多,全球气候变化出现异常。
期刊文章分类查询,尽在期刊图书馆如何短期提高气象预报的精度,以及如何长期应对各种气象灾害及其带来的次生灾害,减少人员伤亡及财产损失,已经引发了越来越多的关注,这也是现在气象预报领域和气候变化预测中的重点和难点。然而,因为气候体系是一个耗散的、具备多个不稳定源的高阶非线性系统,其内部相互作用非常复杂,由此导致了气候的复杂性和可变性。借助于大数据技术的应用,气候变化预测与气象预报精度将得到很大的提升。
2.2生态网络观测与模拟
大数据在生态网络研究方面的应用,可以追溯到国际地球物理年(1957—1958年)以及国际生物学计划(IBP)(1964—1974年),当时被称作大科学研究,其目的是收集大量的数据,后来这种研究演变成了现在的国际长期生态研究计划(ILTER)。ILTER主要是依托研究站开展生态系统过程与格局方面的研究工作,并系统地收集和存储所有观测数据。目前在国际上存在的观测网络,大部分都是基于长期定位观测,用来收集区域的生物、大气、水、土壤和污染物等的综合观测数据,如GEMS(全球环境监测系统)、FLUXNET(通量观测网络)以及GEO·BON(国际生物多样性观测网络)等。这些网络采集的数据量大,涵盖内容丰富,具备生态环境大数据的典型特征。大数据在生态系统研究方面的应用,还需要依靠生态系统长期定位研究网络。
2.3区域大气污染治理
生态环境问题的复杂性不仅源于生态系统的内在复杂性,更受到地球、生命和社会等诸多领域的共同作用。改革开放以来,中国高消耗、高排放和高污染的“三高”粗放型发展模式,带来经济持续快速增长的同时,也带来了严重的生态环境污染问题。美国国家航空航天局(NASA)分析了2005—2014年气流卫星观测图像,发现这10年间中国大陆、中东以及印度因为工业扩张的原因导致空气污染持续增加,雾霾越发严重。据“2015年中国气候公报”统计,全国2015年全年总计出现过11次高强度、大范围的霾过程,持续时间长,具有强雾与重霾混合,以及能见度低、影响大等特点。
3展望
尽管大数据在生态环境领域得到了初步应用,但由于中国幅员辽阔,生态环境状况复杂,监测系统还无法完全满足生态环境建设的需要,很多监测网络设备有待进一步补充完善,数据多是野外实时观测获得的,具有体量大、类型多、结构复杂等特点。除数据本身特点之外,在管理与应用方面还存在很多不足,具体表现在以下几个方面:1)缺乏数据共享。由于各部门收集数据的数据标准、格式和技术路线不统一,导致严重的数据割据,造成了“数据孤岛”。数据共享一直是限制生态环境大数据发展的重大问题,数据共享是开展生态环境大数据建设的条件和基础。2)技术问题。从生态环境数据的采集、存储、管理、分析到应用都需要强有力的技术支持。对大数据所涉及的数据存储与压缩技术,网络传输速度、大数据专业模型的开发、计算机处理能力等提出了新的要求。3)应用不足。中国生态环境大数据的创新应用仍然十分有限,大数据的力量还远远没有发挥出来,政府利用生态环境大数据的能力还很低,没有形成一个成熟的生态环境大数据产业链和有影响力的数据企业。
结束语
近年来,大数据已经在农业、经济、气象、交通、医疗、通讯等领域得到了有效应用。生态学领域也逐渐认识到了大数据的优势,并开展了相关研究。近来,环境保护部门发布了“生态环境大数据建设总体方案”,该方案将生态环境大数据的构建作为推动生态文明建设的重要保障措施。
参考文献:
[1]郭少青.大数据时代的“环境智理”[J].电子政务,2017(10):46-53.
[2]赵芬,张丽云,赵苗苗,邵蕊,刘丽香,赵海凤,徐明.生态环境大数据平台架构和技术初探[J].生态学杂志,2017,36(03):824-832.
[3]刘丽香,张丽云,赵芬,赵苗苗,赵海凤,邵蕊,徐明.生态环境大数据面临的机遇与挑战[J].生态学报,2017,37(14):4896-4904.
[4]赵苗苗,赵师成,张丽云,赵芬,邵蕊,刘丽香,赵海凤,徐明.大数据在生态环境领域的应用进展与展望[J].应用生态学报,2017,28(05):1727-1734.
论文作者:杨斌
论文发表刊物:《防护工程》2018年第14期
论文发表时间:2018/10/17
标签:数据论文; 生态环境论文; 领域论文; 生态论文; 结构化论文; 技术论文; 网络论文; 《防护工程》2018年第14期论文;