物联网搜索技术综述论文_王耀帮

物联网搜索技术综述论文_王耀帮

安徽建筑大学机电学院 安徽合肥 230061

摘要:本文论述了物联网搜索的相关技术,并分析了物联网搜索的知识。

关键词:物联网;搜索技术;综述

随着经济的发展,物联网技术已逐渐融入到人们的生活中。同时,面向物联网的搜索服务将物联网感知客观物理世界的浩瀚信息整理分类,可以帮助人们更有效地从中找到所需要的内容和信息,使物联网资源得以高效利用,为人们提供便利。

一、物联网搜索技术

1、数据采集和融合。由于物联网中数据的类型多与高动态变化及关连性强等特点,对异构海量物联网的数据采集、处理和融合技术进行了快速、实时的研究。

1)主动推送和被动索取。物联网中的实体生成数据,用户输入查询要求,其要求与实体生成的数据进行比较,以查找满足用户需求的实体。在分布式的网络环境中,查询有3种实现方式:一是物理实体主动将数据推送并存储在客户端,查询在用户本地实现,这种查询方法被称为推送法;二是来自用户输入的查询请求发送到物理实体,在各物理实体端进行查询,最后将符合查询要求的物理实体数据发送给用户,这种查询方法被称为索取法;三是采用上述两种相结合的方式,为那些用户通常需要访问的数据采用推送法推送到客户端,其他数据都存储在服务器端,当用户需要时再从服务器端索取过来。

2)发布/订阅。对连续查询,要在物理实体和用户之间建立明确的关系。发布/订阅是指当用户对物理实体感兴趣并需要频繁访问时,订阅物理实体的能力。当用户和特定的物理实体建立订阅关系后,针对该物理实体数据的获取过程,用户不需要花费大量的时间来查询,只需简单地将物理实体定向数据推送到用户处。物理网中的数据规模和用户规模是巨大的,持续的pull和push操作将导致通信资源的巨大成本开销,发布/订阅技术可以减少pull和push操作,不仅节约了通信资源,而且提高了用户查询的效率。

3)数据融合技术。数据融合是指对物联网中不同类型、不同来源的数据进行关联、过滤、统计、推理、合成等获取和推演技术,发现和获取数据中蕴含的各种知识和智慧的过程。物联网的数据具有多样性、异质性、多维度等特点,所以为保证搜索的质量,需在物联网搜索中对获取到的各种搜索数据进行深入分析和集成,以满足客户的要求,并得到准确的结果。由多个传感器融合的信息可以更准确、更全面、更可靠,单个传感器无法做到这一点。例如,对一个较复杂的搜索任务,需分解成若干个子任务,每个子任务在不同的子网中进行搜索。每个子网都有一个最近的搜索代理,在正常情况下,每个子网收集的数据通常会传输给相邻代理。然后,相邻的代理将数据集中到搜索代理,以融合并获得最终结果。数据融合包括数据层融合、特征层融合和决策层融合。

2、数据的存储和管理。根据物联网数据量大、多维度索引、实时动态更新等特征,研究支持实时动态更新、多维索引动态变化、海量数据存储和管理技术。

1)压缩技术。使用压缩技术可以减少数据的存储量和查询的通信开销。例如,服务器通常是存储实体数据的压缩聚合视图。无损压缩不影响系统的基本操作。但有损压缩只能产生类似的视图,所以查询结果可能是启发式的,或考虑使用近似视图表示实体和用户的子集,再在类似的视图上执行查询操作。

2)中间件。中间件是概念性元素,逻辑上位于实体和用户之间,目前是较为常用的数据集成方法。中间件通常维护实体的聚合视图,发送到中间件的查询请求,而不需要所有实体索取数据即可完成查询。中间件可以是集中式的,也可以是分布式的。

3)云计算。云计算是基于互联网相关服务的增加、使用和交付模型,通常通过网络以按需、可动态扩展的方式获取服务和资源。

期刊文章分类查询,尽在期刊图书馆云计算的基本理念,是通过网络连接大量的计算和存储资源并统一管理,形成一个云。当用户需要服务时,它通过网络向云发出请求,云提供相应的服务并将结果返回给用户。云计算是分布式处理、并行处理和网格计算的发展。物联网具有数据海量性、动态特性的实时变化和异质性等特点,造成在物联网搜索中对计算资源的需求提高,云计算为此提供技术支持。

4)语义技术。传感器感知到的信息冗余且不确定。信息的不确定性包括异质性、不连续性、不准确性等。其中异质性尤为突出,通常表现为感知数据在性质、类型、内容和表达形式等的差异。异质性增加了信息处理、集成和描述的难度。物联网的异质性导致了对信息的异构感知。因此,如何实现传感器设备的自动部署、发现和接入是物联网搜索面临的关键技术。另外,随着传感器设备数量的快速增长,物联网的数据量也在迅猛增长,造成大量冗余信息的产生。这给数据传输、存储和处理带来巨大的挑战。此外,在大多数情况下,人们不需要获得所有的感知数据,而只需获取语义信息或事件。如何从物联网的海量数据中获取语义信息和知识是物联网搜索的关键技术。语义技术为上述问题提供了一种可行的解决方法,它也是解决不确定性和冗余性的关键技术。

二、物联网搜索的知识挖掘

1、倒排索引。倒排索引是一种提高搜索效率的数据结构。倒排索引处理如何有效地查询基于属性值的记录。倒排索引表存储每个记录的属性值和地址。因为记录的位置是由属性值决定的,因此称其为倒排索引。

2、评分与排名。评分是实体与查询间相关性标量值的比例,而排名是基于评分所获得的一个实体排序。对实体进行评分和排名可以为用户提供最匹配的实体。其次,通过对具有高匹配度的实体进行推送和索取,可以提高搜索效率。但如何统一化、标准化评分是实现这一目标的关键前提。

3、Top-k查询。在实际操作中,若将所有匹配结果返回给用户,这不仅是对计算和通信资源的浪费,而且对用户来说也不必要。因此,当用户进行查询时,通常不需要返回所有匹配的实体,但只需返回最相关的k个结果,即Top-k查询。对Top-k查询,有时可直接在不考虑所有实体的情况下,直接找到k的最相关结果,这比首先找到所有可能的匹配结果,然后再返回最相关的k个结果的这种方法,极大地提高了查询效率。

4、预测技术。预测是对客观事物发展规律和趋势的预测和推断。预测的目的是揭示事物发展规律,预测事物未来的发展趋势,使人们能够运用事物的规律和趋势来控制事物,为人类提供服务。比如,利用卷积和傅里叶变换来计算人类活动的周期性规律,从而达到准确预测传感器未来的状态,这不仅能节省通信资源,还能提高物联网搜索的高效性和准确性。预测有两种类型:定性预测和定量预测。定性预测是指通过直觉和经验来预测事物的未来。定量预测是利用数学工具对事物进行预测的一种方法。定量预测方法包括回归分析和时间序列分析。回归分析是一种基于事物发展因果关系的预测。回归分析主要研究引起事物变化的各因素之间的相互作用和各因素与未来状态之间的统计关系。具体可通过机器学习法建立预测模型,典型的机器学习方法包括:决策树方法、人工神经网络、支持向量机等。时间序列分析法也被称为趋向外推法,它是基于历史数据,对事物的发展规律进行分析推理。时间序列分析法把发生的时间依照时间进行排列,然后通过趋势外推进行推断。时序分析研究的是预测目标和时间之间的演化关系,所以时间序列分析法是一种定时的预测技术。物联网搜索的空间很大,也具有高度动态的数据,使用预测技术不仅能节省通信资源,还能提高搜索的效率和准确性。

三、结语

随着物联网的普及和发展,物联网搜索是摆在学术界和工业界面前迫切需要解决的问题,物联网搜索因此成为当前的一个研究热点。面对越来越多的传感器及其所产生的数据,只有结合智能的物联网搜索,才能体现这些数据的生命力。

参考文献:

[1]邢涛.面向物联网的实体实时搜索服务综述[J].计算机应用研究,2016.

[2]孙其博.物联网搜索关键技术研究[J].大学学报,2017.

论文作者:王耀帮

论文发表刊物:《基层建设》2018年第3期

论文发表时间:2018/5/16

标签:;  ;  ;  ;  ;  ;  ;  ;  

物联网搜索技术综述论文_王耀帮
下载Doc文档

猜你喜欢