基于Hadoop的房地产交易大数据分析应用系统研究论文_胡国新

基于Hadoop的房地产交易大数据分析应用系统研究论文_胡国新

(惠州市天威网络科技有限公司 广东惠州 516000)

摘要:本文主要以某省域内房产交易信息数据资源的云同步及规范化应用大数据等为例,以Hadoop为基础进行房产交易的大数据综合分析应用系统设计与实现研究,从而能够更好地发挥该系统应用优势,为房产交易的大数据各项分析实践工作提供有利支持。

关键词:Hadoop;房地产;交易;大数据;分析;应用系统

前言:

在大数据时代,数据分析已经成为各行业发展的重要技术力量,起着至关重要的作用,对于房产交易行业来说也是如此,通过对房产交易数据的综合分析,对房产业今后的发展规划所能够起到的积极作用往往不容忽视。鉴于此,本文主要针对以Hadoop为基础房产交易的大数据综合分析应用系统进行综述分析,望能够为相关专家及学者对这一课题的深入研究提供有价值的参考或者依据。

1 系统总体设计

设计背景架构

该系统项目背景为某省域内房产交易信息数据资源的云同步及规范化应用大数据等,以大数据的测试集群系统平台为基础,系统先与大数据的测试集群系统平台连接,处理并加载大数据的测试集群系统平台内数据信息,逐渐生成信息数据集。依据已存储数据集,亦或者是临时所生成数据集开展数据分析工作,结合数据分析结果,呈现并可供择选不同可视化的图表,把所有可视化的图表组合成相应仪表板,以供用户使用。该系统总背景框架类似于房产大数据的报表系统。但该系统面向数据信息不单单属于结构化关系的数据,还包含着非结构化与半结构化数据信息。把业务系统信息数据经ETL模块逐渐加载至大数据的测试平台内,经上层Hive、Spark Mlib、R、Kylin等的调用Spark或Map Reduce分布式地计算分析引擎数据,以接口方式供上层房产交易的数据分析与系统的可视化。

设计系统总框架

房产大数据的分析与可视化的系统共包含着以下模块:连接器系统、数据集的处理系统、数据分析系统、图表设计系统、仪表板的设计系统、安全控制系统、权限管理系统。

设计数据库

R模型,它主要由Chen P S所提出描述着现实世界一种概念模型,把现实世界中客观存在着的所有抽象事物作为实体,把客观食物某一特性作为属性,连接现实世界与信息世界。概念模型设计设计属于数据可库中设计关键,借助文本系统分析,以下分别从实体属性的设计、属性联系的设计、数据库设计三个方面,分别阐明该系统数据库的设计:

1.3.1设计实体属性

①仪表板的实体

包含着仪表板的编号、所属门类、用户编号、名称、仪表板,用户可可借助实际分类具体的名称仪表板来查看自身仪表板看表信息。

②仪表板分类实体

主要包含着名称、用户编号、分类编号等三个属性,用户可依据用户的变化查到用户创建性仪表板。

③数据源实体

仪表板实体分类主要包含着用户编号、数据信息源的编号、数据源的基本类型与内容、数据源名称、数据的源编号。借助数据源的编号实施唯一识别,了解各种类型数据源均出自哪些客户创建。

④图表实体

图表实体主要包含着图表内容、名称、分类、用户编号、图表编号等这五个属性,借助图表编号的唯一识别,分别出哪一种类型图表具体由哪个用户所创建。

⑤数据集的实体

包含着数据集具体内容、名称、用户编号、分类、数据集的编号这五个属性,通过该数据集的编号实现唯一识别。

⑥用户实体及用户的角色实体

用户实体包含着用户的编号、用户名、登录名、密码、用户的状态等这五个属性,用登录的名称与密码组成登录锡系统,设定用户的状态;用户的角色实体,包含着用户角色的编号、角色编号、用户编号这三个属性,借助用户角色的编号实现唯一识别。

期刊文章分类查询,尽在期刊图书馆

⑦角色实体

角色实体包含着用户编号、角色编号、角色内容这三个属性,借助角色编号实现唯一识别。

⑧角色资源的实体

角色资源的实体包含角色的资源编号、资源类型与编号、角色编号这三个属性,借助角色编号实现唯一识别。

1.3.2 设计元信息数据库表

依据实体类设计,该系统主要包含着以下9个元信息数据表,即为:角色资源的信息、角色的信息表、用户角色的信息表、用户的信息表、数据集的信息表、图表的信息表、数据源的信息表、仪表板的分类信息、仪表板的信息表。

2 系统实现应用

2.1 权限管理

由最高权限系统管理员自行进入该权限管理系统模块,对用户的管理模块实施新增或删除用户操作,以赋予不同用户的管理及操作权限。

2.2 安全控制

该系统安全控制以Spring Security策略为基础,系统访问登录均需输入相应用户名及密码才可实现登录,若输入错误则会做出相应提示,提示安全风险存在,需修改用户密码。

2.3 连接器

该系统模块能够实现与不同信息数据源进行连接,以JDBC 统一连接手段实习县各类的连接器结合实际使用要求合理配置。用户进入到连接器系统模块,创建信息源,修改已有数据源,选择数据源类型性,输入数据源相关信息,连通测试数据源,并保存数据源。

2.4 处理数据集

处理数据集,是以数据源为基础而建立的为后期数据信息分析设计数据集市、数据仓库、Cube等各种数据集,用户可实现自助添加,有效满足房产交易的大数据综合分析需求。

2.5 分析数据

以维度及个信息指标为基础,进行计数分析、排序、求和及最值计算。进入刀片数据分析系统模块,配置数据集,用已创建数据集,自定义其数据分析的名称,选择所需分析维度的指标。择选分析度量参数值与数据分析具体类型,执行数据的计算分析命令,对数据分析的名称唯一性进行校验,入库存储。

2.6 设计图表

提供给中国地图、雷达图、桑基图、漏斗图、KPI图、饼图、线形图、柱状图、基本图表等多种类型的可视图表。用户可以已分析结果或自定义的数据分析相同脚本所形成数据分析结果,指定度量值与维度实施可视化。具体操作如下:进入到图表设计系统模块,删除、复制或编辑现有结果,新建图表,对已有的分析结果新建好数据分析,进行数据信息读取,自定义该图表名称,择选可视化具体类型,对已读取数据各取度量值与维度信息,返回上一层修改图表的名称,自行存储入库。

2.7 管理仪表板

管理仪表板系统模块作用在于为用户提供自主搭配各个图表,并生产该仪表板这一功能作用。对于不同用户需求,已有图表可组合呈现,可满足同组图表用不同风格仪表板来呈现这一需求。进入该系统模块后,子项目包含仪表板的分类与设计。如需新建仪表盘的分类,应在子项目下新建仪表盘的分类。用户也可对现有仪表板实施删除、修改及复制各项操作。

3 结语

综上所述,通过以上分析论述之后,可以了解到Hadoop为基础进行房产交易的大数据综合分析应用系统设计工作极具复杂性与特殊性,对技术水平要求有着较高的要求。那么,为了能够更好地发挥该应用系统优势,还需项目组成员能够结合房产交易对大数据的分析工作实际工作需求及各项标准,逐步完善及优化该应用系统,以能够充分发挥该系统效能,为房产交易业的进一步发展提供助力。

参考文献:

[1]韩岩. 基于Hadoop平台对交易记录的数据分析系统设计与实现[J]. 2016,12(09):147-149.

[2]俞栋辉, 于明远, 叶蕾. 基于Hadoop的房产信息服务的方法[J]. 华中科技大学学报:自然科学版, 2016,25(S1):636-639.

[3]段松青, 吴斌, 于乐. PDM:基于Hadoop的并行数据分析系统[J]. 湖南大学学报(自然科学版), 2017, 39(10):879-881.

论文作者:胡国新

论文发表刊物:《科技研究》2019年4期

论文发表时间:2019/6/18

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于Hadoop的房地产交易大数据分析应用系统研究论文_胡国新
下载Doc文档

猜你喜欢