摘要:为了解决传统模型结构确定难,导致过拟合,预估准确性较差,稳定性低的问题。通过数据相关性分组挖掘研究建筑钢材造价成本预估模型。按照各项目特征获取历史工程项目钢材造价特征指标属性集合,通过模糊模式识别,依据就近原则对待筛选样本项目和待预估样本项目的相符程度进行判断,得到和待预估项目最相近的若干历史项目当成建立预估模型的输入样本。基于最小二乘支持向量机进行数据相关性分组挖掘,建立建筑钢材造价成本预估模型。在建立模型中,正则化参数与核函数的宽度是影响建筑钢材造价成本预估结果的主要参数,通过粒子群算法获取两个参数的最优值。把得到的参数值带入模型,重新进行训练学习,获取较优的建筑钢材造价成本预估模型。在进行实验时,选择杆塔钢材、基础钢材和接地钢材三个指标作为建立模型的输入向量进行测试,结果表明建立模型预估精度高,稳定性好。
关键词:数据相关性;分组挖掘;建筑钢材;造价成本;预估
1引言
近年来,国民经济水平普遍提升,人们的生活水平逐渐提高,住房水平为生活中的关键,建筑业迅猛发展[1,2]。随着钢材材料费的逐渐增多,建筑钢材造价成本也逐渐增加,对建筑钢材造价成本进行预估,为相关管理人员提供有价值的信息,便于管理人员决策,为当前的重点研究内容[3]。
传统建筑钢材造价成本预估模型利用统计学法实现,计算过程繁杂,容易出现错误,造成预估结果误差大,无法提供可靠的信息[4,5]。多元线性回归模型按照建筑钢材造价历史数据,对类似建筑钢材造价成本进行回归与拟合处理,较统计学法预估结果可信度增加,然而多元线性回归模型假设建筑钢材造价成本是线性变化因素,不满足实际应用,得到的预估结果不准确[6]。人工神经网络方法有很强的学习能力,能够对建筑钢材造价成本和不同影响因素间的关系进行拟合,获取建筑钢材造价变化趋势,实现预估,但人工神经网络结构的确定很难,在很大程度上会导致过拟合,影响预估结果[7]。
数据相关性分组挖掘方法是一种非线性建模方法,支持向量机是常见的数据挖掘方法,能够对建筑钢材造价成本的变化趋势进行挖掘,获取造价成本与不同因素间的关系,泛化能力强,是一种有效的建筑钢材造价成本预估方法。
2建筑钢材造价成本预估模型建立
2.1样本采集和样本指标属性集建立
本节利用分析大规模文献、施工现场资料,以及咨询相关领域专家[8],获取若干个已经完工的建筑项目相关资料,按照各项目特征获取历史工程项目钢材造价特征指标属性集合,其中用于描述第个历史建筑钢材关于第个指标的属性值,用于描述预估指标数量。任意选择一个项目作为待预估项目,将其余项目当成待筛选项目。
2.2预估样本筛选
本节通过模糊模式识别,依据就近原则对待筛选样本项目和待预估样本项目的相符程度进行判断,从而获取和待预估项目最相近的若干历史项目当成建立预估模型的输入样本。
首先建立模糊集合。不同项目涉及因素不同,对筛选过程产生不利影响,本节仅选择定性预估指标组成的集合作为论域,用进行描述,用于描述第个指标。假设描述样本工程钢材项目与待预估钢材项目的模糊集合依次是与,对模糊集合进行描述,即可获取论域上的模糊集合与:
(1)
(2)
式中,“+”并非代表求和,是概况集合诸元的符号;与并非分数,用于体现点对模糊集与的历史度依次是与。
下面建立隶属函数,通过二元对比排序法实现,建立过程如下:
(1)按照构造的特征指标属性值集合依次获取待预估建筑钢材项目与样本项目的有关论域的属性值集合,依次用与进行描述。
(2)依次获取论域中元素对待预估项目与样本项目的权重分配结果与,获取与的隶属度函数:
(3)
(4)
计算样本项目和待预估项目的贴近程度前,首先求出待预估建筑钢材项目与样本项目的内积与外积:
(5)
(6)
则贴进度计算公式为:
(7)
按照择近原则筛选和待预估项目最相近的若干项目,选择标准为贴进度高于0.8。将筛选的项目作为建立建筑钢材造价成本预估模型的输入样本。
2.3预估模型建立
采用数据挖掘方法建立预估模型时,学习速度通常较慢。本节选用最小二乘支持向量机,最小二乘支持向量机是一种新型数据挖掘方法,有很强的泛化能力,学习速度快,依据数据相关性分组进行数据挖掘。
经筛选得到的历史样本用进行描述,其中,用于描述建筑钢材造价成本的影响因素,用于描述对应建筑钢材造价成本值。通过非线性映射完成对的映射,构造下述建筑钢材造价成本预估模型:
(8)
分析上式可以看出,在构造准确建筑钢材造价成本预估模型的过程中,确定最优权向量与偏差,按照结构风险最小化原理,引入松弛变量,将其转换成等式约束的优化问题,则有:
(9)
其中,用于描述正则化参数。
通过拉格朗日函数完成对上式的求解,构造下述拉格朗日方程:
(10)
其中,用于描述拉格朗日乘子。
经变换有:
(11)
其中,,用于描述核函数,公式如下:
(12)
其中,用于描述核函数的宽度。
完成对上式的求解,获取基于最小二乘支持向量机的建筑钢材造价成本预估模型:
(13)
分析建立模型可以看出,参数与是影响建筑钢材造价成本预估结果的主要参数,为了提高预估结果的准确性,通过粒子群算法获取参数与的最优值。把得到的参数值带入模型,重新进行训练学习,获取较优的建筑钢材造价成本预估模型。
3实验结果及分析
本文研究的目的是通过数据相关性分组挖掘对已有项目建立钢材造价成本预估模型,将新建工程钢材造价重要指标作为输入,获取钢材造价成本预估模型。
对522个已有建筑钢材项目进行合并研究,提取了11个特征参数,通过提取的特征参数进行筛选分析,最终选择杆塔钢材、基础钢材和接地钢材三个指标作为建立模型的输入向量,输出向量是单位静态投资,万元/km。在已有建筑钢材项目中选择贴进度最高的81个作为训练样本,将7个项目作为测试样本进行实验分析。学习样本示例用表1进行描述。
表1 学习样本示例
Table 1 Examples of Learning Samples
在MATLAB 7.0中加载设计模型软件工具包,编写建立的给予数据相关性分组挖掘的建筑钢材造价成本预估模型程序。针对相关参数进行设定,将训练样本输入模型中学习,再对未测试样本进行预测,预测结果用表2进行描述。
表2 本文模型预测结果统计对比表
Table 2 Statistical comparison tables of predicted results of this model
采用本文模型对建筑钢材造价成本进行预估,得到的实际造价成本和预测造价成本预估效果较好,绝对误差与相对误差均较低。
4 结论
为了给建筑项目相关管理人员提供决策依据,建立了一种基于数据相关性分组挖掘的建筑钢材造价成本预估模型。选择杆塔钢材、基础钢材和接地钢材三个指标作为建立模型的输入向量,输出向量是单位静态投资。验证本文模型的合理性,发现通过本文模型对建筑钢材造价成本进行预估,获取的预估数据稳定性较高,并且整体预估数据误差较低。
参考文献
[1]赵学华,杨博,陈贺昌.一种高效的随机块模型学习算法[J].软件学报,2016,27(9):2248-2264
[2]梁喜,刘雨.基于模糊神经网络的建筑工程造价预测模型[J].技术经济,2017,36(3):109-113
[3]安磊,张洁,齐霞,等.基于随机森林输变电线路工程造价估算研究[J].控制工程,2016,23(11):1841-1844
[4]叶青,陈菲,刘婧.基于RN和GN的两种RBF神经网络的工程造价预测模型[J].数学的实践与认识,2016,46(7):25-30
[5]崔祥,张云宁,吴蓉,等.基于物元可拓理论的输变电工程造价风险评价[J].土木工程与管理学报,2015,32(4):90-94
[6]Sangyong Kim,, Shim J H. Combining case-based reasoning with genetic algorithm optimization for preliminary cost estimation in construction industry[J]. Canadian Journal of Civil Engineering, 2014, 41(41): 65-73
[7]徐莉,李卓然.特高压输电线路工程造价预测模型研究——基于因子分析及BP神经网络[J].工业技术经济,2017,36(7):18-26
[8]Sayadi A R, Khalesi M R, Borji M K. A parametric cost model for mineral grinding mills[J]. Minerals Engineering, 2014, 55(1): 96-102
论文作者:曲钰峰,汪洋
论文发表刊物:《基层建设》2019年第19期
论文发表时间:2019/9/21
标签:造价论文; 模型论文; 建筑钢材论文; 成本论文; 项目论文; 样本论文; 钢材论文; 《基层建设》2019年第19期论文;