摘要:该文针对“拍照赚钱”任务定价问题建立了依赖于任务与会员的经纬度、任务定价与完成情况的数学模型。通过对数据的可视化处理以及变量相关性分析,确定任务定价的规律,重新设计任务定价。
关键词:任务定价;智图交互地图;长短期记忆网络;聚类分析;
1 问题重述
“拍照赚钱”是一种基于移动端的自助服务模式。其核心要素是任务定价。定价的合理与否,将直接影响任务的领取情况,进而决定商品检查的成功与否。在对附件数据进行定价分析时,通过对任务与会员的经纬度、任务的标价进行整合分析是确定定价规律的重要方法。
问题一:附件一为已结束的任务数据,附件二为会员的信息数据。研究附件一内项目任务定价的规律,分析导致任务未能完成的原因。
问题二:为附件一的项目重新设计任务定价的方案,并与原方案比较。
2 模型的建立与问题的求解
2.1问题一的模型建立与求解
2.1.1 基于智能交互地图的任务定价规律分析
利用智能交互地图将数据可视化,建立将地区任务标价平均值进行分段构建的标价格网图,将价格均分为65.7~68.92、68.92~72.13、72.13~-5.35、75.35~-8.57、78.57~81.78、81.78~85六个等级,分别用六种颜色表示;还建立了根据会员的地区分布图,均分为1~21、21~41、41~61、61~81、81~101五个等级建立格网图,分别用五种颜色表示。发现任务地理位置均分布在广州、深圳、佛山、东莞四座城市,图中显示会员的密集分布区主要是在城市中心,距离城市中心较远的地区会员人数也相对较少。从图中不难看出任务标价规律和会员分布存在联系,会员密集分布的地区所对应的任务标价较低,会员人数较少的地区所对应的任务标价则比较高。
2.1.2变量相关性分析模型
结合附件一、二相关数据,认为任务的经度纬度、任务标价、任务方圆5公里内会员的平均信誉度、任务方圆5公里内会员到任务点的平均距离、任务方圆5公里内的会员人数都有可能对任务的完成存在影响。
设有两坐标点M(x1,y1),N(x2,y2),根据文献,可知两坐标之间的距离L为:
利用MATLAB对模型进行求解可得程序输出结果,可以看出任务的经度、任务的纬度、任务方圆5公里内会员的平均信誉度、任务方圆5公里内会员到任务的平均距离、任务方圆5公里内的会员人数、任务标价和交通拥挤指数在加权之后相对任务执行情况的相关性虽然没有达到,但考虑到剩余影响因子可能是一些不可预知的客观因素,无法进行判断,所以这七个变量已经具有代表性,故进行继续分析。从求解的结果看,任务标价对任务执行情况的影响最大此外,任务方圆5公里内会员的平均信誉度、任务方圆5公里内会员到任务的平均距离、任务方圆5公里内的会员人数和交通拥挤指数对任务执行情况的贡献比任务标价的影响略小。
综上所述,任务的位置、任务标价偏低、任务方圆5公里内会员的平均信誉度过低、任务方圆5公里内会员到任务的平均距离太大、任务方圆5公里内的会员人数太少、交通拥挤都是有可能造成任务未完成的原因。
2.2问题二的模型建立与求解
三层 BP 网络输入节点为 个(与 同维),个输出节点,个隐节点,输入层到隐含层的激活函数采用 Relu型函数,隐层到输出层的激活函数用 Purelin 函数,可得网络输入与输出的关系。模型求得的预测值和真实值误差较大,说明模型的预测效果不是很好,需要继续考虑基于LSTM的多层循环神经网络预测。
2.2.1基于LSTM的多层循环神经网络预测模型
LSTM在于通过增加输入、遗忘、输出三个门限,使自身循环的权重变化,在模型参数固定,不同时刻的积分限度动态改变,避免梯度消下降过程的消极影响。基于LSTM的多层循环神经网络预测结果:
由图1可以看出,模型求得的预测值和真实值较为接近,可以发现随着训练次数的增加误差逐渐降低,说明模型的预测效果较好。
2.2.2与原方案对比分析
提取20个未完成任务的相关数据,运用建立的基于LSTM的多层循环神经网络定价模型求出与其对应的价格预测值。红线表示预测值蓝线表示真实值,可以发现真实值普遍比预测值低,符合问题一中分析得出的任务标价过低是导致任务未完成的主要原因。综上所述,说明在新的定价方案中,原有的完成的任务的真实值与预测值接近,未完成的任务的标价预测值要高于真实值,大大提高了任务完成的可能性,所以整体来看基于LSTM的多层循环神经网络定价方案的确优于原方案。
3 模型评价与改进
3.1模型的优点
(1)问题一中利用智图交互地图对数据进行可视化处理,便于客观的分析。
(2)问题二利用两个方案进行比较,使结果更优化。
3.2模型的缺点
(1)所提供的和查阅的数据本身存在系统误差,在处理数据过程中不可避免产生偶然误差,使数据的准确性降低;
(2)问题一中对影响因素的分析发现在加权之后对任务执行情况的相关性没有达到100%,说明还会有其他影响因素未考虑在内。
(3)题目中给出的信誉度并未加到本文设计的定价模型中,使准确度有所下降
在原有模型基础上,引进综合信誉评价机制,将信誉度作为一项重要的指标来对任务进行定价。规定会员拥有的线上特征,对这些特征进行综合量化,并针对这些特征建立评价体系和评分标准,最后按照不同特征的权重来综合量化会员的信誉度。在对任务定价加入信誉度的指标后,不仅减小了主观评价定价带来的误差,还利用奖罚措施提高了会员的热情,也起到了预防恶意操作的发生,保证了会员的利益。
参考文献:
[1]卓金武等.MATLAB在数学建模中的应用[M].北京:北京航空航天大学出版社,2014.9.
[2]毛可.软件众包任务的定价模型与人员匹配方法及工具实现[D],北京,中国科学院软件研究所,2014.
[3]桥洪武,葛四友,自由的善—哈耶克的经济伦理思想评介,华中师范大学报41(1):37-42,2002.1.
论文作者:王珂, 燕娜
论文发表刊物:《科技中国》2018年2期
论文发表时间:2018/7/18
标签:方圆论文; 会员论文; 模型论文; 数据论文; 信誉度论文; 神经网络论文; 平均论文; 《科技中国》2018年2期论文;