邮政企业培训学习资源个性化推荐模式研究
文/庞超 刘倩 王颖 宁福旺
摘 要
为了解决培训资源在数量和规模上的爆炸式增长,学员个性化需求与推送方式单一之间的矛盾问题。在邮政企业远程培训中引入个性化推荐技术,通过对学员和资源进行大数据分析,根据学员的兴趣需要和课程资源的特点,利用推荐算法为学员推荐最适合的学习资源,构建“三位一体”的个性化推荐应用新模式。将学员对资源的被动学习转变为系统对学员的主动推送,充分利用课程资源的同时,极大的调动学员的主动学习积极性,不断提升学习的培训效能。
【关键词】 企业培训 混合推荐 聚类分析 协同过滤 培训效能
随着邮政企业培训事业的蓬勃发展,中国邮政网络培训学院(以下简称“中邮网院”)的各项培训业务规模不断扩大,远程培训资源在数量也呈爆炸式增长,面对大量的教学资源,学员很难从中发现适合自己的课程信息,受到信息过载和信息迷航的困扰。因此针对学员的个性化推荐服务成为邮政企业远程培训系统亟待研究和解决的问题。
本文提出一种适用于邮政企业培训的基于混合推荐技术的邮政企业学习资源个性化推荐模式。通过引入个性化推荐技术,对学习资源进行过滤,对学员的学习行为进行数据分析,提取学员学习的兴趣点,将学员对资源的被动接受转变为系统对学员的主动推送,实现课程资源的个性化推荐服务,对实现资源的有效利用,提升企业培训效能都有重要的现实意义。
1 邮政企业培训及应用现状分析
1.1 邮政企业培训资源课程体系建设研究
近几年,随着中邮网院业务发展,微课在总量上逐年增加,种类不断丰富,上升趋势明显。
(1)从课程点播情况分析,发现影响点播率的主要因素包括:培训需求、业务需求、技能需求三个方面。值得关注得是“标题吸睛”在影响因素中排名第四位,这说明吸引人的课程名称,也可以极大提升课程的关注度。
(2)从课程类别分析,发现点播课程主要集中于管理类、职业素养类和金融类,其种类分布不均衡,应加大微课资源建设力度,丰富课程类型和内容。
图1:混合推荐模型
图2:个性化推荐整体框架
(3)从课程评价反馈分析,建议将点赞、评论、推荐、打分、收藏、转发等评价因素综合考量,建立多维度指标评价体系,更加立体化反映学习效果。
1.2 邮政企业培训学员学习行为模式研究
将隐式评分归为5类:浏览(L)、点播(P)、点赞(D)、收藏(C)、推荐(T),各类之间可以通过组合生成综合评价,评分越高越能反映学员对此课程或此类课程的喜爱程度。
(2)按照学习前、学习中、学习后的阶段划分要求,梳理学员的学习记录数据,筛选出能够反映学习过程的关键行为指标:学习行为5 类、学习时长6 类、学习情境2 类、学习方式2 类、课程评价5 类等相结合,分析员工学习行为模式。
2 个性化推荐关键技术研究
2.1 构造评分矩阵
2.3 989名孕妇中对儿童口腔不了解的口腔不良习惯情况 本研究列举了8种儿童常见的口腔不良习惯,只有80名孕妇(占8.09%)对其全部了解。见表2。
2.1.1 指标降维
不论员工个人信息,还是课程资源信息,很多指标,其数据指标取值范围非常大,导致数据运算维度过高,耗费时间和资源成倍增长。在尽量保持原有数据特征和信息量的基础上,通过降低指标维度,简化数据量,可以极大地减少运算量,提升运算效率。
湖北省县市区地理国情普查图涉及到比例尺范围为1:15000-1:14000,比例尺跨度大,使用传统的缩编手段先将1:10000数据,缩编为1:50000,然后在1:50000的基础上再缩编为更小比例尺数据,耗时耗力,WJ-III地图工作站能够实现从1:10000到1:140000逐级或跨尺度综合与成图,解决了从传统单一比例尺制图到多比例尺融合制图,从单一比例尺静态地图显示到多比例尺平滑动态连续显示技术难题,从而使多尺度空间数据能够在PC机、掌上电脑、网络上无级显示。
显示评分是指学员学习完课程后,对课程直接评分过程。
隐式评分是将那些可以体现学员对课程偏好的行为因素加以记录,然后将行为记录转换成学员对课程的评分。
但是这种保护与建立模式,需要学校和老师的正确指导与引领,如果一味交由学生建设与管理,则很容易涣散并失去建立的初衷,最终导致相应校园文化的变形、失传。这意味着,这种模式的保护与建立工作,难以由学生自发组织并长久维持乃至发展传承,需要学校投入一定数量的经历和人员进行管理和监督工作。
(1)按照共性与个性边界清晰,紧密结合工作实践的要求,从人力资源管理系统,筛选出10 项员工信息的关键指标:出生日期、进入系统时间、用工形式、政治面貌、最高学历或学位等级、所属板块、部门类别、岗位序列、专业类别、岗位对应职业。
在人力资源管理系统、中邮网院培训系统,抽取近三年的培训数据及课程资源,将本文研究的个性化资源推荐模型实例化,并进行应用评测与效能分析。
2.1.2 显示评分与隐式评分
建筑给排水工程施工前应做好以下几个方面的准备:①拟定科学的施工方案,设计合理的施工图纸,选用适宜的安装工艺、材料以及使用设备,做出恰当的人员安排等;②制定工程施工相关的规章制度,提高一线操作人员的技术水平,采用适宜的责权划分和奖惩机制;③根据施工设计的要求和标准,合理预留、预埋管道。
邮政有近百万员工,各类课程信息上千门,基于学员-课程评分生成的矩阵维度非常高,且往往评分信息不足,使得推荐系统计算性能和效率非常低,会导致相似度产生偏差。
通过数据分析发现,学员在一段时间内选择学习的课程,呈现出系统化、体系化的特点。学员对某一门课程的偏好,在一定程度上也代表着学员对此类课程属性的偏好,选择同类课程的学员相似度更高。
②对于固态发酵551H,确定各种因素的最高与最低水平为发酵时间12~32 h、固态培养基组成/固液比值1.5~4、发酵温度25~30 ℃、接种量3%~10%;对于固态发酵552H,确定各种因素的最高与最低水平为发酵时间12~48 h,固态培养基组成/固液比值1.5~4,发酵温度25~30℃,接种量3%~10%。
在学员-课程评分矩阵的基础上,引入学员-课程属性偏好评分矩阵,采用双评分矩阵模式,将学员对课程的偏好转化为学员对课程属性的偏好,可以把高维评分矩阵映射到相对低维空间中,从而降低了近邻搜索的时空开销,提高了系统响应速度、降低了数据的稀疏性。
因此,深入研究继电保护装置大生产模式下的智能化测试技术,探索高效的整机测试方案,对推动工业4.0在智能电网保护装置生产制造领域的深入应用,将具有重要意义。
2.2 聚类分析
将聚类分析应用于协同过滤推荐算法,将对课程属性偏好相似的学员归到同一簇内,而不同簇之间的学员相异性则尽可能大。
昆明市发展乡村旅游的乡镇大多处于偏僻地区,团结乡则位于昆明市西郊。近年来,团结乡通过新农村建设等途径,在一定程度上提升了城镇化水平,但基础设施建设相比其他地区依然落后,农村道路和卫生条件有待改善,人口素质有待提高。
根据学员-课程属性评分的欧式距离进行计算,选取距离最大两个学员作为聚类中心,重复此过程,直到找到K 个初始聚类中心。计算剩余学员到初始聚类中心的欧式距离,将学员划分到距离最小的簇,计算每个簇中所有对象的均值,得到新的聚类中心,重复此步骤直至聚类中心不再发生变化。然后在相近的若干个簇中查找最近邻居,这种聚类算法能够在尽量少的学员空间上查询到尽量多的最近邻居。
3 个性化资源推荐模型
3.1 混合推荐模型
在抽取1200 名学员及其1635 门课程中,设定聚类数目为40 时候,搜索40%的学员空间能找到学员将近75%的最近邻居,并且其系统耗费时间与平均绝对误差值(MAE)在四种方案效率比最高。
3.2 个性化推荐整体架构
个性化推荐引擎是个性化推荐整体架构核心模块,也是学习资源个性化推荐实现的中枢,如图2所示。
4 学习资源个性化推荐模式应用与评测
2.1.3 双评分矩阵
4.1 生成数据表、降维及标准化
根据方案设计需求,构建学员特征表、课程属性表、学习行为表、学员-课程评分表、学员-课程属性评分表的数据库表结构;根据已经设计好的数据表,进行数据降维、标准化处理,存储到数据表,为后续计算分析做好数据准备。
4.2 寻找最近邻居
本文研究的混合推荐模型,在传统推荐模型基础上,更注重分析学员的学习行为数据,引入隐式评分机制更好的反映出学员对课程的偏好程度。通过聚类分析技术,发挥大数据分析技术优势,有效提升推荐过程查找最近邻居效率,更强调学员之间或课程之间的多属性综合相似性的度量,基于学员-课程评分和学员-课程属性偏好评分,为学员推荐资源,提升资源推荐准确率。如图1所示。
获取学员聚类结果后,目标学员的最近邻居可以在相近的若干个簇中进行查找。分别对学员-课程评分矩阵、学员-课程属性偏好矩阵,采用修正余弦相似性算法的相似性度量方法进行计算,并将两种度量方法相结合考虑学员相似性。
随着国际贸易环境日趋复杂、国内经济迈入新阶段,以及自贸区改革经验的积累,推动形成全面改革开放新格局是我国目前经济转型发展的必然要求。2017年3月,国务院颁发了《全面深化中国(上海)自由贸易试验区改革开放方案》,正式提出“设立自由贸易港区”。同年10月,十九大报告重申“赋予自由贸易试验区更大改革自主权,探索建设自由贸易港区”的战略部署。2018年3月,十三届全国人大一次会议政府工作报告再次提出“探索建设自由贸易港”。截止目前,已有包括上海、浙江、四川等沿海内陆十余省份竞逐建设自由贸易港。
4月18日,水利部抗震救灾前方领导小组组长、国家防办副主任李坤刚一行检查玉树州结古镇自来水厂、骞马场应急供水等应急供水工程。
4.3 产生推荐
获得最近邻居集合后,目标学员对于未评分课程的评分,就可以根据最近邻集合学员与目标学员的相似度值以及邻居学员对项目评分数据,计算目标学员对其未评分过的项目的预测评分,最终按照预测评分排序,生成对学员的推荐结果。
如本文抽取的目标学员“龙玉仪”,其最近邻居“康江朝”(相似度0.762)和“李金”(相似度0.785),通过计算将“李金”学习过的“邮保安康产品理赔规划”、“其美多吉:雪线邮路,我一生的路”两门课程推荐目标学员“龙玉仪”。
5 效能评估
在测试集数据中选取部分学员,对其学习资源个性化推荐课程,通过邮件方式发放调查问卷,完成应用培训效能评测反馈。
每日优鲜成立于2014年,采取在线销售模式,消费者通过APP下单购买,商家接单后进行订单的配送,一般能在下单后的两小时内送达,让消费者在家就能享受到快速地服务。2017年8月,每日优鲜服务覆盖全国14个核心城市,在一线城市实现整体盈利。
培训效能评估的关注点,主要集中在个人学习效率、个人学习效果提升方面,共计发放问卷40 份,收回问卷30 份,有效占比为75%,其中3 分及以上(有提升)占比80.4%,2 分及以下(无提升)占比19.6%。问卷调查结果说明,基于学习资源个性化推荐模式能够有效提升培训效能。
6 创新及总结
利用大数据分析的方式,通过邮政企业培训课程资源体系、学员学习行为模式研究这两个视角作为切入点,提出亟待解决的学员培训需求个性化与学习资源利提供方式单一化两者间矛盾,通过对个性化推荐模式研究的解决方案,能够有效提升课程资源利用率,又调动了学员培训的积极主动性。
将个性化推荐技术引邮政企业培训的实际应用中,通过构建学习资源的个性化推荐模式,将课程资源体系、学习行为模式、培训效能提升紧密结合,打造“三位一体”的学习资源个性化推荐模式新应用,并结合中邮网院平台,进行了初步的应用与评测。
参考文献
[1]马宏伟.协同过滤推荐算法综述[J].小型微型计算机系统,2009,30(07).
[2]陈如明.大数据时代的挑战、价值与应对策略[J].移动通信,2012,36(17).
[3]孙励.个性化推荐技术及其在远程教育中的应用[J].学周刊,2015(28).
[4]王春才.个性化推荐系统冷后动问题研究[J].现代计算机,2015(29).
更正
兹有吴青衡同志刊于《电子技术与软件工程》杂志2019年1月上半月刊,第243页《基于大数据时代视角下人工智能实践》一文,原文摘要中“职能”改为“智能”、去掉第一个“实现”;第3 要点中“任然”改为“仍然”;结束语中“不在”改为“不再”、“发展的中”改为“发展中的”。
《电子技术与软件工程》编辑部
2019年5月
作者简介
庞超(1981-),男,河北省石家庄市人。硕士学位。工程师。主要从事远程教育与人力资源研究。
刘倩(1985-),女,河北省石家庄市人。硕士学位。工程师。主要从事远程教育与在线考试研究。
王颖(1986-),女,河北省石家庄市人。硕士学位。工程师。主要从事远程教育与课程开发研究。
宁福旺(1972-),男,河北省石家庄市人。硕士学位。高级工程师。主要从事远程教育与项目管理研究。
作者单位
石家庄邮电职业技术学院(中国邮政集团公司培训中心) 河北省石家庄市 050021
标签:企业培训论文; 混合推荐论文; 聚类分析论文; 协同过滤论文; 培训效能论文; 石家庄邮电职业技术学院(中国邮政集团公司培训中心)论文;