基于数据挖掘的现代物流信息系统管理问题研究,本文主要内容关键词为:信息系统论文,现代物流论文,数据挖掘论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
经济全球化和世界市场一体化步伐的加快使得企业面临的市场竞争不断加剧,物流逐渐成为了企业的第三利润源泉和培育企业核心竞争力的重要领域。现代物流活动和作业是集运输、仓储、流通加工、包装、配送、客户服务、信息管理等于一体的综合型服务,其每个环节中都产生和集聚着大量的信息,这样物流企业在物流业务运行和实施中积累了大量的业务信息数据,在信息化时代只有借助先进的数据分析挖掘工具才能有效地对海量的业务数据信息进行及时处理和智能分析,才能有效地挖掘和发现隐藏在数据背后的知识和商业模式特征,从而为管理者进行业务管理决策提供有效的数据支持。
数据挖掘技术的产生有效地解决了这一问题,在物流信息系统中应用数据挖掘技术可以对企业物流运作中产生的海量数据信息进行分析,据此可以分析和掌握企业销售、采购、市场、仓储、流通、客户、财务等信息,决策者可以做出有针对性的科学决策和相应的改进措施,从而提高企业的经济效益和管理水平。
2 物流信息系统组成模块及功能
现代物流企业或企业物流作业内容和范围一般涵盖原材料物资采购、运输、仓储、流通加工、装卸搬运、包装、配送以及相应的信息管理等环节,因而其物流信息系统的模块组成就应该相应地包括这些环节及其衍生环节的需求而提供相应的管理功能。图1给出了通常的物流信息系统功能模块组成框架。
图1 物流信息系统功能模块组成框架
3 物流信息管理中数据挖掘的步骤和定义
3.1 数据挖掘的步骤
Data Mining即数据挖掘,它是计算机数据仓库处理的一种方法,数据挖掘的开始首先是从数据挖掘环境的构建开始的,硬件、软件和用户构成了数据挖掘环境的三大因素;在数据挖掘的环境准备好后,接下来就应该遵循需求分析、初始数据准备整理、数据挖掘实施和挖掘结果应用几个先后阶段进行数据挖掘。表1给出了数据挖掘的基本步骤及其内容。
3.2 物流信息管理中数据挖掘的定义
数据挖掘技术应用到物流企业物流作业管理和物流信息系统中,就是根据物流企业的业务经营目标,综合使用各种计算算法和技术对物流作业中形成的大型业务数据仓库进行数据分析,从中发现或概括出有用的知识模型或商业运作规律,以此为依据和导向来优化调整物流企业内部的业务流程和组织机构以完善其整体管理机制,并为经营管理层的科学决策提供可靠的数据支持,从而提高企业的管理水平和经济效益以及综合竞争力。数据挖掘技术在物流企业信息管理中应用的三大领域是客户关系管理、供应链系统管理和决策支持。客户关系管理中数据挖掘的使用可以帮助物流企业进行客户满意度分析、客户流失原因分析、客户价值细分、客户忠诚度分析、交叉销售分析。在供应链运作模式下,物流企业的每个环节和过程的衔接是否合理科学对于整个系统的运行效率至关重要,同时供应链系统运作中会产生海量的信息,整个链条会不断延伸,这时将数据挖掘技术引入到供应链分析和诊断中来就显得更加重要。总之,数据挖掘技术在物流企业的决策支持系统中有着非常重要的支撑和支持作用。
4 实证研究:物流信息系统中数据挖掘技术的应用
从物流企业物流信息系统的运行实践和结果上看,其已经能够初步满足物流企业业务运行信息化和快捷处理的需要,但随着信息系统的长期运行,其底层数据库的数据积累就会显得异常庞大,而这些业务信息对于企业分析和诊断物流业务经营和管理中出现的问题和状况具有非常重要的价值,为此引入数据挖掘技术实现对物流信息系统数据仓库的优化管理,以迅速及时、优质服务、节约空间、库存控制和规模优化为目标,对物流信息系统中的财务管理模块、销售管理模块、运输管理模块、库存管理模块和采购管理模块进行数据挖掘需求分析。图2给出了上述五个模块应用数据挖掘技术的基本需求。
4.1 数据挖掘框架模型的设计
决策树、神经网络、关联规则、聚类分析、遗传算法等是比较普遍应用的几种数据挖掘算法,上述几种数据挖掘算法和数据挖掘前端工具以及数据选择单元、物流业务管理规则、数据访问接口等组成了数据挖掘的基本框架,该框架与外部的信息发布平台、数据仓库和数据分析库等相连接并进行信息交换,对运输管理、财务管理、采购管理、库存管理和销售管理数据信息的挖掘并将其内在知识联系和模型呈现给企业管理者。图3给出了物流信息数据挖掘的框架模型。
图3 物流信息数据挖掘的框架模型
从图3中可以看出,物流信息系统中用以评判挖掘知识的规则存放在物流管理服务规则数据库中,数据挖掘的结果需要经过论证、评价和检验,其中用户的要求是否得到满足是一个重要的评判标准,涉及物流作业管理的各种数据主要存储在数据仓储中,它包括各种类型的数据文件,数据评估服务允许用户以在线分析的形式根据自定义的数据维度和量度对数据进行分析和查询,其核心在于数据挖掘算法的选择,可以根据需要在主要的数据挖掘算法中进行选择或组合。
4.2 应用关联规则进行数据挖掘的步骤
(1)关联规则挖掘。关联规则挖掘算法是数据挖掘技术算法中一种很重要的算法,其基本思想是在事务性数据库中寻找满足给定最小支持度和最小信度的关联规则,其挖掘流程包括两个基本操作,首先根据最小支持度阈值在事务性数据库中寻找到项目数据集,其次根据项目数据集和最小置信度来生成所有的关联规则。
(2)准备数据。本文在物流信息库中随机抽取了2 000个客户信息作为数据样本,对于每个客户选取其数据记录行中的客户编号、客户类型、经营时间、注册资本、信息反馈和评分等属性字段作为分析数据。对客户注册资金进行分组:P1[100,300],P2[300,500],P3[500,1 000],P4[1 000,2 000],P5为2 000以上,然后对客户的经营时间进行分组:Q1[0,1],Q2[1,3],Q3[3,6],Q4[6,10],Q5为10年以上,对信息反馈率进行分组,R1[0,60],R2[60,75],R3[75,85],R4[85,95],R5[95,100],对评分进行分组:S1[0,60],S2[60,75],S3[75,85],S4[85,95],S5[95,100]。根据分组编写数据挖掘关联规则程序,找出客户类型、经营时间、注册资本和评分之间的关系。表2给出了部分客户评价信息表视图,共有2 000行数据。
(3)挖掘结果。采用apriori分层搜索算法对上述步骤中的数据进行挖掘计算分析,从而找出物流服务质量效果中客户类型、经营时间、注册资本、信息反馈、评分等几个因素的影响大小和作用程度,从而制定出要提高物流服务质量的策略和措施,将最小置信度和最小支持度同时设置为5%即可得到置信度和支持度在95%水平上的关联规则挖掘结果,见表3。
(4)结果分析与评价。从表3的挖掘结果看,规则1说明客户企业的类型属于内资型企业,其置信度为56.7%,支持度为38.2%,规则10则表明注册资金P5即为2 000万元以上的置信度为68.2%,其支持度为24.5%,规则15表明客户企业经营年限为Q5即10年以上的置信度为62%,支持度为24.2%,规则20则表明信息反馈率在R5即95%以上的客户企业其拥有良好信誉的可能性是86.8%,支持度为55.6%。根据应用关联规则挖掘到的数据结果,物流企业可以采取以下措施来提升和改善物流服务质量。
企业类型字段属性中港资企业和内资企业的支持度较高,而其他类型的诸如台商、澳商和外资企业则较低,物流企业的管理者应该加大对这些目标客户群的开发力度,加强对其物流需求的分析,从而扩大服务市场;注册资本在P5即2 000万元以上的客户企业其置信度较高,但支持度较低,说明物流企业的客户组成结构中这部分客户的数量过少,因此应该加大对这些优质客户的开发力度;经营时间较长的客户企业有着较为稳定的物流货物来源,这些客户企业拥有较高的置信度水平,但其支持率偏低,对这些客户物流企业应该多给予一些优惠政策,巩固与这些企业的合作关系,防止客户外流;信息反馈率较高的客户企业对于物流企业所提供服务的关注度较高,交易也比较频繁,这就要求物流企业的管理者要多注重与这些客户企业的沟通交流和互动。
5 总结
随着物流企业的快速增长和信息系统的广泛应用,其数据信息量也呈现出指数级的增长,要提高对这些海量信息的处理速度和处理效果,就必须在物流信息系统中引入数据挖掘技术,数据挖掘技术可以有效地对物流信息系统中的运输管理、销售管理、采购管理、库存管理和财务管理等领域进行数据挖掘和知识发现,提高物流环节的运行效率,减少相关冗余作业和降低物流成本,还可以为物流企业经营管理决策提供科学的依据和数据支持。
标签:数据挖掘论文; 物流信息系统论文; 大数据论文; 数据挖掘算法论文; 客户分析论文; 客户管理论文; 现代物流论文;