C2C市场网商发展模式及其影响因素研究,本文主要内容关键词为:因素论文,模式论文,市场论文,C2C论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
DOI编码:10.3969/j.issn.1672-884x.2013.12.017
中图法分类号:C93 文献标志码:A 文章编号:1672-884X(2013)12-1833-06
随着电子商务的迅猛发展,网络个体创业队伍不断壮大。截至2010年6月,我国个人网店已达1200万家[1],其交易额持续上升,发展路径越来越多元化[2]。随着与雅虎日本战略合作的开始,国际化进程也进入了崭新的阶段[3]。网商作为一个新兴的社会化群体,得到了越来越多的关注和认可。尤其是在金融危机的背景下,个人创业成为中国经济发展的一股重要力量。了解网商成长的主要模式并分析其主要影响因素,从而针对不同行业的网商提供相应的发展指导,对于电子商务市场的良性发展和中国经济的平稳增长都具有十分重要的意义。
网商是指持续使用互联网从事商务活动的中小企业,以及企业负责人、个体经营者和业务操作者[2]。已经有一些学者对网商的成长和转型进行了初步的研究,如LUO等[4]通过抽样数据比较了淘宝市场和eBay市场的发展速度,发现了网店年龄与交易量增长之间的负相关关系。卢向华[5,6]采用案例研究的方法,总结出个人网络创业经历的4个阶段和转型为公司化运营的突破约束的六大途径。两者都采用了抽样的方法,让我们对网商群体有了一个初步的认识。但是就目前的文献来看,尚没有对网商群体做发展轨迹的普查式研究,对网商群体的发展过程很难有一个全貌的认识,因此,本文以“网商发展模式”为研究对象,即研究网商的绩效变化所反映出来的其在不同的发展阶段(状态)跃迁的路径来了解网商发展的一般规律。通过聚类的方法,可以对这些跃迁的波动形态有一个全貌的了解,并找到具有代表性的网商主流的发展模式,了解不同发展模式的关键影响因素。这样的研究成果对于网商进行科学的发展规划、对于电子商务平台进行网商培育都有重要的意义。
因此,本文提出一种基于隐马尔科夫模型(HMM)对网商成长路径建模的方法,将销售数据的波动曲线转化为成长路径图。基于该模型,通过不等长时间序列数据的聚类技术,将网商的发展模式进行聚类,通过对距离各类中心最近的网商进行研究,了解该类别网商的主流发展模式。在得到主流的发展模式后,采用多分类回归的方法,定量分析各因素对发展模式的影响程度。
1 研究方法
1.1 网商成长过程建模
HMM是一种应用广泛的统计模型,用来描述含有隐含状态的马尔科夫过程。HMM研究的内容主要包括3类:第一类评估问题,即给定观察值序列O和模型λ=(A,B,π),求该观察值序列出现的概率多大。第2类解码问题,即给定观察值序列O和模型λ=(A,B,π),选择最能解释观察值序列O的状态序列Q。第3类训练问题,即给定观察值序列O,求出模型参数λ=(A,B,π),使该模型能够最好地描述观察值序列。
除了在语音识别、中文分词、机器翻译、生物信息学方面的成功应用,已经有学者把HMM应用到电子商务的建模中。AIZEN等[7]通过HMM的方法来描述电子商务网站上产品的流行程度。他用HMM中的隐状态来表征流行程度,设每一种状态的观测值是服从伯努利分布的随机变量,用分布的参数来表征消费者购买本产品的机会,并从购买记录中判断最可能的状态迁移,得到流行程度的度量。但是因为他采用启发式算法获得转移概率,很可能违背HMM中“转移到各个状态的概率之和应为1”的基本假设。本研究把网商月销售历史记录作为HMM的观测序列来推测网商所处的状态。由于销售商品数量是离散的整数,故假设观测的销量是一个服从泊松分布的随机变量:
1.2 网商聚类
时间序列聚类是数据挖掘领域的一个重要研究课题,目前的研究方法主要有3类[11]:基于原始序列数据的方法、基于序列特征的方法、基于拟合模型的聚类方法。其中,很多算法都要求进行聚类的序列等长,例如基于原始数据进行聚类中的relocation clustering,self-organizing maps(SOM)等。本研究采用BICEGO等[12]提出的基于隐马尔科夫的相似聚类方法将不等长的卖家销量时间序列数据进行聚类,具体步骤如下:
已有大量的学者对企业成长的影响因素进行了研究,主要可以归为两大类,即外部决定论和内部决定论[14]。由于网商所处的外部竞争环境大体相同,本研究从内部决定论出发,综合考虑资源和能力的影响。从资源论的角度[15]来看,网商发展的内生因素主要包括网店规模、多元化程度;从能力论的角度[16]来看,运营能力和服务能力水平也会影响网商的发展模式。本研究中,用产品数,即网商经营同一类商品的不同品牌、规格、型号等的总的数量,来表征网商规模;用产品类别数,即网商所经营的分属于不同大类的产品类别数,如经营纸尿裤的卖家还同时经营其他关联产品如奶粉、童车等,表征网商的多元化程度;用收藏人气和浏览购买转化率来表征其运营能力;用服务水平来表征其适应消费者变化需求的能力。由此,研究的影响因素与其对应的变量见表1。将影响网商发展模式的这些因素纳入到模型,可以定量地考察这些因素对发展模式发生概率的影响。
2 数据实验
2.1 数据收集
本研究重点探索网商自身运营努力所形成的发展路径,需要尽可能地避免产品自身发展周期对其绩效的影响,因此,虽然服饰、电子产品和化妆品是淘宝社区最畅销的产品类别[14],但其个性化差异明显,产品自身发展周期和季节更替对销售的影响较大。鉴于此,本研究选取产品自身发展较为成熟、同质化明显的母婴产品——纸尿裤的8733个网商进行月销售情况的研究。这些网商的网络店铺年龄分布近似服从幂率分布,拟合指数为2.81(见图1)。其中,有进入社区以来完整销售月报的网商4712名,本研究选择进入淘宝社区超过10个月并且有连续月销售记录的1092名网商月销售额的时间序列数据作为研究的对象。
图1 该行业网店年龄分布
2.2 网商发展模式聚类
通过5个步骤的计算,得到了K分别取3、4、5、6、7情形下的Silhouette值(见图2a)。Silhouette值[17]是用来判断K-means方法聚类效果的重要参数,值域为[-1,1],其越接近于1,表明聚类的效果越好。如图2a所示,在K=6时Silhouette值最大(0.928),表明应当将1092个网商聚成6类。从图2b中也能看到,分成6类时,误分类的点比例较小。
通过K-means算法得到了所有网商的类别归属情况后,通过比较各网商到类别中心的距离,可以找到6个类别中最有代表性的网商。将其销售数据作为输入,采用Viterbi算法[10]得到其在成长各状态的跃迁情况(见图3)。
类别1表明,该类网商在相当长的一段时间内都处于平稳的起步阶段,半年左右的时间后,稳步上升至状态3和状态4,并基本稳定在比较高的状态上,该类别的网商占到了总数的3.6%,可以称为高位平稳型。类别2显示的是平稳起步之后,做了一些努力有所起色,有所波动但取得较大提升的网商,这一类别的网商占到了3.8%,称作上升通道型。类别3和类别4中的网商,都是建店不久就有较好表现,但是不太稳定,状态起伏较大的网商,分别称作波动高位型和波动低位型,2类所占的比例合为11%。类别5占到了总数的2%,呈现出较大波动的情形,但是波动后销售一直处于较为低迷的状态,称为波动沉寂型。类别6占到了总数的79.7%,2次波动相差1年,其余时间一直处于比较平稳的较低的状态,可称作年度波动型。
图2 Silhouette值图
图3 网商的6类成长路径图
2.3 影响因素分析
由聚类结果可以发现,成功发展到较高状态并有稳定表现的网商都是在建店半年后稳步发展起来的。经过初期半年左右时间的熟悉和磨合,网商对电子商务平台和商业伙伴都会有比较深入的认识。在半年的积累期里有哪些因素影响这些网商表现出不同的发展模式,可以采用多分类回归方法,更深入地理解各影响因素的影响程度。为此,又收集了研究对象(1092个卖家)最初半年的各项运营指标,对有月度数据的变量(产品数、产品覆盖行业数、收藏数、浏览购买转化率、好评率)求6个月的平均值,对只有当前值的变量(是否消保)取当前值。
该数据实验的自变量的描述性统计分布情况见表2和图4。
对变量的分布进行分析可以发现(见图4),本研究的重要变量都不服从正态分布,偏度很大,因此需要考察自变量的对数形式对因变量(发展模式)的影响。
以第6类为基准类,Multinomial Logistic模型的估计结果见表3。
由模型参数估计得到的结果可知,与预期截然不同,服务水平(是否提供消保、好评率)在6个类别间没有明显区别,决定网商发展模式的是网店规模、多元化程度和运营能力(收藏数和浏览购买转化率)。如果将类别6作为普通型网商来做比较,呈现较好发展的是那些产品数不多,但是覆盖类别多的网商。
以上的分析结果对于母婴类网商在运营资源配置和提高运营能力方面都有重要的启示。由于网络铺货并不需要和传统零售业一样租用场地,一般都认为商品展示得越多,吸引顾客注意力的可能性越大,所以倾向于在资源能力所及的范围内尽可能地增加商品品种。但是以上的研究结果表明,如果网商希望能有类别1和类别2的发展模式,在资源配置时,并不能一味地追求商品数量,而需要把注意力集中在挑选有竞争力的产品方面,节省进货、客服和售后的成本;另一方面,需要尽可能使产品覆盖的产品大类数多一些,可以认为,采用多元化战略是非常必要的。同时,在运营能力方面,可以看到,“收藏数”和“浏览购买转化率”对良好的发展模式的形成具有显著的正面影响,即同样到达了网商的商铺页面。
3 结论与展望
本文提出了一种基于HMM对网商的发展模式建模的方法,在此基础上,采用不等长的时间序列曲线聚类方法将行业内全体网商的发展模式进行聚类,全面展示行业内网商的主流发展模式。在得到主流模式之后,采用多分类回归方法分析可能影响发展模式的若干因素。在数据实验部分,本文以淘宝社区母婴类别的网商为例,找到了该行业网商主流的6种发展模式,并尝试分析与发展模式相关的影响因素。该方法对于分析行业发展特征,指导网商发展,具有十分重要的作用。
由于数据的限制,目前的研究以销量作为网商绩效的粗略评价指标,并不能十分准确地刻画网商的生存状况。同时,由于网商数量巨大、涉及行业丰富,本研究目前只研究了母婴类网商的发展模式,有待于进一步了解其他行业的情况,了解不同行业网商发展的共性和个性特征。
本研究得到了阿里巴巴集团淘宝网商务智能部陈朝晖、李宗伟、黄健敏的大力支持,一并致谢!