网上拍卖竞价数据特征及分析方法研究_网上拍卖论文

网上拍卖中竞买者出价数据的特征及分析方法研究,本文主要内容关键词为:特征论文,网上拍卖论文,方法论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

修复日期:2008-06-22

中图分类号:C812文献标识码:A文章编号:1007-3116(2008)09-0017-06

一、引言

网上拍卖是将传统的拍卖与网络相结合的一种新的商务模式,它利用网络及其技术平台将所售物品的外观、价格、承运成本等与产品相关联的属性信息以网页的形式加以呈现,并通过竞争投标的方式出售物品。网上拍卖市场的发展,不但为广大用户提供了一个进行商品买卖的平台,同时还为研究者提供了一个对网上拍卖进行实证研究的机会。拍卖网站所提供的数据,使得研究者能够从中攫取有价值的信息,以对参与者的经济行为和产品市场等进行推断,因此网上拍卖越来越成为经济学、管理学及信息系统等学科的热点研究领域之一。

现有关于网上拍卖问题的实证研究中,国外学者做了大量的工作,也取得了许多有价值的结果,代表性的研究有参考文献[1]~[5]等。中国有关网上拍卖的实证研究文献不多,代表性的研究文献有周黎安[6]等。从实证研究中所使用的分析方法来看,虽然一些研究文献使用统计方法分析数据,但它们所采用的方法实质上是将网上拍卖数据看作横截面数据,并在时间维度上进行简单地加总。这种做法忽视了网上拍卖数据自身独有的两个典型特征,即:(1)竞买者出价到来的时间在拍卖期内是随意的、不等间隔分布的,且随不同的拍卖而不同;(2)竞买者的出价过程是一动态变化过程,随时间的变化而变化,是时间的函数,即数据记录呈现函数的形式——函数性数据(functional data)。这种忽视网上拍卖数据的具体特征,且简单地利用传统统计分析方法的思路,不能充分挖掘数据提供的信息,难以对竞买者的出价行为等问题进行准确的刻画。那么为什么不能简单地使用传统的统计分析方法分析网上拍卖数据呢?网上拍卖数据与传统统计数据有什么区别,即其本质特征是什么?应该使用什么方法对其进行分析?对这些问题的回答和解决无疑具有重要的意义。

本文从数据容量、数据的混合性、不等间隔分布和数据密度等方面,以全球最大的C2C拍卖网站eBay(www.ebay.com)上获取的实际拍卖为例,对网上拍卖数据的产生机制进行阐释,对其特征进行分析,并给出了分析此类数据的方法。本文共分四部分,以下内容的安排是,第二部分描述了网上拍卖中竞买者的出价及记录;第三部分阐释了竞买者出价数据的特征;第四部分给出了分析网上拍卖数据的方法,并利用实例说明了分析过程。

二、网上拍卖中竞买者出价及其记录

拍卖网站上,如果买家想以尽可能低的价格购得物品,那么他可以参加拍卖竞标;如果他想更快地购买物品,则可以选择固定价购买。不管是哪种情况,买家的任何出价都等价于与卖家签订了具有法律约束力的合约。

eBay上的物品多采用拍卖的方式登录,且多采用英式拍卖。卖家在eBay上登录物品须首先注册成为eBay用户,并且要通过卖家认证。eBay服务向导会引导卖家填写物品的拍卖方式及欲拍卖物品的相关信息。拍卖方式有两种,即竞价和定价;拍卖物品的信息涉及物品的名称、数量、物品说明、物品所在地等。卖家随其意愿既可选择所售物品的拍卖方式,以及起拍价、一口价和底价等,还可选择拍卖的期限,即拍卖持续的时间,一般有1天、3天、5天、7天、10天、14天或一个月。

买家在竞买时能够看到拍卖物品的信息,内容涉及物品的说明、出价记录、目前的最高出价、拍卖的剩余时间等。同时,买家还可以看到卖家的信用评价、注册日期等信息。在物品的拍卖过程中,一般会有多位对该物品感兴趣的买家对物品出价,拍卖结束时的最高出价者一般会获得该物品。买家在竞买时,拍卖网站要求其每次出价都要比上一个报价至少有一定的增加量。

买家点击拍卖物品网页下部的拍卖记录(history),可以看到其他买家对正在拍卖物品的详细出价记录。另外,eBay网站对于已经结束拍卖的物品的出价至少保留30天,不过出价记录并非根据出价时间的先后顺序进行排列,而是依据出价金额从高到低排列,详细情况参见表1。

三、竞买者出价数据的特征

从上面关于竞买者出价过程的描述,特别是拍卖物品的出价记录表(见表1)可以看出,网上拍卖数据与传统的统计数据有显著的差异,有其独有的特征,具体表现在数据容量大、具有混合性、不等间隔分布及数据密度不均匀等几个方面。

(一)数据容量

随着电子商务的发展,越来越多的商品采用网上拍卖的方式进行销售。据有关资料显示,采用网上拍卖方式成功交易的货物量约占eBay网上总货物交易量的60%,每天在全球eBay网站销售的产品多达数千类,eBay用户每秒买卖的商品总值超过1 640美元,任何时间均有超过一亿零四百万件的商品在全球各地待售,且每日均会增加逾650万件的全新商品。因此,拍卖网站上有大量的拍卖物品,每一件物品的拍卖网页又包含多方面的信息,如物品的名称、数量、物品说明、物品所在地、拍卖的起止时间、拍卖的期限、起拍价、卖家和买家的信用指数和信用评价星号等级、买家的出价记录等。观察表1显示的eBay香港网站上已结束拍卖的Motorola手机(MotoQ)的出价记录,这里共有4个竞买者,出价17次,最高出价为210美元。同时,出价记录中还显示了与出价者交易过的eBay会员数目及对出价者的评价。

由以上分析可以看出:网上拍卖数据的容量很大,而且维度也高。大量丰富的网上拍卖数据及可获性为实证研究提供了资料,如Bapna等在“网上拍卖消费者剩余”的研究中使用了4 514个eBay拍卖的数据,拍卖产品横跨18个类[7];方健雯在其撰写的博士论文《网上拍卖信任机制的建立——基于不同信息来源的分析》中,利用307个拍卖的数据进行了实证研究[8];Ghani等人的研究中,考虑了2004年2月eBay上PDA类产品的拍卖,拍卖中的物品件数达491 727件之多[9]。

虽然大量丰富的网上拍卖数据为实证研究网上拍卖问题提供了可能,但规模大、维度高的网上拍卖数据同时带来了数据存储和处理方面的困难,增加了研究者的计算负担。

(二)数据的混合性

网上拍卖数据,特别是物品拍卖的出价记录,既具有横截面特性(属性信息),又具有时间序列特性(纵列信息),即是横截面数据和时间序列数据相结合的数据,因此网上拍卖中的出价数据具有混合性特征。一般来说,一个包含n个记录的样本,由n个时间序列构成,每一个时间序列又与一组属性相关联。如eBay网站物品拍卖的出价记录,每个拍卖以与时间有关的出价展示,同时又与拍卖属性,如卖家的信誉、拍卖期限等相联系。另一个例子是Yahoo! Moves上的电影评级,用户可在Yahoo!Moves上以不同方式对电影进行评级,于是自某部电影上演之日起每天的平均等级就构成了一个时间序列,且这个时间序列还与电影的流派、批评等属性有关。

(三)不等间隔分布

如果将网上拍卖中竞买者的每次出价看作一个事件,那么这个事件会受到出价者登录网站的时间和其所处的地理位置的影响,其结果是新事件到来的时间是随机的,间隔时间的差异非常大,即事件到来的时间不等间隔分布。观察表1中Motorola手机(MotoQ)的出价记录发现,第一个出价(US$100.00)到来的时间是2008年2月15日的上午7时29分57秒,第二个出价(US$110.00)到来的时间是2008年2月18日的凌晨2时38分59秒,第三个出价(US$110.00)到来的时间是2008年2月18日的凌晨3时24分9秒,第四个出价(US$115.00)到来的时间是2008年2月18日的凌晨3时24分28秒。为了能够清晰地看出时间的分布,本文将表1中出价到来的时间以天为单位表示,具体结果见表2,其图形展示见图1。

从图1可以清楚地看出:出价(事件)到来的时间间隔差异非常大,明显地呈现不等间隔分布,这是网上拍卖中竞买者出价数据的另一个典型特征。竞买者出价数据的这个特征与传统时间序列分析中数据的时间特征形成了鲜明的对比。传统时间序列分析中的观察数据往往以事先设定的时间顺序记录,如按日、周、月、季节、年等来记录,无论时间采用哪种尺度,观察时点之间的间隔是相同的。如果将观察时点序列记为(t),则在传统时间序列分析中,数据观察时点t,t+1,t+2,…之间的间隔是一样的,而在网上拍卖的出价记录中,时点t,t+1,t+2,…之间的间隔差别很大。如表2所示,若将第一个事件(出价)来到的时间记为t=1.3125,则t+1=4.1104,t+2=4.1418,t+3=4.1420,它们之间的间隔明显不同。

(四)数据的密度

因心理、经济或其它原因所致,网上拍卖中竞买者出价的时间序列数据会呈现密度不均的特征,即在有些时间段出价次数较少,数据稀疏,而在有些时间段出价频繁,数据密集。较具说明性的例子是eBay网上拍卖的出价,大量频繁的出价集中在拍卖的后期,从而导致拍卖期间有些时段上出价特别稀少。观察图1发现,eBay香港网站上Motorola手机(MotoQ)的出价集中在第四天至第五天,在接近拍卖结束的时刻,接连有3次出价,而在第一天上午八点以后至第四天开始一直没有出价,数据出现的密度严重不均。

四、网上拍卖中竞买者出价数据的分析方法

(一)网上拍卖中出价数据对传统统计学的挑战

从实证研究的角度看,大容量的网上拍卖出价数据能够使研究者对网上拍卖问题进行实证研究,但规模大、维度高的数据同时也带来了数据存储和处理方面的诸多困难,特别是加重了研究者的计算负担。因为网上拍卖中竞买者出价数据的混合特征,似乎可以使用计量经济学中的面板数据分析方法来处理,但面板数据分析方法依赖一定的假设条件,从而使它在分析网上拍卖数据中的有效性受到置疑。另外,网上拍卖中竞买者出价数据的不等间隔分布特征使得面板数据的分析方法难以对其应用,同时也使得传统的时间序列分析方法难以用到网上拍卖数据的分析中。

综上所述,网上拍卖中竞买者出价数据具有的大容量、混合性、不等间隔分布及密度不均匀的特征,对传统统计分析方法提出了挑战。因此,寻求分析网上拍卖数据的合理、可行、有效的方法就显得尤为重要。

(二)函数性数据分析方法(functional data analysis,FDA)

相对于传统统计分析方法,函数性数据分析方法以函数性数据为其研究对象,它在减轻数据的计算负担、充分考虑数据的混合性、不等间隔分布以及密度不均匀特征等方面具有明显的优势。

函数性数据分析的概念,始见于加拿大统计学家Ramsay和Dalzell于1991年发表的论文《函数性数据分析的一些工具》。近年来,Ramsay和Silverman等国外知名统计学家就函数性数据做了许多研究,取得了许多有价值的结果[10-12]。为了利用函数性数据分析方法对网上拍卖的出价数据进行分析,并出于叙述和计算简单明了的考虑,从eBay国际网站上选取了五个七天期限的拍卖,对出价者的数据进行了整理。五个拍卖中原始出价共计99次,考虑到篇幅的限制,略去了原始数据表。另外,以下的图形绘制和相关计算是利用基于MATLAB编写的程序进行的。

首先,绘制五个拍卖共99次出价金额与其出价时间的散点图(见图2)及每天的出价次数图(见图3)。由图2和图3可以看出,大多数出价集中在拍卖后期,特别是集中在拍卖即将结束的一天或几个小时内,即所谓的拍卖“狙击”(bid snipping)或最后时刻出价(last-minute bidding)现象。同时,图2和图3也显示了出价时间和出价次数在七天中的分布极不均匀。

图2 五个拍卖的99次出价图

图3 五个拍卖出价次数分布图

第二,由于五个拍卖中竞买者的出价数据具有混合性、不等间隔分布及密度不均匀的特征,因此,一个想法是将每一个拍卖的出价数据看成一个整体,并假设产生数据的出价过程是一个连续过程。为了从出价数据得到产生这组数据的连续过程,需要对原始数据进行插值计算和修匀处理。本文利用的是线性插值,并应用B-spline基进行修匀。考虑到五个拍卖出价次数的具体分布,节点选择为0,1,2,3,4,5,6,6.25,6.5,6.75,6.812 5,6.875,6.937 5,7。利用基于MATLAB编写的程序可以得到五个拍卖出价的修匀曲线图(见图4),从左到右分别对应着第一至第五个拍卖。可以看出,每一个拍卖对应着一条匀滑的曲线。由于对出价数据进行处理时,既考虑了数据的拟合程度,又考虑了拟合曲线的匀滑程度,因此,这里的五条曲线对应的函数是可导的(此处保证函数至少二阶可导)。

图4 五个拍卖中竞买者出价的修匀曲线图

第三,为了进一步分析竞买者出价的动态变化模式,对上面得到的出价曲线对应的函数分别求一阶导数和二阶导数,并绘制二阶导函数与一阶导函数的关系图,称其为相平面图(phase-plane plot),具体结果见图5。如果将出价曲线的一阶导数和二阶导数分别类比于物理中的速度和加速度,则其大小分别反映了竞买者出价动态变化的动能和势能,相平面图反映了这两种能量的交替变化情况,从而反映了“支撑”竞买者出价的内外在因素的变化,具体表现为竞买者出价的变化。

图5 五个拍卖的相平面图

利用相平图对出价的动态模式进行分析时,需要结合拍卖的具体属性,出于简洁的考虑,仅考虑起拍价、最终拍卖价和竞买者出价次数,具体情况见表3。由图5可以看出:除第五个拍卖外,其他拍卖在拍卖刚开始时(图中的0-1段)势能较大,而且物品的价值越高、起拍价越低,其势能就越大,其动能一般也较大,竞买者出价的变化也较大,但后期出价变化不大。观察第一个拍卖和第五个拍卖的相平面图发现,刚开始时一阶导数(动能)接近于零,其特点是起拍价高,分别为$49.99和$89,但拍卖后期(图中的6-7段)能量较大,竞买者出价变化较大。两个拍卖中竞买者的出价次数并不多,其后期价格变化某种程度上说明存在经验丰富的竞买者参与后期竞拍,猛抬出价,旨在赢得拍卖。事实上,第五个拍卖在前六天没有出价记录,所有的出价全部集中在最后一天,而且价格猛增的几次出价基本是经验丰富的竞买者所为。

第四,有了以上的准备后,可利用函数性主成分分析(FPCA)及函数性方差分析方法,对典型的出价曲线特征和其变异性进一步分析,也可以使用函数性线性模型等方法对最终出价进行预测。具体方法和应用实例可参见Ramsay和Silverman及参考文献[13],故不再赘述。

综上所述,网上拍卖中竞买者出价数据具有自身独有的特征,传统的统计分析方法对其无能为力。函数性数据的分析方法,在减少大容量网上拍卖数据带来的计算负担、克服数据的不等间隔分布及密度不均匀等方面,具有传统统计分析方法不可比拟的优越性,是分析网上拍卖数据的行之有效的方法。

标签:;  ;  ;  ;  ;  

网上拍卖竞价数据特征及分析方法研究_网上拍卖论文
下载Doc文档

猜你喜欢