在线调查与评估的偏差分析及对策_访问者模式论文

在线调查估计偏差分析及相应措施,本文主要内容关键词为:在线论文,偏差论文,措施论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:C811  文献标识码:A

一、在线调查误差分析

(一)访问者自主决定是否参与调查的偏差

目前网站在线调查的做法是在网页上设置调查问卷,访问者浏览页面,如果感到新奇或确实对调查主题感兴趣,就会参与调查回答问卷,否则离开网站,不参与调查。这种做法是让访问者自主决定是否参与调查,相当于是让所有登陆网站的人参与调查,而大部分不参与调查者成为无回答者。

式(1)表明,用作本均值做n个全部访问者均值的估计值的偏差取决于两个因素:一是无回答率,无回答率越大,偏差就越大。美国调查业已经很成熟,但电话调查的回答率已降到30%[4],而网络调查的回答率更低。回答意愿受访问者网龄、上网目的、交费方式、网络速度等因素影响。根据中国互联网络信息中心2004年7月发布的《中国互联网络发展状况统计报告》(以下简称《报告》),截止到2004年6月,用户上网地点(多选)主要是家中(67%)、单位(42.7%)、网吧(22%),考虑到收费和时间的因素,回答率是较低的。用户上网主要目的主要是获取信息(42.3%)、休闲娱乐(34.5%)、学习(9.1%),而炒股、网上购物、商务等活动不及2%,说明中国网民电子商务活动极少,参与在线调查的积极性也不会太高。可以想象,如果没有有效的广告宣传和相应的奖励机制,在线调查问答率是非常低的;二是登陆网站中回答者和无回答者均值之间的差额,回答者中,除了部分是感到新奇参与调查,其他都是对调查主题感兴趣才参与调查,不具随机性,产生回答偏差。

非网站访问者包括上网但未访问调查网站和不上网者,这里的主要差别是不上网者和上网者之间的。根据《报告》统计,中国网民年龄集中在30岁以下(70.5%),文化程度以高中(中专)、大专、本科为主,占84.8%,职业以学生(31.9%)为主,说明中国网民的分布比较集中,网民与非网民之间的差别很大,用在线调查数据估计目标总体特征值有很大偏差。

(二)增加样本量不能有效降低偏差和方差

由于无问答减少了实际调查的样本数量和产生估计偏差,很多网站的做法是延长调查时间,以期增加样本数量来减少估计偏差和方差。

事实上,从公式(1)和(2)来看,增加样本量并不能减少估计偏差。我们用MSE来反映样本估计值与目标总体真值之间的偏误程度。在此仅计算m个回答者样本均值作n个访问者估计值时的偏误。

通过上述分析说明,要降低估计偏差和有效降低估计量方差,最好的方法是提高在线调查回答率,同时也要降低回答者和无回答者之间估计值的差距。

二、在线调查抽样分析

结合上述分析,在线调查应采用抽样的方法主动选择访问参与调查而不是让访问者随意自主选择参加与否,做法是对于抽中的访问者才弹出调查页面或发出调查邀请,而其他访问者看不到调查页面。根据中国网络的实际情况和网站开发技术特点,采用系统抽样法比较科学,相对其他抽样方法而言偏差较低且容易实现。

(一)采用系统抽样法的原因

在线调查不能采用简单随机抽样、分层抽样、整群抽样等常用抽样方法的主要原因是不能确定样本框。由于一定时间内访问网站的人数是随机的,来源也是随机的,没有很好的办法区分开不同的访问者,更不能主动联系到访问者。有人建议用IP地址来区分访问者或建立样本框,是不现实的。首先IP地址是对应上网机器而非访问人员,而且很多IP地址是分配给服务器使用的。网吧、单位和学校大多是多台机器共用一个IP地址上网,家庭和网吧中基本上是一台机器多人使用。其次是我国有2/3以上的机器是通过拨号方式上网,意味着这些机器每次上网获取的IP地址是不同的。因此,不可能用IP地址和调查对象对应起来。

(二)系统抽样方法的实现

系统抽样是将总体牛的单元按某种顺序排列,在规定的范围内随机抽取起始单元,然后按一定规则确定其他样本单元,特点是简便易行。最简单的系统抽样是等距抽样。一种方法是时间等距抽样,根据样本数量要求,把调查期间分成多个时间段,每个时间段内抽样一定的访问者参与调查。比如,确定每半小时内的第一个访问者为调查对象,一天就可以取得48个样本。但一天之内访问者上网时间不是均匀分布的,据《报告》统计,中国网民上网高峰时间集中在晚上7~11点,据此应该做不等概率调整。另一种方法是访问顺次等距抽样,根据以往登陆情况,估计出调查期间内的访问量,再根据样本需求量,计算出每隔多少访问者抽出一位调查对象。这种方法不受访问者上网时间限制,但需有调查经验和历史资料估计访问量。这两种方法都可以很容易地用网络编程语言实现,如JSP,ASP等。

采用等距抽样法的主要是改变了由访问自主决定是否参与调查的状况,由调查方随机抽样,具有很好的代表性,极大的降低了回答误差;另外,由于是少数访问者被抽样参与调查,回答率也能相应地提高,从而降低估计偏差。

(三)估计值及方差分析

式(6)表明,替换法并不能完全消除估计偏差,受替代者和被替代者之间均值差及替代率的影响。但替代法保证了样本数量,能把抽样误差控制在一定的范围。

比较式(1)和式(6),是采用替代法前后估计偏差的公式一样,但经分析可知,无回答率和回答偏差都有不同程度的降低,因而降低了偏差期望值。

三、结论

在线调查采用等距抽样法简便易行,不同于目前大多网站让访问者自主参与调查的做法,能极大的降低估计偏差,减少抽样方差。用替换法处理在线调查中回答率低的问题,也可以在一定程度上降低估计偏差,控制抽样方差在一定范围。

在线调查作为新的调研领域,有其明显的优势,也有很多亟待解决的问题,需根据中国网络的具体情况分析,不能盲目套用传统调研方法或国外在线调查模式。本文对中国目前在线调查中出现的估计偏差和无回答作了分析,提出了一些解决方法,但在中国的网络普及率还不高的情况下,网民的代表性,如何有效降低无回答率,网络抽样效率等问题都有待进一步研究。

标签:;  

在线调查与评估的偏差分析及对策_访问者模式论文
下载Doc文档

猜你喜欢