中国消费领域社会关注变化趋势研究-基于人民网经济新闻排行榜文本的LDA模型分析(2007—2017)论文

【经济学研究】

中国消费领域社会关注变化趋势研究
——基于人民网经济新闻排行榜文本的LDA模型分析(2007—2017)

王建红,王曼曼,杜宝彪

(华北电力大学 马克思主义学院,河北 保定 071003)

摘 要: 以2007—2017年人民网中每日经济新闻排行榜的文本为对象,运用LDA主题模型方法,分析经济新闻中消费领域的社会关注的内容与趋势变化。研究发现:不同消费行业的社会关注热度和具体关注内容差异较大;对“质量”“健康”“绿色”这种科学理智的消费观念总体关注热情不断高涨,且近年来对“高档”“名牌”这种符号化消费观念的关注逐年淡化;对购物方式、购物地点及支付方式的关注愈加趋向以互联网为媒介所发生的消费行为。

关键词: LDA主题模型;消费行业;消费观念;消费行为

一、研究方法与数据处理过程说明

(一)研究方法:LDA主题模型

LDA主题模型是一种以计算机科学算法为基础,能够对浩瀚、大规模的文本语料库通过自动训练进行主题提炼的文本分析技术。其基本思想是:“文本看成是一系列潜在主题的概率分布,其中每一个主题都是隶属该主题的词条集的概率分布。”[1]具体而言,这种技术方法首要是确定一个研究领域,构建一定规模的对应的文本语料库,将目标文本统一转化为易于识别、建模的数据信息,通过计算每一个文本文档所内涵主题的概率分布,经过足够次数迭代之后,根据收敛最佳状况,最终输出多个不同主题的包含一定量概念词汇的词群。此技术的优势在于,运用这一方法能够尽可能估算给定语料库的最优主题数,克服人为确定主题数太多或太少导致解释力不强的局限,还能依据文本的主题表征,客观处理高维和大规模的文本分类,去除因人工研读无法避免的主观性降维[2]

截至目前,这一技术在自然语言处理、数据挖掘、图书情报、文本检索等领域已有了较为广泛的应用,尤其是在文本语义分析上,由于LDA输出的结果并非是传统意义上的词频统计,而是一组有意义的词群,人文研究者能够利用这些主题词汇和相应的主题权重进行定性、定量及论证方面的研究。可以看到,当前这种技术在人文社会科学研究中具有传统规范研究所不能企及的一些优势。为此,本文的具体研究将以该技术作为主要研究方法,以此来更好地实现既定研究目的。

(二)数据来源和研究过程说明

本研究的对象文本全部来源于人民网每日经济新闻排行榜(每日10条),时间跨度选定为2007年至2017年,主要研究其中与消费有关的内容。选取依据在于,这一时间段中国社会的发展变化相对较大,而又与当前最为临近。人们在这11年间对经济领域中有关消费的关注,可以在一定程度上反映出这10余年我国居民的一些消费变化趋势和消费观念行为趋向。

具体到2007年至2017年人民网每日经济新闻排行榜这一研究对象,由于文本所涉及的经济领域内容庞杂,单纯依靠人工研判很难做到客观降维和分类处理。而运用LDA主题模型分析,很大程度上能够实现对文本内容的主题提取和分层分类处理,根据LDA模型最终输出的主题结果及其权重,还能够从权重变化中探究其变化趋势,再综合相关理论和经济时政进行阐述,使其研究结论更具说服力。

具体研究过程为:第一,基于2007—2017年人民网每日经济新闻排行榜前10条,借助python进行大规模的网络文本抓取,并统一使用TXT文本格式保存,然后分年份进行整合储存,即为语料库构建。第二,利用LDA主题模型对人民网每日经济新闻排行榜语料库进行文本挖掘和语义关系提取。将已统一储存的人民网每日经济新闻排行榜语料库输入LDA主题模型进行运算,然后多次循环调整主题数和迭代次数,直到输出结果达到最佳为止。多次运算结果表明,本文所需要的各个年份最佳主题数为250个,最佳迭代次数为800次(详细技术处理见本研究组另文介绍)。第三,根据最终输出结果,选取相应的主题权重和词频展开二次演算和可视化分析,形成综合呈现结果。第四,根据综合呈现结果,结合相关理论、政策和时政热点进行阐释。

第二,2008年Topic 124、2009年Topic 141、2011年Topic 206、2014年Topic 246、2015年Topic 98这五个主题主要关注的是食品产业健康安全,仔细观察和分析各自提供的主题会发现对食品安全的关注存在细微差别。从2008年Topic 124里的“进口”“出口”“粮食安全”“危机”等主题词显示金融危机同样影响着食品产业,使得粮食安全也被高度重视;2009年Topic 141、2011年Topic 206、2014年Topic 246、2015年Topic 98这四个主题主要侧重于从生产过程来关注食品健康安全,对于“食品”“生产”过程存在的“违法”“滥用”行为和“乳业”“超标”“质量”相关问题,定会加大“质监局”的“专项整治”和社会“监督”,尤其是在2015年全面放开二胎政策之后,“乳业”一时间成为了食品安全关注的焦点。

按照以上研究过程,全面梳理和分析这11个年份各自输出的250个主题,发现较多的主题内容涉及消费行业、消费观念及消费行为,同时由于这三部分各自所呈现的内容存在差异,难以使用同一标准进行主题和主题词的选取,因此,在具体研究行文时,对各自部分均采取了不同的较为客观的选取标准。下面,将基于不同标准,对选出的主题和主题词展开具体探讨。

二、消费行业社会关注变化趋势分析

(一)消费行业社会关注变化趋势

为了解中国消费行业在2007—2017年间的社会关注变化,我们以LDA主题模型输出的各年份250个主题内容为主要依据,以“ICB行业分类基准(Industry Classification Benchmark)”为辅助参考,共划分出了10个消费行业。紧接着,将10个消费行业在不同年份中各自所包含的主题进行主题权重加权,然后将加权值可视化为散点趋势图,如图1所示。由图1可知,无论是观测整体趋势还是散点分布,整体上可以对十大消费行业社会关注趋势划分为三类,社会关注度上升趋势明显的消费行业为:交通、教育、旅游、互联网和通信;社会关注度小幅上升的消费行业为:保险、文娱、医疗;社会关注度呈下降趋势的消费行业为:能源、食品、房地产,能源行业尤为显著。

图1 不同消费行业关注度的变化趋势

(二)当前热点消费行业社会关注变化趋势的典型分析

从宏观层面对不同消费行业社会关注进行简略趋势分析后,为了深入研究不同消费行业社会关注的具体内容,在此选取了2017年主题内容集中呈现较多、具有趋势代表性及主题权重排位靠前的旅游、食品、医疗三大热点行业为典型展开分析。

1.旅游行业社会关注内容变化

依据LDA主题模型演算方法和原理,每一主题所包含的词语之间能够形成一种相互诠释:它们共同构成一个主题,这个主题的内涵就是由这些词汇共同构成,它们之所以出现在同一个主题中,就是因为它们在对应文档中存在相对较强的相关性。将这一分析运用于旅游行业具体社会关注内容上,就可以认为:基于强关联性词语聚类而成的旅游主题,它所包含的主题词代表着相对具体的旅游内容。从2007—2017年间各个年份输出的250个主题中,筛选统计了包含旅游内容较多的代表性主题,具体如表1所示。

表1 2007—2017年代表性的旅游主题词

从2007年Topic 94、2009年Topic 208里的主题词能够看出,旅游出行与法定或俗成的节假日密切相关,在这两个年份提供的旅游主题中,与节假日直接相关的主题词就高达3条以上,足见人们在考虑旅游、选择旅游目的地及景区时,节假日会成为重要关注因素。

1.3.2 发病原因稻纹枯病是受真菌寄生引起。病菌的无性时期产生菌丝和菌核,有性繁殖体是担孢子。菌丝白色,老熟时浅褐色,主枝与分枝成锐角,分枝处溢缩,离分枝不远处有分隔,菌丝能在寄主体内生长,也能在寄主表面结成菌核。

第一,现金冗余与研发投入正相关。现金冗余可充分支持企业的研发活动。第二,对高管实施股票期权激励会正向调节现金冗余与研发投入的关系,且这一关系在非国企中更为明显。与未实施股票期权激励的企业相比,赋予高管尤其是不存在官员身份的非国企高管股票期权可促使其增加利用现金冗余开展研发活动的行为。第三,在实施股票期权激励的企业中,相对于处于草案公告前一年的企业,现金冗余对研发投入的促进作用在处于行权等待阶段的企业中会被削弱。高管在股票期权激励实施的不同阶段存在利用真实的研发活动操纵会计盈余的行为,其在行权等待阶段倾向于减少现金冗余投入到研发活动中的水平,以抬高行权时股票售价,实现收益最大化。

2012年Topic 38 里的“杭州”“北京”“黄山”“昆明”“自然”,2015年Topic 125 里的“黄山”“上饶”“浙江”“武夷”,2016年Topic 98 里的“莆田”“村落”,2017年Topic 1 里的“云南”“文化”“古镇”“武汉”,从以上主题词中还能看出,人们在选择具体旅游目的地时,会去关注自然景区、文化底蕴浓厚的城市及村落古镇。最后,表1所列余下的主题类似,不再赘述。

以纳米粒度分析仪测得复方精油微胶囊的大小与分布,如图所示,A样品运用异丙醇为脱水剂,最佳配方的粒径为259.9±17.8 nm; B样品以冷冻真空干燥直接脱水,最佳配方的粒径为188.2±25.6 nm。后者粒径明显小于前者,分布更加均匀。

2008年Topic 180、2015年Topic 111和Topic 194这三个主题是与出境游的内容相关的。从2008年Topic 180这个主题里的“旅游”“出境”“香港”“美元”“欧元”这些主题词可以明显地看出,人们已经在开始关注境外旅游及可能会需要用到的币种,换言之,人们的旅游地域范围已不再仅限于国内;从2015年Topic 111和Topic 194这两个主题里的“中国”“游客”“日本”“旅游”“出境”“泰国”“美国”“东京”“西班牙”“法国”“旅游”“一带一路”“出境”“沿线国家”这些主题词可以看出,人们对出境游的关注开始向具体到去哪些国家旅游发生转变,以及国家经济战略政策的大力推动也会促进人们对出境游的极大关注。

2.不同年份对食品关注有所侧重

按照演化的规律——随机、适者生存和平衡等来看,地球上每一种生物的出现和存在都有其理由。蚊子的灭绝除了影响生物多样性外,必然也会影响地球的生态,因为地球生物系统之间相生相克、相联相关甚至唇亡齿寒:以蚊子为食的青蛙、蜘蛛和鸟类也都难逃一劫,它们的上一级生物如蛇、鹰隼等也可能减少和消亡,最终厄运将降临到人类头上。也许,某种生物的灭亡不会直接影响人类的生存,但势必影响地球的生态。正因为如此,已经有人反对有关基金对伯特团队基因驱动生物体研究项目的支持了。

从表2的情况来看,不同年份对食品关注有所侧重,详细分析可以发现:第一,2007年Topic 82和 2010年Topic 166这两个主题主要关注的是猪肉食品。查阅猪肉相关文献得知,猪肉作为我们国家的主要肉类食品,是CPI极为重要的影响因素,还有不少业内人士表示猪肉易出现“过山车”行情。因此,“猪肉”“价格”的“上涨”或“回落”,“养殖”“成本”的高低,会对“肉类”“产业”及包括“玉米”在内的产业链产生影响,改变“猪肉”“消费”“市场”的“供求”关系,最终影响着十几亿人的消费和国家的经济政策,这种影响也就必然会引起社会的关注。

总之,除了上文重点分析的人们对节假日、出境游、旅游景区有较多的关注外,还对出境购物、如何将互联网有效利用于旅游及景点餐饮美食也有更为具体的关注,这在某种程度上提供了人们对旅游的关注之所以会呈现上升趋势的缘由。

表2 2007—2017年代表性的食品主题词

本调查的解释变量是风险认知影响因素,被解释变量是风险认知情况。首先运用SPSS22.0通过主成分分析法对风险认知情况进行因子分析,并按照最大方差法进行因子旋转,以特征值大于1为标准提取公因子,并剔除因子载荷小于0.5的题项。再对风险认知的情况因素进行t检验和多元线性阶层回归分析,以P<0.05为差异统计学意义。

(6)车速调节装置激活,定速巡航装置开启、但车速调节装置未激活时,不符合关闭条件,例外:带PEA(预测式高效驾驶辅助系统)的ACC(自适应巡航控制系统),详见下一点;

第四,2016年Topic 94和2017年Topic 172这两个主题主要展现内容是快餐外卖。“冷藏”“技术”和“外卖”“派送”为食品提供了质量保证及其用餐便捷,很好地满足了大众就餐需求,随着经济水平的提升与快节奏生活方式的兴起,人们越来越愿意为这种便利餐饮“消费”“支付”一定费用;要想立足于这个行业,必然要在“竞争”中注重消费者的“口味”和“品质”偏好。就目前来说,快餐外卖仍有更大的被关注空间。

3.医疗行业社会关注内容变化

2007年Topic 200、2008年Topic 217这两个主题主要涉及“药价”问题。“医药”行业存在“暴利”现象,而改变这种不良现象,需要大力推进医药“机制”改革,使其对“药品”“价格”有所调整,此外,对“新药”还要做到严格“审核”;2012年Topic 131、2013年Topic 130主要关注的是药品质量问题,“假药”的流入和药品成分的“超标”不但是国家重点整顿的问题,也是人们切身关注的问题。

从表3的主题显示情况来看,关注视野主要聚焦于医保、药品药价等方面。其中,2015年Topic 41、2016年Topic 37及2017年Topic 235中均出现了“医保”相关主题词,人们对“医保”可以说是持续关注。经过二次对应文献探查发现:2012年国家发展和改革委员会、卫生部等六部门联合下发了《关于开展城乡居民大病保险工作的指导意见》,2014年国务院全面推开城乡居民大病保险试点,2016年至2017年是国家对大病保险界定标准、报销比列和资金来源的调整年份。显然,除了2016年和2017年人们对“医保”关注与医保政策同步外,其他年份并未如此,这说明医疗政策的下发与人们对它的关注并不是完全同步的,这是国家应引起重视并加以引导的地方。

表3 2007—2017年代表性的医疗主题词

本实施例中该环形钢筋紧箍选用钢筋,并且上述的环形钢筋紧箍均独立抱紧设置在木枋的外表面上,外露在木枋外侧的对拉螺杆段上均套接有与2条环形钢筋紧箍配合的“山”形压接件以及位于”山”形压接件外侧并对”山”形压接件进行限位的锁紧螺母。该环形钢筋紧箍优先选择钢筋,是由于钢筋是柔性的,可以平行于胶合面板1的曲面弯曲并且在施工后也方便进行矫直已备作下次使用,而且钢筋和”山”形压接件可以很好地进行搭接封闭。采用环形钢筋紧箍的优点是其柔韧性好,易于人工操作,并且截面小可以在封闭处很好地进行搭接。

2009年Topic 127、2010年Topic 185和2014年Topic 33这三个主题呈现的内容主要是一些比较宽泛的医疗社会问题。2009年爆发了H1N1甲型流感,流感防治及其带来的药品“涨价”问题引起了当年大量民众的关注;2010年Topic 185这个主题内容是老龄化社会问题在医疗行业中的体现,老年人易患的“老年痴呆”“肿瘤”等“疾病”越来越受到重视,而老年化问题得到关注的同时,生育问题也不得不引起重视,2014年Topic 33里所提供的主题词几乎全是与生育相关的,足见人们对生育问题的极大重视。

三、消费观念社会关注变化趋势分析

消费观念是指“人们对待其可支配收入的指导思想和态度以及对商品价值追求的取向”[3]。从经济学的范畴来讲,消费观念是消费领域中极为重要的内容,而公众对不同消费观念的关注变化,会在一定程度上折射出我国居民消费观念的进化轨迹和成长趋向。

为有效观测不同消费观念在这11年间具体的关注变化趋势,从LDA模型输出的不同年份的250个主题中筛选发现,关于消费观念的主题词不在少数,但为了保证这个年份段不同消费观念主题词的连续性,从而更好地开展关注趋势研究,我们精简选取了“品牌”“健康”“绿色”“维权”“质量”“享受”“个性化”“国际化”“体验式”“奢侈”“高档”“名牌”“便宜”13个消费观念范畴内的主题词作为最终的分析对象,然后利用公式对每个被选主题词进行平均权重计算,并将不同年份针对每个主题词计算得到的平均权重值按年度变化做成上升和下降两类散点曲线图,结果见图2和图3。

由图2显示可知,社会关注度整体呈上升趋势的消费观念中,“质量”“品牌”“健康”一直受到社会公众的较高关注,遥遥领先于图中所提供的其他消费观念,其中“品牌”的关注度出现时高时低的变化趋势,变动幅度较大,而对“质量”和“健康”的关注基本呈平稳上升趋势;从年度变化情况来看,对图2中所列消费观念的关注热情在2013年开始普遍高涨,2017年达到最高点。这一关注趋势变化透视着一些传统的消费观念将逐渐被科学理智型消费观念取代,就当今而言,尽管有琳琅满目的商品,相比以往居民也有较多的可支配收入,但人们已不再高度崇尚节俭的消费观念,转而对“质量”“健康”都有着更高的要求,追求的是高质量、符合人身心健康的绿色型消费。

基于布鲁姆学习目标分类法,学校对临床药学专业本科生实践教学体系进行了改革,学生由低阶的了解、加深了解、熟悉药师的工作内容向高阶的基本掌握、掌握药师的临床药学工作技能发展,临床药学教育从基础目标逐步向高级目标(“八星药师”或我国临床药学专业培养目标)转化。由于本校对2016年入学的本科生才开始实施新改的临床药学实践教学模式,目前尚无毕业生,因此在新改临床药学实践教学模式的实施过程中应该利用科学的教学体系评价方法验证其合理性及有效性。

图3是13个消费观念主题词中去除9个呈上升趋势主题词之后剩余的4个主题词。就公众关注热度而言,对“高档”“便宜”“奢侈”的关注要明显热于“名牌”;从关注变化趋势来看,这4个消费观念主题词的关注度在2007—2009年(“奢侈”除外)、2011—2012年、2013—2017年这三个年份段几乎都是呈下降趋势,尤其是在2013—2017年间可以说是持续下滑。也就是说,近年来人们收入水平所产生的消费力尽管有很大提高,但人们不再片面购买持久耐用的“便宜”商品,对“高档”“名牌”“奢侈”这种具有社会表现功能的符号化消费也有逐年减弱倾向。

图2 社会关注呈上升趋势的不同消费观念

图3 社会关注呈下降趋势的不同消费观念

四、消费行为社会关注变化趋势分析

消费行为同样是研究消费领域的重要分支,是指“消费者为获得所用的消费资料和劳务而从事的物色、选择、购买和使用等活动”,其主要表现为购买行为。本研究主要从购买方式、购物地点、支付方式三个方面来探讨对消费行为的关注变化趋势。

1.1 仪器 使用首次实现便携式和商品化的钨丝电热原子吸收光谱仪(WFX-910,北京北分瑞利分析仪器有限公司)进行原子吸收信号测量。仪器以空心阴极灯(HCL)、钨丝原子化器、电荷耦合检测器(CCD)为主要部件,外形尺寸为610 mm(长)×230 mm(宽)×335 mm(高),重量为18 kg。见图1。仪器体积小、重量轻、能耗低,既可通过市电运行,也可采用内置锂电池供电实现正常工作,可满足野外无市电情况下使用。

(一)购物方式

采取与消费观念部分同样的选词和计算原则,精选出了“网购”“团购”“海外代购”“外卖”这4个与购物方式最具相关性及连续性的主题词,并对应地将计算所得到的平均权重值按年度变化做成趋势图,见图4。

由图4示可知,对“网购”和“海外代购”的关注变动幅度显著,其中,“网购”整体上呈现出上升关注趋势,应该说,这种关注热情的高涨与较多人群的逐年广泛利用是分不开的;“海外代购”在2007—2015年间,除了2013年处于低迷关注外,整体关注热度涨幅较大,并在2015出现了关注高峰,关注势头明显超过其他三种购物方式,此后在2015—2017年转入急剧下滑趋势,2016年之后已落后于“网购”和“外卖”,这与现有诸多文章所说的海外代购发展前景大好[4]是相矛盾的,究其原因可能与中国品牌、本土产品的快速崛起,一定程度上满足了大众的购物需求从而降低了其对国外产品的依赖有关,同时“逆代购”现象的出现也是有力佐证之一[5]

第三,2012年Topic 66里的“酒类”“遵义”“茅台”“白酒”这些主题词表明,2012年对食品行业中的国酒“茅台”关注不凡。回到文本梳理茅台酒业这一年经历的“大事件”:“三公”消费限令、国酒商标申请、塑化剂风波、禁酒令……,风波几未中断,股民和大量消费者可谓是几家欢喜几家愁。

另外,对“团购”的关注尚未出现大幅度变动情况,呈略微下降的趋势。而难得的是,2016年之前,对“外卖”的关注在这四种购物方式中处于最低水平,但2016年之后关注势头尤为趋显,并在2017年已赶上且超过对其他三种购物方式的关注,这正好契合了中国商业十大热点中的外卖分析结论① 详细内容参见《2017年中国商业十大热点展望之六》中商联专家工作委员会供稿。 。

图4 不同购物方式的关注变化趋势情况

(二)购物场所

同样采用上述的选词原则,首先精选出了“实体店”“网店”“菜市场”“农贸市场”“超市”“便利店”“小卖部”“集市”“夜市”“商场”“购物中心”11个与购物场所相关的主题词;其次将“实体店”和“网店”这两个代表线下线上的主体词按照消费观念部分的计算公式计算出对应的平均权重值;再次将剩下的 9个主题词分别聚类命名为:(1)农贸市场(“菜市场”“农贸市场”),(2)实体快销店(“超市”“便利店”“小卖部”),(3)露天市场(“集市”“夜市”),(4)大型商场(“商场”“购物中心”)四大类,然后分别计算出每一类所包含主题词的权重加权值,最后将“实体店”“网店”平均权重值和每一类所包含主题词的权重加权值做成散点曲线图,如图5所示。

本文针对图像处理所提出的多物理场耦合的模型,具有实际的物理背景,直观上该问题解的存在性和唯一性符合其物理特性.非线性扩散过程中点扩散函数的选择在理论上有着明显的优越性,但需要在实际的图像数据处理过程中加以验证.此外,边界压力分布函数及流体特性的选取,对于实际的图像数据处理有着重要的相关性,也有待进一步的研究.

图5 不同购物场所的社会关注变化趋势

从图5中散点分布情况来看,对“网店”的整体关注热度要高于“实体店”,这与“网店”的迅猛发展所带来的购物便捷有很大关联。此外,在2014年对二者的关注出现了较大差距,但其他年份的关注差距较为平稳;从曲线变化可以看出,实体快销店和大型商场的关注趋势变动幅度较大,尤其是实体快销店,且在2011年、2013年、2017年表现出了强劲的关注势头,而农贸市场和露天市场的关注趋势可以说变化不大。引人注目的是,实体快销店和大型市场整体关注热度明显高于农贸市场与露天市场。这些关注趋势变化不难验证,随着众多日常生活用品不断入驻实体快销店和大型商场,使得大量消费者能够实现“一站式”购物,而且伴随国家对城市环保督查力度的加大,会促使不合规格的农贸市场及不利于城市环保建设的露天市场逐渐退出,以至于实体快销店和大型商场会得到广泛关注。

(三)支付方式

依旧采取上述的选词和购物场所部分的聚类计算原则,将支付方式分别聚类为:网银支付(包含“网银”“网上银行”“支付宝”)、现金支付(包含“现金”“现金支付”)、刷卡支付(包含“刷卡”“用卡”)、移动支付(包含“移动支付”“微信支付”“扫码支付”“支付宝”① “支付宝”在移动支付出现前(2007—2013年)属于网银支付方式,在移动支付出现后(2014—2017年)又成为了移动支付的代表,为了更好地呈现趋势变化,将其两个年份段权重分别加入对应的支付方式类别中。 )四大类,并将各类所包含主题词的主题权重加权,进而利用加权值做成曲线图见图6。由图6可知,现金支付和刷卡支付尽管趋势变化幅度较大,但由于在日常消费中有相当一部人会采用这两种支付方式,使得整体上还是有较高的关注度;而网银支付基本上处于平稳的关注状态。不过,关注势态强劲的是移动支付,这一支付方式自2014年出现后,关注热度快速上升,表明移动支付能够在相当程度上代替一些传统的支付方式,还有就是现金支付的关注度从2015—2017年呈明显上升趋势,经过二次对应文献探查发现,扫码支付方式替代更多的是现金支付方式,二者常被一起讨论更加促进了对现金支付的关注。

(三)地产行业杠杆率只升不降,与去杠杆政策背道而驰。上市公司2017年年报显示,A股房地产行业平均资产负债率已达到99%,即使剔除预收账款也接近75%,而且永续债、基金、信托等工具的广泛使用,使地产公司的真实负债率可能比表面上高许多。港股房地产公司的负债率多在85%-90%。房地产行业的高杠杆率虽与行业自身的特点有关,但也与当前国内去杠杆、防范金融风险等政策取向相背离。

图6 不同支付方式的社会关注变化趋势

五、结论

本文利用LDA主题模型对2007—2017年间人民网每日经济新闻排行榜有关消费领域内容进行了梳理,从消费行业、消费观念、消费行为三个方面对消费领域社会关注中的一些具体问题展开了分析,得出了以下结论。

首先,消费行业的社会关注度差异显著。基于上述消费行业关注趋势的变化分析可知,关注度较高的多集中于基础民生性和新兴的消费行业,如交通运输、教育及旅游等;在其具体内容关注上,比较热于关注的还是人们日常分不开的一些消费行业,如医疗、食品等。

其次,科学理智型消费观念整体关注度不断上升,符号化消费观念有所减弱。消费观念层面更多关注的是“质量”“品牌”“健康”“绿色”,逐渐倾向追求符合人身心健康的绿色型消费,近年来对“高档”“名牌”这种符号化消费观念的关注度呈现出逐年下降趋势。

最后,消费行为的社会关注度受互联网影响明显,以互联网为载体的购物方式、购物地点和支付方式越来越受关注。购物方式中“网购”一词的社会关注越来越高,且网购所包含的内容也越来越丰富;购物地点方面对“实体店”的关注不如“网店”热切;支付方式层面,逐渐热衷于“移动支付”且在一定程度上替代了传统支付方式。

针对消费领域,至今已有大量以经济数据和调查数据为基础的投资决策咨询参考类文献,这些研究为人们了解消费领域中特定消费行业的宏观走向、拟定某些消费行业的发展规划等方面提供了借鉴参考。但由于这些文献的经济属性过强,并不能很好地反映出人们在消费行为、观念和认知结构等方面的变化趋势,而这些因素反而对消费领域的变化能够发挥更根本的决定性影响。本研究引入LDA主题模型文本分析技术,能够实现对大规模文本的数据化研读与主题提炼,克服了传统规范研究难以逾越的方法困境,以此技术对消费领域社会关注变化趋势进行探析,其研究结论能够很好地反映基于人们日常生活中的一些变动趋势,在一定程度上补充了纯经济性消费研究报告的不足。除此之外,这种研究还有助于尝试一种新的研究范式。

当然,本文是将大数据众多方法中的LDA主体模型这一具体技术应用于消费领域进行研究的一次初步尝试,还处于初探阶段,在数据文本的选取与处理上仍不够充分和彻底。对于这一点,未来的研究将会逐步完善。

参考文献:

[1]刘启华.基于 LDA 的文本语义检索模型[J].情报科学,2014(8):38-43,55.

[2]王小红,科林·艾伦,浦江淮,等.人文知识发现的计算机实现——对“汉典古籍”主题建模的实证分析[J].自然辩证法通讯,2018(4):50-58.

[3]孙习祥,黄 黔.消费观念与扩大内需[J].中南财经大学学报,2001(4):113-115.

[4]姜苏梅,田 颖,邵 川.浅谈海外代购的前景[J].时代金融,2016(12):241-242,247.

[5]王石川.海外“逆代购”呼唤中国品牌[N].人民日报,2016-08-05(5).

A Study of the Change Trend of Social Concern in the Field of Consumption in China——The LDA Model Analysis Based on the Text of Daily Economic News List in People’s Daily Online(2007—2017)

Wang Jianhong,Wang Manman,Du Baobiao
(Marxism School,North China Electric Power University,Baoding,Hebei 071003,China)

Abstract: This paper is to take the text of daily economic news list in People’s Daily Online during 2007-2017 as the object,using the method of LDA thematic model,to analyze the content and change trend of social concern in the field of consumption in economic news.The study found that,the social concerns and specific concerns of different consumer industries vary greatly,and the overall enthusiasm for scientific and rational consumption concepts such as“quality”,“health”and“green”is constantly rising.In recent years,the attention to the symbolic consumption concept of“high-grade”and"famous brand"has begun to decrease year by year.People’s attention to the way of shopping,shopping place and payment method has turned into a consumer behavior which is more closely associated with the Internet as the medium.

Key words: LDA thematic model;consumer industry;consumption concept;consumer behavior

中图分类号: F014.5;C913.3

文献标志码: A

文章编号: 1674-2494(2019)02-0041-09

DOI: 10.13747/j.cnki.bdxyxb.2019.02.007

收稿日期: 2018-12-24

基金项目: 中央高校基本科研业务费专项资金资助“马克思主义理论学科建设的方法体系研究”(2016ZZD09);河北省高等教育教学改革研究与实践项目(2016GJJG213)成果

作者简介: 王建红(1978-),男,河北曲阳人,副教授,硕士生导师,法学博士,主要从事马克思主义理论、大数据方法研究。

(责任编辑 陈 静)

标签:;  ;  ;  ;  ;  

中国消费领域社会关注变化趋势研究-基于人民网经济新闻排行榜文本的LDA模型分析(2007—2017)论文
下载Doc文档

猜你喜欢