基于文本聚类与情感分析的群租房微博舆情量化研究
李 泉1 李 萌1成洪权2蒋林秀1肖舒婷1王極可3
(1.武汉大学政治与公共管理学院 武汉 430072;2.武汉大学测绘学院 武汉 430072;3.武汉大学计算机学院 武汉 430072)
摘 要 [目的/意义] 作为城市化进程中的“顽疾”,群租房屡禁不止,群租房引发的社会问题层出不穷。这一系列问题引发了微博热议,群租房微博舆情文本分析有助于获悉群租房存在的问题,从受众角度探讨政府群租房治理成效。[方法/过程] 利用网络大数据爬取与分析技术,以群租房为研究对象,通过文本聚类分析与情感分析,进行热点评估,补充现有文献中忽视的群租房治理舆论研究。[结果/结论] 研究发现,微博网民对群租房话题的关注明显呈波动趋势,讨论话题主要包括群租房产生的社会问题、政府对群租房的整治行动评价以及透过群租房现象折射出的中低收入群体的焦虑感。大多数微博网民在舆论场中的情感趋势为负面,认为有必要对群租房展开治理。本文的创新之处在于分析政府治理群租房所面对的舆论环境,并将其可视化呈现,为政府深入了解民情,制定适应民意的政策作铺垫。
关键词 群租房 社会舆情 文本聚类 情感分析
1 引言
微博作为Web2.0时代的产物,为人们发布信息、发表观点提供了较为自由的社交场景。舆情(Public Opinion)即公众舆论,是指公众对于各种社会现象、问题从信念、态度、意见和情绪等角度所作出的表达[1]。微博作为重要的舆论场,诸多社会问题均在微博中得以反应。我国城市化的快速发展促使大批非城市户籍人口涌入城市。大城市因其丰富的就业机会和资源吸引大量外来务工人员,然而,一线城市高昂的生活成本成为困扰他们的难题之一。为降低居住成本,他们纷纷选择群租方式,群租房亦日渐成为大都市生活形态中一个挥之不去的组成部分,“蜗居”、“鸽子笼”、“房中房”成为大城市居住空间中的一种新形态。不容忽视的是,在享受群租房低廉租金的同时,外来人员还必须面对群租所带来的一系列安全风险。而每一起突发事件都会成为舆情爆点,引发人们的热烈探讨。
群租房作为社区管理的重大隐患之一,迫切需要政府采取有效措施加以规范与管理。不过从实践效果来看,群租房治理却陷入困境。北京、上海、广州等国内一线城市纷纷出台出租房屋条例和规定,限制乃至取缔群租。政府各部门也先后多次开展集中整治群租房行动。各地政府的每一次整治行为便会引发社会媒体的广泛关注。然而,面对众多的自媒体讨论,要全面了解民众对群租房的看法与态度存在诸多挑战。围绕群租房整治行动,一部分群体抨击政府整治行动的强硬、粗暴,忽视弱势群体利益,而另一部分群体又强烈支持政府各项整治行动以消除群租房带来的社会风险。目前围绕群租房整体舆论趋势的研究鲜有学者涉及。因此,本文期望利用大数据爬取技术,对社交领域使用用户最多的新浪微博中关于群租房的讨论进行爬取,并借助文本聚类分析和情感分析整体分析网络舆情,探寻治理群租房所面临的宏观舆论环境。
2 群租房问题与微博舆情文献综述
截至目前,学者已经对群租房相关问题进行大量研究,主要研究群租房概念、群租房产生的问题以及群租房治理对策等。目前比较一致的观点认为群租是一种租赁关系[2]。群租虽然为大城市低收入阶层提供了居住场所,但无序的群租行为也带来大量的治理问题。学者对于群租房引发的问题探讨主要集中在群租房引起的社会安全[3]、消防安全[4-8]、邻里矛盾[9]、物业管理困难[10-11]等方面。面对群租带来的一系列治理问题,实务界和学界对群租房的治理路径也进行了探析。从政府实际行为看,运动式治理是政府治理群租房的主要手段[6,12]。但运动式治理面临着治理成本高、效率低,难以达到根治效果[15]。从学者们的建议看,多中心治理[13]、协同治理[14]是治理群租房较有效的方式。虽然学者已经意识到群租房存在的社会问题,并探讨了群租房治理方式,但是,目前还没有学者对群租房舆情进行过研究。黑格尔曾言“无论哪个时代,公共舆论总是一支巨大的力量”,微博舆情可以较大程度的反映民众心声,是政府治理不可忽视的重要部分。民众对群租房治理问题持怎样的态度、观点,直接影响着群租房治理成效。
式中,u为轮胎与路面间的滑动摩擦系数,取值0.7;Mc为运输车在后轴上分布的质量总和;g 为重力加速度,9.8 m/s2;m11为满载罐体分配在牵引销上的质量;m3为车头的质量,参数提供为5 990 kg。已知
目前,学者对微博舆情的研究多集中在新闻传播、管理学和计算机科学等领域。计算机科学领域对微博舆情文本分析的研究多是以算法为支撑为微博舆情信息获取[15]、关键词提取[16]、文本聚类[17]、情感分析[18]、舆情可视化[19-20]等提供方法论基础,本文是建立在这些方法基础之上的。对群租房问题引发的舆情的研究鲜有学者涉及,微博舆情文本分析及其可视化方法已日渐成熟。基于既定热点“群租房”进行的微博舆情文本分析也是一种新的研究视角和研究问题。将文本聚类、微博舆情分析方法运用到对群租房微博舆情的分析中既是将微博舆情文本分析方法用于公共治理研究的有益实践,也拓展了研究途径,丰富了群租房治理问题的研究方法。
除了关税,自由贸易港更有赖于没有或尽可能少的非关税贸易壁垒,要求对商品、服务进出口,以及贸易项下资金流入流出,不实行或尽可能少实行管制政策。以香港为例,《中英联合声明》附件规定:香港保持自由港地位,并继续实行自由贸易政策,由此可以看出自由港和自由贸易其实是两个不同的概念。香港《基本法》第115条规定:香港实行自由贸易政策,保障货物、无形财产和资本的流动自由。国务院《关于全面深化中国(上海)自由贸易试验区改革方案》要求上海自由贸易港“对标国际最高水平,实施更高标准的‘一线放开、二线安全高效管住’贸易监管制度。”
由于在实际应用中,纤维复合材料常常会在高于室温的环境下服役,因此需要了解碳纳米管纤维和树脂间界面在不同温度条件下的界面性能.鉴于此,本工作利用微滴包埋实验方法,研究碳纳米管纤维与复合材料在室温到140°C范围内的界面性能,为实现碳纳米管纤维复合材料的工程应用提供技术支持.
3 数据基础与研究方法
3.1 数据获取
本文利用网络数据爬取技术提取微博舆情数据,挖掘社会民众对群租房治理的态度,尝试分析群租房治理过程中展现出来的社会舆论特点,建构治理的舆论大背景。微博舆情数据具体搜集情况如下:
虽然新浪微博提供了开放的API,但是其提供的API当中的话题搜索高级API,能够搜索到的微博信息只有503条,并不满足研究的需求。故我们采用自行爬取的方法对微博平台进行关键字的爬取。本文通过使用Python开源框架Scrapy,以“群租房”为关键词,采用深度优先的策略对网页数据进行爬取,以下是爬取关键字的伪代码:
在爬取过程中遇到了三个问题:(1)微博需要登录后才能浏览相应的搜索结果;(2)微博设置了搜索结果显示的上限,限定为1000条,而与群租房有关的微博数量超过十万条;(3)微博的Web端采用了动态获取的方式加载信息,加大了信息获取难度。
为解决这三大问题,我们采取了以下应对措施。
针对登录问题,我们采用模拟登录的方式解决。一般而言,模拟登录有两种方式:一是在程序中向网站发出登录请求,也就是提交包含登录信息的表单(用户名、密码等),然后从响应中得到Cookie,以后在访问其他页面时也带上这个Cookie,这种方式可以打开只有登录后才能看到的页面。但是该也会遇到诸如反爬加密、验证码等一系列复杂而且麻烦的问题。第二种方式是使用无头浏览器访问,在Python中可以使用Selenium库来调用浏览器,从而达到模拟人为登录的操作,登录之后获取到Cookie就能进行爬取工作。考虑到第一种方式的弊端,本文采取了第二种方式进行模拟登录。
经测量,C/C-SiC1 450、C/C-SiC1 500和C/C-SiC1 550的残余硅含量分别为19%,14%,12%,表明熔渗温度越高,残余Si含量越少。残余Si的存在会影响C/C-SiC的力学性能和高温力学性能,所以反应熔渗温度会对C/C-SiC复合材料的力学性能产生影响。低温熔渗制备的C/C-SiC的残余硅含量较高,这也是低温熔渗制备的C/C-SiC力学性能提高的突破点之一。
针对微博搜索上限限定的问题,实际处理中采用高级搜索功能,按照时间跨度进行搜索。将时间跨度调整到适当的大小,使得每次搜索显示的条数在1000条以内,通过对不同时间跨度的搜索,得到所有的微博信息。针对微博动态加载问题,通过采取爬取微博Wap端,而不是Web端来解决。微博的Wap端没有采用动态加载的方式,可以直接获取所有的微博信息。通过以上解决方案,我们能够利用Python对新浪微博进行关键词爬取。但自2018年开始,微博的反爬机制会自动识别爬虫程序,对爬取所用的账号甚至是IP限制访问,因此每次爬取速度不宜过快。再加上在爬取的过程中,也有一定概率被识别成爬虫,需要重新定向到登录页面。这都导致对微博爬取的过程耗时长,成功率较低。鉴于以上情况,我们爬取了2011至2018年所有时间段的部分数据,重点针对北京群租房大火事件等一些特殊时间节点进行了多次爬取。最终成功获取了2011年至2018年1月以“群租房”为关键字的16294条微博信息,作为后续研究的舆情数据。
3.2 研究方法
本文主要采用R语言分析工具进行微博舆情分析。随着R版本的逐渐成熟和稳定,R在行业里的应用得到了飞速发展。R语言可在Windows、Mac OS、Linux等多种操作系统使用,拥有强大的数据分析功能和丰富的数据可视化效果。实验中运用R主要进行中文文本分析,包括聚类分析与情感分析[21]。
3.2.1 文本聚类分析 聚类分析是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,目标是在相似的基础上收集数据来分类。聚类的各指标之间具有一定的相关关系,常见的聚类有层次聚类与非层次聚类。本文的聚类主要是利用R语言结合K-means算法对中文分词之后的词语进行主题词聚类,挖掘分词之间的共现关系。中文分词主要利用R语言编程软件,主要利用开源包jiebaR中的segment函数对文本进行分词,并利用tibble包的as_data_frame函数将分词了的文本转化为标准化格式,以备后期文本聚类分析使用。
其中χ表示簇中散点的位置,ωk表示第k个簇,u(ωk)表示第k个簇的中心点,RSSk是第k个簇的损失函数,RSS表示整体的损失函数。优化目标就是选择恰当的记录归属方案,使得整体的损失函数最小。k的选值可以引入结构风险对模型的复杂度进行惩罚,或者按递增的方式选择k,求出相应的误差值,通过寻求拐点来确定最优k值。由于文本聚类时采用的是文件、词频构成的TF-IDF权值矩阵,一般不采用欧式距离,通常采用余弦距离对相似度进行度量以求取聚类中心。
图1 K-means聚类流程
4.2.1 群租房微博舆情文本词频分析 将群租房微博舆情数据进行清洗和格式转换后,利用统计工具R对微博舆情内容进行词频统计,得出如图4所示的2011-2018年群租房高频词统计结果。
利用K-means算法进行文本聚类分析的主要流程如图1所示:
自媒体时代,微博为公众赋予了充分的话语权,微博也因其独有的便携性、匿名性和共享自由成为网络舆情的重要发源地[23]。对微博舆情的分析主要从三个方面进行:(1)群租房微博数据处理和讨论概况;(2)群租房微博文本内容分析;(3)群租房微博情感分析。
4 群租房舆情分析
3.2.2 情感分析 情感分析又称情感分类(Sentiment Classification)、评论挖掘(Review Mining)或意见挖掘(Opinion Mining),通过自动分析商品、服务、人物等研究对象的相关评论文本内容,发现评论者对该研究对象的褒贬态度和意见[22]。而网络用户情感分析则主要针对社会化媒体产生的评论信息进行自动情感分析。我们利用挖掘的微博用户评论的文本文件,借助R语言分析工具,根据清华大学李军等人的中文褒贬义词典,将微博评论按照正面、负面词性进行分类,以此了解网络用户对“群租房”的态度和情感倾向。在数据分析实验中,微博舆情情感分析的主要流程包括:舆情数据中文分词→特征提取→特征选择→分类。通过结合情感词库,该过程可以获得较好的情感词统计结果。
4.1 群租房微博数据处理和分布趋势
利用网络爬虫技术对群租房信息进行扒取,共获得16294条数据。对爬取到的数据为空白的无效数据进行删除,对获取数据的时间、ID、内容等进行筛选后的重复数据进行删除,共获得14053条数据。为了了解群租房舆情热点分布情况,对群租房微博数量按照月份进行统计,如图2所示:
图2 群租房微博舆情月度讨论数量走势
由图2可知,人们对群租房的讨论峰值集中在2013年7月、2013年12月、2014年5月、2016年12月、2017年8月、2017年11-12月,结合附表1可发现舆情爆发的时间节点与关于群租房的重大社会事件是紧密相关的。进一步对归类的微博舆情热点问题进行汇总,可以得到群租房微博热点问题占比图如图3所示。从中可以看出,群租房所造成的诸如公共安全与消防安全问题是人们讨论最多的话题(超过半数),且群租房导致的社会问题中消防安全问题是人们最关注的问题。微博舆情中对城市租房需求、租房市场混乱和政府治理措施的讨论占比均接近15%,说明这三类问题也是民众普遍关注的问题。
图3 群租房微博热点问题占比图
4.2 群租房微博舆情内容文本分析
从图4可以看出,在群租房微博舆情文本中:租房、北京、群租、消防、整治、租客、房屋、隔断、安全隐患、中介、违法、治理、房东、消防安全、拆除、整改、排查、记者、居民、上海、调查、地下室、死亡等词汇出现的频次较高。从这些高频词可以看出,群租房舆情探讨主要集中在:涉及的行为主体、群租现象的高发地、群租房带来的主要问题以及政府针对群租房的作为。
K-means聚类的优化目标是使优化目标函数(损失函数)的平方误差最小,其计算式如下:
图4 2011年-2018年微博舆情文本词频统计(前15)
为明确群租需求与群租社会问题的主要内容,我们尝试利用计量工具R的词频统计和聚类功能对微博舆情中具体内容进行分析。
虽然各年度微博讨论整体内容趋于一致,但是高频词汇词频的增减与排序变化可以从另一个侧面反映出微博舆情中探讨群租房问题发生的变化。例如,“火灾”等词的排序变化可从侧面反映出某一年份火灾在微博中被探讨的热度情况,2017年的火灾频次创新高,反映出2017年的火灾引发人们广泛关注,引发网民热议。政府治理行动的相关词汇,如治理、整治、检查等出现频次也反映出了政府治理力度的强弱变化。同时,在对微博舆情热点问题进行汇总时,我们也发现,虽然群租房存在的社会问题在其他城市也有体现,但是政府治理引起人们探讨最多的是北京市。因此,我们着重对北京市群租房的整治行动所引起的社会舆情进行分析。图3中2011年-2012年高频词中并未出现明显带有政府整治群租房措施的词汇。虽然北京市从2009年便开始了群租房的整治行动,但还停留在初步探索阶段。到2013年-2014年,出现取缔(2013年348次)、治理(2013年376次、2014年544次)、整治(2014年654次)等词汇且频次较高,这与北京市在这两年出台大量群租房政策并且实施大量群租房整治行动紧密相关。2015-2017年,政府对群租房的整治工作亦没有松懈,从词频中也有反映,都维持在300次左右。2015年-2016年主要采取实行逐处挂账督办、规范租房市场、促进民众监督对群租房进行治理,整治类词频次数并未发生较大变化。到2017年,群租房消防问题大爆发(大兴区群租房起火死亡人数19人)促使北京市再次开展“安全隐患大排查大清理大整治”专项行动,政府对群租房的整治力度进一步加强。从词频中的表现则是“整治”这一词汇2017年出现673次,2018年1月的数据中整治出现88次。
4.2.2 群租房微博舆情聚类分析 通过微博文本内容的词频统计分析,可以发现群租房产生的社会问题与政府整治群租房行动是网民热议的重点话题。为探索“问题—行动”之间是否存在相关关系,我们对分词文本进行聚类分析。选取词频次数大于15、词汇相关系数大于0.8的词汇进行共现聚类探索,聚类分析的结果如图5所示。图5中的点表示聚类词汇,连线的粗细表示词与词之间的关系,连线越粗表明这些词共现的频次越高联系也越紧密。由图5可知,微博舆情内容出现5个明显聚点。其中,最中心的聚点聚集的贡献词汇最多,包括整治行动主体——公安部门、派出所、消防大队、城管等词,整治措施——宣传、排查、拆除、整改、检查、执法、清理等词,整治区域——街道、社区,以及整治原因——隐患、期货、火灾等词,相关系数达到0.9以上,这些贡献词与北京市展开的群租房专项行动具有强烈的一致性,可见网民对政府整治群租房行动高度关注。此外,分散于中心集簇的四个小聚点主要呈现群租房存在的问题,共同出现的高频词包括:电气、电水壶、充电器、线路、插座等词,这些词反映出群租房内存在的乱拉电线等现象,大量的易燃物品如烟头、充电器、老式电水壶等物品,这些都是引发火灾的潜在隐患。此外,针孔摄像头、偷拍、偷窥等词共现率也较高,反映出群租房潜在的公共安全问题。
图5 2011-2018年微博舆情总体聚类图
以上文本词频和聚类分析展现了网民对群租房话题的关注度,在微博讨论中,重点内容涵盖群租房产生的社会问题、政府对群租房整治举措、以及外来人口住房需求等。另外,群租房是否应该存在也一直为社会舆论激烈讨论。群众既有从弱势群体的关怀角度支持群租房的存在,也有从社会治安稳定角度对其表示担忧,为探究微博舆情反映出来的对群租房的情感态度,需要进一步通过情感分析进行探索。
4.3 微博文本情感分析
本文将2011-2018年的微博文本按月份进行拆分,通过计算每个月的微博文本中正向情感词与负向情感词,对整月的文本情感贡献的差值绘图,得到2011-2018年微博文本的整体情感倾向,具体如图6所示,其中横轴代表时间,从2011年1月至2018年1月共81个月,排列顺序从1至81;纵轴表示情感倾向,数值等于积极情感词数减去消极情感词数。从中可以看出,近八年来,公众的情感差值基本维持在较负面消极的水平。导致这种现象的原因主要有三个,一是大部分群租房都存在违法行为,政府取缔群租房引发群租房群体的住房焦虑;二是群租房事故频发,给群租租房者、房东抑或是邻里带来很大困扰;三是长期以来有关群租房的负面新闻不断,这使得公众对群租房的整体印象较差。虽说公众情感整体呈现较为负面的水平,但仍有部分月份呈现出积极的情感倾向,这多与政府的治理举措有关。政府在治理群租房的过程中并非仅仅是运动式搜索、取缔,也会进行诸如群租房整改、打击黑中介、群租房安全知识宣传与消防安全检查等行为,这些行为本质上对租客与业主双向利好,因此会引发群众积极的评论。除此之外,政府在整治群租房过程中并非只堵不疏,如2017年7月住建部等九部委下发了《关于在人口净流入的大中城市加快发展住房租赁市场的通知》,积极推行租购同权、试点商改租、大力治理群租房。这些举措得到群众较大支持,在图中呈现出正面的情感倾向。加快大中城市住房租赁市场发展让更多底层人民租得起正常的住房更是解决群租房问题最根本的措施,获得较多积极评价。政府对群租房的治理虽具有一定成效,但目前房租如房价一般居高不下,高额房租使他们不得不选择群租房,群租房整体状况仍旧堪忧,舆情整体呈现出较为负面的倾向。
图6 2011-2018年微博文本情感趋势图
同时,我们也详细分析2011-2018年每个月的微博。通过计算每行微博文本中正向情感词与负向情感词,对整月的文本情感贡献的差值进行绘图,得到每月公众的情感倾向,如图7、图8所示。总体来看,从2011年至2014年公众的整体情感差值基本都是维持在极度负面的水平,说明该时段群租房问题引发问题比较显著,而政府治理的成效有限。从2014年起公众的整体情感倾向则逐渐往正向积极的情感态度转变,尽管仍然呈现出波动态势,但总体趋势中有积极情绪出现。
《冯孝将子》述东晋广州太守冯孝将之儿马子,年二十余,夜梦见一女子,年十八九,自言是北海太守徐玄方女,不幸为鬼所杀,乞马子相救,愿为其妻。马子按约定日期祭坟、开棺,见女尸完好如故,遂抱归细心调养。一年后肌肤气力悉复如常,遂骋为妻,生二男一女。这篇小说中祭坟、开棺全由马子主持,与《牡丹亭》第35出《回生》中全由柳梦梅操办类似,而与话本中柳梦梅禀明父母再行开棺不同。
(4)将第4行对角元以右的1个元素赋值给对角元以下的1个元素;再对第4行的1个元素规格化;继而对第4列元素消元,仅计算虚线框中的1个元素,见图5下图。
对微博舆情正向情绪出现较明显的月份进行解读发现,政府得到的举措会引发较多人的支持。如2015年10月,广州首次明确住房租赁标准,租房签约将有范本可依。2016年1月广州出租房有明确标准,出租人必须网上备案。这些对群租房的合法规制,获得较多积极评论。另外,政府对群租房的治理不断加强群租区域安全检查与宣传也引发了较多的积极评论。而对微博舆情负向情绪的峰度进行解读发现,群租房重大安全隐患事件会引发较高的舆论负向情绪。在对群租房的讨论中对舆情起引导作用的主要是新闻媒体,公众多是参与评论者。从图7、图8中可以明显看出群租房舆情中有三处明显的舆情低峰:2013年11至12月、2014年11至12月、2017年9月。对2013年11至12月舆情低峰的微博舆情单独查阅发现:主要有两个大事件导致了微博舆情较严重的负面情绪,分别是青岛某群租房于11月15日发生大火和北京市对群租房进行全面整治过程中爆出的群租房拥挤危险频发等新闻,如“北京一处‘群租房’被拆:地下室竟隔出307个房间”等。对2014年11至12月的群租房舆情进行内容解读,发现主要是“情侣出租屋内吵架点燃床单致合租2女生死亡”这一事件激发了较强的负面情绪。而2017年9月的负面情绪则是由“北京大兴火灾27死伤 3D还原着火公寓结构”这则新闻引发,之后政府采取的强制搬迁措施也引发群众较多不满与焦虑情绪。通过对上述微博舆情低峰时期进行分析,发现群租房热点事件与整体情感倾向存在明显的对应关系,这说明通过微博舆情的分析能够对热点事件进行预测,这对于政府监控热点事件防止群体性事件的发生大有裨益,而群租房微博舆情监控与预测的实现则有待进一步的研究与完善。
图7 2011-2014年微博文本每月情感趋势
图8 2015-2018年微博文本每月情感趋势图
5 结论
本文利用R语言分析工具,结合词频分析、聚类分析和情感分析等方法,对北京市群租房的微博舆情状况进行了研究,讨论了微博网民对群租房话题的关注度与情感倾向。通过研究发现2011-2018年网络对群租房的关注呈波动趋势且与群租房热点事件密切相关,而2013、2014、2017年相关话题的讨论最多,分析发现讨论的具体话题包括群租房产生的社会安全、消防治安问题,政府对群租房的整治行动与措施等,揭示出群租房背后反映的中低收入住房群体焦虑现状。通过情感分析发现网民虽然认为群租房存在有其必然性,但由于群租房容易导致诸多安全隐患,所以大众普遍认为对群租房的整治也必不可少,其中民众对政府的安全教育、消防检查、发展租赁市场保障租户权益等持支持态度。但整体而言,微博网民的情感趋势为负向,反映出在这一治理领域基本的社会情绪。
本文的创新之处在于通过大数据爬取和R语言分析手段在宏观层面分析政府治理群租房所面对的舆论环境,为政府开展治理行动奠定舆论基础,增加政府对群租房治理的行动信心,使政府行为真正成为民之所向。同时本文的分析方法也为群租房问题的研究提供了新的视角,有利于更全面地分析群租房问题。此外,本文仍存在一定的不足之处,文中对群租房微博舆情的分析仅对群租房折射出的社会问题、政府治理难题进行了一定程度的分析,并对民众对政府行为持积极态度的方面进行了分析,但对于如何因地制宜治理群租房还需要全面深入的研究与探索。
1.3.2 样品制备 准确称取0.5000g加工好的样品于50mL的聚四氟乙烯坩埚中,用水湿润后加入5mL HCl,放在温控电热板(120℃)上,使样品初步分解,当溶液剩大约2mL时取下冷却,加入5mL HNO3和5mL HF,2mL HClO4,调节电热板温度至180℃。待整体溶液剩余3mL左右时取下稍微冷却后再加入2mLHNO3、2mLHF和1mLHClO4。当白烟冒尽时取下冷却,用水冲洗坩埚盖和内壁,并加入1mLHNO3,温热溶解残渣,然后将溶液定容至25mL的容量瓶中,摇匀待测。同时制备空白样品。
附件:
1904年前后,学生演剧活动方兴未艾。然此时的学生演剧皆在学校内部进行,并没有展开大规模的社会公演,也没有产生足够强大的社会效应,属于自娱自乐性质的话剧演出活动。直到学生演剧活动走向社会,特别是学生演剧的目的是向社会“募捐筹款”开始,学生演剧才正式产生强大的社会效应,逐渐成为中国话剧职业演出的雏形。
附件1 北京市群租房微博舆情重大事件统计
参考文献:
[1] 周金元,张莎莎.国内微博舆情研究的文献计量分析[J].图书情报研究,2014,7(2):45-49.
[2] 宋安成. 禁止“群租” 关键看执法[N]. 房地产时报,2007-01-29(A07).
[3] 张孟佳, 万发文. “群租房”刑法属性的实践分析[J]. 上海公安高等专科学校学报, 2013(2):82-85.
[4] 郭骏峰.“群租房”建筑消防安全存在的问题及处置对策[J].门窗,2016(09):238.
[5] 丁 伟. 浅谈群租房的消防安全问题及管理对策[J]. 湖北科技学院学报, 2016(7):143-144.
[6] 刘艳敏. 群租房整治的反向思考[J]. 新安全 东方消防,2008(9):72.
[7] 王婷涵. 浅谈某辖区群租房消防安全突出问题及整治对策[J]. 消防技术与产品信息, 2016(12):69-71.
[8] 林 震.对群租房相关消防安全问题的思考[J].消防技术与产品信息,2010(4):22-24.
[9] 张志成.浅谈群租房问题解决之道——以苏州市吴江经济技术开发区为研究样本[J].公安研究,2014(4):37-40.
[10] 郭 君. 多中心理论视阈下北京市群租房治理问题研究[D]. 北京:北京邮电大学,2016.
[11] 徐洪军, 薛东琦. 私法公法化视野下的公权干预私权——从上海市政府介入“群租房”现象考察[J]. 长春理工大学学报(社会科学版), 2008(2):69-72.
[12] 庄刘成. 运动式治理模式的困境与转型[D].苏州:苏州大学,2013.
[13] 蔡佳瑜. 中心城区“群租房”问题协同治理研究[D]. 上海:华东师范大学, 2015.
[14] 王淑荣. 社会管理创新视角下的群租房治理对策研究——以北京市为例[J]. 北京行政学院学报, 2013(5):68-71.
[15] 王彦慈.基于云计算的微博舆情流式快速自聚类方法研究[J].情报科学,2017,35(8):23-27.
[16] 李 岩,韩 斌,赵 剑.基于短文本及情感分析的微博舆情分析[J].计算机应用与软件,2013,30(12):240-243.
[17] 王恒静,曹存根,高 尚.基于词类和搭配的微博舆情文本聚类方法研究[J].南京师大学报(自然科学版),2015,38(1):57-65.
[18] 徐嘉成. 基于k-means聚类和TF-IDF的新浪微博舆情分析[D]. 鞍山:辽宁科技大学,2016.
[19] 曾星宇,李淑琴,陈 斌.基于微博文本的舆情分析和研究[J].信息技术与信息化,2014(1):86-89.
[20] 黄冠华. 微博舆情可视化系统的研究与实现[D].镇江:江苏大学,2016.
[21] Silge, Julia.Text Mining with R: A Tidy Approach[M].O'Reilly Media,2017.
[22] 赵妍妍,秦 兵,刘 挺.文本情感分析[J].软件学报,2010,21(8):1834-1848.
[23] 吉顺权,李卓卓.基于信息生命周期的微博舆情规律分析——以食品安全事件为例[J].电子政务,2015(5):58-65.
Public Opinions of Group Leasing in Chinese Social Media:A Research Based on Text Cluster and Sentiment Analysis
Li Quan1, Li Meng1, Cheng Hongquan2, Jiang Linxiu1, Xiao Shuting1, Wang Jike3
1. School of Political Science and Public Administration,Wuhan University, Wuhan 430072, China;2. School of Geodesy and Geomatics, Wuhan University, Wuhan 430072, China;3. School of Computer, Wuhan University, Wuhan 430072, China
Abstract [Purpose/significance] As the “chronic disease” in the process of urbanization,group leasing has been banned for many times. Because it leads to endless social problems, it has generated heated discussion in the social media. An analysis of the public opinion texts on micro blog will help us to learn about the problems caused by group leasing and study the effectiveness of government regulation of group leasing. [Method/process] In this paper, we use big data mining to study group leasing in Beijing. Specifically, using text cluster analysis and sentiment analysis,we analyzed public opinions on group leasing in China’s social media, micro blog. [Result/conclusion] We found that the on-line discussion of group leasing in the social media is very volatile and centers around three main topics: the social problems caused by group leasing, the government regulation and its pitfalls, and the anxiety over low-income groups. Most microblog users displayed a negative tone in their public conversation and expected better regulation of group leasing by the government. Our contribution is that we studied the public opinion environment in terms of public sentiment as a reaction to government regulation of group leasing at the macro level.
Key words group leasing; public opinion; text cluster; sentiment analysis
分类号 C939
引用本文 格式 李泉,李萌,成洪权,等. 基于文本聚类与情感分析的群租房微博舆情量化研究[J].图书情报研究,2019,12(1):82-89,105.
作者简介 李 泉,男,1974年生,汉族,博士,教授,研究方向为美国司法中的政治行为、国会行为与利益集团分布、总统内外决策体系、选举预测、极地治理,发表论文数篇;李 萌,女,1993年生,2016级公共政策专业硕士研究生;成洪权,男,1994年生,2016级地理信息系统硕士研究生;蒋林秀,女,1994年生,2016级公共政策专业硕士研究生;肖舒婷,女,1995年生,2016级公共政策专业硕士研究生;王極可,男,1994年生,2016级计算机科学专业硕士研究生。
(责任编校 田丽丽)
标签:群租房论文; 社会舆情论文; 文本聚类论文; 情感分析论文; 武汉大学政治与公共管理学院论文; 武汉大学测绘学院论文; 武汉大学计算机学院论文;