中国城市国际关注的总体结构与特征--基于互联网搜索引擎和社会媒体的大数据分析_大数据论文

我国城市国际关注度的总体结构与特征——基于互联网搜索引擎和社交媒体的大数据分析,本文主要内容关键词为:互联网论文,大数论文,社交论文,据分析论文,总体论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       一座城市受外界关注的程度,是其在国际主流话语体系中文化影响力的重要维度之一。城市受关注的程度越高,人们就越能全面、准确地获取由城市自身规划布局、建筑空间、文学艺术和风物典故等具体要素所构成的直接意象,以及经由媒体宣传而形成的间接认知。同时,城市文化影响力越强、意象越丰富、越为知名,就越容易唤起更多的城市关注。本文拟从媒体的视角来考察中国城市的国际关注度。该议题之所以重要,是因为中国城市发展日趋国际化,而以国际互联网为代表的新兴媒体的异军突起,使媒介生态发生巨变,新兴媒体开始成为城市形象传播的重要渠道和必要手段。

       一、大数据及其测量方法

       能够用来分析人们对城市关注程度的当代媒体首推互联网。这是因为:互联网的人机互动界面,使得我们可以获得人们主动检索、提及某个城市的详细记录,而传统的图书、报纸等单向反馈的平面媒体则不具有这一优势。此外,互联网使用者的覆盖面越来越广,弥补了网民代表性不足的缺陷。目前,利用互联网使用数据来研究城市关注度的文献在经济、旅游、传播等领域已有零星出现,但均立足于某个城市或区域,多聚焦于城市国内关注度与旅游产业、经济发展、公共政策、危机事件以及网络舆情等方面的关系,缺乏对我国城市国际关注度的全景式把握。此外,现有研究大多仅依托于互联网搜索引擎,忽略了其他重要的网络平台,亦未能区别正面与负面的网络报导。因此,本研究立足于国际互联网搜索引擎的数据来分析当代中国城市国际关注度的总体结构和特征;同时,我们还辅以主要的国际社交媒体数据进行对照,并进行正负面报导内容的指标校正。

       具体而言,本文首先以谷歌(Google)搜索引擎的官方数据库谷歌趋势(Google Trends)近5年间的全部搜索记录作为语料库(Corpus),以我国全部直辖市、副省级城市、省会城市以及港澳台地区共39座主要城市名称作为关键词,以这些关键词在语料库中每周出现的频率作为计数点,获取城市在全球范围内的国际关注度变化曲线,并据此进行排序分析,以揭示国内主要城市国际关注度的现状、特征和文化传播的内在趋势。为确保分析的可靠性,我们还随机选取了著名国际互联网社交媒体推特(Twitter)一个月内的全部帖子进行复制性检索,以获得基于社交媒体的城市关注度指标。此外,我们还利用社交媒体综合平台提供的正面、中性和负面的评论记录,对社交媒体关注度指标进行校正。

       本质上,本文的方法是从大数据中提取出传统社会科学分析方法所能处理的变量,实现对城市关注度的结构和趋势的分析。与传统社会科学分析所采用的数据调查方法相比,本文所使用的搜索引擎数据和社交媒体数据非常符合大数据在数量(Volume)、类型(Variety)、速度(Velocity)和价值(Value)等四个方面的基本特征①。目前,使用这类数据的社会科学研究无论是在国际学术界还是国内学术界,往往都被称为“大数据”研究。对社会科学而言,大数据研究方法既可以在海量信息中直接发现和展示出社会现象的规律,避免定性方法在案例选择方面的样本偏差,又可以从海量数据中提取出传统社会科学分析方法所能够处理的关键性变量进行二次分析,充分发挥传统定量分析方法的价值,还可以以数据可视化的方式把海量的数据和信息视觉化,清晰地揭示数据间的作用模式和信息背后的规律性。因此,该方法已然得到社科领域学者的普遍认同。本文是应用互联网大数据在城市传播研究领域进行的初步尝试。

       1.搜索引擎数据

       谷歌搜索引擎是英语世界中影响最广泛的互联网搜索工具,它每天接受来自世界各地超过2亿次的查询。根据维基百科信息显示,自2005年起,谷歌“已存储超过80亿的网页,1亿3000万张图片,以及超过1亿的新闻组消息,总计大概10亿4000万个项目”,全球一半的搜索量都集中在谷歌②。和百度等主要覆盖中国的搜索引擎相比,谷歌搜索引擎的全球使用覆盖率要高得多,因此,它也被视为研究国际影响力的有力工具。本文使用最新版谷歌趋势(2013版)来提取谷歌搜索记录档案。谷歌趋势是建立在谷歌搜索引擎之上的数据平台,它主要对谷歌搜索,即谷歌网页搜索、图片搜索、新闻搜索、谷歌购物以及YouTube搜索的历史资料(自2004年起)进行检索信息的汇总比较。由于关注度具有很强的时效性,所以我们仅关注近5年来中国城市国际关注度的变迁,故本文仅选择2010~2014年的谷歌趋势大数据作为检索对象。

       2.社交媒体数据

       尽管谷歌趋势语料库浩如烟海,但并非人们在互联网上关注城市的全部渠道。因此,我们还选择了用户直接创造内容的自媒体即社交媒体的数据来进行对照分析。社交媒体与谷歌搜索的区别在于它更多的是让受众主动参与到新闻和信息的收集、报道、分析和传播过程。因此,该语料库储存的数据可以帮助我们更好地了解当下社会化媒体上活跃着的普通用户是如何看待中国城市的,通过对该语料库数据的分析,我们可以进一步了解和掌握当前国际社会对中国主要城市的舆论态度与社会情绪。

       在本研究中,我们抽取了一个月度时间单元(2014年12月16日至2015年1月15日)中推特的城市数据,并将相关词频数据与谷歌趋势中出现的相应词频数据进行比对。在推特数据分析中,限于检索精度我们无法获得与谷歌搜索同步的5年来的每周数据,但我们可以直接用每个城市的推特指标来进行排序,然后与谷歌搜索排序进行大致比对。此外,我们利用社交媒体搜索引擎的综合数据库,获得了中国39座主要城市在这一月度时间单元内被各类社交媒体正面、负面和中性提及的比例。尽管该比例不仅仅针对推特,还涵盖了包括脸书(Facebook)等在内的100多家国际知名社交媒体网站中由用户创造的内容(含博客、评论、社会化书签、事件、新闻、视频以及微博服务等),但考虑到推特的普及性和海量内容,我们近似地把该数据库中的城市提及正负比例和推特提及总量相乘,以获得大致的推特正面提及排名。

       3.概念和测量

       网络搜索的频度和在社交媒体中被提及的次数,可以被认为是民众关注热点和整体思潮的再现:被全球网络使用者搜索次数越多,被提及次数越多,该城市的当前国际关注度就越高。因此,本文基于互联网数据,采用语义学中的语料库词频分析方法作为测量城市当前国际关注度的工具。词频方法让我们可以从无结构的海量数据中提取和转化出时间轴上有结构的数据,然后再用传统的社会科学方法进行描述或建模,从而获得当前城市国际关注度前所未有的精确数据。

       谷歌趋势中的搜索量指数(Search Volume Index,SVI)是一定区域内和一定时间段中针对某关键词实际搜索数与平均搜索量之间比例关系的反映,通常认为它能够表明某关键词对比当期平均搜索数量的相对上升/下降比例和时间序列的变化情况。陈涛和林杰将其用公式表示为:

      

       其中,

表示当前针对关键词Ti的搜索引擎数量,

表示在考察搜索量的一定区域和一定时间段中所有关键词的平均搜索数量,该值越大,说明该关键词Ti的被关注度越高③。基于检索对象的搜索量指数,谷歌趋势进一步以一周内历时最高点为分母重新计算获得每周的比例数据。因此,本文分析的最终谷歌搜索关注度的计算公式为:

      

       其中,

为城市i在第t周互联网搜索引擎关注度,

表示城市i在第t周中的引擎搜索量指数,

为在谷歌趋势中同次被检索的所有城市(如果只检索一座则就是自身)在检索时间段(本文为5年)内的单周引擎搜索量最高点。推特数据检索则相对比较直观,我们直接报告检索日(2015年1月15日)至前一月内推特上所有包含城市名关键词的推特数量。

       二、当前我国大城市国际关注度的结构

       本文所说的大城市是指中国内地的省会城市、副省级(计划单列)城市、直辖市以及香港、澳门、台北三市一共39个城市,分别是:北京、天津、上海、重庆4个直辖市;哈尔滨、长春、沈阳、呼和浩特、乌鲁木齐、拉萨、西宁、兰州、银川、西安、太原、石家庄、济南、郑州、南京、合肥、武汉、成都、长沙、昆明、南昌、贵阳、南宁、广州、福州、杭州、海口等27个省会城市;大连、宁波、青岛、厦门和深圳等5个计划单列市以及香港、澳门和台北等3个港澳台地区城市。

       1.基于谷歌搜索引擎数据的分析

       根据5年内谷歌趋势的数据结果,我们给出了上述39个城市的国际关注度序列排行(见下页表1),并将其中前20强城市的时间序列分别在图1和图2中进行了可视化展示。

      

      

       图1 中国大城市国际关注度前5强近5年时间序列(谷歌趋势)

      

       图2 中国大城市国际关注度前6~20强近5年时间序列(谷歌趋势)

       从表1可以看出,国际关注度排名前10的城市依次是:香港、上海、北京、澳门、台北、广州、深圳、拉萨、西安和南京。从图1和图2可以看出,当前国际社会对中国大城市的关注度呈现出明显的梯度特征,如果我们把下一个梯次的城市群体和上一个梯次的城市群体置于同一个坐标系之中,它们就会非常集中地分布在坐标系的最下端以致难以区分。香港、上海、北京、澳门和台北这5个城市属于第一梯次,广州、深圳、拉萨、西安、南京为第二梯次,以上构成前10强。哈尔滨、武汉、昆明、天津、青岛、宁波、大连、重庆、杭州和成都这10个城市属于第三梯次。最后,未在图中展示的厦门、沈阳、郑州、南宁、福州、长沙、济南、海口、合肥、南昌、兰州、石家庄、贵阳、太原、呼和浩特和银川等其他19个大城市则属于第四梯次。

       国际关注度和国内关注度的关系如何?考虑到百度是最大也是使用最为广泛的汉语搜索引擎,我们利用百度指数(其原理类似谷歌趋势)对国际关注度前5强(第一梯次)和前6~20强(第二梯次)的城市进行对照分析,并分别在图3和图4中展示了2011年1月到2014年10月两梯次城市的每周百度搜索引擎热度。

       将图3、图4与图1、图2进行对照可以发现,我国城市国内关注度的座次和国际关注度的座次既有相似之处又存在一定区别,国内关注度的层次清晰度明显弱于国际关注度。总体而言,北京在国内关注度排名中居于第一,上海第二,而香港为第三④,这与国际关注度中香港位居第一的情况有所不同。此外,更为重要的是,尽管我们没有在图4中增加重庆、天津、南京、西安等内地大城市,但实际上这些城市的百度指数曲线基本上处于上海和台北澳门之间⑤。这说明,台北和澳门的国内关注度远远低于内地的大城市。此外,拉萨的国内关注度也明显低于其国际关注度。

      

       图3 国际关注度前5强城市的国内关注度时间序列(百度指数)

      

       图4 国际关注度前6~20强城市的国内关注度时间序列(百度指数)

       由于在平均值位次上国内和国际的关注度有所不同,因此我们从时间序列角度来分析某一城市的国际、国内关注度之间的统计关联。我们推测:那些国际化程度较高的中国城市,其国际和国内关注度之间应该存在统计显著的格兰杰因果关系⑥。从跨国传播的特征和时间限制来分析,由于国内公众总是能更直接、更快和更全面地感受中国城市,因此,对于对外开放度较高的“国际化城市”,较早前的国内关注度或者国内关注度的变化,可以预测稍后的国际关注度或国际关注度的变化。为此,我们对国际关注度前15强的中国城市进行国际与国内关注度的双变量时间序列分析,以验证这一假说。我们在表2中展示了本文所关注的15座大城市的分析结果。

      

       从表2中不难发现,国际关注度前6强的城市,其百度指数都是谷歌趋势的格兰杰原因。换句话说,北上广和港澳台这6座城市,其国际关注度和国内关注度呈现出显著的统计相关,可以说是我国真正的“国际化大都市”。

       2.基于社交媒体数据的分析

       我们将以上39座城市在2014年12月16日至2015年1月15日期间在推特中被提及的数据列在表3中。同时,为进行国内国际关注度对比,我们将同样时段内新浪微博的提及数据也纳入表3。对比表3各栏,我们发现:第一,推特提及和正面提及的排名几乎一致。在39个城市中,两者之间的最大差异仅仅是4个位次(如乌鲁木齐)。大部分差异位次仅仅在1~2个身位。第二,推特数据排名和新浪微博数据排名有较大差距。国内排名中,重庆和天津均在前十,港澳台以及拉萨提及较低。这反映了国际公众和国内公众的不同关注取向。第三,推特关注度排名与谷歌趋势关注度排名虽有出入,但关注度层次尤其是前列城市是比较接近的。如:前3名的城市一致,仅有位次差异,前10名的城市相似率高达80%等,而前19名的差异仅在于,谷歌数据前10名中有深圳、拉萨,而推特数据为厦门与成都。

       通过采集和分析国际互联网搜索引擎和社交媒体的大数据,我们发现,在谷歌搜索引擎数据和推特正面提及数据这两个数据中,能够双双进入前10名的城市有8个,按照平均排名为:香港(1)、北京(2)、上海(2.5)、广州(5.5)、澳门(6)、台北(6)、西安(6.5)、南京(9.5)。其余城市的两大指标平均排序则为深圳(9.5)、拉萨(9.5)、厦门(13.5)、哈尔滨(14)、武汉(14)、成都(15)、重庆(15.5)、青岛(16.5)、天津(17.5)、昆明(17.5)、大连(18)、杭州(19.5)、长沙(20.5)、济南(20.5)、宁波(22)、沈阳(23)、郑州(23)、福州(26)、南宁(26.5)、乌鲁木齐(29)、合肥(29.5)、西宁(29.5)、长春(30.5)、海口(32.5)、兰州(32)、南昌(32.5)、石家庄(35.5)、贵阳(35.5)、太原(35.5)、呼和浩特(38)、银川(39)。本研究显示,中国大城市当前国际关注度综合排名前10分别为:香港、北京、上海、广州、澳门、台北、西安、南京、拉萨、厦门。

      

       3.大数据分析与传统调查分析的比较

       目前,已有调查机构对当代中国城市的国际形象和知名度排名进行了对比。例如,复旦大学国际公共关系研究中心2010年度的“中国国际形象最佳城市”排名前10为上海、北京、南京、成都、杭州、宁波、西安、长沙、昆明、长春。美国调查机构(PRI)2008年度“中国城市国际知名度排名”前10强为北京、香港、西安、上海、台北、广州、杭州、桂林、深圳、南京。尽管这些排名和我们的研究结果略有出入,不过,在目前的三种排名中,三次均进入前10的内地城市就有5个,分别为北京、上海、广州、南京、西安。在涵盖港澳台地区城市的排名中,香港和台北也都进入前10。这表明,无论是哪一种排名,前10强的指向都非常集中,北京、上海、广州、南京、西安和香港、台北这7座城市总是名列前茅。

       那么,调查结果的差异在哪里?我们进一步对比了三者的数据来源、样本代表性、问题设计和分析逻辑后发现:复旦大学的调查被访者仅有7980人,覆盖全球100多个国家,主要是各国驻华机构、驻华企业和到过中国的外籍人士等。显然,这样的样本仅仅代表对中国有过切身了解的西方政商人士,而无法代表整个国际社会公众对中国城市的认知程度。而美国调查机构(PRI)的调查则覆盖全美50个州,样本量据称达200万,但其全部集中在美国,因此也同样不具有国际代表性。相比而言,我们的研究数据时间跨度5年,空间跨度全球,是质量较高的网络大数据。虽然我们的样本肯定也有偏差,但在互联网普及的今天,我们的大数据应该还是比其他任何一种关于中国城市关注度的传统抽样调查数据要可靠得多。进一步地,我们分别检验了搜索引擎数据和社交媒体数据,双方非常接近的结果进一步验证了本研究的可靠性。

       三、我国大城市国际关注度的特征

       基于结构分析和城市国际关注度排名时间序列的可视化展示(见图1、图2),我们归纳出了当前我们城市国际关注度的两大特征。

       1.国际关注度并不取决于城市经济实力,和国内关注度也不一定存在关联

       通常认为,城市关注度是与其经济实力密切相关的,国际关注度排名靠前的城市往往经济发展水平也名列前茅。然而,可视化数据清楚地表明:国际关注度排名并不取决于城市的经济规模。这一点,和基于百度指数的国内关注度排名形成了强烈的反差。以GDP指标为例,2014年我国GDP排名前10的省会以上城市为上海、北京、广州、深圳、天津、重庆、武汉、成都、杭州、南京。而同期反映国际关注度的谷歌和推特排名,前10位的分别是上海、北京、广州、深圳、拉萨、西安、南京、哈尔滨、武汉、昆明,以及北京、上海、西安、广州、厦门、南京、成都、拉萨、深圳、重庆。其中,拉萨、西安、厦门、昆明等四个城市,完全没有出现在GDP排名上。与之相对的是:体现国内关注度的百度指数均值排名前10分别为北京、上海、深圳、重庆、西安、南京、广州、杭州、成都、武汉,新浪微博排名前10分别为北京、上海、广州、深圳、成都、重庆、武汉、南京、西安、天津。除西安外,国内关注度指标和GDP排名的前10名构成完全一致。

       实际上,我们的格兰杰时间序列分析进一步验证了上述结论:除北上广和港澳台六大国际化都市外,国际关注度和国内关注度在国内大部分城市中并不存在格兰杰因果关系。也就是说,除了国际化大都市外,中国其他城市的国际、国内知名度之间没有统计关联。以拉萨为例,在国际关注度靠前的城市中,无论是经济状况、社会实力还是人口规模,拉萨在国内城市排名中都进入不了前列,但其所受到的国际关注却远远超过国内绝大多数综合排名靠前的城市。我们认为:这可能有赖于其独特的人文底蕴和政治历史——作为藏传佛教的发源地,拉萨丰富的宗教胜迹、独特的文化资源、壮丽的自然风光和地缘政治的微妙影响,使其在国际关注度排行榜上长期居高不下。

       上述结论促使我们思考城市国际关注度的排名与其既有的文化资本之间的关系。文化资本是以财富形式具体表现的文化价值的积累⑦,是包括文化能力、文化习性、文化产品、文化制度在内的一切文化资源的总和,而城市本身正是一个文化积累的过程⑧。以国际关注度排行榜独有的拉萨、西安、厦门、昆明四城为例,其物质文化遗产布达拉宫、大雁塔、鼓浪屿和滇池,历史人物松赞干布、张良、陈嘉庚和郑和,以及大昭寺、兵马俑、厦门大学和春城等文化象征与文化符号均产生于特定历史时期,属于该市不可再生的文化资源。在漫长的历史进程中,这些文化资源被赋予历史的、政治的属性及意义,并逐步演变成该市所独有的文化符号。随着时间的流逝,这些文化符号逐渐产生越来越厚重的文化意向和悠远的人文情怀,并进一步形成了该城市特有的文化再生产场域,凸显出其文化资本的属性和价值。文化再生产的过程也是在文化资本的层面更大范围地影响大众深层次文化心理结构、进而赢得广泛认同和信任的过程;因此,随着城市文化资本的累积,城市的国际关注度也随之不断提升。

       2.国际关注度具有稳定的层次性,但存在媒体事件的脉冲式影响

       通过可视化数据还可以看出:当代中国各城市的国际关注度曲线基本都保持在一个相对稳定的区间内上下波动,单个曲线的差异稳定,没有非常明显的坡度,但曲线间有一定的层次差异性。实际上,在我们的时间序列分析中,国际关注度全部是平稳的时间序列,没有明显的时间趋势。不过,不少曲线都明显地存在规律性的起伏和剧烈的脉冲式波峰。这一结果与我们对城市国际知名度的研究发现完全不同:知名度的时间序列曲线往往是非平稳的过程,时间趋势明显,即知名度受到历史政治事件的影响之后往往就改变了知名度的总体梯次,而关注度则会显示出平稳时间序列的特征。

       通过将图3、图4各曲线波峰与当年该城市的大事记相互对照可以看出:曲线的波峰总是与“媒体事件”一一对应,比较典型的“脉冲”包括:2010年上海世博会、2012年十八大在京召开、2013年上海自贸区申请获批、2014年南京青奥会、2014年昆明暴恐事件等。从传播的角度看,“媒体事件”主要是指因媒体集中关注而放大社会影响的各类突发和常发事件,除不可控的突发事件外,大型国际会议、赛事和重要的政治、经济活动能将全球媒体的关注焦点迅速汇聚到某一特定城市,该城市可以利用这个短暂而集中的时间段,面向世界高频率、超强度地推销和展示自己,一方面可以吸引游客、拉动投资、提高在国际舞台的公众形象,另一方面还能改变国际舆论中原有的刻板印象、加强对国际社会的影响力。

       由于会议、赛事和活动都属于短期行为,只能在一段时期内提升城市的国际关注度,一旦另有热点发生,人们的注意力就会立即转移,因此,媒体事件对城市国际关注度的提升难以持续。但从长期看,媒体事件对城市国际关注度的冲击效应具有更为深远的意义。互联网时代,注意力是最稀缺的资源,城市间国际关注度的竞争,其实质是对注意力的竞争。信息的无限性导致了注意力的匮乏,而媒体事件能够通过将人们的注意力高度集中到某一特定的事件或活动,完成对注意力这一稀缺资源的生产、加工和再分配,因此,通过阶段性开展的热热闹闹造势、轰轰烈烈登场的媒体事件,城市国际关注度能够得到波浪式的提升。进一步地,注意力是影响力的基础,虽然城市国际关注度差异稳定,没有明显坡度,但阶段性的脉冲也能在无形之间扩大城市的影响,进而形塑出城市的个性品牌,在此过程中,关键看城市是否能最大限度地将关注度放大并转化为经济利益和商业价值,进而打造出响亮的城市品牌。城市品牌是城市公信力的象征,也是城市信誉的符号,事实上,城市借助媒体事件积极进行品牌推广、放大品牌效应的过程也正是城市最大限度寻求外界认同的过程。当大众对城市本身的认同达到制度或价值观层面时,不仅会大大提高城市的国际关注度,甚至关注度自身还会转化成城市的文化资本。

       四、结语

       大数据方法的应用在我国社会科学界尚属起步,其重要原因之一,就是因为大数据难以获得、难以分析。在本文中,我们使用最新版的谷歌趋势语料库大数据、推特大数据和社会化媒体搜索引擎资料,分析了当代中国城市国际关注度的结构和特征。分析显示,中国当代城市国际关注度综合前10名为:香港、北京、上海、广州、澳门、台北、西安、南京、拉萨、厦门。我们发现:城市国际关注度并不取决于经济实力,和国内关注度也不一定存在关联,更多的是与其文化资本密切相关,并会受到媒体事件的脉冲式影响。可以说,城市国际关注度是其经济实力、城市形象、开放程度、文化底蕴和发展能力等各种因素的综合反映。随着全球化程度的不断加深,国际关注度将日益成为城市发展的文化资本和软实力,并对城市经济社会的进一步发展产生深远影响。在21世纪的城市竞争中,文化影响力的竞争是重要的方面,对任何一座中国城市而言,了解自己在当代城市国际关注度排行榜中的序位,通过提升自身的国际关注度来拓展城市的发展空间,是强化城市文化国际影响力的必由之路。

       我们的分析表明,除了传统的抽样数据可以用来对城市进行研究之外,大数据特别是互联网大数据可以为城市和文化传播研究提供新的维度。特别是,大数据在时间和空间层面显示出传统抽样数据所无法比拟的广度和深度。尽管本文没有进行传统社会学定量模式的回归分析,但大数据中涌现出的社会现象本身已经为我们展示了饶有兴味的历史画卷,并可以为这一领域的研究提供新的启迪。不过,我们的研究还存在不少不足:首先,尽管互联网的普及率非常高,而且会越来越高,但互联网并非人类表达关注的唯一载体,而目前除了互联网数据,其他可以用来分析人类关注某事物的互动数据极为匮乏。其次,尽管词频是文本分析的主要指标,但衡量关注度还有其他各种不同的测量;因此,我们的词频方法可能仅仅代表了城市关注度在文化影响力方面的维度。最后,由于时间、篇幅和搜索精度的限制,我们没能积累更多的推特时间序列数据,这使我们无法进行其他的深度分析,比如,在互联网主动搜索城市和在社交媒体提及城市可能存在一定的因果关联。不过,随着系列研究的不断深入和延展,进行类似的相关分析完全不存在技术上和理论上的障碍,在下一步我们会做更深入的分析。

       注释:

       ①维克托·迈尔-舍恩伯格著:《大数据时代》,杭州:浙江人民出版社,2012年。

       ②http://www.comscore.com/Insights/Market-Rankings/comScore-Releases-May-2014-US-Search-Engine-Rankings.

       ③陈涛、林杰:《基于搜索引擎关注度的网络舆情时空演化比较分析——以谷歌趋势和百度指数比较为例》,《情报杂志》2013年第3期。

       ④香港仅在2014年9月28日到10月4日的一周内有非常集中的国内搜索量,可能和所谓的“占中”行动有关。

       ⑤按照均值排序,百度指数前10的中国城市为北京、上海、深圳、香港、重庆、西安、南京、广州、杭州、成都。

       ⑥格兰杰因果关系为计量经济学术语,并非指反事实框架下的因果关系验证。在两个时间序列X和Y之间的格兰杰因果关系的最简单定义就是,如果变量X有助于解释变量Y未来的变化,则认为变量X是引致变量Y的格兰杰原因。

       ⑦Throsby,D,“Cultural Capital,”Journal of Cultural Economics,23(1),1999,pp.3~12.

       ⑧刘易斯·芒福德著:《城市发展史》,北京:中国建筑工业出版社,1989年,第74页。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

中国城市国际关注的总体结构与特征--基于互联网搜索引擎和社会媒体的大数据分析_大数据论文
下载Doc文档

猜你喜欢