利用大数据挖掘城市图书馆地理空间分布特征及时空演变
李云华 赵晓明
摘 要 文章基于社交网络点评数据(北京市),提出利用核密度估计和统计分析探测城市图书馆的空间布局及图书馆时空变化趋势的方法,揭示城市图书馆的空间分布现状及存在的问题。同时,结合图书馆的顾客评分,对不同类型的图书馆进行用户满意度分析,检测出不同类型图书馆用户满意度的差异性,以为城市图书馆资源的合理配置、图书馆的管理、选址和类型确定及读者出行和选择等提供有效的参考依据。
关键词 图书馆 空间布局 用户满意度
0 引言
随着信息化时代的到来,阅读对于个人成长、城市发展及国家竞争力提高都有着非常重要的意义。在城市中,作为必要的基础公共设施——图书馆,不仅具有传播知识与信息的职能,还能体现一个城市“以人为本”的理念和目标。合理的图书馆布局有利于城市的经济发展,并且影响城市居民的文化精神水平。因此,研究城市图书馆的空间结构及分布模式对于城市资源合理配置、城市文化健康发展等有着重要意义。
图书馆作为城市文化的代表性建筑,一直受到学者的关注。从研究内容来看,目前国内外学术界对图书馆的研究主要集中在以下几个方面。一是对图书馆的效率和可持续发展水平空间分布研究[1-2]。二是城市图书馆的空间分布及图书馆信息资源空间分布公平性研究[3-4]。三是对图书馆服务满意度影响因素的研究[5-9]。从研究方法来看,现有研究主要通过收集文献资料或问卷调查的方法获取研究数据,并且大多使用统计分析方法进行研究分析。但可以看出,在城市图书馆空间分布特征上的研究还比较少,研究数据和方法也比较单一,对图书馆的空间分布动态变化及其用户满意度的研究重视程度也不够。
随着“大数据”时代的到来,社会信息的传播方式发生了重大变化,特别是随着智能手机的普及,Facebook、Twitter、微博、大众点评等社交网络服务网站,为人类活动提供了重要的数据源[10]。例如,“大众点评网”是我国领先的城市生活消费平台和独立第三方消费点评网站,是为顾客提供不同空间位置的商户服务的评价平台,顾客可以根据自己的消费体验对商户服务做出满意度评价。“用户满意度”这一概念是由R.L.Oliver等最早提出,用于反映用户对一种产品或服务满足自身的需求与期望程度的感受,是对产品或服务本身的评价[11]。用户满意度已经成为消费者和商户决策的重要考虑因素,并且能够影响消费者的选择行为和商户的空间分布布局[12-16],还可以为商户分析顾客满意度提供数据支持。因此,利用大众点评网点评数据来研究城市不同类别图书馆的用户满意度,不仅有助于解决传统图书馆设施和图书馆资源研究中对用户满意度难以衡量和数据样本量不足、获取成本高等难题,而且可以为城市图书馆资源合理配置、图书馆布局、选址和类型的确定、消费出行和选择等提供有效参考。
本文以北京市为例,采集了“大众点评网”中的图书馆点评数据,提出利用核密度估计和统计分析探测城市图书馆的空间布局及图书馆的时空变化趋势的方法,揭示城市图书馆的空间分布现状及存在的问题。结合图书馆的顾客评分对不同类型的图书馆进行用户满意度分析,检测不同类型图书馆用户满意度的差异性。这些分析结果能为城市图书馆资源的合理配置、图书馆的选址和类型确定、读者出行和选择等提供支持。
1910年,EDWIN BEER首次报道了通过内镜下电灼替代传统的开放手术处理膀胱乳头状肿瘤。1931年,STERN和MCCARTHY推出了临床实用的电切镜,使得膀胱肿瘤的内镜下诊断和治疗成为可能。由此,经尿道膀胱肿瘤切除术(transurethral resection of bladder tumor,TURBT)成为了膀胱肿瘤处理的基础,肿瘤的确切病理分期、分级都需要依据TURBT术结果确定。对于NMIBC,TURBT既是重要的诊断方法,更是主要的治疗手段。相较于传统单极电切,等离子双极电切具备手术效果好、并发症较少的优势,临床应用渐趋广泛。
运用ArcGIS中空间分析工具的核密度分析,带宽设置为800米,对从大众点评网获取北京市图书馆数据进行处理,得到北京市图书馆的分布核密度。北京市图书馆主要分布在五环以内的主城区和昌平、房山、怀柔、顺义、通州5个城郊区,但主城区与郊区图书馆数量差异较大。图书馆空间分布主要围绕主城区重要的住宅小区、街道、高校等进行布局,且集中于西城区、东城区、朝阳区和海淀区。其中, 西城区、东城区、朝阳区西部、海淀区东南部分布密度较高,且集聚范围远远大于其他地区。昌平区大学城、 石景山区居民区、 丰台区东北部分布密度和范围次之。其他区县的图书馆分布较为零散,分布密度和分布范围相对较小。
1 点评数据获取与预处理
大众点评网是中国使用最普及的点评类网站,它不断产生涉及社交用户日常生活的海量点评数据,这些数据包含时间、用户评论等多种属性。本文设计了一套数据采集的方案,采用网页爬虫方法爬取大众点评上研究区域内图书馆商户数据和这些商户的评论数据,并对数据进行预处理。本文对点评数据的获取与满意度处理流程如图1所示,主要包括3个步骤。首先,爬取研究区域内的图书馆数据,从爬取结果中解析出店铺ID(用来唯一标示商户)、店铺名称、店铺亚类、店铺类别、区域名称、店铺URL、店铺经纬度坐标等信息;然后,根据店铺ID从“大众点评网”获取每个图书馆的评论地址,以获取图书馆的顾客评论数据;最后,计算每个图书馆的用户满意度和点评数量,得到每个图书馆的名称、地理坐标及用户满意度、用户点评数量。
图1 点评数据获取、处理流程
“外国人写作中国计划”属于我国“十三五”时期新闻出版走出去的一项重点工程,此工程旨在鼓励与支持海外一些友好的作家、汉学家与社会知名的学者或人士写作亲历“中国故事”,向世界传播中国文化,以创新的话语体系,向所有关注中国的海外读者说明,“一带一路”既是经贸通道,也是文化通道,是民心通道,是文明互鉴通道。写作“中国故事”的外国作家及作品对于“一带一路”文化的现代阐释意义非凡,因此,本文将针这一问题进行全面而深入的探讨与研究。
表1 北京市各类图书馆数量统计
图2 北京市图书馆空间分布
2 图书馆的空间分布特征
基于大众点评数据,我们按照年份分别计算2010年、2012年、2014年和2016年北京市图书馆的核密度,生成四个年度北京市图书馆的空间分布核密度图,如图3所示。
2.1 图书馆的空间布局
另外,分别计算公共图书馆、学校图书馆、国家图书馆和其他专业图书馆的空间分布核密度,生成四类图书馆的空间分布核密度结果,可以看出:公共图书馆数量较多,分布密度最高,且基本聚集在街道、小区等的居民住宅区;学校图书馆基本分布在各个高校内部,海淀区东部高校云集,故学校图书馆分布较为聚集,其他地区高校分布较零散,所以学校图书馆没有呈现明显的聚集现象;国家图书馆数量较少,但大多聚集分布在海淀区、西城区的高校附近;其他类型的专门图书馆分布较为零散,但基本分布在一些专门的科研机构、教育培训机构等附近。
通过研究图书馆的空间布局和现状,可以揭示城市现存图书馆的空间分布结构及其合理性。一个城市图书馆空间分布特征的形成与其时空演变机制是密不可分的。为了进一步探索图书馆的空间分布特征的形成及其合理性,我们运用核密度估计方法探测北京市图书馆的空间分布随时间变化的情况,分析图书馆的时空变化趋势及其合理性。
所幸,吉卜林并没有因为自己的肤色,以及英印人的身份而尴尬,相反,他却是很感谢这种安排的。在吉卜林写于1895年10月的一封信中,他这样写道:
总体看来,由于受经济、人口、交通、自然环境等诸多因素的影响,北京市主城区和郊区图书馆空间分布不均衡的现象比较明显。设施较好、功能较齐全的图书馆几乎均集中于城市中心地带,这反映了北京市主城区和郊区图书馆分布缺乏均衡性。
本文从大众点评网共获取362家北京市图书馆设施数据及各自对应的用户点评信息,总数为5180条,时间跨度从2006年1月至2017年12月。不同的图书馆具有不同的职能,针对的用户群体也有所不同,本文研究对象为不同类型的图书馆。根据国际标准化组织颁布的ISO2784-1974(E)“国际图书馆统计标准”中“图书馆的分类”一章所阐述的我国图书馆的分类标准,本文将北京市图书馆划分为国家图书馆、学校图书馆、公共图书馆和其他专门图书馆(专业图书馆、科学图书馆、少儿图书馆、工会图书馆、军事图书馆、盲人图书馆)四大类。据此分类标准,北京市各类图书馆数量统计见表1。公共图书馆数量最多,有208家,数量远远高于其他类型的图书馆;学校图书馆和其他专门图书馆都有70家左右,数量相当;国家图书馆数量最少,只有14家。根据采集数据中图书馆的详细地理坐标及北京市地图,经过整理、分类和可视化分析生成图书馆设施的空间分布图如图2所示。从图2中可以发现,五环以内与五环以外的图书馆数量差异较大。
核密度估计是一种广受欢迎的研究地理对象空间分布模式的方法,已经被应用于城市交通、城市规划、城市商业设施布局、犯罪等领域[18-23]。核密度估计能够求解给定样本点集合的分布密度函数问题,它从数据样本本身出发,研究数据分布特征,它依据核函数和带宽来计算地理点事件在平面上的密度函数分布,估计函数公式(1) 为:
由此可见,北京各类图书馆的位置选址顾及了区域功能需求,这是其他城市图书馆建设值得借鉴的地方。但是,大多数高校和专门图书馆多分布于市中心地带,市中心虽然人群聚集,但过于喧闹拥挤,无法保证读者的阅读环境和阅读质量。因此,学校图书馆和专门图书馆的选址不仅要顾及到人口聚集范围,还要考虑到读者所需的阅读环境。
对学生来说,提高外语学习的效率,在减轻个人负担的同时获得更高的学习质量和外语水平是学习模式优化的主要方向,而预制性词块教学对学习效率的重大优化作用令其得到相当多学生的青睐。在应用了预制性词块的外语教学中,词汇、句子、词块并不是分立的,而是一个被串联起来的系统,学生可以通过对词块的记忆完成对三个外语学习模块的练习和提高,大大提升了学习效率。另外,预制性词块教学显著的应用能效可以令学生意识到,外语并非只是一门要考的课程,更是未来实际能用到的应用工具,是可以伴随自己终身的能力素质,这对学生外语学习积极性的提高有很大帮助。
由于柱塞泵的冲次高达370次/min,在密封函内做往复运动的柱塞与其配合的盘根、导向环、弹簧座以及压套的摩擦力很大。随着运行时间的延长,它们之间的配合间隙不断加大,导致盘根刺漏严重,从而使密封失效,增大了泵的容积损失,降低了柱塞泵的效率。经过对部分具有代表性的柱塞泵的运行情况的统计分析,得出以下结论:在343次停泵工况中,由盘根漏失造成的停泵206次,占总停泵次数的60.1%;由柱塞磨损造成的停泵105次,占总停泵次数的30.6%;由其他因素造成停泵32次,占总停泵次数的9.3%。
2.2 图书馆的空间分布时空演变分析
其中,D(s) 代表当前位置s的密度估计值,r代表核密度估计的带宽, dis代表当前位置s到第i个点事件的最短路径距离。k()代表一个服从距离衰减的核函数,一般采用高斯核函数,如公式(2) 所示:
图书馆作为向人们提供信息和知识的社会职能设施,其空间分布状况及特征能够直接影响公众传播信息、利用信息的效率与效果[16]。因此,研究城市图书馆的空间结构及分布模式对于城市图书馆资源的合理配置、城市文化的健康发展等有着重要的意义。本文提出探测图书馆空间分布模式的核密度估计方法,分析图书馆的总体空间布局及现状、不同类型图书馆空间分布特征及时空演变特征。
2.2.2 发病时间分布 480例现患哮喘儿童发病好发于冬季和秋季,发病人数分别占42.71%(205例)和21.55%(102例),不定季节发作者占9.58%(46例),常年发作者占1.04%(5例),换季节发作者占14.58%(70例)。好发时间以午夜43.13%(207例)和清晨29.38%(141例)为主,睡前和午后发病分别为17.08%(82例)、1.04%(5例),无规律者为9.28%(45例)。
图3 图书馆的空间分布变化
从图3可看出,从2010年至2016年,图书馆的数量由海淀区东南部逐渐向东城区、西城区、朝阳区等市中心区域扩展,这与北京市政治和经济中心的发展地位直接相关。通过查看北京市中心地图,可知北京市中心区域集中了众多诸如国家气象局、北京市文物局等国家机关和政府部门,以及中国中医科学院、首都师范大学等科研教育机构。而市中心以外的其他地区发展则十分缓慢,六年以来一直呈现零星分散的状态,没有形成明显的聚集现象。由此可见,北京市图书馆布局由市中心逐渐向外发展,但总体上一直注重主城区的发展,而城市外围图书馆发展十分缓慢,这种不合理的演化趋势造成了主城区和郊区图书馆布局不均衡的现状。
3 图书馆用户满意度分析
读者的满意度能够影响读者的选择行为和图书馆的空间分布布局。为了进一步探索用户满意度与图书馆的关系,本文通过统计不同类别的图书馆用户满意度情况,来探讨各类图书馆用户满意度的差异性。
基于大众点评网上用户对每家图书馆的评分,本文将北京市图书馆按照顾客满意度分为三类,即图书馆满意度在4分至5分之间的为好评,满意度在3分至4分之间的为中评,满意度低于3分的为差评。经过统计,共计177家图书馆在大众点评上有用户满意度评价,满意度为“好评”的图书馆共有82家,满意度为“中评”的图书馆有61家,满意度为“差评”的图书馆有34家。其中,满意度排名靠前的图书馆有:国家图书馆学津堂、清华大学李文正图书馆、北京航空航天大学图书馆、首都图书馆南邵分馆、西城区图书馆什刹海街道分馆等。通过统计不同满意度的各类图书馆的数量和百分比,得到表2和图4,从中可以发现各类图书馆的满意度分布情况。
表2 不同满意度各类图书馆数量统计
图4 各类图书馆用户满意度分布情况
从表2和图4可以看出,对于公共图书馆,满意度为“好评”“中评”和“差评”的图书馆数量相当。学校图书馆相较公共图书馆数量较少,但只有不到10%的学校图书馆用户满意度较差。国家图书馆共有7家,6家(85.71%)的用户满意度较好,1家(14.29%)用户满意度较差。其他专门图书馆中,超过一半(19家)的图书馆用户满意度较好,只有约13.51%(5家)的图书馆用户满意度较差。整体来说,国家图书馆的用户满意度最好,学校图书馆和其他专门图书馆的用户满意度一般,公共图书馆用户满意度相对较差,这与图书馆的设施水平、文献资源数量、阅读环境、周围设施等都有很直接的关系。为了进一步了解哪些图书馆最受读者欢迎,笔者还统计了图书馆用户点评量,其中用户点评量较多的图书馆有:中国国家图书馆(中关村总馆)、首都图书馆、北京大学图书馆、篱苑图书馆、东城区图书馆、国家图书馆(古籍馆)等。由此可见,用户满意度较好、用户点评量较多的图书馆基本上都是国家图书馆、高校图书馆和较大型的公共图书馆。
4 结语
通过将社交网络数据与城市地理空间信息相结合,能够在一定程度上拓展传统城市设施研究的思路,并且为图书馆学或数据研究领域提供新研究方向。此次研究以社交网络点评数据为信息源,设计了能够探测城市图书馆设施的空间分布特征的核密度估计及统计分析的方法,研究了北京市图书馆设施具体的空间分布格局,并揭示了研究区域图书馆在空间上分布不均衡的现状及在时序上的变化趋势,同时揭示了四类图书馆用户满意度的差异性,发现用户满意度、点评量最好与最差的图书馆,可以为政府的图书馆设施规划和政策制定提供重要的决策依据,并能够引导图书馆管理层做好智慧管理和读者的智慧选择。
社交网络点评数据的使用虽在一定程度上避免了传统数据获取方式的缺点,能够大致揭示城市图书馆设施的空间分布特征及用户满意度情况,但社交网络应用的用户多是年轻人,这部分人群更倾向于对图书馆商户进行光顾和点评,这样就限制了样本数据的范围。另一方面,影响城市图书馆设施空间分布的因素及影响图书馆顾客满意度的因素也需要进一步的研究。
参考文献:
[ 1 ]王惠.中国省域公共图书馆的可持续发展水平空间分布研究[J].农业图书情报学刊,2015,27(4):10-13.
[ 2 ]王惠,赵坚.中国省际公共图书馆效率动态演进与空间分布[J].图书馆理论与实践,2016(5):75-80.
[ 3 ]吴正荆,孙成江,褚迪.长春市图书馆信息资源空间分布公平性研究[J].图书馆学研究,2010(22):56-59.
[ 4 ]侯海霞.西安市儿童图书馆的空间分布及其优化对策研究[J].商,2016(19):99,92.
[ 5 ]王平,茹嘉祎.国内未成年人图书馆服务满意度影响因素:基于扎根理论的探索性研究[J].图书情报工作,2015(19):41-46.
[ 6 ]汤诚,李萧萧.读者满意度影响因素调查研究:以三所师范类院校为例[J].图书情报知识, 2010(3):96-100.
[ 7 ]彭冬莲,彭备芳.读者满意度测评方法研究[J].图书馆学研究, 2005(8):52-56.
[ 8 ]SHI X, HOLAHAN P J, JURKAT M P. Satisfaction formation processes in library users: understanding multisource effects[J]. Journal of Academic Librarianship,2004,30(2):122-131.
[ 9 ]MARTENSEN A, GRONHOLDT L. Improving library users’ perceived quality, satisfaction and loyalty: an integrated measurement and management system[J].Journal of Academic Librarianship,2003,29(3):140-147.
[10]景东,张大勇.社交媒体环境下用户信任度评估与传播影响力研究[J].数据分析与知识发现,2018(7):26-33.
[11]OLIVER R L, BURKE R R. Expectation processes in satisfaction formation: a field study[J]. Journal of Service Research,1999,(3):196-214.
[12]张子坤.在线点评平台如何影响人们的消费行为?一个信息性社会影响的观点[D].合肥:中国科学技术大学,2010.
[13]郝媛媛,邹鹏,李一军,等.基于电影面板数据的在线评论情感倾向对销售收入影响的实证研究[J].管理评论,2009,21(10):95-103.
[14]GHOSEH A, IPEIROTIS P G. Designing novel review ranking systems: predicting the usefulness and impact of reviews[C]//International Conference on Electronic Commerce. ACM, 2007:303-310.
[15]MUDAMBI S M, SCHUFF D. What makes a helpful online review? a study of customer reviews on amazon.com[J]. Social Science Electronic Publishing,2010,34(1):185-200.
[16]陈江涛,张金隆,张亚军.在线商品评论有用性影响因素研究:基于文本语义视角[J].图书情报工作,2012,56(10):119-123.
[17]林光美.网络时代图书馆的挑战与方向[J].公共图书馆, 2007(1):19-23.
[18]BAILEY T C, GATRELL A C. Interactive spatial data analysis[M]. Essex: Longman Scientific & Technical,1995.
[19]O’SULLIVAN D, UNWIN D. Geographic information analysis[M]. New York: John Wiley & Sons, 2014.
[20]SILVERMAN B W. Density estimation for statistics and data analysis[M]. New York: Chapman and Hall, 1986.
[21]DELMELLE E, THILL J C. Urban bicyclists: spatial analysis of adult and youth traffic hazard intensity[J].Transportation Research Record: Journal of the Transportation Research Board, 2008(2074):31-39.
[22]ERDOGAN S, YILMAZ I, BAYBURA T, et al.Geographical information systems aided traffic accident analysis system case study: city of Afyonkarahisar[J].Accident Analysis & Prevention,2008,40(1):174-181.
[23]ANDERSON T K. Kernel density estimation and K-means clustering to profile road accident hotspots[J]. Accident Analysis & Prevention,2009,41(3):59-364.
Spatial Distribution and Spatial-temporal Variations of Urban Library Based on Big Data
Li Yunhua, Zhao Xiaoming
Abstract Based on the social network comment data (Beijing), this paper puts forward the method of using nuclear density estimation and statistical analysis to detect the spatial layout of urban libraries and the temporal and spatial changing trends of libraries, so as to reveal the current situation and existing problems of the spatial distribution of urban libraries. At the same time, combining the library’s customer rating with different types of libraries, it carries out user satisfaction analysis and detects the differences of user satisfaction among different types of libraries, which can provide effective reference for rational allocation of resources, management of libraries, location and type determination of libraries, and the travel and selection of readers.
Keywords Library. Spatial layout. User satisfaction.
中图分类号 G250
DOI 10.16810/j.cnki.1672-514X.2019.09.014
李云华 武汉大学图书馆馆员。 湖北武汉,430072。
赵晓明 武汉大学测绘遥感信息工程国家重点实验室硕士研究生。 湖北武汉,430072。
(收稿日期:2019-01-30 编校:曹晓文,陈安琪)
标签:图书馆论文; 空间布局论文; 用户满意度论文; 武汉大学图书馆论文; 武汉大学测绘遥感信息工程国家重点实验室论文;