我国广场舞研究高被引论文共词聚类分析论文

我国广场舞研究高被引论文共词聚类分析

杨鹏

(济南大学体育学院 山东济南 250022)

摘 要: 本文以我国广场舞研究论文高被引共词聚类分析为研究对象,以CNKI数据库为数据,利用SATI3.2(文献题录信息)软件对现有广场舞领域高被引论文的关键词进行提取和统计,最终确定高被引论文的高频关键词,并生成高频关键词的相异矩阵,然后通过SPSS 22.0统计软件对高频关键词进行聚类分析和多维尺度分析,揭示当前广场舞领域研究主题和趋势动态,为日后从事该领域的研究者提供理论参考依据,并有一定的借鉴价值。

关键词: 广场舞 聚类分析 多维尺度分析

随着全民健身计划的推行,人们参加体育锻炼的热情和积极性逐渐增长。尤其是在全面健身上升为国家战略后,广场舞轻松、充满活力的锻炼方式得到大家普遍的关注。根据对中国知网数据库的搜索,以“广场舞”为主题词,进行高级检索,共检索相关文献1379篇,而广场舞研究开始被关注是在2005年之后,可见在短短的10多年间,我国广场舞的研究得到诸多学者支持。那么,我国广场舞研究十几年来研究热点是什么?未来发展态势如何?针对以上问题,不少学者从不同视角及方法做了相关分析,而本文试图对我国广场舞高被引论文进行聚类分析和多维尺度分析探究其研究热点,提供一定的参考依据。

1 数据来源与研究方法

1.1 数据来源

本文通过查询CNKI数据库,查询时间截至到2017年11月20日,以“广场舞”为主题进行期刊的高级检索,去除重复、内容相关度低的文献,最终共检索到1379篇。考虑到论文发表时间的影响因素,即早期发表的文献,其被引频次相较高,基于文章的真实性和代表性考虑,研究按照文献被引频次排列,确定以频次不小2的文献370篇为研究文本。

羲之既去官,与东土人士尽山水之游,弋钓为娱。又与道士许迈共修服食,采药石不远千里,遍游东中诸郡,穷诸名山,泛沧海,叹曰:“我卒当以乐死。”[9](《王羲之传》,P2101)

1.2 研究方法和步骤

本研究主要借助SATI3.2、Excel和SPSS工具和软件,对选取的370篇广场舞研究领域高被引论文进行科学的统计,并对其高频关键词进行聚类分析和多维尺度分析,具体操作步骤如下。

(1)利用中国知网文献导出功能,将研究文献的标题、作者、发文结构以及关键词等元数据以endnote格式,并以文本(.txt)格式保存下来。

图1 高被引论文高频关键词聚类分析图

图2 高被引论文高频关键词多维尺度分析结果图

1.1 一般资料 选取上海市浦东新区肺科医院结核科收治的84例重症肺结核患者,收集时间2015年1月-2017年1月,采用信封法随机分为病例组和对照组各42例。

此文中非常值得注意的是海德格尔对非真理的描述。非真理包括遮蔽与迷误。对于遮蔽,海德格尔认为,遮蔽比显现、开放更为古老,更为本源。这种遮蔽并非是存在及其真理发生之后才随后产生,也并非由于人对于存在的认识的不足与匮乏,而是因为,存在者整体的遮蔽状态作为根本性的非真理,比任何一种存在者和存在的敞开状态更古老,比“让存在”亦即存在的真理更本源。存在的真理自行遮蔽,存在在此就被遗忘了,因为人总是固执于“方便可达的和可控制的东西”。

(3)确定高频关键词,在SATI3.2中生成关键词共现的相异矩阵。

采用SATI3.2软件对文献关键词的原始数据进行包容化的处理,得到表2高频关键词相异矩阵,为后面文章中高频关键词的聚类分析和多维尺度分析分析提供基础数据源。表2中显示的是不同关键词之间联系的紧密程度,相异矩阵与相似矩阵,表达意思相反。其中数值越大,表示两者之间的关系越疏远,相似值越小;相反数值越小,二者之间的关系越紧密,相似值越大。如广场舞与作用之间的关系值是0.095,而广场舞与现状之间的关系值是0.0547,其结果表明广场舞现状比广场舞作用收到更多的关注,联系更紧密一些。

多维尺度分析同聚类分析一样是研究不同对象之间的相似性或距离,不同之处是多维尺度分析将研究对象在一个低维的空间里立体呈现的一种重视图谱可视化方法,是对聚类分析结果的矫正。从图2中显而易见,我国广场舞领域的研究热点大致分为3个类团:(1)位于坐标左边的是“广场舞现状、纠纷问题和解决对策”,其中老年人、广场舞特征、建议、高校和现状和问题是该类团的研究热点;(2)位于坐标最下方的是“广场文化、文化生活、文化活动、身心健康和谐社会”等精神层面研究类团,其中化、思考、排舞、文化生活和活动“是该类团的研究热点;(3)位于坐标右边的是“全民健身视角下广场舞的发展趋势”。相较于其他两个类团,该类团研究内容较为分散一些,研究内容宽泛包含“体育公共服务、群众体育、中老年人和公共空间等。聚类分析和多维尺度分析等知识图谱可视化的新方法,为广场舞研究增添了活力。

2 数据分析

2.1 高频关键词词频统计分析

借助SATI3.2软件,提取370篇论文的关键,并对关键词的频次进行统计,根据它们的频次,依据普莱斯定律确定核心要素。通过限定关键词词频阈值,以频次4为高频关键词的截取阈值,共获得43个关键词,表1是对部分高频关键词进行的统计。通过表1可知,关键词频次最高的是广场舞275,其次是作用是30,现状24,群众文化21,另外频次17的有3个词,对策、公共空间和全民健身,扰民有12次,健身、发展和问题分布是11次等。由此可见,我国广场舞领域高被引论文研究主题分布比较广泛。而且通过这43个高频关键词反映了我国广场舞研究领域的研究热点,通过分析关键词之间的联系,有助于确定近几年我国广场舞研究的发展过程、前沿和发展趋势。

2.2 高频关键词相异矩阵构建

(4)运用SPSS 22.0软件进行转化后数据的聚类分析和多维尺度分析,从而获得聚类树状知识图谱和多维尺度知识图谱。

表1 高被引论文高频关键词频次统计分析(部分)

表2 高被引论文高频关键词相似矩阵(部分)

2.3 高频关键词聚类分析

为了更加直观地呈现广场舞领域高频关键词之间的关系和相似程度。将上文中SATI3.2转化的相异矩阵表2导入到SPSS 22.0软件中,然后根据分析—聚类—系统聚类的一线式流程,完成广场舞高频关键词的聚类分析,最终得到如图1所示的组间平均联结的谱系图。根据横向的距离,依据图1中的结果,可清晰的发现,该聚类可以划分为3个模块,研究结果相对比较集中。依据聚类结果,可将我国广场舞领域的研究分为3个主要方面:(1)作用、地位和群众文化;(2)广场文化、文化生活和文化活动;(3)第三类相对分类比较分散,包含现状、发展、问题、对策等诸多关键词。

(2)采用文献题录信息SATI3.2软件,提取文本的关键词并进行频次统计分析,导出到Excel格式文件,进行讨论和分析。

2.4 高频关键词多维尺度分析

(5)根据上述的分析结果,梳理和归纳我国广场舞领域研究的热点和趋势。

3 小结与讨论

(1)该研究的理论基础是普莱斯定律。本研究借鉴普莱斯定律确定高频关键词。目前有很多学者将此方法应用到高被引论文的研究中,能够在一定程度上反映真实情况。

橄榄玄武岩平面上呈条带状展布,剖面上呈似层状,侵位于寒武纪长清群朱砂洞组及馒头组。岩石新鲜面土黄色—灰黄色,略带绿色色调,具斑状结构,块状构造。岩石由斑晶、基质组成,斑晶由橄榄石假象、单斜辉石、角闪石、黑云母组成,粒径一般0.3~3mm不等,杂乱分布,橄榄石呈半自形柱粒状,少数呈两端尖锐的六边形,被皂石及少量碳酸盐、硅质交代,呈假象,部分隐约可见横向裂纹;单斜辉石呈半自形柱粒状,少部分呈近方形的八边形,沿边缘少皂石化、碳酸盐化,常见2组近直交解理;角闪石红褐色、黄褐色,半自形柱粒状,常见熔蚀结构,部分可见两组近菱形解理,夹角约56°;黑云母红棕色,叶片状,多被细小黑云母置换呈假象。

(2)高频关键词的确定。高频关键词是笔者研究的重点,但是在确定词频阈值时发现,根据普莱斯定律,选择的文献数量减少,因此基于以上考虑,阈值的确定结合二者考虑。另一方面在选取高频关键词时发现,有不少关键词的意义趋同的,如“广场舞文化”和“文化”,因为笔者是针对广场舞研究,所以二者可以完全合并。

(3)关于我国广场舞研究的热点问题。通过采用上述数据分析,采用聚类分析和多维尺度的研究方法,结合我国广场舞研究的相关内容等进行综合分析后,本文从3个方面对当前我国广场舞研究进行探索性分析。包含3个主题:广场舞现状、纠纷问题及对策;广场舞文化影响;全民健身视角下广场舞的发展趋势。

参考文献

[1] 成盼攀,马鸿韬.广场舞多元文化价值及文化建设研究——以北京市城六区为例[J].北京体育大学学报,2017,40(3):33-39,45.

[2] 郭伟.论广场舞在推动城市文化建设中的作用[J].西安体育学院学报,2015,32(4):448-450.

[3] 胡利勇.图书情报领域高被引论文共词聚类分析[J].图书馆学刊,2016(8):132-135.

[4] 罗应婷.SPSS统计分析从基础到实践[M].北京:电子工业出版社,2010.

[5] 储节旺,闫士涛.知识管理学科体系研究(下)——聚类分析和多维尺度分析[J].情报理论与实践,2012(3):5-9.

中图分类号: G8

文献标识码: A

文章编号: 2095-2813(2019)11(b)-0250-03

DOI: 10.16655/j.cnki.2095-2813.2019.32.250

标签:;  ;  ;  ;  

我国广场舞研究高被引论文共词聚类分析论文
下载Doc文档

猜你喜欢