人工智能研究前沿识别与分析:基于高产机构对比研究视角*
● 范丽鹏1,余厚强1,2,姜宇星1,王曰芬1,2
(1.南京理工大学经济管理学院,江苏 南京 210094;2.江苏省社会公共安全科技协同创新中心,江苏 南京 210094)
摘 要: [目的/意义]从机构层面探测领域研究前沿,以把握机构在整体中的研究动向与状态,发现机构在研究中所处的位势、特色及其与整个研究领域切合程度。[方法/过程]运用突变检测算法识别机构的研究前沿;采用定性分析法探究机构的前沿变化;通过定量分析法和余弦相似度计算公式,探究机构与总体以及机构间研究前沿的相似程度。[结果/结论]以中国科学院和卡耐基梅隆大学为例,探测出前者前沿较侧重算法模型分析,后者较侧重智能应用研究;通过机构与总体前沿重合度分析,将高产机构划分为引领型、同步型、追赶型、均衡型和特色型;通过机构间前沿相似度分析,探测出特色型机构与其他机构前沿一致性较低,而国内机构间前沿相似度较高等特点。突变算法检测到的机构前沿能反映出机构整体的前沿变化,机构在整体中的位置以及机构间前沿的相似性程度,能够为探明机构研究方向、整体实力、所处地位及其差异提供参考。[局限]前沿突变术语清洗过程中,未处理语义相似的词汇。
关键词: 科研机构;研究前沿;突变检测;人工智能;余弦相似度
一直以来,科学工作者对学科前沿的研究热度有增无减。了解学科的研究前沿,有助于学者追踪最新的研究方向及未来的发展趋势,为国家科技发展政策提供重要的信息[1]。
教师阅卷前,通常由学校的教务部联合智学网工作人员批量注册各科教师的工作账号。待学生考试结束后,工作人员会将所有学生试题扫描至电脑,根据先前设置的答题卡分割方式,系统会自动分割、提取学生的答题数据。数据整理完毕后,教师可根据自己的账号密码登陆智学网教师端(网页版、App版均可),选择试题,开始阅卷。
科研机构是开展科学研究的基本单位之一,是科技创新工作的重要主体,也是国家科技政策管理与资金投入的重要对象。从机构角度探究其研究前沿并进行对比,有助于明确机构在领域发展中的位置、研究的侧重、整体实力与机构间研究的差异,有利于多元化评价科研机构的绩效,更能体现出主导学科发展的研究动向及未来前景,为国家政策管理及资助提供更加有效的建议[2]。
目前,在前沿探究的过程中,学者多从学科某一子领域或整体角度进行探索。如赵玉鹏[3]运用多视角引文网络分析方法,对领域分支学科的研究前沿及前沿演化路径进行探究;李悦等[4]分析学科领域近15年的整体发展状况,通过分阶段的关键词共现分析来探究领域研究前沿;余厚强等[5]从多个角度识别领域总体的研究前沿。另外,关于高产机构的识别及分布研究也得到许多学者的青睐。如Niu Jiqiang等[6]基于Web of Science数据库中的文献数据,结合机构的地理信息,展示出高产机构的分布情况,并统计出“中国科学院”“麻省理工学院”等高产机构;张春博等[7]对学科领域权威学术会议AAAI的论文集进行总体分析,统计出“卡耐基梅隆大学”等高产机构;彭丽等[8]分析Web of Science数据库中以“artificial intelligence”为主题词的文献数据,统计出以“香港理工大学”为首的高产机构。
人工智能是当今发展最快的领域之一,涉及的研究内容面广泛,参与的机构众多,影响着社会的方方面面,因此,本文以人工智能领域为例,拟从机构前沿角度出发,对以下几个问题进行探究:①不同机构研究前沿的侧重点有哪些?②各个机构在整体发展中处于怎样的位置?③不同机构间研究前沿的相似程度如何?
由于高产机构众多,无法展示每一个高产机构的具体研究前沿,本文选取中国和美国发文量最高的机构为例进行研究前沿的探测和对比分析。由于突变权重越大,突变术语成为领域新兴研究趋势的可能性越大,本文选取两所机构中突变权重前20的突变术语进行分析。
1 数据来源与方法
1 .1 数据来源与处理
Web of Science数据库是文献计量学领域中使用最广泛的数据库之一。本研究于2018年5月10日,使用检索式WC=“Computer Science,Artificial Intelligence”对该数据库进行检索,限定年份为2008—2017年,共检索到文献记录435276条。使用BibExcel[9]提取文献中的机构字段,对机构名称进行整合处理[10]。
发文量可以反映一定时期内机构对特定学科领域的贡献程度,由于本文主要目的在于探究机构的研究前沿,合作发文也代表了机构部分研究方向,本文对清洗后的数据采用统一计数法进行发文量的统计,排名前20的高产机构如表1所示。在表1中,属于中国的机构较多,可见中国各大机构对人工智能领域的研究相比其他国家较为重视且有相当的成果产出。其中,中国科学院发文量居于首位,是中国自然科学最高的学术机构,包含100多家科研院所、3所大学。在人工智能领域中,中国科学院发文量最高的前5个科研院所分别为自动化研究所、计算技术研究所、深圳先进技术研究院、沈阳自动化研究所和软件研究所,发文量最高的大学为中国科学院大学,上述6所院所占中国科学院总发文量的55.6%,为中国科学院在人工智能领域的研究作出了重要贡献。
1 .2 研究方法与工具
在本专题的前述文章中已阐明研究前沿与突变术语之间的关系,本文同样采用突变检测的方法,探究机构的研究前沿,这里不再赘述。本文采用CiteSpace 5.2.R2版本分别对表1中高产机构的科技论文进行突变术语的检测,
表1 2008—2017年人工智能领域发文量
排名前20的高产机构
2)卡耐基梅隆大学研究前沿分析。由表3可知,卡耐基梅隆大学于2008年突现“城市挑战”这一突变术语,且突变权重较高。经分析发现,2007年,美国国防高级研究局(DARPA)举办了一场名为“城市挑战”的无人驾驶机器人汽车大赛[15],卡耐基梅隆大学团队获得第一名,因此使得“城市挑战”这一术语在之后几年中发生突变。另外,“主动外观模型”“类人机器人”“发音人辨认”这些突变术语突变时间为2008—2009年,表明在这两年或2008年之前,卡耐基梅隆大学致力于机器人的外观、声音识别等方面的研究。“无人驾驶汽车”这一突变术语突变时间较长,始于2008—2011年,而卡耐基梅隆大学在1989年就推出了第一代无人驾驶车,表明前期卡耐基梅隆大学主要关注于机器人、无人驾驶汽车等方面的研究。
Salton等[11]首次在信息科学中引入余弦相似度的计算方法,来判定文档或语句之间的相似程度。随后,多数学者使用该方法来计算不同类别数据所组成的向量之间的相似程度,如学科主题向量[12]、词向量[13]等。本文通过构建高产机构的突变术语向量,并使用该方法来计算高产机构间研究前沿的相似程度,具体方式方法为:将表1中所有高产机构的突变术语作为语料,则任意两个高产机构的突变术语向量v i 与v j 余弦相似度计算公式如下:
(1)
本文运用突变检测算法,从机构研究前沿的角度入手,通过定性分析法对机构的前沿及发展变化进行探索,通过定量分析法和余弦相似度计算公式,探究了机构在人工智能领域发展中的位置及机构间前沿一致性的程度,得到以下三点主要结论。
在探测高产机构的研究前沿过程中,对CiteSpace软件中的参数进行如下设置:时间跨度选择2008—2017年,时间切片选择1年;由于Term比关键词分析更能深入到文本内容,反映的信息也更加全面,因此,本文节点来源选择名词短语(Noun Phrases)、节点类型选择术语(Term);其他参数设为默认值。
1)建立模拟巷道精度验证绝对坐标系。首先使用手持式激光测距仪反复测量验证系统坐标系原点O,巷道中线在底面的投影作为验证系统绝对坐标系的X轴,其正方向为掘进机试验样机的掘进方向,Y轴方向由精密测角仪测量X轴顺时针偏转90°方向,Z轴为O点竖直向上方向。
2 研究结果与综合分析
2 .1 高产机构研究前沿识别与分析
针对上述研究问题,拟采用的研究思路是,一方面通过定性分析的方法,了解机构的具体前沿动态;另一方面,通过定量分析的方法,探索机构在整体中的位置以及机构间前沿的相似程度,为探明机构研究方向、整体实力、所处地位及其差异提供参考。
1)中国科学院研究前沿分析。由表2可看出,近10年期间,中国科学院研究前沿始于2008年的突变术语较少,持续时间最长的突变术语为“线性判别分析”——一种经典的数据降维方法。此外,“粒子滤波器”和“移动机器人”这两个突变术语虽然突现时间较短,但是由于本文数据源始于2008年,其可能前期已在持续研究。其中,“粒子滤波器”是一种基础算法,应用范围较为广泛;在机器人领域,机器人学国家重点实验室依托于中国科学院沈阳自动化研究所,该实验室的总体水平在国内相关领域处于核心和领头地位,是国内外具有重要影响力的机器人学研究基地[14]。
表2 中国科学院突变权重前20的突变术语
将试件在轴向、水平方向预加载至20kN,避免加载初期因试件摩擦滑移而产生噪声信号。初次加载采用力控制,以1kN/s的加载速率在轴向与水平方向同时加载。水平方向加载至200kN,轴向加载至800kN后,保持当前载荷,调整应力状态5分钟。其后将充填体用锤子缓慢凿出,再次调整5分钟。二次加载,声发射系统开始监测声发射数据,加载系统采用位移控制,以0.3mm/min的加载速率加载,直至试件发生破坏。实验加载路径如图2所示。
通过前期对南京机场线S1车辆段的事前施工筹划,按照场地填筑选材和工艺的不同进行了区域划分,根据后续施工的先后顺序进行合理安排。事中组织现场管理人员对原材选取和现场回筑的质量进行了过程控制,根据含水量和压实系数动态调整碾压工艺和遍数,最终提前将一区房建区填筑完成,为后续桩基施工创造条件。同时通过合理的施工组织,将四区绿化区用土提前预压堆载,既保证了充分的沉降时间,又减少了场内驳运。根据事后对埋设的沉降和水平位移边桩的监测数据来看,复合地基的整体沉降控制在可控范围之内,确保后续库外有砟轨道和库内无砟轨道对接平顺,没有产生差异沉降,为后期试车线运行调试提供了有利保障。
在前述研究已探测出人工智能领域近10年总体突变术语的基础上(见本专题系列论文《人工智能研究前沿识别与分析:基于领域全局演化研究视角》中的表1),本文对总体和表1中高产机构的突变术语进行对比,结果如表4所示。
以探究人工智能领域各高产机构研究前沿及其变化情况。
表3 卡耐基梅隆大学突变权重前20的突变术语
2009—2015年间,卡耐基梅隆大学的突变术语较多,且持续时间均为2年,主要有“概率分布”“阅读辅导师”“移动机器人”“点云”“认知科学”“模式识别”“事件检测”“大集合”。这些突变术语多为人工智能领域算法的应用研究。卡耐基梅隆大学被公认为是全球将机器人应用于教育领域的先驱者,其在2010—2011年间的研究前沿主要为“阅读辅导师”;2011—2012年,卡耐基梅隆大学的主要研究前沿为“认知科学”,认知科学是探究人脑或心智工作机制的前沿性尖端学科,为解释人脑工作机制作出了不可磨灭的贡献;2012—2015年,其主要研究前沿为“模式识别”“事件检测”等,这些词汇均离不开机器人的研究。
卡耐基梅隆大学突变至2017年的突变术语主要有“卷积神经网络”“深度神经网络”“3D模型”“约束编程”“面部动作单元检测”“图像分类”“视觉特征”。表明近期的研究前沿多集中于机器学习、三维模型、人脸识别、图像处理等相关算法的研究。此外,以“视觉特征”为主题词,在Web of Science中检索卡耐基梅隆大学2015年至今的人工智能相关文献,经分析得出,该主题词多关于无人机对场景的探测以及图像内容分析等。
3)中国科学院和卡耐基梅隆大学研究前沿对比分析。由上述分析可看出,中国科学院和卡耐基梅隆大学各自的侧重点较为明显。其中,中国科学院主要集中于算法模型等方面的研究,如降维、图像处理、机器学习等,其在应用领域中的研究较为分散,突变术语较少;卡耐基梅隆大学主要集中于智能应用方面的研究,如类人机器人、无人驾驶汽车、阅读辅导师、无人机等,其有关算法模型的研究同样以应用为导向,解决算法模型的优化问题。两者的相同之处在于近期的研究均涉及机器学习、图像处理等相关算法模型,如卷积神经网络、图像分类等。
2 .2 高产机构与总体研究前沿对比分析
中国科学院突变至2017年的突变术语有“输入图像”“深度神经网络”“卷积神经网络”“深度学习”“极限学习机”,这些突变术语多为实现深度学习、机器学习的重要算法。此外,“社交网络”亦为中国科学院突变至今的突变术语,表明近年来,中国科学院的研究重点倾向于如何综合研究机器学习和社交网络。
2009—2015年间,中国科学院的突变术语较多,且不断发生变化。其中持续时间最长为“主成分分析”“降维”“稀疏表示”“机器学习”。“主成分分析”是数据降维的另一种经典方法,可见在2013年之前,中国科学院持续对降维的相关方法关注度较高。“稀疏表示”主要应用于压缩传感等方面,如图像处理、模式识别等,同时期的突变术语有“数据挖掘”“高斯混合模型”“对象跟踪”“数学模型”“收敛性分析”“图像分类”“模型参数”等,表明该阶段中国科学院主要集中图像处理、机器学习等算法模型和相关性能方面的研究。
表4 高产机构突变术语与总体突变术语对比表
表4中最后一列展示了高产机构与总体相同的突变术语中,突变时间比总体早、同步、晚的突变术语个数。根据机构与总体突变术语的重合度以及突变时间的早晚个数,将机构分为5类:
1)引领型机构,即突变术语提前的个数大于该机构同步或延后的突变术语个数,且与总体重合度大于10%的机构。该类机构能够提前反映总体的前沿研究。表4中符合这种类型的机构有:“瑞士联邦理工学院”“东京大学”“麻省理工学院”“清华大学”“卡耐基梅隆大学”“北京大学”。
2)同步型机构,即突变术语同步的个数大于该机构提前或延后的突变术语个数,且与总体重合度大于10%的机构。该类机构多数研究与总体保持同步发展。表4中符合这种类型的机构有“上海交通大学”“印度理工学院”“哈尔滨工业大学”“北京理工大学”。
3)追赶型机构,即突变术语延后的个数大于该机构提前或同步的突变术语个数,且与总体重合度大于10%的机构。该类机构少数研究领先或与总体同步,但多数研究晚于总体的研究。表4中符合这种类型的机构为“南洋理工大学”“北京航空航天大学”。
4)均衡型机构,即较总体提前、同步或延后的突变术语个数相差不大,且与总体突变术语重合度大于10%的机构。该类机构较总体提前、同步和延后的研究主题数目相差不大,且均未呈现出明显的特性。表4中符合这种类型的机构有“华中科技大学”“慕尼黑理工大学”“浙江大学”“中国科学院”“新加坡国立大学”“东北大学”。
5)特色型机构,即与总体突变术语重合度小于10%的机构。该类机构多专注于自身特色的发展。表4中符合这种类型的机构有“东南大学”“伊斯兰自由大学”。其中,东南大学的突变术语中多出现“智能电网”“汽车组配线”等相关突变术语,表明其研究多集中于智能装备与制造系统、智能城市网络系统等。伊斯兰自由大学的突变术语中多出现“燃料电池”“旋转储备”“电动汽车”等突变术语,表明该机构多集中于电动汽车方面的研究。
2 .3 高产机构间研究前沿相似度对比分析
运用公式(1)计算高产机构间的相似度,结果如表5 所示,其中颜色深浅表示机构突变术语相似度的高低。
选取的高产机构中,位于中国的机构较多,因此将 表5 划分为3个部分进行分析。
表5 高产机构间突变术语相似度
1)国内高产机构间研究前沿相似度对比分析。国内高产机构间研究前沿相似度普遍较高,表明国内高产机构对人工智能领域的前沿研究关注趋势一致性较高。其中,相似度较高的机构组合多集中于清华大学、上海交通大学、哈尔滨工业大学和华中科技大学,这4所大学均是国内理工科实力较强的名校,表明国内高产机构中,理工科院校在人工智能领域的前沿研究中一致性较高。此外,清华大学作为国内的引领型机构之一,与国内多数机构的研究前沿相似度均较高,进一步验证了其在领域前沿方面所具有的引领作用以及在国内科研机构中的学术影响力;东南大学作为国内的特色型机构,与国内多数机构的前沿相似度较低,进一步表明,东南大学在人工智能领域多专注于自身特色的发展,与国内其他高产机构的前沿一致性程度较低。
在新闻摄影中,应突出照片及摄影作品中的新闻主体性,让观众第一眼就可了解到摄影作品内涵,充分发挥出新闻摄影在补充新闻信息中的积极作用。不仅如此,相关摄影人员在实际摄影中需清晰表达出新闻整体色彩,明确新闻主体内容,选择摄影作品相对应的色彩及内容,以更好地突出摄影图片层次感,使摄影作品具有高度的艺术性。
2)国内与国外高产机构间研究前沿相似度对比分析。国内机构中,清华大学与中国科学院和国外多数高产机构研究前沿相似度较高,表明清华大学作为国内的引领型机构,在国内和国际机构间均具有较高的影响力,中国科学院作为国内自然科学最高的学术型研究所,亦紧跟国内及国外高产机构的前沿研究;国外机构中,新加坡国立大学和南洋理工大学与国内多数高产机构前沿相似度较高,表明在人工智能领域,国内的多数高产机构与新加坡著名的两所高校在前沿研究的探索过程中具有较高的一致性。此外,国内高产机构与卡耐基梅隆大学和麻省理工大学的前沿平均相似度均低于国内与国外所有高产机构之间的平均相似度,表明国内多数高产机构与美国这两所引领型机构前沿一致性较低。
3)国外高产机构间研究前沿相似度对比分析。国外高产机构间前沿相似度普遍较低,表明国际不同高产机构在人工智能领域的研究中各有侧重,互相的影响力较弱。其中,前沿相似度最高的两个机构组合为新加坡国立大学与瑞士联邦理工学院、南洋理工大学与印度理工学院;麻省理工学院和卡耐基梅隆大学,同位于美国的高等学府之林,前沿相似度仅为15.47%,低于新加坡两所高等学府的前沿相似度(新加坡国立大学与南洋理工大学相似度为18.68%),亦低于国内高产机构间的平均相似度(22.84%),表明美国和新加坡国内高产机构间研究前沿一致性相比中国国内较低,其高产机构研究前沿有着明显不同的侧重。
3 结论与展望
其中,n 为语料库中突变术语的个数;为语料库中第m 个突变术语在机构i 的突变术语集中出现的次数。
周教授说,话不可这么说么?此汉奸非彼汉奸么。我给你们讲啊,从现在的形势看,保命才是第一要务么。只有保命了才能回去么。
式中:j为第i项制约因素的第j项制约子因素,j=0,1,2,…n,; k1为第i层制约因素包含的制约子因素个数,k1=1,2, …,n;
1)在探测机构研究前沿中,以中美发文量最高的机构——中国科学院和卡耐基梅隆大学为例,通过对机构突变术语的解读,得出中国科学院较侧重人工智能领域算法模型方面的研究,当下较为侧重深度学习等方面的算法以及社交网络等方面的应用研究;卡耐基梅隆大学较侧重人工智能领域智能应用方面的研究,如机器人、无人驾驶汽车、人脸识别等,当下较为侧重无人机等方面的研究。
施工安全管理体系的建立,有助于施工企业对铁路隧道施工的各个环节进行有效把控,是提高施工安全管理效率的重要保障。对风险识别进行动态管理,将风险调查、风险监控和处理贯穿在整个施工过程中,采取措施降低风险等级或避免风险发生。识别评估体系能够有效识别评估施工中的风险因素,并在决策管理体系进行决策制定,通过技术应对体系采取相应的技术手段,在安全措施体系的有效运行下完成安全管理。
这套书一共5本,分别描述了花金龟、圣金龟、大孔雀蛾、节腹泥蜂等家族和直翅目家族等。每一幅画和每一段文字都充满着作者对法布尔先生的敬意,也体现了作者跟昆虫融为一体的境界。
2)为探索机构在整体中的位置,对比了机构与总体的研究前沿,并通过各机构与整体突变术语的比较,将高产机构划分为引领型、同步型、追赶型、均衡型和特色型机构,区分不同高产机构之间的差异。
3)在分析机构间前沿相似程度的过程中,清华大学、中国科学院、新加坡国立大学、南洋理工大学和瑞士联邦理工学院与多数高产机构的前沿相似度较高,表明这5所机构在其他高产机构中影响力较大,而特色型机构东南大学和伊斯兰自由大学与其他高产机构前沿一致性均较低,表明这两所机构较专注于自身特色的发展。
此外,本文亦存在一定的局限性,如在机构突变术语相似度计算过程中,仅清洗了书写形式不同的突变术语,如“benchmark dataset”和“benchmark data set”“dimensionality reduction”和“dimension reduction”等,而对语义相似的突变术语,因专业领域知识的缺乏,并未对其进行清洗。
在现有研究中,有关机构合作模式、机构合作影响因素等[16-17]方面的研究较多。因此,本文将机构间突变术语相似度的高低与机构合作强度、机构间重合的突变术语与机构合作主题之间的关系作为下一步的研究方向。
不再犹豫,做个顶天立地的男子汉,我已学会当机立断,就算那条蜀道再难,我相信,我必能用那把“果断”之剑,杀向青天之上那个叫“成功”的终点!
参考文献
[1] HUANG M H,CHANG C P.A comparative study on three citation windows for detecting research fronts[J].Scientometrics,2016,109(3):1835-1853.
[2] AN L,LIN X,YU C.Measuring and visualizing the contributions of Chinese and American LIS research institutions to emerging themes and salient themes[J].Scientometrics,2015,105(3):1605-1634.
[3] 赵玉鹏.基于知识图谱的机器学习研究前沿探析[J].情报杂志,2012,31(4):28-31.
[4] 李悦,苏成,贾佳,等.基于科学计量的世界人工智能领域发展状况分析[J].计算机科学,2017,44(12):183-187.
[5] 余厚强,曹嘉君,王曰芬.情报学视角下的国际人工智能研究前沿分析[J].情报杂志,2018,37(9):21-26.
[6] NIU Jiqiang,TANG Wenwu,XU Feng.Global research on artificial intelligence from 1990-2014:Spatially-explicit bibliometric analysis[J].ISPRS International Journal of Geo-Information,2016,5(5):66.
[7] 张春博,丁堃,贾龙飞.国际人工智能领域计量与可视化研究——基于AAAI年会论文的分析[J].图书情报工作,2012,56(22):69-76.
[8] 彭丽,叶充.基于Web of Science的人工智能研究计量分析[J].图书情报研究,2015(4):53-59.
[9] PERSSON O,DANELL R,SCHNEIDER J.How to use Bibexcel for various types of bibliometric analysis[J].Celebrating Scholarly Communication Studies A Festschrift for Olle Persson at His Birthday,2009:9-24.
[10] HUANG S,YANG B,YAN S.Institution name disambiguation for research assessment[J].Scientometrics,2014,99(3):823-838.
[11] SALTON G,MCGILL M J.Introduction to modern information retrieval [J].McGraw-Hill,New York,1983.
[12] 刘自强,王效岳,白如江.多维度视角下学科主题演化可视化分析方法研究——以我国图书情报领域大数据研究为例[J].中国图书馆学报,2016,42(6):67-84.
[13] 姜霖,王东波.采用连续词袋模型(CBOW)的领域术语自动抽取研究[J].现代图书情报技术,2016,32(2):9-15.
[14] 机器人学国家重点实验室简介[EB/OL].[2018-12-13].http://rlab.sia.cas.cn/sysjj/sysgk/.
[15] 占强.从科幻到现实:无人驾驶城市挑战赛[J].世界汽车,2007(12):90-93.
[16] LUO Q,XIA J C,HADDOW G.Does distance hinder the collaboration between Australian universities in the humanities,arts and social sciences?[J].Scientometrics,2018(3):1-21.
[17] RIBEIRO L C,RAPINI M S,SILVA L A.Growth patterns of the network of international collaboration in science[J].Scientometrics,2018,114(3):1-21.
Identification and Analysis of Research Front in Artificial Intelligence :From a Perspective of the Comparative Study among Highly Productive Institutions
Abstract : [Purpose/significance] In order to grasp the research trends and status of organizations in the whole,we detect the frontiers from the institutional level,which could also help to find out the position,characteristics and research relevance of organizations in this filed.[Method/process] We take burst detective algorithm to identify the research frontiers of institutions,qualitative analysis to explore the frontier changes of institutions,and quantitative analysis and cosine similarity to research the status of institutions and the similarities among institutional research frontiers.[Result/conclusion] We find that the frontiers of Chinese Academy of Sciences are more related with algorithms and models,while that of Carnegie Mellon University mostly focus on application research;the productive institutions can be specified into five types:leading,synchronous,catch-up,balanced and characteristic institutions;the similarities of frontiers between characteristic institutions and others are relatively low,while that between domestic institutions are relatively high.The frontiers of institutions detected by the burst detective algorithm are effective,and can help to find out the research trends,position and differences among organizations.[Limitations] When cleaning burst terms,some synonymic vocabularies were not processed.
Keywords : scientific research institution;research front;burst detection;artificial intelligence;cosine similarity
DOI: 10.16353/j.cnki.1000-7490.2019.09.003
*本文为国家社会科学基金重大项目“面向知识创新服务的数据科学理论与方法研究”的成果之一,项目编号:16DZA224。
作者简介: 范丽鹏 ,女,1993年生,博士生。研究方向:数据科学,知识服务。余厚强 ,男,1990年生,副教授,硕士生导师。研究方向:科学计量,知识服务。姜宇星 ,博士生。研究方向:数据科学,知识工程。王曰芬 (ORCID:0000-0002-7143-7766,通讯作者),女,1963年生,教授,博士生导师。研究方向:知识服务,数据挖掘。
作者贡献声明:范丽鹏 ,提出研究思路,设计研究方案;采集、清洗和分析数据;进行实验;论文起草。余厚强 ,论文最终版本修订。姜宇星 ,采集、清洗和分析数据。王曰芬 ,提出研究思路,设计研究方案,论文最终版本修订。
录用日期: 2019-03-27
标签:科研机构论文; 研究前沿论文; 突变检测论文; 人工智能论文; 余弦相似度论文; 南京理工大学经济管理学院论文; 江苏省社会公共安全科技协同创新中心论文;