时间线和地形式可视化图谱:科学传播研究前沿演进趋势分析,本文主要内容关键词为:图谱论文,形式论文,趋势论文,时间论文,科学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
科学传播,作为推广、扩散和普及科学技术知识、方法与精神的一种社会活动,是现代科学技术活动的重要环节和组成部分;科学传播研究越来越受到学术界的普遍关注,科学传播学作为一门新兴的交叉学科正在建立和发展起来。“科学传播”的对应英文是Science Communication,Scientific Communication或者Scholar Communication。这些词组有时泛指科学与技术传播(Science and Technology Communication),有时又指科学和工程传播(Science and Engineering Communication)[1]。
自20世纪40年代美国学者对农业技术推广模式进行传播学研究以来,科学传播研究作为一个专门的研究领域,经过长达半个世纪的探索,取得了一些重要进展;伴随着现代科学技术进步,特别是网络技术和信息技术的引入,科学传播的领域、内容和手段正在发生一系列重大变革,科学传播学研究者的兴趣面也随之而不断变化。因此,确定科学传播研究领域在不同时间段的研究前沿,展示科学传播研究主题的兴衰过程,不仅对于科学传播研究的学科发展与理论创新具有重要的学术价值,而且对于探讨和发挥科学传播在提高公众科学素养中的作用具有很强的现实意义。
由于科学传播的社会责任和重要性,国内外的科学家们都在积极地探索,为科学传播寻找一套模式和结构,以适应和支撑科学技术和社会的快速发展。其中也不乏一些研究者运用科学计量学方法来对科学传播进行研究。美国加州大学的贝格曼(Christin L.Bergman)和弗内尔(Jonathan Furner)曾运用文献计量学方法对科学传播的核心期刊进行确定,并试图描绘科学传播学的知识网络[2]。复旦大学传播学教授黄旦在2005年就曾绘制过传播学科的“知识地图”,试图通过“知识地图”为人们描绘出传播学科的基本结构,对其边界及其内部格局进行构建[3]。本文尝试运用科学计量学中最新的信息可视化方法,探索科学传播学的发展态势,通过寻找哪些领域对于科学传播学发展有重大影响以及探索科学传播学的知识“借用”过程,从而预测未来科学传播的研究前沿。
2 数据来源和研究方法
本文所使用的数据,来源于美国的科学信息研究所(Institute for Scientific Information,缩写为(ISI)的《社会科学引文索引》(SSCI)数据库。数据的最后更新时间为2007年6月1日。论文的主要数据为国际科学传播学权威期刊——《科学传播》(Science Communication)1994~2007年发表的350篇论文的8570篇引文为基本数据,包括作者姓名、标题、摘要、日期、文献类型、地址及引文。SAGE出版公司在其专业网页上对《科学传播》期刊作了详细介绍,其前身是《知识:创造、传播、利用》(Knowledge:Creation Diffusion,Utilization),1994年改为现名[4]。《科学传播》给自己界定为一个交叉学科的社会科学杂志,注重理论和实际问题,围绕当代最活跃的政治和社会问题,跨越国家、文化和经济的限制,讨论聚焦专业研究领域的热点主题。因此,以这份权威期刊数据进行计量分析的结果,基本上可以反映国际科学传播学的研究状况。
本文采用的是科学知识图谱方法中的时间线和地形式可视化方法。时间线是把时间作为x轴,描绘研究主题的发展趋势的一种可视化图谱。也就是建立一个以时间为变量的研究主题函数,并将其反映在图谱中,使科学研究主题的变化脉络更加清晰。1989年Small和Greenlee曾利用时间线来描述研究主题之间的联系,以艾滋病研究为例,运用文献共引方法来描述时间线的主题变化。1991年Braam,Moed和Van Raan(1991)用时间线揭示关键文献的引用频率。本文运用的时间线方法与2003年Steven Morris以炭疽热研究为例的时间线研究方法类似,运用文献耦合的方法进行聚类分析,形成研究前沿的文献聚类并按照时间变化水平延伸,这个可视化过程的数据流见图1。
图1可视化流程图
运用Matlab绘制出时间线的地形图,用三维知识图谱将科学传播的研究前沿可视化,进一步针对不同研究前沿的峰值进行对比,向大家展示层峦叠嶂的研究前沿地貌。三维地形图作为一种新的可视化方法也曾经被国外的学者们应用过,2001年美国能源部的SANDIA国家实验室(Sandia National Laboratories)运用VxInsight软件绘制三维地形图,研究科学与技术管理领域的可视化。美国印第安纳大学图书馆与信息科学学院的博尔纳(Katy Borner)也在2003年运用三维图来绘制可视化知识图谱[5]。美国能源部西北太平洋国家实验室(PNNL)的视觉分析团队曾经在2004年运用地形图来确定研究领域的热点主题。
时间线和地形式可视化方法可以清楚展现各个研究前沿之间的互动关系以及研究主题的时间变化。时间线和地形式可视化知识图谱中,可以为研究者分析研究前沿如下几个方面的信息:①某个研究前沿出现和消失的时间;②可能出现研究前沿的基础文献;③在某个研究前沿的文献中出现的中心机构和核心人物;④研究前沿的层次结构;⑤研究前沿与其他领域之间的信息流动;⑥突出峰值的研究前沿。
研究前沿的定义为持续引用固定的一组基础文献的文献聚类。这个定义与以往科学计量学领域关于研究前沿的概念略有差异。1965年,普赖斯(D.J.de S.Price)曾把研究前沿定义为拥有成长中的新主题的当代文献以及引用这些文献的文章集合;1994年,加菲尔德(Garfield)则把“共引文献以及引用他们的论文”作为研究前沿的定义;2006年,陈超美(Chaomei Chen)[6]曾对科学计量学关于研究前沿的概念进行了概括与比较;陈超美还把研究前沿定义为一组突现的动态概念和潜在的研究问题,可以从引文网络中作为研究前沿的知识基础,即引用文献的路径轨迹与关键论文节点加以判别。实际上,探测科学领域的研究前沿,很大程度上取决于科学计量学的探测方法。采用的时间线方法不同,研究前沿的内涵也有所不同[7]。本文采用的是文献耦合聚类方法来确定研究前沿,由于耦合文献是基于共同引用相同参考文献而具有相似内容的文献,因此持续引用相同参考文献越多的耦合文献,其耦合强度就越高、内容相似程度也越高,这意味着这些耦合文献代表了共同关注的前沿领域与研究热点。这样,通过对耦合文献进行聚类,就可以显示出一个研究领域的前沿主题。
运用的具体分析工具主要是Steven Morris的DIVA软件[8],DIVA是一个运行于Matlab环境中,基于数据库的可视化分析软件,相对于以往基于文件和内存的可视化软件来说,DIVA的最大优势就是利用了现有的数据库资源来完成复杂的分析过程,处理的数据量可以达到1G字节,处理速度也相对加快。由于DIVA并不是商业通用软件,因此在分析数据的时候有很强的针对性,为了完成本文的特殊研究目的,在原有软件的基础上又进行了二次软件开发,使用的软件和方法包括MS Acess、VBA、SQL以及Matlab。如图2所示,虚线部分为可视化处理软件的核心,其中MS Acess具有强大的数据库功能,Matlab具有计算与三维绘图的功能,集中了多种方法的优势,为可视化分析提供了有力的技术支撑。其可视化分析结果如上所述,一般为两种知识图谱形式:①时间线图谱,即耦合文献聚类形成的不同研究领域按时间序列而变化的二维图像;②地形式图谱,耦合文献聚类生成的不同研究领域文献密度按时间序列而如峰峦起伏的三维图像。
图2 软件系统框图
用于文献耦合聚类的改进DIVA软件是一种数据库处理分析方法,不限于英文文献,可以处理中文数据,这比国外大多数信息可视化软件具有一定优势,为今后进行中文数据的文献分析提供了可能。
时间线和地形式可视化图谱绘制方法的优势可概括为以下几个方面:①采用文献耦合聚类的方法进行学科前沿研究;②基于数据库的可视化分析方法,可以处理1G字节的数据;③利用Matlab的计算与三维绘图功能;④可以根据个人研究需要完成特殊研究目的;⑤为今后中文数据处理提供可能。
3 科学传播学研究前沿的时间线和地形式可视化图谱
美国《科学传播》(Science Communication)杂志在其期刊介绍一栏中明确表示,把三大部分融为一体进行科学探索,分别是科学共同体内的传播、面向公众的科学传播以及科学与技术传播政策。议题的选择非常广泛,包括健康、教育、国际发展、环境和风险管理等,并特别强调,科学内容是该杂志的重中之重,包括社会科学、工程、医学、物理学等。下面我们就利用科学知识图谱的时间线和地形式可视化方法来描绘科学传播研究领域的前沿,探索其研究前沿的发展过程。
从SSCI数据库下载的1994~2007年6月间《科学传播》杂志的350篇文献,共8570篇引文,经过文献耦合分析,把耦合次数小于3的文献对剔除之后,剩余105篇论文,再经过聚类分析得出时间线的研究前沿图谱(见图3)以及地形式研究热点图谱(见图4)。
知识图谱中,横坐标表示时间,纵坐标表示研究前沿,每一条平行线代表一个聚类,左侧的树状图描绘了10个研究前沿之间的层次关系与结构。为了进一步确定每个研究前沿都分别代表什么,通过把每个聚类里的论文题目都一一列出,综合地为每个研究前沿进行命名。
图3 科学传播学研究前沿时间线图(1994~2007年)
图4 科学传播研究前沿地形可视化图谱(1994~2006年)
时间线图谱中,点的大小与文献被引用次数成正比例相关,被引次数越多,点也就越大,说明这篇文献对研究前沿的影响也就越大。图中的实心点则代表在离现在最近的一年,也就是2006~2007年被引频次多的文献,是前沿中的“前沿”。图中清晰可见的两个实心的大圆圈分别位于领域3和领域6中,涉及的研究前沿领域分别是公众理解科学和生物工程学传播。领域3中最大的实心圆圈是Borchelt对21世纪科学公众传播未来的研究。领域6中最大的实心圆圈是Nisbet对美国媒体生物工程学报道的研究。从图谱中,我们还可以看到科学信息的流动过程,各个研究前沿是阶梯式发展的规律,随着时间的变化,科学信息从最初的领域1流向其他领域,信息的流动可以带动其他科学研究领域的发展,产生更多的研究主题和研究热点[9]。
通过时间线图谱,我们还可以发现科学传播学研究发展的三个阶段,分别为初步研究、深入研究和专业研究。在2000年之前,所有的研究主题几乎都集中在领域1中,主要是科学可信度以及风险传播的研究,其他主题领域基本没有涉及。从2000年之后,逐渐出现了科学政策与管理、公众理解科学、生物工程学传播等研究主题。2000年是科学传播研究的新阶段,各个研究主题从这开始基本都有研究者涉足,特别是公众理解科学和生物工程学传播,科学政策与管理和网络科学传播研究也逐渐兴起,科学传播学进入了第二个发展阶段——深入研究阶段。在初级研究阶段占据优势地位的科学可信度研究,进入第二阶段之后,研究热点出现了转移,在第三个阶段——专业研究中,研究主题打破了原有局面,出现了多主题多角度的研究前沿。从2004年至今的近三年中,科学传播学研究进入到一个专业研究阶段,信息集中流动到各个专业领域中,科学传播研究也更加专业化,研究主题和角度也逐渐增多。
从图谱中看,直到2000年,生物工程学等专业科学知识的传播才与领域1出现大量重合,也就是说从2000年起,专业的科学知识传播才逐渐发展起来,公众理解科学的研究主题则更晚些才成气候,接近2002年集中出现大量文章,公众理解科学才得到广泛关注,成为当时的研究前沿之一。因此,笔者把科学传播学研究前沿的变化进行总结后得出,科学传播学研究前沿由原来的科学可信度和风险传播主题为主导转移到公众理解科学与专业科学知识传播为主导,之后又逐渐出现多学科多视角多主题的研究局面,见表1。
为了更好地展示科学传播学的研究前沿全貌,进一步分析不同研究前沿之间的关系,笔者运用Matlab绘制出了科学传播学研究前沿地形式图谱[11],为寻找最有影响力的学科前沿和重要文献提供清晰的可视化图谱,见图4。地形式可视化图谱是一个科学领域研究前沿的三维图,横坐标X代表时间,纵坐标Y代表研究前沿,坐标Z代表论文密度,图谱中的山峰代表研究领域的不同研究热点。地形图中的山峰按照与X轴平行的方式排列,一排排的山峰代表了科学传播研究领域中的10个研究前沿,图4中研究领域都被标注了序号,与时间线的研究领域序号是一一对应的关系。将科学传播的10个研究前沿根据论文数的多少进行降序排列,论文数量多的研究前沿表明影响力和受关注程度比较大,见表2。由表2可以看出,论文数量大于10的研究领域有4个,分别是风险传播与可信度、公众理解科学及效果、生物工程学传播以及科学政策与管理。笔者把这4个论文数量大于10的研究领域定义为科学传播研究的4个主要研究前沿。
图5 科学传播学研究前沿地形图(1994~2006年)
从科学传播研究领域的10个研究前沿来看,每一个研究前沿的聚类中都分布着数量不同的山峰,每个山峰所代表的研究主题也不同。地形图中,论文的密度代表山峰的高度,也就是说,某个研究主题的论文密度决定了山峰的高度,某个研究主题的论文越多,山峰就越高,这些文献所代表的研究主题也就越受关注,成为某个领域的研究热点。代表不同研究主题的山峰组成了“层峦叠嶂”“高低不一”的地形式可视化图谱,某些山峰所代表的研究主题在图中已被标注,见图5。在这些代表研究主题的山峰中,论文数量大于3的山峰被定义为科学传播领域的研究热点,在表3中列出并进行了简单的排序。由此可见,科学传播研究热点有5个,主要集中在领域1和领域3中,分别是可信度与科学责任、科学层次与风险传播、信息来源可信度与受众分析、科学公众与文化以及公众理解科学。这5个山峰所代表的研究主题是科学传播学者们最关注的,也是科学传播研究的热点。
4 结语
时间线与地形式可视化图谱作为科学知识图谱领域的一个新兴方法,采用文献耦合的聚类方法,一改以往基于文件和内存的数据处理技术,利用了数据库的强大数据处理和提取功能,可以同时处理1G字节的中英文数据,计算和处理速度也实现了一个飞跃。在原来时间线图谱的基础上,对可视化图谱的方法作了新的改进,把二维时间线图谱扩展为三维地形式图谱,从全新的维度观察、描绘并预测科学研究前沿的动态发展趋势,使学科研究前沿的计量分析在可视化分析方法上实现重大突破。时间线与地形式可视化图谱可以为某个学科领域确定研究前沿,清晰展现随时间变化的研究前沿发展变化脉络,准确掌握学科研究热点,层次结构清晰明了,并描绘出不同研究前沿之间的信息流动关系。根据地形式图谱的突出峰值,确定研究领域的核心人物和中心机构。
将时间线与地形式可视化图谱成功地应用在科学传播研究前沿的计量分析,并取得了良好的效果。通过对国际权威期刊《科学传播》论文耦合聚类分析,绘制了1994~2006年该刊主要研究前沿领域与热点主题的知识图谱,显示当代国际科学传播研究前沿主要是风险传播与可信度、公众理解科学及效果、生物工程学传播以及科学政策与管理。时间线与地形式可视化图谱清晰展示了科学传播研究的发展规律及趋势,研究领域中的聚焦热点及其热点的动态变化,为进一步科学传播研究及学科预测提供有效信息,对政府部门科学政策的制定起到一定借鉴作用。
时间线与地形式可视化方法可以根据研究者的需要实现不同的研究目的,具有很强的灵活性和针对性,处理数据的数量也大大增加,可以实现以往可视化方法无法实现的功能。目前还处于尝试和探索阶段的时间线与地形式可视化知识图谱,还需要继续完善,应充分利用其数据库的特性,突破数据语言和类型的限制,为未来科学知识可视化及不同国家科学知识研究形势的对比提供更大的发展空间和新思路。
收稿日期:2008年6月16日