改革开放30年来我国情报学研究论文的作者分析,本文主要内容关键词为:情报学论文,改革开放论文,年来论文,我国论文,作者论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
doi:10.3772/j.issn.1000-0135.2009.04.019
研究者是推动学科发展的力量。探讨作者的著述规律及其数量关系,可以发现学科的高影响力作者和科学生产率,明晰学科的增长和内容的分布及其结构;也可预测科学家数量的增长和科学发展的规模及趋势等。从1978年到2008年,中国情报学发展刚好经历了30年的风雨历程。那么在这30年中,我国情报学研究者整体上呈现出怎样的图景,有哪些为我国情报学做出重要贡献的专家,以及新出现了哪些有影响的青年作者,他们的研究哪些具体领域?本文试图运用文献计量和内容分析等研究方法,通过大规模的数据收集和大跨度的时间分析,对这一问题进行初步回顾、解剖与探析。
1 论文样本的选取
要分析统计专业论文,首要问题是论文样本的确定。情报学作为发展中的交叉学科,对其研究领域并没有权威界定,这加大了样本选择的难度。以往常见数据选取方法:选取几种专业期刊进行统计、利用《全国报刊索引》、利用期刊库按分类号检索,除此之外,还有通过人工选取,但这些方法都存在一定缺陷。本文从新的角度进行情报学30年论文的选取,样本来源于两方面数据的合并[1]:一是从《中国分类主题词表》中选取情报学领域主题词,然后用这些主题词到《中国期刊数据库》中检索到记录227 927条;另外,收集《中国期刊数据库》中情报学专辑论文记录24 636条。经过人工下载题录、筛选与合并等处理后,最后得到1978~2007年情报学研究论文60 755篇。在整个处理过程中,采用专门软件实现自动化处理,并结合人工分析进行。
2 各年段作者数量分析
30年来情报学论文总作者数为46985人,92259人次。其中无作者论文215篇,署名为“编辑部”的105篇及署名为“课题组”的25篇,对于这些论文以独著处理,没有考虑作者同名异人的情况,因为这些特殊论文占全部论文的比例很少,可认为不会对结果造成影响。具体各年段数据见表1。对于作者总体发文情况可以作者平均发文量来表示,人均发文量=论文总数/作者数。各年段人均发文量在1篇左右,后面的年段人均发文量比较少,主要原因是合作人数在增加,另外每年段出现了大量新人。因为著者发文的累加性,所有年的人均发文量最大,达到1.29。
科研是一项集体活动,一篇论文有适量的合作者,可以充分发挥群体智慧,在知识结构等方面相互取长补短,提高研究成果水平。对作者合作情况的分析主要有两种指标来衡量:①合作度=(一定时期内相关文献)作者总人次/(一定时期内相关文献)论文总数;②合作率=(一定时期内相关文献)合作论文数/(一定时期内相关文献)论文总数[2]。从表1来看合作度是逐年段上升,到2003~2007年段平均每论文有1.65位作者。论文的合作率更是增长显著,在1978~1982年段超过85%的论文是独著,但到2003~2007年段单作者论文仅占不到60%。总体上有超过1/3的论文有两个或两个以上作者。随着科学不断向深度和广度发展,各学科相互交叉、相互渗透,科研难度加大,许多课题项目必须相互协作,联合攻关,依靠多学科集体的力量和智慧才能完成研究;同时计算机网络技术的发展也方便了人们的合作与交流,因而合著论文越来越多,相信合作度和合作率在未来还会有所提高。
对每篇论文作者数量的统计,可以更详细地分析作者的合作团体数量。根据表2,每年段中独著论文占的比重最大,各年段二人、三人、四人及以上著论文数量依次减少。图1则是各年段,不同作者数量的论文占各年段论文数的比例,可以看出,二人及以上著论文比例呈逐年增加,如四人及以上合作的论文占所在年段论文的比例,由1978~1982年段的1%增加到2003~2007年段的5%。
图1 不同作者数的论文比例分布
3 核心作者分布分析
作者与论文数量分布具有不均衡性,这可通过作者在一定时间撰写论文数量来衡量,称为“科学生产率”。表3列出了各年段发表论文最多的前二十位作者,其中省略了匿名作者,总体上高产作者的生产率逐年段增长。在30年中既有持续的高产作者,也有阶段性的多产作者;有许多老一辈专家的退出,也有一批批新人的出现。各年段的作者都是情报界的精英,特别是总年度的前105位作者更为我们所耳熟能详,为我国情报学研究作出了重要贡献,见表4。
根据我们的研究,非高产作者成为高h指数作者的概率极低,即高发文量是作者影响力的基础,故发文量在很大程度上说明作者在学科中的地位,这从高产作者与高h指数作者的吻合上也说明这一问题[3]。
为反映作者变化情况,我们把六个年段进行了第一作者对比分析,每相邻两个年段进行两两对比。得出了表5和表6的结果。在表5中列出了各年段对于前年段新出现的作者,由于篇幅限制,我们仅列出了发文频次最高的前15位作者,如1983~1987年段相对前一年段新出现的作者中,樊松林以第一作者发文19篇。我们认为如果一个作者在五年内都没有以第一作者发表论文,那他可能已经隐身或退出了学术界或转向其他学术领域,表6就是关于作者退出情况的统计。表6列出相对于后一年段不发文的作者中,在该年段发文最高的前15位作者。需要说明的是作者是以第一作者算的频次,所以可能会少于前面表中的数据。有少量作者的发文是跨年度的,在统计时有可能分散其论文量。
4 洛特卡定律拟合分析
1984年帕欧在洛特卡原始处理过程的基础上,通过修改,总结出一套处理洛特卡定律数据的一般步骤和规范标准,得到学界的广泛认可。其具体步骤包括:收集数据、建立数学模型、斜率求解、C值计算、进行预测,还有结果的检验[4]。收集的数据按表7进行计算,其中建立数学模型就是确定广义洛特卡定律中选定参数,广义洛氏定律公式为:。对1978~1982年段进行计算。首先去掉
即受著者群大小的影响。著者群越大,值越小,检验精度越高;著者群越小,值越大,检验精度越低。著者群也不能太大,因为著者群越大,K-S检验的精度越高,越不容易通过检验。著者群只能在一定的范围内取值。既不能太小(著者群下限),也不能太大(著者群上限)。著者总数大于著者群上限时,通过K-S检验的概率小于10%[5]。经查作者总数与对应的C值,后二年段都超过了上限,所以不能通过检验。对于作者分布洛氏定律的验证与公式的研究主要集中在上世纪90年代,现在新的网络环境下,作者样本数量的大幅增长,这是一个值得深入研究的问题。
5 作者共被引分析
1981年,White和Griffith提出作者共被引分析(Author Co-citation Analysis,ACA),此方法对于探讨学科结构有着积极的开创意义。ACA现在已有较固定的分析步骤,包括作者选定、构造作者共被引矩阵、转化矩阵、进行聚类与多维尺度分析等[6]。
本文选择在30年中发文量大于或等于43篇的前30位作者。以中国学术期刊全文库武汉大学镜像站为统计源,利用该数据库引文检索中的著者同被引检索功能,在线检索出30位高产著者的同被引次数,共有(30×29)/2=435组不同的数据。具体方法是:在检索路径中选择“参考文献”字段,在检索词中分别输入两位作者的姓名,二者为逻辑“与”关系,而后得出两位作者的同被引次数以及同被引的文献列表。检索过程为“精确”匹配,检索年限选择为1978~2008年。检索学科范围为全部。因为检索时间为2008年11月中旬且数据库有滞后性,所以2008年为不完全数据。
通过检索得到共被引矩阵,其中范文田和彭靖里的同被引次数过少,予以删除,另外王伟、王军、杨华等名字发文较多,但经验证这些名字对应了众多的不同作者,故也删除,最后得到25人组成的矩阵。初步处理后,利用SPSS中的相关分析,将著者同被引次数矩阵转化为泊松相关矩阵;消除由著者被引次数差异所带来的影响。对这25位高被引作者进行了聚类和多维尺度分析,并用Pajek进行可视化,得到了图2、图3和图4的结果。
图2为改革开放以来我国情报学高产作者的聚类情况,25位作者细分为8个方向,这与实际情况比较相合。通过分析各作者发文的关键词,具体8个领域的内容为:①竞争情报。竞争情报研究萌芽于20世纪80年代,它在情报学中占有重要地位,上世纪末以来竞争情报进入新的阶段,竞争情报的概念、基本特征、功能、意义和操作方法等基本问题,以及竞争情报与知识管理的关系、反竞争情报、竞争情报教育等内容进行了深入的探讨。这几位高产作者是国内较早从事竞争情报理论研究和实践的著名学者。②信息系统。这是一个与计算机网络技术比较密切的领域,内容包括智能信息系统,智能检索系统,信息可视化与信息系统工程等,周宁和张玉峰都为武汉大学信息管理学院教授,长期从事这方面的研究。③检索语言。检索语言在信息组织与查寻中十分重要,张琪玉和侯汉清在此领域赫赫有名,研究的内容包括分类法和主题法、信息标引、自动抽词与分词、索引编制、语义检索等。④医学情报。医学情报在研究中往往被人们所忽视,其实它有自身独特的研究内容与领域,国内也有一些医学情报院系及系列的医学情报杂志。夏旭为南方医科大学教师,方平为中南大学湘雅医学院信息管理系教授,他们是医学情报方面代表人物。⑤文献计量。历年来,文献计量都占情报学研究的大部分内容,先后经历了书目统计、文献计量、信息计量和网络计量等阶段。王崇德、罗式胜和邱均平等发表大量相关论文,都出版了文献计量学方面专著。⑥数字图书馆、知识管理。这个方向最为复杂,数字图书馆是图书馆学与情报学交叉领域,将情报学和图书馆学的理论、技术等运用到数字图书馆的服务、管理和利用当中。与国外不同,在国内知识管理研究与图书馆学有着千丝万缕的联系。许多知识管理学者都从图书馆学起步或偏向图书馆的知识管理,如盛小平、柯平等学者。⑦情报学理论。该领域研究者数量最多,研究者之间的关系也较为密切。具体研究内容包括情报学学科基本理论、学科发展、信息用户与服务、信息经济等。包括严怡民、马费成和胡昌平等著名教授。⑧文献检索。情报检索理论和方法的探讨是情报学中最具特色的领域之一,一般认为与情报检索语言比较紧密,但两者侧重点不同,在图中两者显著分开。情报检索在国外情报学学科结构中占据了主导地位也是十分重要的研究内容。但国内这一领域的研究者数量较少,尚未形成较为成熟的学术集团。
图2 多产作者多层聚类分析结果
图3 多产作者多维尺度分析图
图3的结果与图2比较吻合,作者之间的距离表示了他们的相似程度,距离越近说明越相似。从二维图可看出,左下方聚集了竞争情报研究的作者;在左上方则是关于信息检索与信息系统方面的专家;文献计量与信息计量学作者在右下方;情报学理论的作者集中在右边的中部;另外关于数字图书馆及知识管理方面的作者则在右上方,但与情报学理论研究的作者关系较为密切。
图4 多产作者的共被引网络
聚类分析与多维尺度分析的结合较好地表现了作者共被引的分布,但只是相似性的体现,他们之间共被引的强度大小无法具体展现。为弥补这一缺陷,需使他们之间的共被引强度获得较直观的体现。下面采用Pajek软件对共被引原始矩阵进行可视化处理。例如谢新洲和包昌火、邱均平和王崇德之间连线最粗,说明他们之间的共被引强度最大。这一网状结构较好地展现了作者之间的共被引强度。
以上从著者角度对30年来国内情报学的学科结构以及研究现状进行揭示。有许多专家的研究领域涉及多个且可能随着时间而转移,这里反映其最主要方面,也是影响较大、被人们更认可的领域。论文被引具有累积性,故前面年份论文被引可能比后面年份的反映得更好,这样可以更好地分析作者以前的情况。另外我们仅分析了前30位发文最高的作者,业界还有许多有影响的专家,可能发文量较少但被引率高或以其他形式为情报学作出了重要贡献。
6 结论
从以上分析可看出,改革开放30年来情报学论文作者形成了较大的规模,总作者数为46985人,92259人次。作者合作度和合作率较为合理,两者都有逐渐增加的趋势。通过对作者总发量、各年段新出现和退出作者统计,在30年中既有持续的高产作者,也有阶段性的多产作者;有许多老一辈专家的退出及一些学者研究领域的转移,也有一批批新人的出现;特别是发文量排名在前的一些核心作者更为我们所耳熟能详,为我国情报学研究作出了重要贡献。因为作者总数超过传统检验的上限,故改革开放30年中情报学作者分布洛氏定律的验证没有通过,这是一个值得深入研究的问题。通过对核心作者进行共被引分析并可视化,发现改革开放以来我国情报学高产的30位作者可细分为8个研究方向,这与实际情况相合,分别是:竞争情报;信息系统;检索语言;医学情报;文献计量;数字图书馆、知识管理;情报学理论;文献检索。
收稿日期:2008年12月4日