我国研究机构科技论文排序——频度分布*,本文主要内容关键词为:频度论文,研究机构论文,我国论文,论文论文,科技论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
本文选择国际论文、国内论文和国际论文引文等科学计量学指标,讨论了我国高等学校与科研机构科技论文的排序—频度分布特征,在此基础上提出了几个应引起科技管理和决策部门重视的问题。
关键词: 科技论文 排序—频度分布
科技成果的排序—频度分布是科学计量学、文献计量学和信息计量学共同研究的内容。选择科技论文数量、著作数量、被引文数量和第一著者人数等计量指标的绝对数值或相对数值,按照学科领域,或按国度、地区、机构等进行排序,我们可从排序后各指标的频度分布格局中获得有关学科发展趋势,有关国家或地区的科技发展水平和不同研究机构科学生产能力的强弱等许多信息。60年代初至今的30年中,各国学者已对不同学科分支、不同研究机构、不同地区的科学产出率的排序—频度分布作了卓有成效的研究。这种研究或是世界范围内的比较研究,或是针对某一国家的研究。但是,有关中国科技成果的排序—频度分布研究仍是一项空白。
选用中国科技情报所《1990年中国科技论文统计与分析(年度研究报告)》提供的数据,我们对我国科学研究的两大主力军——高等学校和科研机构科技论文的排序—频度分布作了比较研究。
我们所研究的科技论文包括国际论文和国内论文两类。前者系指1990年被世界SCI、EI、ISTP、ISR等检索系统收录的中国学者的论文;后者限于1990年在国内1230种质量较好的学术期刊上发表的论文。这1230种期刊是从国内数千种科技期刊中筛选出来的,在坚持质量标准的前提下,兼顾了期刊的学科和地区分布。除国际论文和国内论文的数量分布外,我们还对国际论文被引证篇数和次数的排序—频度分布作了考察。国际论文被引证数据采用的是1990年SCI原期刊中引用的1985-1989年SCI收录的我国科技论文的篇数和次数。需要说明的是,我们以论文第一作者所属地区和机构作为论文分类的依据。
一、高校与科研机构科技论文按地区排序—频度分布的比较
1990年,以我国高校学者为第一著者的国际论文共计7085篇。对这些论文按高校所在省、直辖市和自治区进行分类,得到我国高校国际论文在30个省区(暂未考虑台湾省)的数量分布。1990年以高校学者为第一著者的国内论文共计47840篇。按第一著者所属高校所在地区进行分类,得到我国高等学校国内论文在30个省区的数量分布。
1988年至今各年度,我国科研机构的国际论文和国内论文数量均少于高校相应论文数。1990年,科研机构国际论文数量约为高校国际论文数量的55%,国内论文数量约为高校国内论文数量的49%。按论文第一著者所属科研机构所在地区对科研机构的国际论文和国内论文进行分类,得到我国科研机构国际论文和国内论文在30个省区的数量分布。(接表1)
表1 我国高等学校与科研机构科技论文的地区分布
依据论文数量多少,分别对高校和科研机构的国际论文和国内论文作地区排序,得到四组排序—频度分布序列。图1—图4的双对数坐标系绘出上述各排序—频度分布所对应的点列。横坐标为排序位次x的对数,纵坐标为指标频度值y的对数。(图1—图4)
图1 高校国际论文地区分布
图2 高校国内论文地区分布
图3 科研机构国际论文地区分布
图4 科研机构国内论文地区分布
比较图1—图4中的排序—频度分布点列,发现其共同特点是高产段点列分布较平缓,而低产段呈急剧下垂状。以1-15位为高产段,16-30位为低产段,分别对各点列作分段线性回归。回归方程lgy=lgc-αlgx中α的数值及相关系数│r│列入表2。
表2 高等学校与科研机构科技论文按地区排序—频度分布α值表
表2中的│r│值表明,我们所作的各线性回归都是有意义的。
比较表2中各α值我们发现,高校与科研机构科技论文的排序—频度分布格局有同也有异。相似之处是,高校与科研机构国际论文高产段的α值均大于国内论文相应段位上的α值。而国际论文低产段的α值与国内论文低产段的α值十分接近。一般说来,包含相同位数的两个对应段位,α值较大的段位,其内部各位次间的指标值相对差别也大;α值近似的段位,其内部各位次间指标值的相对差别也近似。因此,无论是高校还是科研机构,高产省区间国际论文数量的相对差别都大于国内论文数量的相对差别,而低产省区间国际论文数量的相对差别与国内论文数量的相对差别近似。我们看一下实际数据。在高产段,高校国际论文排序第1位的北京市拥有1401篇论文,是排序第15位湖南省论文数量(170篇)的15倍。而高校国内论文排序第1位的北京市的论文数量(4972篇)仅为排序第15位的天津市论文(1385篇)的3.6倍。与此类似,科研机构国际论文排序第1位的北京市拥有1904篇论文,是排序第15位的河南省论文数量(31篇)的61.4倍,而国内论文排序第1位的北京市的论文数量(7233篇)仅为排序第15位的河南省论文数量(500篇)的14.5倍。在低产段,高校国际论文第16位与第28位(1990年西藏、新疆的高校无国际论文)的数量比是165,国内论文第16位与第30位的数量比是176,两比值相差无几。科研机构国际论文第16位与第29位(西藏科研机构无国际论文)的数量比为29,国内论文第16位与第30位的数量比是34,两比值也很接近。
高校与科研机构科技论文按地区排序—频度分布的不同之处是,无论是国际论文,还是国内论文,在高产段上,科研机构的α值均大于高校的α值;在低产段上,科研机构的α值均小于高等院校的α值。从表2可以明显看出这一特点。这说明,在高产段,各省区间科研机构科技论文生产能力的不均衡性要甚于各省区间高校科技论文生产能力的不均衡性。低产段结论完全相反。
从总体上看,科研机构科技论文按地区分布的集中度高于高校科技论文按地区分布的集中度,而国际论文的集中度又高于国内论文的集中度。科研机构国际论文排序前5位的省区,其国际论文数量占全国科研机构国际论文数量的比例高达80%,而高校相应的比例是54%。科研机构国内论文排序前5位的省区,其国内论文数量占全国科研机构国内论文总量的57%,高校相应的比例是36%。
二、高校与科研机构科技论文高产单位论文及引文的排序—频度分布特征
众所周知,不同机构,不同单位间科技论文的产出能力是不均衡的,存在高产者与低产者之分。表3列出我国高校和科研机构按科技论文、引文数量排序前50名(30名)的单位的论文、引文数。其中,国际论文包括1990年SCI、ISTP和ISR收录的论文。引文采用按篇和按次两种方法排序。图5-图12给出了22对数坐标系中相应的点列。总体上看,各点列均近似直线分布,与图1-图4截然不同。这正是所谓局部(高产者)指标排序—频度分布的特点。表4列出了对各指标排序—频度分布所作线性回归的α值。所作线性回归均可通过统计检验。(表3、表4、图5-12)
表3 我国高校与科研机构科技论文高产单位论文及引文的排序—频度分布
表4 高校与科研机构科技论文高产单位论文及引文排序—频度分布α值表
结合图5-12和表3数据比较表4中的α值,我们发现这样几个特征:
1.图5与图9的α值很接近,图6与图10的α值更接近。因此,从总体上看,高校与科研机构科技论文高产单位论文数量的分布格局类似。但是,局部有差异,主要是几个最高产单位论文的分布不同。高校国际论文排序前3位的学校的论文数依次为240篇、236篇和233篇,相差很少。而科研机构国际论文排序第1名的单位,其论文数(201篇)为第2名(113篇)的1.8倍。国内论文排序也存在类似情况:高校第1名的论文数1.2倍于第2名的论文数;科研机构第1名的论文数1.9倍于第2名的论文数。
2.图5的α值大于图6的α值,图9的α值大于图10的α值。这种比较告诉我们,无论是高校还是科研机构,国际论文高产单位间论文产出能力的相对差距都大于国内论文高产单位间的相对差距。实际情况也是这样:高校国际论文排序第1位的学校与排序第50位的学校,其论文数量比为8.9,而国内论文的相应比值为3.2;科研机构国际论文排序第1位的学校与排序第50位的学校的论文数量比为20.1,而国内论文相应比值为5.2。
3.分别比较图7、图8和图5的α值,图11、图12和图9的α值我们发现,对于科研机构来说,国际引文高引文篇次单位的引文数量,无论是按篇计,还是按次计,其分布格局均与国际论文高产单位论文数量的分布格局相似。高校则不然,引文分布的α值较小。
三、几个应引起重视的问题
通过对高校与科研机构科技论文按地区排序—频度分布格局的比较,和对高校与科研机构科技论文高产单位论文及引文排序—频度分布特征的考察,我们认为,以下几个问题应引起科技管理和决策部门的重视。
第一,以国际论文数量为计量指标的各种排序—频度分布的α值,均大于以国内论文数量为计量指标的相应排序—频度分布的α值。这表明,各地区、各机构、各单位间国际论文产出能力方面的差异大于国内论文产出能力方面的差异。由此可以看出,国际论文数量是一个区分度较大的指标。因此,尽管我国国际论文数量远少于国内论文数量,但仍应以国际论文数量作为计量不同地区、不同机构和不同单位研究能力的首选指标,而以国内论文数量为辅助指标。这与国际论文的总体学术水平高于国内论文,从而能真实地反映一地区、一机构、一单位真实科研能力的作用也是一致的。
第二,引文指标作为衡量科技论文质量和影响的指标是不可忽视的。但是,一般说来,如果研究无需十分精细的话,在考察地区、机构科技论文总体分布状况时,引文按篇计量和按次计量两指标择一即可。因为两指标的排序—频度分布模式十分近似。
第三,我国高校与科研机构科技论文按地区排序—频度分布点列均存在急剧下跌的尾部,这符合科学计量学中科技指标的Zipf-Pareto分段分布模式。这一分布模式也表明我国科技发展落后的省区与科技发展先进的省区的高校和科研机构在科学研究能力方面存在着十分明显的差距。采取有效措施努力提高后进者的科学生产能力,逐步缩小这种差距,改变科技成果的分布格局,将会使我国整体科技水平得到提高,这也是制定科技发展战略时应重视的问题。
第四,高校与科研机构科技论文按地区排序—频度分布模式不同,这与我国重要科研机构地区分布相对集中,而重点大学的地区分布相对分散有关。成果分布模式不同,相应的科技资助与奖励政策也应该不同。使资助与奖励的分布模式与成果的分布模式基本保持一致,这是资助与奖励在宏观上具有合理性的一个重要标志。因此,有必要对资助和奖励的排序—频度分布格局作相应的研究。在这方面我们也曾作过一些尝试(见参考文献[4])。
第五,我们仅选择1990年一年的数据作排序—频度分析,这就难免有各种偶然因素影响分布格局。样本数量少的序列对偶然因素尤其敏感。因此,把数据扩充到三年或三年以上,再对各项指标、各种分类作类似的扫描将是一件更具普遍意义的事情。
*本项目为国家自然科学基金资助项目