基于文献计量的我国数字档案馆研究现状分析
黄 清
(中国地震局地震研究所(地震大地测量重点实验室)湖北省地震局文献档案室,湖北 武汉 430071)
摘 要: 以中国期刊全文数据库为文献来源,借助文献计量方法,从文献出版年代分布、来源期刊分布、高被引文献这几个角度进行研究;论文研究热点分析采用共词分析法,通过构建论文关键词共词矩阵,采用多维尺度分析、聚类分析等方法,分析得出近20年来我国数字档案馆领域研究相关论文的研究热点,了解数字档案馆研究领域现状和发展趋势。
关键词: 数字档案馆;文献计量;共词分析;聚类分析;多维尺度分析
自20世纪80年代以来,伴随着互联网技术日新月异的飞速发展,信息时代的到来,引发了全球范围内的信息产业革命。随着这场产业革命,中国的信息化也进入了全方面,多层次推进的新阶段。档案信息化作为档案事业发展的新常态,越来越受到相关专家和学者的关注和重视。而数字档案馆作为档案信息化工作的重点,它的提出不仅满足了档案信息化建设的需要,也丰富了档案信息化的建设内涵,促进了与读者之间更为有效的对接。笔者通过文献调研发现,国内对数字档案馆的相关论文研究,大多集中在定性分析上,主要专注于理论研究,侧重于对数字档案馆概念及具体特征的文字描述。对于定量的分析较少。为了更全面的了解我国数字档案馆研究的基本情况和研究热点,以及今后的发展趋势。拟运用文献计量学的方法,对过去20年来我国数字档案馆研究论文的研究现状进行一个梳理和了解,以便为今后数字档案馆领域的相关研究提供参考。
1数据来源与研究方法
本文将中国知网(CNKI)全文数据库作为数据来源,检索年代范围为1999年~2018年,日期截止为2018年12月31日,匹配设置为“精确”,检索期刊范围为“全部期刊”,精确检索关键词或题名中含有“数字档案馆”的论文,对这两种方式检索出来的论文进行筛选,去除重复的,同时删去公告、会议通知、简报等没有实际研究意义的文献,最后,共获得数字档案馆研究相关论文3 403篇。通过对这过去20年有关数字档案馆相关论文进行收集整理,针对其总体分布特征以及其研究热点进行深入分析。其中,相关论文总体分布特征分别从文献出版年代分布、来源期刊分布、高被引文献这几个角度进行研究;通过构建论文关键词共词矩阵,利用多维尺度分析、聚类分析等方法,分析得出近20年来我国数字档案馆领域研究相关论文的研究热点,了解数字档案馆研究领域现状和发展趋势。
2论文总体分布特征分析
2.1 文献出版年代分布分析
文献是记载科学研究重要成果的主要载体,无论何种形式的科学研究及发明都需要以论文发表的形式被大众所知晓。对论文的每个年代发表数量的多少进行统计能够有效反映出该研究领域的发展水平与规模,可以更加直观的从时间的概念上认识该专题研究的发展历程[1]。对我国数字档案馆相关研究论文的出版年代分布进行统计分析可以从一个侧面反映出国内数字档案馆领域研究的科学化程度。笔者通过对得到的3 403篇相关论文按照年份进行频数分析,得到数字档案馆研究论文近20年的年代分布图(见图1)。
表 1来源期刊分布分析
从图1可以清楚的看出,在过去20年中,关于我国数字档案馆领域的研究文献大体上呈逐年上升的趋势,且速度由1999年的仅有1篇,增长到2018年的258篇,增长速度很快。这是因为在20世纪末,网络还远远没有现在的普及程度高,网络对信息服务的冲击影响力也非常有限,但随着网络信息化的发展,在2004年~2008年之间增长态势趋于稳定,随后的几年增长速度明显加快,在2014年我国数字档案馆领域研究的论文数量达到高峰,论文有319篇。这在一定程度上反映了数字档案馆研究越来越受到有关学者的关注和重视,其研究热度也在不断的升温。
智朴“早年行脚诸方”,辗转多地,历经艰辛。 “曾谒南华,憩佛日峰”,可见智朴曾于南华寺拜谒,后又在佛日峰小住一段时间。 一处是湖南凤凰的翠叠南华,一处是江西赣州的世外仙境佛日峰,都是南宗禅修行的重要道场。 江西是曹洞宗的发源地,在此修行之后,智朴又去上海青浦隆福寺继续深造,受记于青浦百愚净斯大师,也因此成为曹洞宗第三十世。 智朴本为明官僚,明亡后出家为僧,潜心修佛。 曾亲历兵戈铁马的智朴强抑内心的悲凉,遁入空门,依佛据典,清净心灵。 构庵青沟后的智朴洗尽铅华,悠悠自在,涉猎广泛,于诗文书画都有佳作,他既是诗僧也是画僧。
图 1文献发表年份趋势图
2.2 来源期刊分布分析
即便如此尴尬,客套话并非生来就有什么不好,相反,在职场上很多需要沟通的地方,它还会起到作用。有人因此发明了话术这个词,即说话的艺术、技术,成就了网络上许多以话术为生的大V。不过他们虽然被人崇拜,也常因为某些传销般的极端言论,转头就被人忌恨。相比之下,主持人蔡康永就显得聪明许多,他的《蔡康永的说话之道》占据畅销排行榜首位多年——术与道,一字之差,谬之千里,话术管得了一时,却讲不清道理。
2.4.2 聚类分析与多维尺度分析。利用spss23.0软件,将高频关键词共现矩阵转化后的相关矩阵进行系统聚类分析,度量标准采用平方欧氏距离,聚类方法选取组间联接。随后,借助聚类分析的结果,通过多维尺度分析对高频关键词分布加以检验,并对结果予以可视化降维表示,以直观展现数字档案馆研究领域的研究结构,结果如图2和图3所示。
2.3 高被引文献分析
由表2可知,被引频次最高的前10位期刊中80%属于档案学的核心期刊。内容主要涉及数字技术、虚拟馆藏、档案后保管范式、档案保管、档案数字化、信息化建设等方面,都是数字档案馆领域关注的热点问题。其中,多位学者对数字档案馆建设的阶段性特征、意义和信息服务的模式进行了深入研究。张晓霞、王宇晖、王萍等提出网络环境将会突破时空隔阂,其在网络上的传输,将会使档案馆的形态不再受限于传统的形式,并发生根本性的变化[3]。刘明探讨了数字档案馆信息服务的3种模式,并就这3种模式进行了系统地比较[4]。在数字档案馆信息化建设的实践与思考方面,傅荣校认为数字档案馆有着传统档案馆无法比拟的优势。就显著特征而言,传统档案馆无论是技术或管理理论都无法与数字档案馆进行比较,要在实践中加快数字档案馆信息化的建设[5]。
通过分析某研究领域期刊的分布,不仅可以揭示该研究领域相关文献的分布特征,它也可以反映该期刊的发文特点和倾向,为作者投稿和期刊的发展具有一定的指导作用,同时也为该领域相关文献的收集和整理提供一定的依据[2]。笔者将国内数字档案馆领域相关研究论文的前20位期刊分布情况整理,如表1所示。
表 2高被引文献分布
表 3高频关键词 78×78的共词频次矩阵(部分)
文献的被引频次在一定程度上体现了文献的质量的认可度及其影响力,高被引文献是作为今后更深一步科学研究的重要参考。通过检索将得到的3 403篇论文进行统计,将被引频次高于55次的论文作为高被引文献共10篇,如表2所示。
立案登记制改革为群众“找法院说理”敞开大门,司法责任制改革实现“让审理者裁判、由裁判者负责”,以审判为中心的刑事诉讼制度改革筑牢防范冤假错案堤坝,阳光司法机制让公平正义看得见、摸得着。
图 2聚类分析结果
图 3多维尺度分析结果图(选用平方欧氏距离)
2.4 研究主题与热点分析
2.4.1 构建关键词频次共词矩阵。关键词是指用来表示全文主题内容的单词和术语。一篇论文的关键词能够直接反映出这篇论文所要研究的主题及其要点。而针对某个研究领域的论文高频关键词进行分析,便能很大程度上有效地反映出该研究领域的研究热点和研究趋势。在本文中,通过对3 403篇论文进行统计得到3 945个关键词,为保证共词分析的效果,选取其中频次大于27的78个高频关键词,通过统计这78个高频关键词在文献中同时出现的频率。形成了一个78×78的共词频次矩阵(部分数据如表3所示)。
从表1可以看出,在来源期刊分布中排名最靠前的20位期刊的载文量占总期刊的载文量的65.9%,它们是数字档案馆研究领域中发文量相对较大的期刊。前三名的分别是《兰台世界》318篇、《中国档案》233篇、《黑龙江档案》163篇。随后依次是《浙江档案》和《档案与建设》均为149篇、《中国档案报》137篇、《北京档案》113篇、《档案管理》109篇、《档案学通讯》100篇、《档案学研究》98篇等。由此可见,关于刊载数字档案馆主题的期刊大多专业性较强,综合类的期刊较少,且排名靠前10位的期刊中核心期刊占多数。可以说,档案学领域对数字档案馆的相关研究颇为重视。在以后对数字档案馆主题的研究中,可以重点查找这些期刊。
宋代园林和明清时期园林在寻找象征与诗意方面呈现的是当时园林文化的自觉自为,园林艺术都呈现出一种独特的文化内涵。从园内的物质内容到精神功能,从园林的立意布局到园内景区的主题分配,从景物本身的表义内涵到景物之间的符号关系都有了深刻独到的见解和相应的表现原则。[2]这一切都是中国园林艺术的文化内涵之所在。
聚类结果显示,国内数字档案馆领域研究主题可分为六大类:①数字档案馆概念研究;②资源管理;③信息服务;④大数据时代下数字档案信息挖掘;⑤信息资源建设及保密安全;⑥技术模型(OAIS)。
从图3中可以看出,在多维尺度分析结果图中,坐标轴左侧中间(区域①)主要为数字档案馆的概念研究的关键词,坐标轴右下角(区域② )主要为资源管理的关键词,坐标轴右上角(区域③)主要为信息服务的关键词,坐标轴左下角(区域④)主要为大数据时代下数字档案信息挖掘的关键词,坐标轴左上角(区域⑤)主要为信息资源建设及保密安全的关键词,坐标轴右中间(区域⑥)主要为技术模型(OAIS)。的关键词。多维尺度分析结果比较客观、清晰地反映出我国数字档案馆研究主要在于“资源管理”、“信息服务”、“大数据时代下数字档案信息挖掘”、“信息资源建设及保密安全”等方面。同时进一步分析发现,我国数字档案馆领域研究的主题可归纳为两类:关于理论方面的研究和关于数字档案馆开发与利用方面的研究。
3结束语
数字档案馆是大数据时代背景下档案馆发展的一个主要趋势,是新形势下承载档案工作的主要形式。建设数字档案馆是对新形势下档案工作提出的新要求,它不仅更进一步促进数字信息资源的有效管理和便捷利用,同时,它也进一步完善了档案信息资源的规范标准。当前,我国数字档案馆的进程正在不断的加速,未来数字档案馆的建设也将有助于确保数字档案资源的齐全性和完整性,为推动全国档案信息化工作全面、健康、均衡发展奠定基础。笔者采用文献计量的方法,对1999年~2018年我国数字档案馆领域研究文献进行统计分析,描述了我国数字档案馆的发展情况,并分析得出近20年来数字档案馆研究论文的研究热点,了解数字档案馆研究领域现状和发展趋势,希望对今后我国数字档案馆的研究能够有所借鉴和参考。
[参考文献]
[1] 王瑜.我国信息用户研究论文的计量分析[D].绵阳:西南科技大学,2014.
[2] 李楠.我国图书馆读者服务的文献计量学研究[J].内蒙古科技与经济,2017,(6):100~102.
[3] 张晓霞,王宇晖,王萍.数字档案馆:21世纪档案馆的新发展[J].兰台世界,2000,(1).
[4] 刘明.数字档案馆信息服务模式研究[J].档案学通讯,2007,(5).
[5] 傅荣校.关于数字档案馆的思考[J].档案学通讯,2001,(5):26~28.
收稿日期: 2019-04-11
作者简介: 黄清(1987-),女,毕业于西南科技大学情报学专业,硕士,就职于湖北省地震局,馆员。
中图分类号: F270.7
文献标识码: A
文章编号: 1007—6921(2019)15—0087—03
标签:数字档案馆论文; 文献计量论文; 共词分析论文; 聚类分析论文; 多维尺度分析论文; 中国地震局地震研究所(地震大地测量重点实验室)湖北省地震局文献档案室论文;