情报计量学视野下的当代人文社科发展背景描绘———个人文社科领域数据密集型科学发现的探索性案例,本文主要内容关键词为:计量学论文,人文社科论文,情报论文,视野论文,当代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 研究背景 吴炫在《什么是真正的理论?》一文中认为,古今中外理论家在理论上的共同特点是:一种理论总是隐含着理论家对时代和现实独特的问题意识,这种问题揭示着为什么会产生这样的理论的现实性原因并规定着理论的内容,没有独特的问题便没有独特的理论内容。所以选择一种新理论去批判既定的理论不是理论批判,“理论研究”也不同于“理论”,因为前者是以阐释现有理论为目的,其结果是观念上的认同而解释上的不同,后者是通过理解理论来达到批判现有理论的目的,其结果是改造现有理论和观念[1]。由此出发,我们可以推出这样的结论,即只有努力地去发现时代和现实中的问题,才可能有学术上的真正点滴发现;只有真正地深刻地洞察到了当今时代和现实中的最深层次或者是独特的特征,才有可能产生比较大的和源源不断的学术新见——理论!因此,我们也可以进一步地明确这样一个逻辑:对于学者来说,能否清晰地提前洞察到各自研究的学科领域“所面临的主要问题和挑战”,本文将之称为“学科发展背景”,是决定一个学者能否成功的关键。 那么,自然而然产生的又一个问题是,我们又“如何可能”或“如何才能”洞察到各自研究的学科领域“所面临的主要问题和挑战”呢?显然,对于一个学者来说,要做到提前或及时地洞察是一个非常困难的问题。因为,一般说来,无论是从无数学者个人的经验来说,还是从创造力研究理论或是大量关于灵感来源的研究结果来说,除了虚心向高人请教的方法以外,就是要靠自身的“勤研苦习、长期积累”,除此以外好像并无他法。那么,问题是否就真的这样无解呢?特别是在海量的数字化的人文社科文献数据库已基本完善,数据密集型科学发现渐渐成为科学研究的第四范式时代的到来的情况下[2-4],又是否为我们提供了一些新的可能通道呢?笔者认为,这种可能性是存在的,我们的最重要的任务或说挑战,无非是要寻找到“适当而又可行的方法”来建立起“想要解决的问题”和“已经拥有的数据”之间的桥梁,即“建桥行动”!在大数据的时代,作为一个从事情报计量的学者,一个从事“研究的研究”的学者来说,我们的一个新任务,也许就是做一个高明的“桥梁工程师”,来帮助其他学科的学者更好地利用人类现有的知识。就本文来说,笔者的目的就是试图从情报计量学的视角,依托大规模或较大规模的数据,通过某种“计算”来自动或半自动地描绘当代人文社科各学科的发展背景,以此既为各学科的学者提前或及时地洞察各自研究的学科领域“所面临的主要问题和挑战”提供一些启发和帮助,同时也对“如何可能”和“如何做好”人文社科领域的数据密集型科学发现做一些探索性的尝试。 2 研究设计 2.1 研究假设 从科学学的角度讲,学术研究不可能从无开始,学术的进步主要在于对先前知识的修改,在试探和淘汰中接近合适的东西,而且学术研究作为人类文明的积累,本身就具有天然的公共性,它是前人多年来共同创造的。因此,简略而言,现在学术上的新发现都离不开前人知识的积累,新的学术本身是已有学术的累积延伸[5]。反过来说,也就是现有的海量的人文社科论文数据既是未来我们进一步发展学术的源泉,它本身也是历史和现实环境下所有学术的一种集成和总反映。那么,我们要洞察的“各学科当前面临的问题和挑战”,即“学科发展背景”,理论上说本身就已蕴含和反映在当代人文社科的海量论文中,我们的挑战只是如何“建桥”,即如何从中将其识别、凝聚和精炼出来。 依据笔者对中文人文社科研究模式、特征和规律的多年跟踪分析,笔者认为,从考察论文题目和关键词中“化”字的使用视角,基本可以来回应上述的挑战。因为,按照汉语词典的解释,“化”字的使用,最多的是作为动词用,表示变化、融化、消化等,但还有一种重要用法是作为后缀,即加在名词或形容词之后,作为一种对某些已在实践中悄然兴起和发展但又很难用单一的准确术语表达的现象的统称,如网络化、城市化、全球化、人口老龄化等。在学术论文中,类似上述的由“化”字组成的关键词,往往代表着“问题提出的背景”,如很多论文开头中经常使用的“随着信息化时代的来临”、“随着数字化时代的到来”等。当然,有时它又代表一种“对策”和“路径”等,但仔细考虑起来,这些“对策”和“路径”层面中使用的“化”关键词,其实质是对“所面临的问题和挑战”的一种回应手段,本质上仍反映着“问题提出的背景”本身。因此,概括起来,通过对这些“化”关键词的考察,我们显然就已经可以在一定程度上,或者说在某种比较宏观的意义上,以小见大地管窥到“面临的问题和挑战”。由此启发我们,在论文数据库已日益齐备的“大数据”背景下,如果对最近年份刊发的海量论文的题目或关键词中的“化”的使用进行计量研究,即可使我们对当今人文社科研究面临的问题和挑战有一个比较全面的了解,从而有利于我们在学术研究中收到陈寅恪先生所说的“预流”的成效,多打伏击战,少打遭遇战,并有可能由此启思出新思维。 2.2 数据来源和计算方法 本文的研究目的是要描绘我国当代人文社科研究领域各学科面临的问题和挑战,即“学科发展背景”,这就决定了本研究所要选择的数据必须同时满足“最新”、“系统”、“大量”、“优质”的要求。为此,本文最终选择中文人文社会科学索引数据库(CSSCI)最近一年(即2013年)收录的来源论文作为研究数据来源。需要进一步说明的一点是,本文在确定上述数据源的过程中,最初也曾考虑过选择2009~2013年这5年的数据作为本文的研究数据,但一则考虑到数据的时间跨度一长,就会和我们想达到的“最新”的要求产生一些矛盾;二则考虑到就本选题来说,5年的数据和1年的数据之间具有高度的同质性,就最后结论来说影响不会太大。所以,在综合考虑这些因素后,本文最终只选择了2013年的数据。当然,选择5年数据或者更长时间数据,理论上说都不存在任何障碍。 具体的数据检索和分析方法是:选择2013年CSSCI来源论文数据库,下载论文关键词中含有“化”字的14231篇论文数据,然后分别按“宏观”、“中观”和“微观”三个层次对论文中含“化”的关键词进行词频计算和共词计算(此处踢除了“文化”类关键词以及明显和本文研究目标无关的一些关键词,如“化学”、“深化体制改革”等),最后结合各学科的具体情况作适当的筛选和论述。 3 研究结果 3.1 宏观(整体)视野下人文社科研究面临的主要问题和挑战 依据上述研究假设、数据来源和计算方法,本研究首先统计出这些论文中所使用的关键词种类及其频次,发现含“化”的关键词共有7037种,剔除频次不到5次以及和本文研究目标无关的一些关键词后,可使用netdraw软件将其绘制成图1。 图1中点的大小代表着该关键词出现频次的多少,其中“城镇化”和“城市化”这二个关键词的频次最高,分别达到了345次和265次。由图1可以看出,我国当代人文社科研究领域面临的问题和挑战主要是在如何处理和解决好城镇化、城市化、全球化、国际化、本土化、现代化、气候变化、马克思主义中国化、数字化、工业化、人口老龄化、大众化、城乡一体化、信息化、可视化、市场化、多元化等过程中所带来的问题和挑战。 当然,上述结论只是就整体、宏观而言,具体到这些问题和挑战对各个学科的影响广度和深度而言,显然都不一样。比如,城市化的发展,主要影响到的是经济学、管理学、社会学、环境科学等学科,全球化的发展,主要影响到的是经济学、管理学、教育学、政治学、社会学、法学、新闻学与传播学等学科,而且,各个学科对这些问题和挑战的关注程度、关注重点和关注视角也不一样。这就需要我们继续从分学科的视角来回答这些问题。 3.2 中观(分学科)视野下人文社科研究面临的主要问题和挑战 通过对各个学科领域论文关键词的计量,可以得到表1结果。 由表1可以看出,由于学科的研究对象、研究方法和研究视角不同,各学科对当今时代和现实环境面临的问题和挑战的回应也有很大的不同。如社会学目前最关注的是城市化、城镇化、老龄化、市民化等所带来的问题和挑战;新闻学与传播学最关注的是数字化、国际化、社会化媒体等所带来的问题和挑战;马克思主义学科最关注的则是马克思主义中国化、马克思主义大众化、马克思主义时代化等所带来的问题和挑战等。 3.3 微观(具体现象)视野下人文社科研究面临的主要问题和挑战 由表1还可知,虽然从总的来说,各学科对当今时代和现实环境所面临的问题和挑战的回应有很大的不同,但是也有一些共同性的方面,比如城市化、全球化、数字化等趋势即是很多学科都共同关注的。也就是说,这些问题和挑战的涉及面是很广的,往往是多学科、跨学科或学科交叉的问题。 当然,结果上呈现出来的共同和差异,只是因为分析问题的层次、角度不同。一般说来,越是宏观层次的分析,共同性就会呈现得多一些,越是微观层次的分析,差异性就会呈现得多一些。比如,表1中的城市化、全球化、数字化等趋势是很多学科都共同关注的问题和挑战,但是各学科对它们的研究内容是不是会一样呢,答案显然是否定的。因为各学科虽然都对某种客观存在的某个现象和事实进行研究,但看待该现象的视角和研究的具体问题并不相同,也就是说各学科研究对象中,还存在“实质对象”和“形式对象”之间的区别[6]。显然,要真正洞察各学科的发展背景,我们需要的是从宏观到微观各层面的谱系式结果。当然,因为要深入到微观层次,就需要针对每个具体问题作显微镜式的观察。在此,笔者以“城市化”为例(其他的可依此类推)来进一步展示其丰富的情景细节(见表2)。 表2的结果也启发我们,重视学科之间的相互借鉴和交叉综合,不仅是可能的,而且对于解决复杂问题和综合性问题来说也非常必要。 4 基本结论和进一步的讨论 综上所述,本研究依托2013年CSSCI数据库,综合运用词频统计、共词统计及知识图谱等情报计量学的方法,对当代我国人文社会科学各学科的发展背景进行了计量式的描绘,既在一定程度上体现出了大数据所带来的全景式展示的特征,同时也在一定程度上体现出了深度性挖掘的特征,获得了一些较为客观、准确而又耳目一新的研究结论。如图1和表1~2中所揭示出来的结果,就为人文社科学者系统而又条理地进一步思考时代和现实给各自学科所带来的问题和挑战提供了一张“战略地图”。按照这张地图,我们不仅可站在较为宏观的高度鸟瞰整体,而且也可凭此地图按图索骥地研究一些具体的微观层面的问题。总而言之,这些研究结论将有助于人文社科学者“基于现有的知识”来及早地“洞察各学科的发展背景”。当然,由于本文的另一个写作出发点是想作为一个案例来介绍,即同时体现出其方法论意义,并不是想要非常准确地回答各个学科从宏观到微观的各种问题和挑战,即背景问题,因此,在分析方面都还存在着不少过于简化的不足。 与本文的研究相关,笔者还想在这里进一步提出讨论的一个问题是,随着海量的数字化的人文社科文献数据库的逐渐完备,如何开展好人文社科领域的数据密集型科学发现,做出更多更好的人文社会科学研究成果,显然也同时已经成为一个迫切需要回答的问题。通过对本文所进行的一个相对比较简单的探索性案例研究,笔者认为有以下两点结论特别值得关注: 一是随着信息时代或者说大数据时代的来临,“应用信息手段解决信息时代的各种问题”(包括人文社会科学)不仅已经成为“可能”,而且还可以说已经是“必须”和“不可避免”,这既是时代和当前的现实环境给我们提出的挑战,更是一种机遇。因为如果没有当今时代计算机技术、网络技术、通信技术的高度发达,如果没有海量数据库的日积月累式建设,自然就没有开展“数据密集型科学发现”,或者说开展“计算社会科学”、“数字人文”等研究的条件。今天,不仅数据已大量涌现,而且我们开采和挖掘数据的方法手段也已日益先进,如云计算的兴起,在这种情况下,数据的地位日益重要,即从“附属”渐渐走向“核心”,也为我们“用数据来表示世界”[7]——不仅是“自然界”,而且还包括“人或人体”本身,提供了越来越多的可能。因此,作为情报计量学界来说,我们必须认识到自身学科的使命,在这种时代挑战面前“有言”和“行动”。 二是数据密集型科学发现是一项综合性的工作,需要同时具备多种学科知识或是需要团队合作才能做好。因为从过程看,它必须能够同时满足以下三个条件:一是必须要有能力获得充足而可靠的大规模数据;二是必须要掌握一套先进的计算机数据分析技术;三是必须能够深入理解问题的本质,而且还必须能够建立起“问题”和“数据”之间的桥梁——研究假设,这不仅需要有经验上的长期积累和比较高的学术鉴赏力,有时还需要灵感的帮助。缺了哪个环节,都不可能完成这种富有挑战性的任务。例如,就本文来说,值得一提的创新点是:通常的论文关键词计量研究类论文,一般都理所当然地将论文中使用的关键词“原始组成状态”作为“不可分割的计量对象”来“照搬照抄”地计算,而本文中设计的计量方法则没有停留于此表层,而是通过进一步“打碎关键词”和挖掘关键词“原始组成状态”中的“附着信息”来建立“问题”和“数据”之间的桥梁。显然,在平时,这类附着信息往往是隐含的,在计算时也是不易为人“剥离”出来,因此也是不为人所易察的。单就这第三点,即最后一点来说,我们可以得出的一个延伸性的结论是,在大数据时代,关键还是在“人”,在理解“大数据的逻辑”。 本文获第五届全国情报学博士生学术论坛优秀征文一等奖。信息计量学视角下的当代人文社会科学发展背景描述&以人文社会科学领域的数据密集型科学发现为例_科学论文
信息计量学视角下的当代人文社会科学发展背景描述&以人文社会科学领域的数据密集型科学发现为例_科学论文
下载Doc文档