大数据时代人文社科成果评价变革探析,本文主要内容关键词为:探析论文,成果论文,评价论文,人文社科论文,时代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 大数据时代人文社科成果评价变革的缘起 “可以确认,人文社会科学学者的研究产出具有一些不同于自然科学学者的特性,足以支持人文社会科学学者研究产出的学术评价不宜与自然科学家采用同一标准的看法”[1]。通常来讲,人文社会科学相比理工农医等领域的研究成果,表现出了更大的广泛性、复杂性、历史性、社会性和相对性等特点,其成果评价要求要考虑到成果的以上属性,尽可能地反映出成果的实际“含金量”。 国内外人文社科学术成果评价在理论和实践上已进行了一些有益的探索,围绕同行专家评价、文献计量评价(如核心期刊)、绩效评价等方法开展,其主要建立在因果关系的评价方法上,在很大程度上反映了学术成果的价值。然而,似乎始终存在一些困扰着中国人文社科评价者和研究者的问题,比如,“重量轻质”致使评价结果的公信力频遭诟病;同行评议评委数量少、受到“人情关系”干扰、主观随意性较难控制等因素严重影响了评价的公正性;真正的同类比较难以开展,科学的分类评价体系极为缺乏;评价的实效性和预测能力难以满足学术发展需求;评价的准确性和投入成本之间的矛盾无法协调,准确的评价似乎必须付出巨额的时间和实践检验成本等。这些问题阻碍了人文社会科学的健康发展,甚至使一部分学者对评价丧失信心,悲观地认为人文社科学术成果不可评、不可测[2]。目前,针对上述问题,国内外的学界和管理部门尚不能提出较为科学可行的解决办法。难道这些问题真的无法解决吗? 近年来炙手可热的“大数据”似乎可以为问题的解决带来一丝曙光,突破以往评价的一贯思路,以崭新的角度来变革人文社会科学学术成果评价,更好地挖掘出成果价值的真相。“大数据”的概念并不算新,只是近3年以来才成为一个充斥着人们眼球的概念。早在1980年,托夫勒[3]的《第三次浪潮》就对大数据的显现进行了热情的描述;2011年5月麦肯锡公司发布的报告《大数据:创新、竞争和生产力的下一个前沿领域》[4],明确界定了“大数据已成为重要生产要素”,这被普遍认为是“大数据时代”到来的标志;此后,世界经济论坛、奥巴马政府、Gartner公司等,均发布了与大数据有关的重要报告。伴随着物联网、移动通讯、云计算等技术的兴起和成熟,社会已悄然步入了一个全新的大数据时代。虽然以PB(1024TB)为单位的非结构化和无序性数据信息如此庞大,但许多新兴技术仍可便捷地分析和运算某一目标的模糊和相对性结果,挖掘出隐藏在庞大信息中背后的真相。 目前对大数据的认识尚不统一,对于大数据的规模标准、多样性、实时性如何界定,大数据的价值与一般的数据有何不同仍待界定。一般认为,大数据就是囊括了包含各方面的信息的一个数据总和,一般指在10TB(1TB=1024GB)规模以上的数据量[5]。从数据的类别角度,大数据指的是无法使用传统流程或工具处理或分析的信息;它定义了那些超出正常处理范围和大小、迫使用户采用非传统处理方法的数据集,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[6]。普遍认为大数据具有“4V”特性,即规模性(Volume)、多样性(Variety)、实时性(Velocity)、价值性(Value)[7]。大数据最核心的价值就是对于海量数据进行存储和分析,并实现预测某一事物发展的趋向,相比起现有的其他技术而言,大数据的廉价、迅速、优化这三方面的综合成本是最低的。 如今,学术评价领域也受到了大数据时代的冲击。事实上,学术评价与大数据的渊源较深,当前在国际上举足轻重的论文评价工具“引文索引”就可以将其理解为一种基于“大数据”的评价,这一工具是基于加菲尔德从海量数据中总结出的引文与论文影响力之间的文献计量规律。目前SCI收录期刊超过1万种,论文数据超过80万条,引文数据则更为庞大,并且数据仍在实时更新中[8];文献计量方法之所以成为重要的学术成果评价方法之一,也离不开对大量数据的分析,三大文献计量定律均是如此。大数据时代使学术评价和大数据的关系更为贴近,三大引文索引数据库的运营商汤森路透公司宣称,他们利用大数据方法成功预测多位诺贝尔奖获得者,准确率超过70%[9]。鉴于人文社会科学的独有特征,其学术成果评价也许比其他领域对“大数据”有更加强烈且特殊的需要。 大数据时代的预言家维克托·迈尔-舍恩伯格指出:大数据是一场生活、工作与思维的大变革[10]。大数据有无可能解决前文所述的人文社科学术评价中存在的问题?能否利用大数据时代的理念和方法对人文社科学术成果评价进行一场彻底的变革?本文试图通过思考探讨大数据时代可能实现的人文社科成果评价变革的主要内容,以及变革的优势、劣势、机遇与挑战。 2 大数据时代人文社科成果评价变革的主要内容 根据维克托·迈尔-舍恩伯格的论著[11],大数据时代的思维变革主要体现在三个方面:一是从随机样本到全样本,二是从精确性到混杂性(意味着“非结构化”数据也可以发挥价值),三是从因果关系到相关关系,并由此衍生出更多的新变化。可以说,大数据时代的思维变革给人文社科学术成果评价的变革带来了一系列启发。粗略来讲,大数据时代的人文社科学术成果评价变革,会给各评价要素带来一系列可能发生的变化,如表1所示。 综合而言,大数据时代可能实现的人文社科学术成果评价变革,集中在如下七个方面的内容,且每个方面均可能交叉涉及表1中的评价要素。 2.1 从基于“随机样本”的评价到基于“全体数据”的评价 在信息处理能力受限的时代,世界需要数据分析,却缺少用来分析所收集数据的工具,因此随机采样应运而生。统计学的目的之一就是使用尽可能少的样本数据反映或证实大群体的事实,随机样本是一个既能达到目标又能节约成本的方法。在学术评价领域,遴选若干同行专家对成果进行评价,在成果评奖时对参评对象的条件进行限制,都是利用随机样本对成果进行的评价;由于人文社会科学的许多成果量化数据少、统计意义小,因而其成果评价更为依赖基于随机样本。然而,随机样本常常会导致评价结论片面、甚至不正确,而且由于样本量小,易受人为因素的干扰。 在我们长期沉溺于如何改进随机抽样方法和避免主观偏见的时候,大数据时代来了,新的技术和工具使计算和制表不再像过去一样困难,成本也可控制在能接受的范围内,基于全体样本的评价可能不再是妄想。大数据时代,可以收集到过去无法收集到的评价信息,跳出了对抽样调查的完全依赖,对全体数据的分析有利于有效避免随机样本的不足,这一点在很多领域已得到验证[11]。人文社科成果评价也可以使用“全体数据”的评价,将评价对象扩展到“全体数据”有利于扩大“同类比较”的范围,得出更可信的结果,将评价主体扩展到“全体数据”有利于降低样本可能导致的片面性。 2.2 弱化评价数据的精确性,接受混杂性并从中获益 当我们掌握有限的数据时,确保每条数据的精确性才能保证分析结果准确,因为收集信息的有限意味着细微的错误会被放大,甚至有可能影响最终结果。因而,以往的学术评价活动,要付出相当多的劳动确保数据的结构化和精确性,引文数据、同行专家的评分等数据,都力求不出差错。然而,虽然在数据精确性上投入巨大,但是仍常因样本小而无法得到完全公正或正确的评价结果。人文社科学术成果,更是由于引文数据量小、同行专家主观随意性大等原因,即使来自随机样本的评价数据精确,其评价结论的正确性也是有限的。 大数据突破了常规的“点对点”式评价模式,从更广阔和多元的维度评价人文社科成果,要求转变评价观念,接受数据的“混杂性”,并从中获益。在大数据时代,“不精确”已经成为一个新的亮点,而非缺点。因为放松了容错的标准,人们掌握的数据也多了起来,并允许错误的信息存在,而不是以高昂的代价来避免“不精确”。即使人为因素导致个别成果的某条评价不公正,在大数据环境中也可能成为“微瑕”,而不是在随机样本环境中的“致命伤”。对于学术评价的研究者和实践者,将评价活动的重心从“确保数据精确性”转移到“提高数据收集广度和处理能力”上。虽然接受了混杂性和不确定性,但通过对评价数据的深入分析研究却能从中获得真相的全貌,依据大数据的完整而混杂的信息,得出可预期人文社会科学科研成果效益和价值的结论。 2.3 从因果关系式评价转变到因果与相关关系并重 当前的学术评价力图在评价指标和数据与成果质量之间建立“因果关系”,但效果并不理想。用论文发表期刊的级别、资助项目的级别、被引频次、被转载情况、同行专家评分等数据来评价学术成果的质量,事实上都是基于这些指标与成果质量之间存在因果关系的假设。已有大量研究表明[12],这种因果关系并不稳定甚至常常出错,而且被引频次等指标需要以长时间的数据累积为代价,时效性也不高。预测性强、因果关系稳定的人文社科成果评价指标和数据似乎是渴望而不可及的。 大数据则另辟蹊径,不再单纯纠结于因果关系,而是寻求通过相关关系分析实现预测。相关关系一般指某一事物不论是好的还是坏的,只要发生就一定与某些人或者物有关系;任何不确定因素成分的存在都与相关关系有直接或间接的联系[13]。比如,如果A和B往往一起发生,那么B的发生也预示着A的发生,在巨大的信息量中,无数个A和B相关性被发现,那么A的发生也就相应的有了大概率的预测办法。这可以让我们更快地发现指向因果关系的风向标,同时更快速的排除不必要的评价行为,提高发现新的、更好的成果评价指标的效率。鉴于时代的发展速度和社会需求,深入研究相关关系的意义高于研究因果关系。当然,这并不意味着要完全放弃因果关系,因果关系和相关关系“双管齐下”更有助于揭示人文社科学术成果的真正价值。 2.4 建设人文社科成果同行评议大数据平台 评价工具和方法的变革是重要一环。当前中国人文社科学术成果评价领域,基于文献计量方法的“引文数据库”等工具已相对成熟,南京大学、北京大学、中国社科院等在研制“核心期刊”的相关引文数据库方面均已取得显著成效。但是基于同行评议方法的主观评价数据仍较为缺乏,虽然许多部门通过同行评议方法开展人文社科成果评奖、职称评审等活动,但形成同行评议数据库的机构却很少;而且由于同行评委数量少、参评对象范围有限等原因,其评价结果的可信度也常受到诟病和质疑。 在大数据时代,现有的技术使得建设人文社科成果同行评议大数据平台成为可能。这一平台可以收集来自全国甚至国外的人文社科成果,汇聚国内外的作者和评委,在全体数据、实时更新的环境下通过“混杂互评”形成“同行评议数据库”,为各级管理部门提供评价数据支撑。这一构想并非纸上谈兵,中国人民大学“复印报刊资料”的选文评文实践已为此构想的实现奠定了基础。“复印报刊资料”[14]每年收集近4000种中国人文社科报刊上公开的论文近30万篇,并通过同行评议方式精选后转载并专题化出版;这项工作已持续50余年,近年来还根据其选文、评文数据定期发布人文社科期刊、作者机构的转载指数排名。若将其工作转移到数字化、网络化的环境中并完善改进,建成人文社科成果的同行评议大数据平台的可能性非常大,对于解决中国人文社科学术成果评价中的诸多问题,促进学术评价机制向“同行评议为主”的方向改进是极为有益的。 2.5 深入整合各类人文社科成果评价数据 学术评价领域普遍主张定量与定性相结合的综合评价,然而综合评价在实践中却屡屡受阻。不同类型的定量和定性评价数据,由于数据产生“时间差”、数据来源不统一、评价目的不一致等原因,开展综合评价的理想虽好,但落实却很难,综合评价成功案例极为少见。虽然引文在某种程度上也是一种同行评议,但是毕竟不能等同于同行专家对成果质量的直接评议。有些人文社科学科的论文需要长达5年的时间才能形成具有统计意义的引文数据,而同行评议却可随时进行,因此两类数据实难整合。即使引文数据之间或同行评议数据之间,由于数据来源、采用指标、评价范围等差异,也很难科学便捷地整合到一起。此外,尽管人文社会科学与社会发展的关系密切,但最终用户和社会大众对成果的评价受到诸多条件限制,推行范围小、发挥作用十分有限,尚未形成具有一定规模的量化数据。 大数据时代为不同类型评价数据的整合提供了一系列条件。第一,接受数据的混杂性,有利于将不同来源、类型的评价数据纳入到统一的数据库中,根据不同目的、类型和渠道来源数据分析形成的百度指数就是例证之一。第二,评价数据收集途径更宽、范围更广,实时更新成为可能,使学术成果评价成为一个动态连续的活动,数据产生时间差的问题有望得到解决。第三,大数据已深刻影响了人文社科学术研究行为和社会各领域的发展,学者和社会大众对大数据日益集中的关注度,为整合这两类主体的评价数据奠定了基础。第四,云计算、数据挖掘、可视化等信息技术日新月异,为收集、处理和挖掘不同类型评价数据,尤其是非结构化数据提供了不可或缺的条件,结构化和非结构化数据的整合不再是幻想。 2.6 非结构化数据将有力推进“创新和质量导向”的评价 目前国内外学术成果评价数据库,多为“结构化”数据,比如成果的标题、关键词、引用频次等。此类数据库在评价学术成果中发挥了重要作用,但无法保存和利用那些针对成果创新性、内容质量等方面的“非结构化”、“个性化”评价结论,因此更适合理工农医等领域的成果评价,对人文社科领域适用程度相对较低。主要原因在于理工农医领域的知识表示相对清晰,因此很多图书馆或科研管理部门通过结构化数据库的“成果查新”即可判断成果的创新性;然而,人文社科成果的知识表示相对自由灵活,结构化数据库无法支撑类似“查新”这样的内容评价活动。“创新和质量导向”的成果评价确实是人文社科领域的迫切需要,这一点也得到了管理部门的认可[15],但学者提出的建设人文社科成果的“创新点知识库”、论文摘要库等非结构化评价数据库的想法却至今未能实现。 大数据时代,非结构化评价也可量化,因此建设非结构化评价数据库应作为人文社科成果评价的一项重要内容。清华大学、武汉大学等已研制的科研论文反抄袭系统软件,收录了近几十年来公开发表的海量成果,并已应用于许多部门的期刊论文和高校毕业生论文审校中,有效降低了科研成果重复率。虽然这些工具尚不完善,但却为非结构化评价数据库提供了较好的示例。基于前文提到的人文社科成果同行评议大数据平台和百度大数据平台,依托相关的数据挖掘、可视化等技术工具,建成一系列非结构化评价数据库,很可能对成果的独创性、潜在价值和社会效益进行更好的预测分析,为“创新和质量导向”的人文社科成果评价开辟新的途径。 2.7 评价管理政策应体现大数据的时代特征 调查显示[15],学者们认为人文社科评价管理政策的缺失和不到位情况处于“比较严重”和“非常严重”之间,已严重影响了人文社科成果评价实践活动的开展。尽管教育部的发文已明确指出,应适当使用“引文索引”等工具、加强同行评议、科学合理分类评价等要求[17],但真正落实却不易。原因在于可供科研管理部门选择的评价方法、工具和数据有限且不完善,因此必须在评价的“科学性”与可行性之间做出选择,牺牲一部分“科学性”。鉴于这种现状,成果评价在支撑人文社科发展中只能发挥有限的作用,有时甚至会阻碍学术的健康发展。 大数据时代,评价管理政策应着重对评价大数据的形成和应用机制的引导和建设。对于具有较强公共物品属性的学术成果而言,其评价大数据很难“自发”形成。因此,转变评价理念、改进评价工具与方法、深入整合评价数据等活动,迫切需要评价管理政策发挥顶层设计作用,明确大数据时代的人文社科成果评价导向、掌控大数据评价的基本框架、调动各部门参与大数据评价变革的积极性,制定大数据评价的基本规范,指导评价大数据的合理开发利用,使评价在促进人文社科发展中发挥更充分的作用。 3 大数据时代人文社科成果评价变革的SWOT分析 维克托·迈尔-舍恩伯格认为:世界的本质是数据,一切皆可量化,重点是如何使用大数据。他还指出了大数据时代的管理变革体现在两个方面:即关注“让数据主宰一切”带来的隐忧和风险;二是掌控“责任与自由并举的信息管理”[11]。围绕“数据规模极为庞大”这一核心特点,大数据具备了传统时代评价数据所不具备的一系列特征,比如全样本、实时更新、数据混杂等,我们对大数据时代的人文社科成果评价变革进行了SWOT分析,如下页图1所示。 3.1 优势:为完善人文社科成果评价提供新思路 开篇所述的人文社科学术成果评价难题原本难以逾越,但大数据提供了解决这个问题的方法。大数据时代对人文社科学术成果评价的变革具备如下优势:第一,评价活动可能冲破同行之间、学科和部门之间的局限,以及对有限指标的小范围、随机样本、点对点模式,把评价投入到网络世界更广阔的空间和数据当中;这样既可能解决“少数人评价少数人”[16]带来的一系列问题,使评价更具备相对性和客观性,也可能使基于全样本的数据实现更加科学合理的分类评价。第二,由于大数据具有规模巨大和混杂的特性,人为因素对大数据的影响难度要远远高于小范围样本数据,评价主体的主观随意性也可以大幅度降低;评价结果的“社会的需求性”和“学术的需求性”可以更好地切合,引文索引和同行评议结果数据也可更好地相互印证。第三,我们一度对人文社科成果评价的“重量轻质”问题不满,是因为量化的手段不够先进,使量化结果与成果质量之间的相关性显得十分薄弱,大数据时代,我们可能依托更先进的技术形成更为准确公正的量化评价数据,使评价结论反映成果质量的程度大幅提高。第四,人文社会科学科研成果的价值显现过程通常很长,但基于相关关系开展评价数据挖掘,有利于发现更多更有价值的评价规律和指标,实现更好的预测性评价,大幅缩减评价时间和评价成本。评价时间和成本的节约则意味着人文社会科学研究效率及对经济社会发展支撑力度的提高。 3.2 劣势:大数据的相对正确性和变革成本 “大数据”并不等于“大成功”,在推进大数据时代人文社科成果评价变革时,我们必须清醒地认识到大数据的劣势。第一,大数据在本质上仍为量化评价,并不是对人文社科成果直接作出的定性判断,因此仍具有“间接性”及其衍生出来的一系列问题。第二,“不确定性”,或称“相对正确性”、“模糊准确性”,是大数据最重要的劣势。虽然大数据可能是全面的,但允许不准确性存在使其过于庞杂,且对大数据的掌控力度有限,不可能完全把握“脏数据”带来的隐患。因此,基于大数据的评价结论通常相对正确,而非完全精确,甚至可能出错[18],因此不能将大数据时代的评价“神化”、“万能化”。第三,大数据时代的人文社科成果评价变革可能面临不可估量的成本,包括人力、物力、财力、时间等,将评价量化这一步骤就可能付出昂贵代价。虽然大数据时代的评价变革让人憧憬,但也可能会因昂贵的成本变成“竹篮打水一场空”,因此必须充分依托已有数据、方法、工具逐步推进变革、控制变革成本。第四,大数据评价的预测性仍十分有限。由于社会是变化存在不可控因素,虽然创新的人文社会科学科研成果可以通过大数据得以体现,但很难通过大数据预测出哪些创新成果会成为热点。如果过度依赖大数据的评价结果,则可能会束缚人文社会科学的发展。 3.3 机遇:变革评价机制具备诸多有利条件 本文所提出的大数据时代人文社科成果评价机制的变革内容,现面临着不可多得的发展机遇。第一,传统时代所积累的人文社科学术评价数据、方法和工具仍然有效,比如CSSCI、“复印报刊资料”、百度指数等,为变革奠定了基础。第二,大数据的思想已渗透到经济社会发展的各个领域,包括学术领域,使变革有可能受到更广泛学者的支持。第三,新兴的数据挖掘、云计算、物联网、可视化等技术工具,为大数据评价平台的建设提供了技术基础。第四,当前学术界对人文社科学术成果评价中的种种弊端进行改革的呼声很高,变革内容刚好迎合了改革的需求。 3.4 挑战:观念、执行、技术和隐私安全挑战并存 大数据时代的人文社科成果评价变革面临的挑战包括:第一,观念挑战。学术界、管理界和评价界都可能质疑变革,甚至阻碍变革,改变现有人文社科学术评价的原有理念,使之顺应大数据时代的发展要求,应是推行变革的一大难点。第二,执行挑战。变革既需要管理部门的有力支持,也需要实践部门的积极配合,要使各方放弃个人主义、本位主义、地方主义,积极参与变革,贡献出各方所掌握的数据和方法等资源,必须有效协调各方利益。第三,技术挑战。虽然信息技术的发展为变革带来了意想不到的便利,但收集整合不同来源、类型的评价数据,仍面临较大的技术难题。第四,隐私安全在挑战。人文社科学术成果评价的大数据中存在着许多可能威胁个人隐私安全的信息,如个人兴趣、经历、联系方式等,在变革过程中如何应对个人隐私安全威胁,也必须予以重视。 4 结语 综上所述,大数据时代开展人文社科学术成果评价的变革,很有可能减轻甚至解决当前评价中的许多棘手问题,得出更为准确、可信、及时的评价结论,进而为人文社会科学带来前所未有的发展面貌。但是我们要认识到,仅针对个别评价要素开展的局部人文社科成果评价变革很难奏效,因为大数据提供的变革思路是崭新的,必须从人文社科成果评价机制着手推进变革才有可能使变革落到实处。同时也不能盲目拥抱大数据时代,走向“用量化手段代替一切评价”的极端,辩证地认识大数据时代评价结论的相对性,警惕风险、扎实推进,是确保人文社科学术成果评价变革取得成功的关键。大数据时代人文社会科学评价改革探析_大数据时代论文
大数据时代人文社会科学评价改革探析_大数据时代论文
下载Doc文档