科技情报研究发展趋势与应用环境分析,本文主要内容关键词为:发展趋势论文,环境论文,科技情报论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[分类号]G350
修回日期:2009-08-04
随着人类信息生产能力的提高,数字化科技文献数据资源成为科学探索和科技创新的重要战略资源,也成为科研环境的基础设施。新环境下,科技情报人员需分析并产出更深入的情报研究成果,探索和开发更先进的分析方法和工具,积极构建支撑科研创造和支持决策的基础设施,实践和改进对综合集成研讨厅体系的情报支撑。通过分析国外重要科技信息机构的战略规划、前瞻项目和专题报告可知,科技情报机构可能要在自身定位、情报方法和技术、情报应用环境等方面作出调整,才能更好地抓住新环境下的发展机遇。
1 机构定位:基于数据计算的科技知识发现与仿真模拟分析中心
当前,传统科学研究方法已发展为在新时空保真度下利用数值计算、数据、信息和网络所进行的知识发现和电子仿真。仿真模拟分析已经成为大气与环境科学、医学与生物学、决策支持等领域的主要研究手段之一。任务导向研究机构设立的典型项目有:美国能源部基于高级计算的科学发现项目、美国国家卫生研究所生物医学信息学研究网络等;科学驱动的试点项目有:地震工程仿真网络、国家虚拟天文台、空间物理和大气研究协同实验室等。
发达国家的国家级科技情报机构,如美国国家医学图书馆(National Library of Medicine,NLM)和韩国科技信息研究院(Korea Institute of Science and Technology Information,KISTI),较早建成公共超级计算平台,为计算密集型和数据密集型的科学研究和决策提供快速、精确、海量的数据处理平台,来支撑知识发现和仿真分析等科研应用,现已经广泛应用在许多领域,如情报分析、武器系统集成模拟、空间物理等应用科学和基础科学研究领域,并用于政府决策支持[1]。
1.1 NLM:集成多种数据进行知识发现
美国NLM支撑了大量生物医学研究的计算和生物信息学的知识发现;研制了可视化虚拟人体项目,为医学教学和科研提供模拟实验平台。其生物技术信息中心作为计算和数据库中心,负责开发和连接大型、长期研究的临床和基因型数据库,并开展跨学科数据分析和集成服务[2]。其长期战略目标之一是“集成生物领域各种卫生信息系统,促进科学发现并加速研究向实践的转化”,并建议:开发能发现临床数据、遗传信息和环境因素间关系的关联数据库;促进先进的电子化生物医学知识及健康记录的开发和利用。
1.2 KISTI:集成多方数据进行仿真分析
KISTI是韩国科技信息界的领头羊:作为国家战略信息分析中心,提供国家战略尖端信息的生产和支撑;作为国家超级计算中心(KSC),建设及运营超级计算基地。KSC作为韩国最大的超级计算资源,为科学研究提供可视化技术并构建超级计算的研究环境;为天文物理、气象学、结构和流体力学、生物学等领域提供模拟和仿真分析[4],如模拟致密天体碰撞和恒星坍塌、运转高分辨率气候模型等。
通过对NLM和KISTI的分析可知,科技情报机构在生产常规性情报研究产品之余,还可向基于数据计算的科技知识发现与仿真分析中心发展,从而为科学研究提供数据增值服务和模拟分析平台。
2 研究方法:数据融合、方法集成进行发现、分析、预见和评价
2.1 利用未来技术分析进行技术预见和危机分析
情报人员的工作,需逐步地从提供有助于理解对手正在做什么的科技情报,延伸到能进行识别对手能作什么的危机分析。美国国防委员会曾发布报告称:国防部需要忧患者或预见者,来探索对手将会如何利用技术来获得破坏美国目标的能力;采用更一致和综合的方法来预言对手将怎样来开发和利用技术。为此,必须通过科技情报来理解对手正在做什么;利用冲突模拟来识别对手未来能做什么;并通过净评估来理解可能的后果[5]。
2008年,欧洲未来技术研究所的Cagnin等多位专家编写了《面向未来的技术分析》(FTA:Future-Oriented Technology Analysis)一书,介绍了FTA研究方法及其在创新政策、决策制定等方面的应用。2004、2006和2008年分别举办了专题研讨会,重点关注FTA对政策和决策制定的影响。FTA日益倾向于综合使用多种分析方法:①国家政府层面开展的FTA活动以大规模技术预见为主;②部门和行业层面的FTA则主要以情景规划和各类基于模型的方法;③企业则往往采取效率更高的趋势外推和一些计量方法,以便能及时应对瞬息万变的市场竞争。
情报分析类方法在充分揭示现有技术状态的基础上,如何更好地与其他方法结合(如创造性方法和模型类方法)来实现对未来技术信息的揭示与分析,将是一个重要的发展趋势。另外,随着科学与技术之间发展演变的加快,如何将基于科技论文的分析与基于专利信息的分析结合起来发掘未来可能的“突破性”技术,也将是情报学的重要研究领域。
2.2 利用综合科技信息的知识发现进行隐性知识关联分析
目前,在科技情报研究领域,基于文献的知识发现方法、跨领域的共现知识关联分析和不同类型信息融合的知识发现基本上代表了这类方法的主要发展趋势。
2.2.1 基于文献的知识发现 在情报研究领域里,利用文献计量方法进行的知识发现可统称为基于文献的知识发现,包括基于相关文献和基于非相关(Disjoint)文献的知识发现。前者考察文献在外部特征和内容上的关联;后者在具有内隐性关联的文献间进行知识发现。
1997年,美国芝加哥大学Swanson教授提出基于非相关文献的知识发现,所得信息具有预测意义。1995年,美国海军研究部Kostoff博士申请了数据库内容结构分析(DT)方法专利,并以此为基础开发出了独特的知识发现方法和技术体系[6]。该方法从间接相关的文献集中确定具有发现潜力和包含创新机遇的信息,挖掘出这些信息与核心文献集间的关联,随后在核心文献集和间接相关的文献集中都引入不同领域的知识进行发现,对实现面向需求的发现具有参考意义。
经过多年的发展,基于文献的知识发现方法具有以下发展趋势:发现对象正由文献主要特征转变为全文献信息,各种聚类和相关性算法等发现技术正不断被改进和发展并更加有效,挖掘结果已主要采用可视化方式来展示,挖掘结果的解读则更多地包括了领域专家[7]。
2.2.2 跨领域的共现知识关联分析 通常所说的共现分析方法,包括共引分析、共词分析以及其他文献特征间的共现。
共引方法自1973年Small提出理论以来,已从单纯的文献本身,延伸到词、著者、期刊等一系列共引关系[8]。Kostoff将文献计量学、计算机辅助分析、专家决策等同共引分析有机结合,将共引分析应用于知识发现并为决策服务。目前,共引分析已成为基于文献的知识发现的主要手段之一。
共词分析已从最初纯粹基于数学指标体系的分析和基于数学模型、空间坐标、网络比较的分析,发展到了新一代综合性DT共词分析。共词分析能更全面地体现文献内部的深层语义,而且将低频共现现象同样列为发掘目标,现主要用于揭示学科领域内部知识结构,或揭示研究主题的成熟度。
开展预见需要跨学科领域的知识,不同学科领域在同一研究主题上的知识跨度或许可用于预测未来知识发展的空白。因此,我们可设计不同学科之间的共现分析方法,实现不同领域知识的融合并建立相关知识的信息链推理,进而有可能发现潜在的或跨学科边界的科技解决方案,可作为预测的前提。
2.2.3 不同类型信息融合的知识发现 科学数据是支撑科技活动的基础资源,也是支撑国家科技创新发展的重要资产和战略资源,对决策的支持作用与科技文献同等重要。美国国家科学基金会(NSF)曾发布报告称:美国在科学和工程领域的领先地位将越来越取决于利用数字化科学数据以及借助复杂的数据挖掘、集成、分析与可视化工具将其转换为信息和知识的能力[9]。2008年,欧洲核物理研究组织在其未来定位中称其未来目标是要将大型强子对撞机实验数据以一种可用格式进行保存和共享。很明显,如果能将基于科学数据的数据挖掘方法和基于科技文献的文本挖掘方法进行有机融合,就能实现更有效的科技预测。
为此,有学者提出了基于形态分析和联合分析的综合分析方法用于技术预测。形态分析法将研究对象分成多个基本属性分别加以分析、提供解决方案,并最终得到问题的解决方案;而联合分析则分析组合的整体反应以评估研究对象的发展变化。由此,可结合两种过程提出基于科学数据与文献数据挖掘的科技预测方法:①从科学或文本数据中,对研究对象进行形态剥离,找出代表该问题领域的形态组合;②利用文献计量方法建立文献数据的属性之间的关联关系,或者利用前述知识发现方法实现初步的知识预见;③对关键形态属性的科学数据进行挖掘,发现单个形态或多种具有关联的形态间未被发现的潜在规则;④将上述②和③的结果融合,找出没有发现的可能的新知识,为进一步预见提供线索。
2.3 构建模型对科技政策进行模拟分析、理解、评价和预见成效
未来科技的发展方向,一方面以满足社会经济需求、解决社会问题为导向;另一方面为了占据科技优势,追求高风险、突破性研究的新进展。因此,科技预见方法既需具备由需求和问题引导的、对未来科技需求的发掘功能,又要具有突破性知识的发现功能。
美国NSF的SBE委员会曾提出科学与创新政策学项目,对科研投入的收益进行评价,并且全面考虑可能结果,在允许的误差范围内预测将来科研投入的回报[10]。NSF“创新的高级评价指标”工作组探索了创新相关的数据及研究,希望在政策背景、资源和条件限制等方面找到与创新相关的新型数据,探索数据开发的优先领域和策略,促进跨学科的多来源数据的开发研究工作[11]。法国国立科技与管理学院的学者介绍了欧洲科技情报指标平台中用于多学科研究评价的定位指标。该指标既可用于充分理解、洞察科学与创新系统的工作方法,也可用于科学系统的评价或者子系统分析,即瓶颈分析[12]。分析发现,现有情报研究理论与方法的拓展,可为上述任务的完成提供支撑。
不难看出,未来情报研究方法将向着融合多种数据、集成多种方法进行发现、分析、预见和评价的方向发展。相应的,科技情报人员需调整研究思路,开展识别所跟踪对象能做什么的危机分析;将针对科学数据和科技文献的数据挖掘有机融合,开展更有效的科技预测;关注各种科技政策评价模型的发展和应用,从跨学科、多来源数据中挖掘突破性研究点来支撑创新型科研活动。
3 应用环境:集成支撑科研创造和科学化 知情决策的基础设施
科技的发展越来越重视高风险、突破性研究,促使科研创新受到了管理者和研究者的空前重视;在医学领域起源并获得成功应用和发展的循证决策与实践(EBPP),逐渐在英国等国家被包括科技决策研究领域在内的其他领域所采纳;国内多个机构建设的综合集成研讨厅体系作为高级决策支持系统也得到了越来越广泛的应用,这都对科技情报研究提出了新的要求。从情报学的视角出发,如何适应这些新型应用环境,更好地发挥科技情报应有的作用,将是情报学在创新环境下面临的重要课题。
3.1 支撑科研创造过程的基础设施
创造性环境可被看做一个支撑人类创造过程的计算工具,是学术界、科学创造的重要基础设施。2008年,欧洲核物理研究组织发布宣言称希望建造一个超级科学情报系统,提供现有情报系统的所有功能并成为电子化研究基础设施,能评价各个国家和机构的科学产出、自动侦测文章主题、自动筛选同行评议文章等,并能获取大规模可计算数据。波兰学者将科学研究的创造性环境划分为五个功能模块,提出了创造性环境的一般模型[13]:①个人工作区模块;②信息检索模块,能提供关键短语抽取代理、自适应启发式代理和思考代理等检索代理服务;③群组交流模块,能支持虚拟研讨会;④规划和路线图模块,能与用户的个人工作模块协同;⑤实验模块,包括完成虚拟实验和实验结果统计分析两种组件。
有效支持创造性科研环境将是情报学未来重点关注的内容之一,特别是如何为创造性研究提供预见、如何嵌入相应模块等。比如,在信息检索模块嵌入前沿分析功能,在规划和路线图模块嵌入演化分析和知识发现功能,在实验模块嵌入模拟试验环境等科学信息学分析模块。
3.2 集成支撑知情决策的基础设施
源自医学领域的EBPP已经向各个领域辐射,并引起了科技决策研究机构的极大兴趣。2008年,荷兰召开的循证决策国际会议中不乏科技决策研究机构的学者。在政策研究领域,EBPP于1999年首次出现在英国的现代管理中,英国经济和社会研究理事会已建立了社会科学循证评价网络。2000年成立的Campbell国际协作网络是EBPP的一个典型实例。该网建有社会、心理、教育与犯罪对照试验注册资料库,是该领域最集中的干预试验证据的资料库,并不断得到补充和发展。在健康和社会问题交织的领域,对证据的整体性理解对知情决策的支撑显得尤其重要。
为科技决策提供依据的科技情报研究需把握趋势,认真思索自身所应发挥的作用。但是,由于医学与社会科学的研究方法有差异,循证情报研究的理论和方法仍有待进一步研究和实践。
3.3 支撑综合集成的研讨厅体系
近些年来,国内多个科研机构建设了“综合集成研讨厅体系”(HWME),这成为科技情报研究应用的新环境。集成研讨厅是用于复杂决策问题求解的高级决策支持系统,起源于钱学森先生提出的系统工程并首先成功用于航天领域。后来,戴汝为院士以此为基础研究了“基于信息空间的从定性到定量的综合集成研讨厅体系”(CWME)。CWME是一种由专家体系、机器体系、知识体系三者共同构成的支持复杂问题决策的虚拟空间,其中也包含对科研创造和知情决策的支持。汶川地震后,中国科学院遥感所龚建华研究员利用虚拟地理研讨厅,结合卫星、航空遥感、虚拟地理环境等技术,在堰塞湖问题的处理上发挥了重要作用[14]。2009年,装备指挥技术学院李元左教授介绍了“空间军事系统研讨厅”的研究实践成果[15]。另外,中国科学院国家科学图书馆开发了“战略情报集成研讨厅”,采用先进的情报研究工具和方法,如科学结构演化分析、科技情报共享平台等,集成多种分析工具并行操作,能实现多角度专家交互研讨、多渠道内容有机实时聚合以及多专家即时合作写作等功能。由此可见,科技情报研究如何有力地支撑综合集成的研讨厅体系这种新生决策支持系统,也应成为今后科技情报界研究的一个方向。
4 结论与展望
综上所述,科技情报研究机构在机构定位、情报研究方法和技术、情报应用环境等方面面临着许多挑战和机遇。在机构定位方面,科技情报机构需加强自身集成多种数据进行知识发现和集成多方数据进行模拟仿真分析的能力;在情报研究方法和技术方面,越来越依靠融合多种数据、集成多种方法进行发现和预见,需关注未来技术分析和综合科技信息的知识发现;在科技情报应用环境方面,创造性科研、循证决策、综合集成研讨厅体系等应用环境需得到特别的关注。总之,应对好新的挑战就意味着把握住了新的机遇,只要广大科技情报研究人员积极地探索和实践,必定能使科技情报研究与服务更好地发挥决策支持的作用。