基于科研项目数据的科技前沿识别有效路径实证探索论文

基于科研项目数据的科技前沿识别有效路径实证探索

张 婧1,刘彦君1,张 炜1,李 荣1,李梦辉1,贠 强2,石永亮3

(1.北京市科学技术情报研究所,北京 100044;2.中国科学技术信息研究所,北京 100038;3.北京理工大学,北京 100081)

摘要: 以科技创新型国家重大科研项目数据资源归集为基础,通过实证从项目所属科研计划、项目名称及关键词、项目摘要三个方面探索基于科研项目数据的科技前沿识别有效路径。认为科研计划、项目名称、关键词、摘要等一定程度上揭示项目内容的数据字段在科技前沿识别方面可以发挥作用,但存在数据字段缺失、数据规范性不足、杂质较多,识别方法工具待改进等问题,并提出以全球科技创新型国家重大科研项目数据库为基础的宏观、中观、微观组合式前沿识别路径。

关键词: 全球科技创新型国家;重大科研项目数据;科技前沿识别;路径

如何科学、准确、快速地从海量科技数据中识别、追踪科技前沿,及时把握其发展趋势,以服务于科技创新与科技决策,已经成为科技情报研究人员关注的焦点。世界科技创新型国家的科技计划、最新资助的科技项目等战略投资重点领域作为这些科技强国政府、主流科技共同体和决策者的所思、所想、所为,代表了国际科技发展趋势,一定程度上能直接反映国际科技前沿领域或科技前沿主题[1]。因此,归集重大科研项目数据资源、探索重大科研项目数据的有效利用,揭示其蕴含的前瞻科技前沿主题,对于以“创新驱动,情报先行”为科技部门、创新企业做好“耳目、尖兵、参谋”,助力科学规划部署、角逐科技创新、抢占创新制高点有着及其重要的意义。

1国内相关研究现状

科技数据和科技文献既是科技交流的主要信息源,也是记录着科学技术研究、发展演化的历史性文件。大数据时代,这些记录越来越多地以数据库形式被规范记录、开放共享、便捷利用,最常见的包括科技论文数据库、专利数据库、科技项目数据库等等,这些海量记录中隐含着不同时期科技热点、前沿及发展趋势等主题信息。此前,国内已有大量专家学者利用科技论文、专利数据库以论文、专利数据为基础开展科技前沿识别及知识图谱构建研究,提出了了许多卓有成效的理论与方法,但探索利用科研项目数据识别科技前沿的相关研究相对不多:

王飞等[2]以1997—2015年国家社会科学基金统计学所立项目对应成果论文来研究热点及研究前沿的演化;刘小平等[1]指出国际科技前沿是世界科技强国的科技规划、战略、路线图、资助机构通过各类计划、项目最新资助的战略投资重点领域,探讨科技前沿的分析方法、实施途径、获取信息的渠道;静发冲等[3]对美国国家科学基金会生物科学部新兴前沿科学处的在研项目摘要进行K-Means文本聚类归纳主要研究主题;李广建等[4]以近五年我国国家社会科学基金项目中的情报学项目数据为基础,通过人工判读以内容分析法和对比分析法对项目的主题分布、热点分布、研究侧面、研究背景等方面进行分析;白如江等[5]通过对科技规划文本和基金项目数据文本两种不同数据源中蕴含的科学研究前沿主题相似度对比分析,采用新兴度和热点度两个指标,识别出新兴研究前沿主题和热点研究主题两类科学研究前沿主题,进而揭示出前沿领域竞争态势;孙晓玲等[6]利用我国国家自然科学基金资助项目的论文成果用基于层次 Dirichlet过程模型和主题相似度映射算法,分析研究前沿主题的时序演化;王效岳等[7]以 NSF 资助的碳纳米管研究领域基金项目数据为研究对象,利用 PLDA 模型以及主题的资助时间、资助金额和中心性指标进行研究前沿主题探测。

测绳、电测水位计、超声波探头等手段是绕坝渗流监测中常用的人工比测手段。测绳测量受水的表面张力影响水沿测绳孔壁上升,对测量精度有一定影响。电测水位计的缺点主要为无法校核孔深,从而影响计算水压力的精度。超声波探头可以测量水深外还能测量孔内流速,且精度较高,达到10-6精度等级,其主要缺点除受孔径影响外,还受到输送电线路电波、磁场、环境扰动等影响较大。实际操作中220KV输电线下,孔深35米,测值频率为50.01赫兹,呈正玄波变化。本工程因受输水管道、隧洞及输电线路影响无法开展超声波探头测量。

可以发现,近年来,国内研究者开始探索利用基金项目数据进行前沿识别研究,但所利用的数据源较为单一,以我国和美国国家科学基金项目数据为主,较少系统、大规模地搜集项目数据资源,分析数据特征,构建相关支撑数据库并利用数据,在识别研究主题方面也以具体的算法研究为主,少有人以全球开放项目数据资源为基础总结分析前沿识别路径。因此,本文尝试以科技创新型国家重大科研项目数据资源归集为基础探索基于科研项目数据的科技前沿识别有效路径。

设计SPWM软件算法时,通过控制调制度M的大小就可达到控制输出电压大小目的。理论上该参数取值在0~1之间,由于器件极限参数的影响,实际调试中发现M值最大为0.95。假设变频器输出电压为U,补偿电压为Ua,输出频率为f2,异步电动机额定电压UN为380 V,额定频率fN为50 Hz,调制度M计算式为:

2科技创新型国家重大科研项目数据资源归集

数据资源归集是以数据资源为基础的科学研究和科技情报工作的首要环节。只有充分掌握数据资源的获取渠道和具体状况,才能更好地分析、应用数据。

在各科技创新型国家政府机构网站、相关文献资料中查找、筛选重大科研项目信息源,我们最终选定美、英、法、德、日、韩、以色列以及欧盟所属的17个权威、高质的开放项目数据库作为数据来源,包括美国国家科学基金会项目数据库、联邦资助项目数据库、能源部先进计划署项目数据库、国立卫生研究院资助项目数据库、环境保护署资助项目数据库,英国研究理事会所属项目数据库,法国国家机构研究项目库,德国、韩国、以色列科学基金会项目库、日本科学研究资助数据库KAKEN等(如图1所示),这些数据库收录各科技创新型国家政府及政府部门资助支持的立项科研项目信息,例如美国政府的“振兴制造业”战略、“美国创新战略”、欧盟的“地平线2020”、日本的“i-Japan战略2015”、德国的“工业4.0”战略等。

选定信息源后,需通过细致调查对各信息源的数据来源、数据量、数据字段、覆盖时间范围、检索方法、更新时间等数据内容、使用方式方面信息进行采集、归纳、整理、记录,并比较分析各信息源数据的整体特征、比较特征,为进一步数据利用和分析做准备。各信息源数据内容各不相同,例如美国NIH项目库(Research Portfolio Online Reporting Tools,RePORT)收录了1985至今由NIH支持、历来所属30多个研究机构/中心管理的共计约160多万项生物医药相关科研项目数据,提供项目编号、项目标题、项目关键词、项目摘要、项目负责人、项目承担机构、项目开始日期、项目结束日期、NIH花费类目、研究领域、财政年度、资助机构、相关声明、子项目-项目ID、项目出版物、项目专利等72个数据字段;而美国交通部The USDOT Research Hub项目库则收录交通部及下属机构支持的5千余项科研项目数据,提供项目名称、项目链接、摘要、资助机构、管理机构、执行机构、计划/规划、项目状态、项目资金、项目开始时间、项目结束时间、项目报告的链接、项目成果综述、子项目等34个数据字段。

总体来说,美国国家科学基金会对机器人的基础研究资助重点集中在自然语言处理、医疗环境下机器人精细操作、视觉和感知、外骨骼与假肢等辅助机器人、纳米级协同操作机器人、腿式机器人等方面。

图 1科技创新型国家重大科研项目信息源

经调查和比较分析可发现,尽管各信息源数据内容不统一、数据语种多样化,但在数据内容构成方面可大致分为三个方面:一是基本信息,即基本所有信息源均提供的项目数据字段,包括项目名称、项目摘要、项目负责人、项目承担机构、项目经费额度、项目起止时间等;二是项目附加信息,即部分信息源提供的项目详细信息,包括项目所属科研计划、项目所属学科领域、项目管理部门、立项年度、项目资助类型等;三是项目扩展信息,即部分信息源提供的项目成果信息,包括项目产生的专利、报告、论文等信息。

3基于重大科研项目数据的科技前沿识别路径探索与实证研究

3.1 基于重大科研项目数据的科技前沿识别策略设计

以科技论文为语料的定量化前沿识别一般利用引文关系(高被引、耦合、共被引)和词汇关系(高频词、共词分析),同理,理想状况下项目数据也可利用项目间的引用、承接关系和揭示项目内容的词汇关系。通过前文科技创新型国家重大科研项目数据资源归集可以发现,尽管和一般用来识别研究前沿的论文数据相比,项目数据的内容更加繁多、细致,但比较少有揭示项目间关系的数据字段,揭示项目内容的数据字段同科技文献类似,主要是项目名称、关键词、摘要以及部分信息源提供的科研计划、资助类型等字段, 因此,本文主要考虑从词汇关系(高频词、共词分析)来探索利用科研计划、项目名称、关键词、摘要等字段识别科技前沿:

(1)基于项目名称及关键词识别科技前沿。同文献数据类似,项目标题是项目总体内容的体现,体现项目开展的意图、主旨以及亮点,关键词则选用对表述项目中心内容有实质意义的主题概念,因此,析取领域内一定数量的近期项目数据的标题、关键词中的关键词组,进行频次统计,找出高频关键词组以及词间关联,能发现领域近期研究热点和趋势作为科技前沿主题。

(2)基于项目摘要识别科技前沿。同文献数据类似,项目摘要信息会对项目研究目标、研究方法等进行简要概括,甚至会预期研究结果、成果、效益。析取相关领域一定数量的文献摘要信息中的关键词组,继而进行频次统计、共现分析有助于挖掘领域研究热点,基于科技创新型国家科学基金项目自身所具备的先导性、前瞻性,我们可以将由项目摘要信息挖掘的研究热点视为科技前沿主题。

在工程项目管理当中应用价值工程分析方法,可以将其作为整体系统,对项目进行功能性分析,还可以创造和评价方案,详细分析用户所需功能。因此,从某种意义上看,价值工程得本质在于采用低成本获得高性能的建设项目。其次,价值工程主要在于功能性分析,所以在项目具体实施期间需要全面分析工程的功能性。由于价值工程借助集体智慧实现,所以属于一项具备领导组织的活动。

2011年美国推出“美国国家机器人计划(National Robotics Initiative, NRI)”,以国家科学基金会作为领头单位,联合国立卫生研究院、联合国立卫生研究院(NIH)、国家航空航天局(NASA)、农业部(USDA)、国防部(DOD)、能源部(DOE)等政府机构共同实施,来“建立美国在下一代机器人技术及应用方面的领先地位”。2017年,美国又发布了“美国国家机器人计划2.0(NRI-2.0)”来替代之前的计划。本文搜集选取NRI计划所支持的项目数据,尝试识别美国国家科学基金会机器人研究前沿,将项目数据格式转换成Vosviewer支持的WOS文本数据格式,利用Vosviewer的Abstract字段数据处理功能对选取的项目摘要数据进行内容分析(分词处理、虚词清洗)和结果网络可视化模式展示(图6所示)。

3.2 基于重大科研项目数据的科技前沿识别实证研究

3.2.1 基于项目名称及关键词识别金属锂研究前沿

有些汽车上台检测,几次检测数值出入较大,这是因为踩制动踏板的方式不同,一脚踩到底与缓慢踩或一脚点一脚刹,得出的数值是不一样的,这是由于以下几个因素:

金属锂被发现至今已长达两个世纪,它及其化合物因特殊属性和作用已被广泛应用于人类生活的方方面面,例如锂对造血功能、中枢神经活动的作用,优质能源锂电池,锂在玻璃陶瓷工业中的运用等等。本文尝试以金属锂为主题,于项目名称及关键词识别金属锂研究前沿。

在项目资源库中检索金属锂相关项目,得到近期相关项目共计2 428项(如表1所示),利用TDA(Thomson Data Analyzer)工具自定义导入数据,用TDA的自然语言处理对项目名称、关键词进行分词、人工清洗、高频词统计以及关键词共现分析。

治理酒托乱象,除了打击站在最前面的酒托,还不能遗漏幕后操纵者。如果忽略了更可恶的主使者,就难以遏制酒托乱象。

通过物理斜面模型与岩质边坡受力分析,发现高中物理模型受力分析与岩质边坡受力特征非常相似;尤其是边坡滑动时,物理斜面模型与岩质边坡受力特征一致,斜面摩擦力与岩质边坡下滑粘结力计算方法一致,所以岩质边坡受力特征可以用物理斜面模型代替;

表 1金属锂相关项目数量国别分布

(1)美国。美国金属锂相关项目资助机构主要分布在国立卫生研究院、中小企业管理局、国家科学基金会以及能源部先进研究计划署(如图2所示)。

图 2美国金属锂相关项目资助来源分布

对各机构资助项目进行关键词词频统计、共现分析,对于没有关键词的项目数据以标题分词、虚词清理后结果代替关键词,得到项目高频关键词(见表2)和关键词共现图谱(如图3所示)。

表 2美国三个机构资助金属锂相关项目高频关键词

图 3美国三个机构资助金属锂相关项目关键词共现图谱

经领域专家结合项目原始数据对共现图谱进行主题判读发现,美国国立卫生研究院作为医学与行为学研究机构,资助的金属锂相关项目主要围绕锂用于情感性精神障碍(例如双相型障碍BIPOLAR DISORDER、双极性疾病BIPOLAR ILLNESS、双极II抑郁症bipolar II Depression、躁狂症MANIA、攻击性行为障碍AGGRESSIVE CONDUCT DISORDER、耐锂型双相情感障碍患者LITHIUM-REFRACTORY BIPOLAR PATIENTS等)的治疗(选择性5羟色胺再吸收抑制剂SSRI、胆碱能活性CHOLINERGIC ACTIVITY、LITHIUM PROPHYLAXIS锂的预防、治疗Treatment等)以及影响(钠锂逆向转运Sodium-Lithium Counter transport、影响INFLUENCE、lithium Effects、LITHIUM ACTION、分子机制MOLECULAR MECHANISM等)开展研究。

美国国家科学基金会的金属锂相关项目支持层次很明显,既有偏基础的研究,也有重点应用(锂离子电池)的研究,还有电池里最关键的电极材料的研究:(1)锂(lithium)集群:研究项目主要集中在锂元素、锂同位素、应用、制备、锂电池、锂铝合金、锂硼合金、Quantum gases等方面;(2)锂离子电池(lithium-ion batteries)集群:研究项目基本集中在锂离子电池机制(电子迁移)、降低电池成本、电池的应用领域、电池动力学优化,model reformulation等方面;(3)锂离子电池电极(lithium ion battery electrodes)集群:研究项目主要集中在电极、计算机模拟、锂卡宾、电极结构、材料合成、可替代材料等方面。

美国中小企业管理局金属锂相关项目更偏工程化和应用性,应用研究侧重卫星、无人机电源等。知识图谱上三个较大的集群中,第一组(low Cost、lightweight、High Rate 、Rapid、rechargeable Lithium-ion Batteries、Nano-Engineered Anode Materials、High Energy Density Lithium-ion Batteries),重点在电池的轻量化、低成本、高效率、高能量密度、充放电速度,还有纳米阳极材料等方面;第二组(Novel、development、Thin Film Lithium-ion Battery Technology、Naval Aircraft Applications、Durable Lithium-ion Battery 、Large-Format Lithium lon Batteries、Aircraft、Safe),主要集中在航空、海军等方面的应用,以及大规格锂电池等新型电池的研发方面;词量最大的这组(Ultra-lightweight Lithium Air Battery、Unmanned Air Vehicles、Low Temperature Performance、Deep Discharges、Lithium-lon Batteries、Ultra capacitors Hybrid、Satellite Power、Useful Remaining Life、SBIR Program、Phase),主要集中在深度放电、可用寿命、低温性能、材料相变、超轻锂-空气电池、超级电容混用等方面。

美国能源部先进研究计划署资助金属锂相关项目共计12项,项目承担机构和名称如表3所示。

表 3美国能源部先进研究计划署资助金属锂相关项目

(3)外骨骼与假肢等辅助机器人相关群组(绿色): device、controller、locomotion、safety、exoskeleton、life、quality、effect、assistive robot、daily living、stability、individual、mobility、next generation、injury、advancement、stroke、prosthesis。

(2)欧盟。用同样的思路方法对欧盟资助的金属锂相关项目绘制关键词共现图谱(见图4),由专家判读发现,欧盟的项目可聚合为3个大类:一类是锂离子电池集群(Lithium-ion batteries、Energy、Silicon Anodes、development、Application、electric vehicles、lithium-carbon-liquid electrolyte battery system),相关项目主要围绕电动汽车、开发、应用、硅系阳极材料、锂碳液体电解质电池体系等方面进行研发;第二类聚合物锂电池集群(Lithium/polymer batteries、recycling、tracer、electrochemical energy storage),项目主要围绕锂元素、循环、示踪、电化学储能等方面;第三类则为锂空气电池(lithium-Air Batteries)。

采用SPSS 22.0软件分析数据,在具体处理数据期间,计量资料予以t值检验,x2检验计数资料,组间差异经P值判定。

图 4欧盟资助的金属锂相关项目关键词共现图谱

(3)英国。英国研究理事会资助的金属锂相关研究项目可聚合为5个大类(如图5所示): 1)锂电池集群,主要围绕材料、数学分析、纳米结构电化学体系、太阳能电池等;2)锂硫电池集群,主要围绕阳极保护、氧化还原介质;3)铌钽酸锂固体电解质集群,主要围绕晶体学、极性材料、新型的、特性等方面;4)有机锂化合物集群,主要围绕芳基化反应的立体选择性、合成、结构分析等;5)实用化锂空气电池。

图 5英国研究理事会资助的金属锂相关项目关键词共现图谱

(4)法国。法国国家机构资助金属锂相关项目数量较少,共计12项(见表4)。通过对项目名称内容进行理解分析可以发现,法国非常重视纳米技术在锂离子电池上的应用,3个项目(1/4)与此相关。另外,锂硫电池、锂-空气电池等下一代锂电池也是研发的重点。

表 4法国国家机构资助金属锂相关项目

表4(续)

美国国家科学基金会交叉学科资助计划分为四种:一是人才培养类计划,把相关领域的科学家汇聚到一起,开展不同学科之间的交流与合作,将研究队伍建设和人才培养紧密结合;二是科研基础设施建设类计划,资助科学技术中心(STC)、学习科学中心、工程研究中心等研究基地的建设;三是科学家自主选题类计划;四是对围绕国家利益的领域的资助计划,是在组织交叉学科研究时紧密围绕国家优先发展领域,把许多传统学科的发展方向全面推向瞄准那些对国家重要的综合性问题,紧密围绕国家目标开展基础性研究。在美国国家科学基金会科技计划数据中检索近十年标题、摘要中出现“interdisciplinary”的科研计划,根据计划名称、摘要内容进行筛选,删除人才培养、科研基础设施建设等非科学研究类资助计划(见表6)。

表 5以色列科学基金会资助金属锂相关项目

3.2.2 基于项目摘要识别美国国家科学基金会机器人研究前沿

(3)基于项目所属科研计划识别科技前沿。许多政府基金资助机构每年会发布研究计划( Program)来征集研究者提交的研究项目( Project) 申请。某一研究计划的制定一般可代表该领域当前研究前沿或热点,或重点关注的领域和亟需解决的问题,因此应用好项目研究计划数据对掌握某一研究领域所关注的重点、凝练前沿方向具有重要的参考价值。

图 6美国国家科学基金会机器人研究项目摘要关键词共现图谱

Vosviewer网络可视化模式下,不同的主题群组由不同的颜色区分。由领域专家结合项目标题、关键词、摘要等原始数据对图谱的不同群组主题进行判读,可以发现:

(1)自然语言处理相关群组(红色): structure、representation、efficiency、mapping、language、complex environment、natural language、agent、accuracy、underrepresented group、limitation、open source、multiple level、abstraction、educator、reliability、inspection、bridge、quadrotor。

这部分相关研究重点主要是自然语言处理(natural language),不仅仅是传统的表面语义理解,还要更接近人类交互的抽象感情理解。总体上是提高机器人在复杂环境(complex environment)下多层次(multiple level)认知、表达和交互能力,提高机器人对抽象层事物、语言、情感等的认知判断能力,使之更接近人的交互习惯和思维方式,机器人的认知水平的提高有利于促进机器人服务或者执行其他任务过程中的工作效率。多层次就是环境感知,环境语义理解,抽象层的感情认知理解。映射(mapping)就是指人类语言向计算机语言的映射,也是自然语言处理的目的。教育(educator)是交互性、认知水平提高的应用方向。四旋翼(quadrotor)只是一种机器人平台,这部分的研究内容主要是偏软件部分,可应用于任何机器人平台。

(2)医疗环境下机器人精细操作相关群组(蓝色):Manipulation、Uncertainty、control algorithm、hardware、deformable object、robotic manipulation、belief space planning、frictional contact、undergraduate、csa(complementary situational awareness)、surgery、slam、future、unstructured environment、exploration、patient。

综上所述,要想不断提升航空服务人员亲和力,就需要对其亲和力重要性有更深层次的了解,并不断对自我进行完善,提升基本功。此外,在航空服务工作中,工作人员的微笑服务可以提升我国航空服务人员的亲和力,进而提高我国航空服务质量,促进我国航空业持续健康地发展。

这部分相关研究主要是以医疗环境下(复杂环境)机器人精细操作为特定背景,展开与其相应的控制、定位、操作算法研究,尤其强调对可变形物体的操作算法研究。医疗过程中的操作,除了要操作骨骼等固定形态的物体,更多的是操作一些可变形物体(deformable object),机器人对不确定形态的物体的状态跟踪及操作难度以及对应的控制算法(control algorithm)是解决手术机器人的核心问题;操作过程中,机器人根据执行器与物体的摩擦接触(frictional contact)判断力度等信息,通过belief space planning估计机器人相对于物体的抽象状态,对机器人进一步的作业进行姿态和力度调整;slam(simultaneous localization and mapping)主要用于环境重构和定位,由此来判断机器人所处环境的基本结构和机器人相对于环境所处的位置。

美国能源部先进研究计划署只投资和关注那些有可能对美国能源现状产生巨大影响的革命性能源技术。从项目列表来看,美国能源部先进研究计划署的项目主要瞄准下一代锂电池进行研发,针对安全性差、能量密度低和成本高等现有锂离子电池体系的限制和不足实现重点突破,例如安全性更好的水性电解质体系,能够同时提高安全性和能量密度的固态大尺寸锂电池;具有更高能力密度和更低成本的新一代锂硫电池等等,具有较强的前瞻性。

(6)腿式机器人相关群组(黄色):contact、terrain、frictional contact、intent、physic、machine learning、sequence、ground、legged robot、sequence、risk、computer。这个群组的关键词主要体现出美国对于腿式机器人的研究投入。地形对于机器人的限制是巨大的,腿式机器人与地面的接触面积小,可以更好的适应多样地面环境,为了能够适应物理条件艰苦的作业环境,规避踩空摔倒等对机器人造成损伤的风险,其控制系统的复杂程度就不得不提高。控制序列需要经过复杂的算法公式演算得出。随着机器学习在计算机领域的成功运用,现在的腿式机器人也开始尝试将机器学习算法(更准确地说是深度学习和强化学习算法)加入到控制系统中,从而提高机器人应对复杂地形的泛化能力。

(4)机器人核心技术相关群组(淡蓝色):operator、sensing、wide range、communication、real time、vision。

叶晓晓不信邪,找到了舅舅,长航分给她爸爸的房子就被他家住着,多少年一分钱的房租都没有给,更没有半点还房子的意思。她想,这回家里有事,他总不至于袖手旁观吧。

操作员(operator)负责控制机器人并接受机器人反馈信息,这一过程被称为交流(communication)。控制机器人不仅需要操作员(operator)输入指令还需要从通过机器人携带的传感器感知(sensing)外部环境信息(如障碍分布、光照、红外、温度等)和自身信息(如机械臂的姿态、里程计等)。在这一过程中,一类很重要的信息类型是视觉(vision),典型的与人(operator)交流的视觉信息之一是机器人的人机交互界面,机器人对外界的感知(sensing)中视觉也占了很大一部分。机器人与人交互和感知信息的方式越来越多样化(wide range)。不论是感知(sensing)还是操作员(operator)与机器人的交流(communication)都要求保证实时性(real-time)。

从这些关键词可以看出,当前美国在机器人学科研究的重点主要是视觉(vision)和感知(sensing)。机器人各种复杂功能的实现与智能化依赖于对外界和自身信息的有效感知,机器人的感知是机器人技术发展的重要一环,其中视觉由于具有采集方便、信息丰富、造价便宜等特点正在机器人的信息来源中扮演着越来越重要的角色。

(5)纳米级协同操作机器人相关群组(紫色):movement、skill、material、assistance、nanorobot、side、instrument、collaborative robot、infant。

随着纳米材料和纳米技术的不断发展及对其在机器人领域应用的更深入研究,机器人工程学提出纳米机器人这种新兴科技,即在纳米尺度上应用生物学原理及相关仪器,发现新现象,研制可编程的分子机器人。这种机器人的最初一代需具备完善的移动功能,在另一方面,由于单一纳米机器人难以完成复杂任务,机器人之间需具备协助能力。因此,研究纳米级协同操作机器人技术将成为未来机器人研究领域的主流。

这部分相关研究主要是通过外骨骼与假肢等辅助机器人设备,提高中风偏瘫或脊柱损伤个体的机动性,提高患者的生活质量。该类辅助设备通过手持或反馈控制器辅助患者行走,解决日常生活中行动障碍患者的行走问题,同时可作为康复设备。运动中的安全、康复效果、稳定性是评价设备优劣的关键点。随着人工智能与机器人技术的发展,该类智能设备势必成为下一代康复辅助器械的中流砥柱。

继电保护系统可靠性评估时,应考虑到隐性故障因素,并对继电保护系统总体能效进行衡量。其中,在分析继电保护系统靠性模型的过程中,也可借助概率模型计算法,让继电保护系统通过自检处发现隐性故障。同时,增加继电保护系统隐性故障预警功能,从根本上降低隐性故障发生几率。

在博士学位论文采访中,绝大部分博士论文在学位授予一年内会送缴至国家图书馆,而缺缴的博士论文中也会有部分论文在随后1~2年中补缴至国家图书馆。而来华留学生博士论文如果在授予一年内未送缴至国家图书馆,随后时间也很难进行补藏。

3.2.3 基于项目所属科研计划识别美国交叉学科基础研究前沿

交叉学科研究( Interdisciplinary research,IDR),据2004年美国国家科学院、国家工程院以及国家卫生研究院发表的《促进跨学科研究的报告》中的界定,是指整合两门或者多门以上学科或专业知识领域中的信息、数据、技术、工具、视角、概念或理论,来加强基础性理解或者解决某一学科或领域内不能解决的问题。随着科学技术的发展和知识体系的分化、联系、渗透、融合,打破孤立、纵深的传统思维,综合多学科思想和方法的交叉学科研究作为人类认识自然和社会能力不断增强的必然产物已成为一种新的趋势,各科技创新型国家政府、科研机构等也均将交叉学科研究放在重要的战略位置。

科技史上,科学前沿的很多重大突破得益于学科交叉融合,学科交叉点本身往往就是科学新的生长点、新的科学前沿。美国国家科学基金会对学科交叉研究的资助有明确的指导思想和系统的实施计划[8],对跟踪世界交叉学科研究的发展、把握国际研究前沿具有重要的参考价值,因此,本文选取美国国家科学基金会交叉学科资助计划数据探索前沿分析。

(5)以色列。以色列科学基金会资助金属锂相关项目7项,通过标题阅读可以发现,跟锂电池相关的有2个,都瞄准了下一代锂电池,即锂硫电池和锂-空气电池(见表5)。

因科技计划类数据量较小,我们主要通过领域专家人工判读方式解读科技计划中蕴含的主要科技主题和方向。可以发现,美国国家科学基金会学科交叉类科学研究资助计划数量呈逐年增加趋势,虽然每年美国国家科学基金会对交叉学科研究的资助方向随时代发展和科技需求变化而变化,但基本上主要围绕大数据应用、神经认知、智能系统、高能效计算、创新等战略性研究方向来开展交叉学科研究资助。

表 6美国国家科学基金会近 10年学科交叉领域科学 研究类资助计划(节选示例)

4结论、不足和展望

通过前文从词汇关系探索利用科研计划、项目名称、关键词、摘要等重大科研项目数据字段识别科技前沿的实例可以发现:

(1)这些一定程度上揭示项目内容的数据字段在科技前沿识别方面可以发挥一定作用。项目所属的研究计划数据揭示的热点和前沿较为宏观,理论上能对监测大范围甚至整个科学研究领域的内部知识结构演变提供有价值的参考;通过项目名称、关键词以及摘要识别的科技前沿相较研究计划数据而言能更直观揭示研究领域和主题的内容特征,但与论文识别出的前沿相比不会针对某些具体问题。总体来说在识别的热点、前沿主题粒度方面,科技计划数据>项目数据>论文数据。

(2)项目研究计划数据的搜集和利用尚待进一步加强。一方面,前文我们归集的数据资源中,仅有美国的科研项目信息源提供项目所属研究计划数据,其他国家科技项目数据未提供相关字段;另一方面项目研究计划数据相对项目数据、项目成果数据数量较少,单独使用项目研究计划数据来以计量方法来探索科技热点、前沿主题的识别较为困难,由此前文的实例仅仅通过人工筛选、专家判读来利用研究计划数据,主观性较强。在后面的探索研究中,不论是研究计划数据资源的搜集发现统筹方面,还是数据分析利用方法方面都有待进一步加强,例如在现有的专家判读科技计划热点主题的同时考虑引入科技计划的资助金额、支撑项目数量等来量化科技计划的重要程度。

第五步:利用各省(自治区、直辖市)水资源保护状况评价的综合得分进行排序,见图1。子系统A、B和C的排序,见图2、图3和图4。

(3)项目的关键词、题名、摘要信息相对学术论文、专利等成果性数据有所欠缺,有碍于科技前沿识别。在基于项目名称、关键词和摘要识别路径下我们的实例采用了传统基于科技论文识别热点前沿所利用的方法和工具,尽管得到了可供凝练前沿参考的有价值的信息,但实际试验中仍存在较多问题:

1)项目的关键词、摘要信息相对学术论文规范度、严谨性稍有欠缺,尤其摘要信息,相对随意性较强,选定的科技领域相对集中、专业的情况下,通过摘要识别科技前沿是可行的,但选定的科技领域范围宽泛的情况下难以识别。我们曾选取美国国家科学基金会新兴前沿研究和创新研究计划项目数据通过摘要进行共词分析,结果无法识别。

试卷共分两部分,第一部分为单项选择题,共25小题,每题2分,共50分;第二部分为非选择题,共8小题,共50分。考查分值所占比例较高的章节有: 生物的遗传和变异(9分),生物与环境(9分),人体生命活动的调节(8分),绿色植物与生物圈中的碳—氧平衡(7分)。

2)项目的题名和摘要的内容包含了许多有关研究计划安排、负责人机构等与研究实质不相关的描述性内容,在对主题词进行聚类时要特别注意主题词的筛选,否则得到的图谱与实际情况可能会有较大偏差。

3)信息源中部分数据未提供关键词字段,因此要对没有关键词的项目名称进行分词,分词工具的选择会对结果产生影响。

(4)单一的路径、维度和方法局限性强,可探索以创新型国家重大科研项目数据库为基础的宏观、中观、微观组合式前沿识别路径。在前文试验中我们主要用词频、共词分析方法识别热点主题,时间维度上仅主要以近五年、十年来约束主题时效性,辅以专家分析判读的方式来认定科技前沿。在时间维度利用、综合路径选择上尚需进一步加强,而方法方面词频分析操作简便,能直观揭示研究领域的内容特征,但人为阈值选择对结果影响较大;共词分析更关注词间关系,减少了人为干预,但无法反映尚未形成热点的潜在前沿主题,且脱离了语境的关键词不能完全表达词间语义关系。

总体来说单一的科技前沿识别路径和方法,总会不可避免地存在这样或那样的缺陷,整合利用多样化数据源、综合运用多种识别路径和方法,并以领域专家介入辅助判读等方式则可以更大程度提高科技前沿识别的可靠性和精确度。由此,我们可以提出以创新型国家重大科研项目数据库为基础的宏观、中观、微观组合式前沿识别路径(如图7所示)。

图 7宏观、中观、微观组合式前沿识别路径

归集、建设覆盖各科技创新型国家的,包括项目基本信息、附加信息以及成果信息的、全面的科研项目数据库,通过各种手段完善数据库项目科技计划和关键词等信息,精炼摘要信息,关联项目研究成果(论文、专利、报告等)详细信息,解决多语种等问题;综合运用项目标题、关键词、摘要、起止时间、资助额度等基本信息,科技计划、资助类型信息等附加信息以及项目论文、专利等成果信息,从宏观、中观、微观角度识别科技前沿,并对不同角度、不同粒度结果辅以领域专家进行综合判读、凝练进而提升科技前沿识别准确度和整体效果。

参考文献:

[1]刘小平,冷伏海,李泽霞.国际科技前沿分析的方法和途径[J].图书情报工作,2012(6):60-65.

[2]王飞,梁继文.基于国家社科基金统计学领域项目成果分析[J].西南民族大学学报(人文社科版),2017(9):230-234.

[3]静发冲,李晨英,韩明杰,等.基于文本挖掘的美国NSF生物科学部新兴前沿项目主题分析[J].现代情报,2014(12):107-112.

[4]李广建,祝振媛.基于硕博士论文和国家社科基金项目的我国情报学研究热点分析[J].图书情报研究,2016(2):3-11.

[5]白如江,冷伏海,廖君华.一种基于多数据源主题对比的科学研究前沿识别方法[J].情报理论与实践,2017(8):43-48,36.

[6]孙晓玲,丁堃.管理科学研究主题及其演化趋势:基于NSFC基础研究知识库的分析[J].科学学与科学技术管理,2017(6):3-11.

[7]王效岳,刘自强,白如江,等.基于基金项目数据的研究前沿主题探测方法[J].图书情报工作,2017(13):87-98.

[8]樊春良.美国国家科学基金会对学科交叉研究的资助及启示[J].中国科学基金,2005(2): 122-124.

Empirical Exploration on Effective Paths to Identify Frontier Tech Based upon Data of Scientific Research Projects

Zhang Jing1, Liu Yanjun1,Zhang Wei1, Li Rong1, Li Menghui1, Yun Qiang2,Shi Yongliang3

(1. Beijing Institute of Science and Technology Information, Beijing 100044, China;2. Institute of Scientific and Technical Information of China, Beijing 100038, China;3. Beijing Institute of Technology, Beijing 100081, China)

Abstract :This paper summarizes the data resource of major scientific research projects and explores the effective utilization of data, so as to reveal the included forward-looking themes of frontier tech. It is of great significance for being “detector, pioneer and adviser” for the “innovation-driven and intelligence-prioritized” technological departments and innovative enterprises, supporting scientific planning and arrangement, chasing after technological innovation and striving for innovation superiority. Based on the resources gathering of major national scientific projects in the technological innovation-oriented countries, the paper explores the effective paths of identifying frontier tech according to the data of scientific research projects from perspectives of scientific research plans that projects are included, project name and key words as well as project brief. The method used is empirical investigation. To some extent, scientific research plan, project name, key words and briefs reveal that, the data fields of projects can work on identifying frontier tech. But there are still problems like absence of data fields, lack of data standardization, much irrelevant information and identification methods and tools to be improved. Besides, this paper puts forward a macroscopic, midscopic and microscopic-combined path of frontier identification, based on the major scientific research projects databases of worldwide technological innovation-oriented countries.

Key words :worldwide technological innovation-oriented countries; data of major scientific research projects; frontier tech identification; path

收稿日期: 2018-10-22,修回日期: 2019-03-08

doi: 10.3969/j.issn.1000-7695.2019.16.014

中图分类号: F406. 3; G311

文献标志码: A

文章编号: 1000-7695( 2019) 16-0108-12

作者简介: 张婧(1985—),女,湖北孝感人,硕士,助理研究员,主要研究方向为情报理论、方法与技术;刘彦君(1976—),通信作者,女,山西大同人,硕士,研究员,主要研究方向为情报理论、方法与技术;张炜(1980—),女,江苏连云港人,硕士,副研究员,主要研究方向为科技情报、科学计量;李荣(1977—),男,甘肃兰州人,硕士,副研究员,主要研究方向为情报服务;李梦辉(1976—),男,河北衡水人,博士,副研究员,主要研究方向为系统科学;贠强(1977—),男,河南安阳人,博士,副研究员,主要研究方向为科技政策与情报、新能源汽车电与专利分折;石永亮(1989—),男,山西吕梁人,在读博士,主要研究方向为仿生与机器人技术、SLAM、机器人导航。

标签:;  ;  ;  ;  ;  ;  ;  

基于科研项目数据的科技前沿识别有效路径实证探索论文
下载Doc文档

猜你喜欢