基于专利信息评价和挖掘智能机器人领域技术创新人才-主成分分析法(PCA)的视角论文

基于专利信息评价和挖掘智能机器人领域技术创新人才
——主成分分析法(PCA)的视角

赵 宁1 ,石 磊1,翟凤勇2,张 玲1,郭 伟3

(1.哈尔滨工业大学图书馆;2.哈尔滨工业大学管理学院;3.机器人技术与系统国家重点实验室,黑龙江哈尔滨 150001)

摘要: 挖掘技术创新人才,是实现人才强企、强校的重要策略,是国家科技人才体系建设的重要一环,可以优化科研财政支出结构、完善人才发展投入机制、提高科研效率。基于专利是衡量技术创新能力和水平的重要指标,以智能机器人领域为例,对发明人进行专利信息统计,从数据库中选择及计算能反映其技术创新的多指标,结合主成分分析法筛选指标特征,构建技术创新人才评价指标体系。通过因子得分,对发明人进行评价和排序;通过共现矩阵和聚类分析,挖掘智能机器人领域中的技术创新人才及团队。

关键词: 专利分析;评价挖掘;技术创新人才;主成分分析

与一般的技术人才相比较,技术创新人才在基础研究、技术研发、组织管理等综合方面具有自己独特的特征,具有开发自主知识产权、新技术、新产品、新品牌能力,并能取得一定的效益,具有相当的学术影响力[1-2]。技术创新人才评价以其科研产出计量指标为主,基于学术文献评价识别科技人才的研究比较丰富,其指标的构建考察需要体现技术创新的不同维度[3-4]。据世界知识产权组织(WIPO)的统计,专利文献涵盖了世界上95%的科技成果,是产业技术创新能力的直接体现[5]。作为一种标准化、公开透明、客观的文献,专利文献对技术发明有详细描述,数据详细全面、稳定,具有可比性、可获性,能从本质上揭示发明人的技术创新能力[6]。基于专利信息的分析角度,宏观上,可以挖掘技术创新团队,审视发明人在团队中的重要性;微观上,可以判断专利的技术水平,判别发明人的技术创新能力[7-8]。专利信息分析可作为衡量技术创新分析的重要指标纳入人才评价中,会简化评价流程而得到可靠的评价结果[9]。目前国内外对智能机器人的研究不断深入,本文将根据德温特的Dewent Innovation(DI)专利数据库检索智能机器人领域的专利信息,建立其发明人的专利评价指标体系,采用主成分分析法(PCA)挑选关键变量子集简化参数,对技术创新人才进行综合打分排序,挖掘智能机器人领域技术创新人才。

本刊讯 12月7日,由中央广播电视总台央视财经频道主办的2018《魅力中国城》文化旅游魅力榜发布会暨城市文化旅游论坛在北京举行。2018《魅力中国城》十大年度魅力榜单也在论坛中正式发布。其中,由陕文投集团、延安文化产业投资有限公司出品的大型红色文化主题演出——红秀《延安延安》荣获年度魅力旅游演艺项目奖,这也是陕西省唯一入选的旅游演艺项目。

1 技术创新人才评价的研究途径

1.1 技术创新人才评价的现状

国内外已有的基于专利分析的技术创新能力的研究,包括对于高校创新能力、高科技公司进行技术创新能力评价,对于产业技术创新能力的评价和对区域创新人才竞争力评价与预测[10-14]。美国《企业技术评论》杂志根据CHI Research, Inc.公司的数据库,每年发表一次被称为“专利记分牌”的统计结果,用综合性指标衡量技术实力、专利数量、当前影响指数、科学联系、生命周期5个方面。已有研究对于机构、区域和产业的创新能力分析比较多,普遍选取成果数量、质量、创新投入与产出作为衡量指标,但是缺乏成熟、统一的理论和具有一致性和可比性的技术创新能力测度模型[15-17],对于技术创新者能力分析选取的专利信息数据测度比较有限。已有基于专利指标体系评价自主创新能力的理论框架构建,包括专利与技术创新的关系研究和各指标计算公式说明,选择的计量指标比较多,但只列出指标,并没有相应的量化分析[18-20];而基于发明人的量化分析大部分为粗粒度宏观评价,单一指标测度得出的结论可靠性不够[21-22]。而量化指标体系更适用于科研院所和机构,不适用于个人,其能力评价标准也是一直争议的话题,不仅要从成果数量上衡量,还应该从质量上测度其技术水平。目前在技术创新能力评价指标中多使用专利的数量、发明人等数据,涉及的都只有简单的专利数量指标,未有深入研究,但专利文献信息中还可以挖掘更多、更全面的测度指标。

1.2 技术创新人才评价指标体系构建

由专利信息有关指标构成的技术创新人才能力评价体系,应该是一个多层次的体系,能准确反映技术创新能力的各个方面。对于技术创新人才的挖掘评价,需要有科学性、可测量性、可行性,符合目标管理的系统优化、相关性、注重质量和技术的作用、数量与比率相结合的原则[23]。基于此,本文结合DI数据库所能选择及计算的指标,构建发明人技术创新能力评价指标体系如表1所示。

表1 发明人技术创新能力评价指标体系

2 主成分分析原理

2.1 主成分分析法思想

发明人技术创新能力受多个因素影响,其评价指标体系是一个多层次综合体系,基于专利信息提取的评价指标比较多,每个专利指标在不同程度上反映了技术创新的信息,这些指标间有一定的相关性,统计反映的信息在一定程度上有所重叠,各指标在一定程度上有重叠。对于多变量研究,层次分析法(AHP)并不适用,而主成分分析法是在对多元数据处理时能够消除原始变量指标间的相关影响,根据线性变换的思想,通过累加贡献率选出重要成分、化简变量,从而揭示新的变量间关系的多元数据统计分析方法[24]

2.2 主成分分析法步骤

(1)定义原始矩阵。设是由p 个指标组成的变量,即评价指标数;n 为样本数,即待评价的发明人。原始矩阵为:

面对专利信息搜集的多个评价指标,主成分分析是尽可能减少、消除评估指标之间的相关影响,利用较少的综合指标来反映各指标间的变化,并减少信息损失。PCA 的基本原理和步骤为:

(2)计算相关系数矩阵。

(5)由主成分载荷计算得分。计算主成分荷载,方差贡献率作为权重,通过对m 个主成分进行加权求和计算得分,从而对样本进行评价。

(3)计算特征值和特征向量。求解特征方程常用雅可比法求出特征值λi (i =1,2,…,p ),并使其按大小顺序排列特征值,即λ 1≥λ 2≥…≥λp ≥0,分别求出特征值λi 对应的特征向量ei (i =1,2,…,p )。

将因子的主成分提取采用方差最大正交旋转法,得到总方差,用于描述各成分的特征值、累加贡献率以及循环后的累加贡献率,累加贡献率达到80%以上的,可以认为主成分包含全部指标的信息。样本数据中特征值大于1的特征值分别为5.961、3.026、2.713、1.986、1.159,累加贡献率达到82.467%,能够比较全面地反映原来的18个指标的信息,因此提取这5个主成分作为新的综合指标对发明人技术创新能力的评价。

式(2)中:rij (i ,j =1,2,…,p ) 为原始变量的相关系数,其计算公式为:

3 实证研究——智能机器人领域技术创新人才评价

3.1 数据来源

本文检索所涉及的智能机器人是指不完全依赖人类的操作,具有对语音、行为、姿势等感知、识别、交互能力,如移动机器人、服务机器人和仿人机器人等的自控机器人,具有自主性、交互性、自适应、自学习、自感应,可以强化学习、深度学习,进行路径跟踪、路径规划、位置识别、智能导航……另外智能机器人在结构上具有手眼协调、双臂协调的特色,主要的关键技术有多传感器新信息融合、超声波传感器[25-26]等。利用这些关键词测试组合形成检索式TI=((Intelligen* or AI) ADJ5 robot* or (Intelligen* or AI) ADJ3 (manipulat* or mobile ADJ platform or moving ADJ platform or unmanned ADJ system) or smart ADJ2 (robot* or manipulat*) or bio*ADJ robot* or automatic ADJ control ADJ3 (robot* or manipulat*) or Interact* ADJ3 robot* or (autonomous or automatic ADJ programming) ADJ5 robot* or self ADJ adaptive ADJ5 robot* or self ADJ learning ADJ5 robot* or(reinforcement ADJ learning or deep ADJ learning) ADJ5 robot* or (sensor or sensing) ADJ3 robot* or "ultrasonic sensor" NEAR3 robot* or (speech or activity or gesture)ADJ recognition ADJ5 robot* or robot* NEAR4 path ADJ (tracking or planning) or position ADJ tracking NEAR4 robot* or Intelligent ADJ navigation ADJ5 robot*or "arm* cooperation" ADJ5 robot* or dual ADJ arm*ADJ3 robot* or "hand eye coordination" ADJ5 robot*or slam ADJ5 (robot* or mobile ADJ platform or moving ADJ platform) or obstacle ADJ avoidance ADJ robot* or humanoid ADJ robot* or soccer ADJ robot*)。

国际药学联合会2014年通过并发布《药师誓言》,誓言与一些国家已经使用的药剂师誓言类似,国际药学联合会工作组收集了这些誓言,并准备了一份草案交予组织审查。这一誓言的优点在于它是在国际视野下撰写的,全面考量了指导药学专业人员道德行为的最基本原则[11]。

⑨Tom wicker,Introduction to the 1991 Edition,quoted from:Louis Hartz,The Liberal Tradition in America,An Interpretation of A-merica Political Thought since the Revolution.

3.2 利用主成分分析的统计分析

3.2.1 KMO和Bartlett球形检验

将样本数据用SPSS进行标准化处理,去除指标间系数、量纲的影响,进行归一化处理。第一发明人申请量、发明专利申请量、授权量、授权率、有效率、国际同族专利数、IPC大部、IPC小类、DWPI分类、被引篇数、被引次数、被引百分比、引证率、H指数、G指数、平均专利权数、平均合作发明人数、合作专利数分别用x 1,x 2,…,x 19表示,对所得相关指标数据进行检验因子模型的适应性分析,KMO和Bartlett的检验结果如表2 所示,可见偏相关性KMO>0.7,显著性小于0.05,表明指标数据适合主成分分析。

房屋建筑施工中钢筋混凝土结构施工技术的应用分析……………………………………………………… 袁劲松(9-195)

表2 样本数据的KMO和Bartlett检验结果

3.2.2 方差贡献率分析

(4)计算主成分贡献率和累加贡献。主成分贡献率(i =1,2,…,p )和累加贡献率(s =1,2,…,p )。一般取累计贡献率达到80%以上的特征值λ 12,λm (m ≤p )分别对应第1、第2、…、第m 个主成分。

3.2.3 因子载荷矩阵和得分矩阵

社会信用环境欠佳,影响了小额农贷推广。受社会信用大环境的影响,一些农户信用观念淡薄,想方设法逃废银行的债务。地方政府、司法部门对维护金融债权、建立社会信用、打击恶意逃废债务行为的力度不够,导致银行不同程度地产生了“慎贷、恐贷”的心理,在一定程度上抑制了农户小额信用贷款的推广。

DI数据库整合全球专利情报,收录来自全球超过50家专利授予机构(涵盖90多个国家和地区)的专利信息和过亿件专利,相关专利文献均由专家进行深度加工改写生成德温特世界专利索引(DWPI),保证检索全面、具有专业权威性[27]。结合关键词在数据库测试的结果,设置检索式检索,截止时间为2018年5月19日,经过去重,得到12 335个专利族;通过字段KI=(a or a1 or a2 or b or b1 or b2 or c)筛选发明专利,得到9 241个专利族。根据普莱斯定律,选取评价分析的发明人的数量由各专利发明作者总数(未进行算法分析和人工校对)的平方根来大致决定,即每件专利发明人总数的平方根决定入选高技术创新人才所需的数量的阈值。本研究数据中不到10 000件专利,选取第一发明人为主要分析对象,除去重复的数据,所研究发明人的数量肯定是小于其平方根100,所以对申请量排名前100个发明人进行指标分析,即可挖掘出该领域的技术创新人才。本文选取2001—2018年的检索结果,通过对发明人数据进行清洗和专利信息各项统计,得到原始专利指标样本——申请量排名前100的发明人专利指标数据(以下简称样本数据),使用SPSS 22工具进行分析。

通过SPSS22,采用Kaiser正交旋转后得出主成分因子载荷矩阵,取消最小系数绝对值为0.35的显示,如表3所示。可以看出,主成分F 1在x 11、x 13、x 15有较大的载荷,表明F 1主要是根据专利影响力判断技术创新水平的;主成分F 2在x 2、x 10、x 18有较大的载荷,说明F 2是根据特定专利数量的3个“量”来判断的,即申请数量、被引数量、合作数量;F 3在x 4和x 17有较大的载荷,说明F 3是根据专利授权率、平均发明人数的指标影响技术创新水平的;F 4在x 7、x 8、x 9表征专利的技术范围指标上有较大的载荷;F 5在x 12上有较大荷载,说明F 5根据被引百分比的指标判断技术创新水平。

表3 样本数据旋转后的因子载荷矩阵

3.2.4 因子得分排序

我们用H表示有限维实希尔伯特空间,它的内积和范数分别记为〈·,·〉和‖·‖。用R表示全体实数,用Rn表示n维向量空间,其内积定义为:

根据归一化的原始变量和因子得分矩阵,可以计算样本数据的因子得分,得到主成分得分系数矩阵,见表4所示。

表4 样本数据的因子得分矩阵

表4 (续)

通过表 2系数求出F 1、F 2、F 3、F 4、F 5主成分得分,构建综合技术创新能力评价函数,即对应的18个系数与归一化后的值相乘再求和,得到F 为评价各发明人的指标,F 的系数由表2中主成分占比计算得出。根据F 值得出指标的总排名,对专利发明人技术创新水平进行排序,选择前50名发明人进行综合指标评价,如表5所示。虽然在原始样本数据中,按照申请量排名,在智能机器人领域,国内发明人占据优势,排在前列的都是中国机构的发明人,但是根据专利综合指标评价分析,国外公司的发明人占据排序前列,其专利的综合技术水平较高,说明国内技术创新人才水平和国外存在一定的差距。

表5 智能机器人领域发明人综合指标评价排名

4 结果分析——智能机器人领域技术创新人才挖掘

采用德温特数据分析平台(Derwent Data Analyzer,DDA ),根据发明人指标数据生成发明人和发明人、发明人和DWPI共现矩阵,通过矩阵查看器生成数据聚类可视图(如图1),可见发明人合作共现图;生成发明人研究领域共现图(如图2),可见挖掘技术创新团队和技术创新人才。图1、图2中,交叉的节点表示发明人研究出现的共同专利量,节点之间连线越粗,说明这些发明人在同一专利中合作的次数越多,由此表示这些节点之间的合作度越高。这些关系紧密的节点所表现的协同合作能力越高、其文献关联度越高,表明发明人之间的合作密切,是识别技术创新团队依据;而连线越少的节点代表的文献关联度则较低,表明发明人之间的合作没有很频繁。

③规则库。其用来存储 那些能够用来分析检测各类计算机病毒特征、连接特点的规则集,给数据挖掘技术的实际使用奠定规则基础,大量的规则会重点将互联网病毒连接数据以及病毒特征反映出来,并且还能将互联网的行为方式展示出来,继而给手机与分析计算机病毒数据的相关特征提供关键的选择根据。

图1 智能机器人领域发明人-发明人共现矩阵

图2 智能机器人领域发明人-DWPI手工代码共现矩阵

通过表5,结合图1、图2进行智能机器人领域技术创新人才挖掘分析。美国iRobot公司的创新团队主要为Sandin P E和Jones J L组成,其成员包括Vu C、Mass P R、Ozick D N、Mack N E、Nugent D M、Lynch J,Cohen D A和Gilbert J D也是该公司可以挖掘的创新人才,通过分类代码聚类得出其主要研究方向集中于X27-D04R的Robotic Vacuum Cleaner除尘机器人上;国内清华大学张文增的创新团队,其研究领域主要在P62E机械手,团队成员包括陈强。在计算机与程序控制机机器人主要技术领域上,挖掘到主要创新人才有:美国iRobot公司的Cohen D A,中国科学院自动化研究所的谭民,北京理工大学的黄强,国家电网山东鲁能技术有限公司的韩磊,浙江大学熊蓉。

5 结论

与单纯对发明人专利申请量评价相比,本文建立的基于第一发明人申请量、发明专利申请量和发明专利授权量、授权率、有效率、国际同族专利数、IPC大部、IPC小类、DWPI分类、被引篇数、被引次数、被引百分比、引证率、H指数、G指数、平均专利权数、平均合作发明人数、合作专利数的指标评价体系,能够反映技术创新规模、技术创新质量和技术创新管理等方面情况,可以综合评价技术创新人才能力和水平。基于发明人技术创新能力评价指标体系,采用主成分分析法简化其专利信息指标的分析,对DI检索清洗出的发明人进行综合评价,并对结果数据进行共现聚类进一步归类,挖掘出智能机器人领域的技术创新人才及团队。基于主成分分析法具有相对的普遍性和适应性,在此基础上,评价体系指标的进一步完善可以使得结果更加科学和准确。

参考文献:

[1]毛彬.对技术创新概念的认识[J].现代营销(学苑版),2014(2):54.

[2]刘扬,孔繁士.高校创新人才评价机制探索[J].科技管理研究 ,2013(15):76-79.

[3]李红,朱玉奴,缪家鼎.基于专利情报分析和对比的高校技术创新评价研究:以浙江大学为例[J].情报理论与实践 ,2015,38(5):100-104.

[4]姜军,武兰芬.基于专利分析的中美纳米技术领域人才分布比较研究[J].科学管理研究,2016,34(4):84-88.

[5]冯昌扬.国内外专利研究文献综述:2003—2012年[J].知识管理论坛 ,2013(1):52-62.

[6]鲍志彦.高校技术创新能力评价实证研究:基于专利信息的测度分析[J].农业图书情报学刊,2016,28(8):5-10.

[7]徐迎,张薇.专利与技术创新的关系研究[J].图书情报工作 ,2013,57(19):75-80,68.

[8]曹明,陈荣,孙济庆,等.基于专利分析的技术竞争力比较研究[J].科学学研究 ,2016,34(3):380-385,470.

[9]JUNGA S, IMM K Y.The patent activities of Korea and Taiwan:a comparative case study of patent statistics[J].World Patent Information, 2002,24(4):301-311.

[10]曾莉,王明.基于专利视角的重庆高校科技创新能力评价研究[J].南昌航空大学学报(社会科学版),2016,18(3):106-112.

[11]应璇,孙济庆.基于专利数据分析的高校技术创新能力研究[J].现代情报 ,2011,31(9): 165-168.

[12]HAGEDOORN J, CLOODT M.Measuring innovation performance:is there an advantage in using multiple indicators[J].Policy Research, 2003,32(8):1365-1379.

[13]龚关.基于专利信息的产业技术创新能力评价研究[D].上海:华东师范大学,2012.

[14]沈春光,陈万明,裴玲玲.区域科技人才创新能力评价指标体系与方法研究[J].科学学与科学技术管理,2010,31(2):196-199.

[15]CHEN D, LIN W, HUANG M.Using Essential Patent Index and Essential Technological Strength to evaluate industrial technological innovation competitiveness[J].Scientometrics, 2007,71(1):101-116.

[16]ABRAHAM B P,MOITRA S D.Innovation assessment through patent analysis[J]. Technovation,2001,21(4):245-252.

[17]彭茂祥,李浩.基于大数据视角的专利分析方法与模式研究[J].情报理论与实践 ,2016,39(7):108-113.

[18]冯君.基于专利信息分析的高校科技创新能力评价指标体系初探[J].科技情报开发与经济,2010,20(10):193-194, 204.

[19]高继平,丁堃.专利计量指标研究述评[J].图书情报工作 ,2011,55(20):40-43.

[20]马廷灿,李桂菊,姜山,等.专利质量评价指标及其在专利计量中的应用[J].图书情报工作,2012,56(24):89-95,59.

[21]王刚波,官建成.纳米科学与技术之间的联系:基于学术型发明人的分析[J].中国软科学,2009(12):71-79.

[22]杜凯,马宏珺,张博,等.特斯拉汽车公司专利申请中的发明人分析[J].中国高新技术企业,2016(6):190-191.

[23]方曙.基于专利信息分析的技术创新能力研究[D].成都:西南交通大学,2008.

[24]叶春明,耿文龙,陆静.基于主成分分析的我国区域专利评价研究[J].科技管理研究,2010,30(19):128-132.

[25]何静,蔡利超.广东省智能机器人产业的分析与思考:基于专利的视角[J].科技管理研究,2017,37(15):155-163.

[26]AUSTIN T,陈勇.智能机器: 区分事实与虚幻[J].电子产品世界 ,2016,23(10):7,24.

[27]DERWENT INNOVATION.Derwent innovations[EB/OL].(2018-05-19)[2018-05-19]. http://www.derwentinnovation.com/login.

Evaluation and Excavation of the Technological Innovation Talents in the Field of Intelligent Robot Based on Patent Information:The Perspective of Principal Component Analysis (PCA)

Zhao Ning1, Shi Lei1, Zhai Fengyong2, Zhang Ling1, Guo Wei3
(1. Harbin Institute of Technology Library; 2. School of Management, Harbin Institute of Technology;3. State Key Laboratory of Robotics and System(HIT), Harbin 150001, China)

Abstract: Excavating talents of technological innovation is an important strategy to realize talents to strengthen enterprises and schools, and an important part of the national scientific and technological talent system, it can optimize the financial expenditure organization of scientific research, perfect the investment mechanism of talent development,and improve the efficiency of scientific research. This paper takes the field of intelligent robots as an example, carries out patent information statistics for inventors, chooses and calculates multiple indicators reflecting their technological innovation from the database, combined with the characteristics of principal component analysis (PCA), the evaluation index system of technological innovation talents is constructed. By calculating factor scores, the inventors are evaluated and ranked. Through co-occurrence matrix and cluster analyzing, the technology innovation talents and teams in the field of intelligent robots are excavated.

Key words: patent analysis; evaluating and excavating; technology innovation talents; principal component analysis

中图分类号: G255.53;TP242.6;G301

文献标志码: A

文章编号: 1000-7695(2019)17-0160-06

doi: 10.3969/j.issn.1000-7695.2019.17.021

收稿日期: 2018-07-24,

修回日期: 2019-01-03

基金项目: 中国科学技术信息研究所科学计量学联合实验室开放基金项目“基于专利分析对智能机器人领域创新人才的挖掘和评价”(IC20180014)

作者简介: 赵宁(1980—),女,黑龙江哈尔滨人,副研究员,硕士,主要研究方向为科技查新与专利服务;石磊(1980—),男,黑龙江哈尔滨人,馆员,博士,主要研究方向为专利分析和文献计量;翟凤勇(1970—),通信作者,男,黑龙江哈尔滨人,副教授,主要研究方向为管理科学与博弈论;张玲(1979—),女,黑龙江哈尔滨人,馆员,主要研究方向为学科服务与文献检索;郭伟(1965—),女,黑龙江哈尔滨人,教授,博士,主要研究方向为机器人技术。

标签:;  ;  ;  ;  ;  ;  ;  

基于专利信息评价和挖掘智能机器人领域技术创新人才-主成分分析法(PCA)的视角论文
下载Doc文档

猜你喜欢