明星发明人识别与角色分析:来自机器学习领域的实证论文

明星发明人识别与角色分析:来自机器 学习领域的实证

吴菲菲,李 倩,黄鲁成,李 欣

(北京工业大学 经济与管理学院,北京 100124)

摘 要: 明星发明人有助于提高企业研发创新绩效。目前对明星发明人的地位与功能探讨不足,导致企业无法全面掌握发明人信息,难以为研发活动招聘合适的人才。鉴于此,对机器学习领域明星发明人的领导、传播、知识或任务排他等功能和地位进行识别,采用动态网络分析方法确立六类明星发明人,即焦点型发明人、领导型发明人、潜在跨界型发明人、传播型发明人、任务排他型发明人和知识排他型发明人,分析其角色功能。结果表明:部分发明人同时拥有多种地位;领导型、焦点型和知识排他型明星发明人影响范围更广、职业流动性更强,与其他发明人的交互时间更长;隔离同时具有3种地位的明星发明人对焦点型发明人影响显著。

关键词: 明星发明人;明星科学家;角色分析;动态网络分析;机器学习

0 引言

明星科学家或明星发明人是指能够产生大量科学和技术想法、具有很强影响力的个人,他们对行业技术进步发挥着重要影响[1-2]。明星发明人作为最具潜力的研发人员,虽然在创新群体中数量不多,但有较多专利产出,对创新绩效的贡献巨大[3-7]。企业要想取得成功,基础研究投入固然重要,但更重要的是引进明星发明人,获得更多创新产出。因此,对明星发明人进行识别与角色分析,是提高企业创新绩效的重要前提。

1 文献综述

从明星发明人识别方法看,早期采用专利数量和专利引用率对明星发明人进行识别。意大利学者Lacetera 等[8]将“年度出版物的3年移动平均线高于6年的”定义为明星科学家。尽管Lacetera识别的是明星科学家,但该定义也反映出研发人员在群体中的地位存在差异。英国学者Pilkington等[9]将发明专利数量和专利引用率均高于平均值两倍以上的发明人定义为明星发明人,并证实了发明人流动能促进隐性知识传播,强调企业管理发明人的重要性。意大利学者Rota等[10]基于发明人专利产出分布,运用重尾HILL估计方法区分明星发明人和普通发明人,发现雇佣明星发明人会对企业全球竞争产生潜在的决定性作用。随新兴技术复杂性提高、更新速度加快,越来越多的专利发明产生于创新群体(团队)中[11],创新群体作为特定性的创新合作网络,实质是以科研创新项目团队为基础而不断发展演变的网络组织[12],创新产出通过成员间互动和知识互补实现[13-14]。个体专利产出数量和质量已不能全面反映群体创新绩效,还需结合发明人合作网络的结构特征进行考察。因此,研究者应利用各种网络指标及网络连接性特征识别明星发明人。美国学者Grigoriou & Rothaermel[15]提出“关系星”概念,将具有高创新产出且占据企业内部网络关键位置的发明人定义为明星发明人,并发现“关系星”提高了周围人群的知识重组效率。

不同发明人在创新群体中扮演着不同的角色,由此形成了不同类型的明星发明人。虽然基于专利数量和专利引用率的识别方法容易掌握,但就发明人个体特征及流动性对明星发明人形成发挥了怎样的作用讨论不足。有研究指出,企业在选人用人时,既要了解发明人的产出绩效,也要观察其在群体中的表现[16-18]。虽然网络结构能较好地反映发明人个体在创新群体(网络)中的地位以及与其他个体的作用关系,相较于专利产出这一明星发明人识别指标更具说服力,但目前该方法也存在一定局限:一方面,未考查明星发明人的影响范围和影响强度;另一方面,未涉及企业间研发合作网络结构及网络成分的影响。影响范围可以用来验证识别结果的准确性,影响强度不仅可以观测明星发明人离开对网络结构的影响,还能帮助企业预测新的关注人群。创新网络不局限于企业内部,还包括其它网络成分。在共发明网络中,最大连接成分比其它成分拥有更高的网络稳定性和创新绩效[19]。因此,利用网络最大连接成分识别明星发明人更具可靠性。

鉴于现有明星发明人识别方法对发明人个体特征及流动性的考察不足,而且未验证识别的准确性,难以对明星发明人的形成作出准确预见,而明星发明人的预见对于提高企业研发竞争力至关重要。因此,本文采用动态网络分析法,选取机器学习领域,利用创新群体最大连接成分识别具有不同功能和地位的明星发明人,分析其合作范围、知识拥有量、职业流动性、动员潜力及与其他发明人的交互影响,旨在揭示发明人个体特征和职业流动在共发明活动中的作用,提高企业识别明星发明人的能力。

2 研究设计

2.1 数据来源

本文使用美国授权专利作为衡量创新活动的指标。尽管专利不能代表创新活动的全部,但可以系统体现出发明人和发明人群体参与发明的过程。因此,专利成为分析创新活动的重要指标[20]。首先,确定分析领域的专利检索表达式,借助DI(Derwent Innovation,原TI,Thomson Innovation)工具抽取美国授权专利中的发明人、专利公开号、IPC分类号等信息。然后,使用Patent Network Dataverse[21]对发明人进行去重、合并,对发明人姓名进行消歧,以保证识别的准确性。最后,通过职场社交平台Linkedin、研究者学术搜索网站Aminer及财经资讯网站Bloomberg获取发明人职业流动信息,以分析职业流动对明星发明人形成的影响。

2.2 方法与步骤

由卡内基梅隆大学教授Carley[22]及其团队开发的动态网络分析法(Dynamic Network Analysis,DNA)善于处理大规模动态多模、多边、具有多层不确定性的网络,而构建不同类型元矩阵是动态网络分析的基础和关键。元矩阵中的实体包括人、知识/资源、事件/任务及组织。动态网络分析工具ORA(Organization Risk Analyzer)是一款强大的可视化工具,常用于揭示多模、多链接的复杂关系网络特征,使DNA的快速求解和分析更加便捷。与大多数社交网络分析工具不同,ORA利用的是元矩阵本体,因而更适合对多模、多链接关系进行分析[23]

依据NCCLS2004年版标准判读结果。质控菌株为铜绿假单胞菌ATCC 27853、金黄色葡萄球菌ATCC 25923、大肠埃希菌ATCC 25922等。抗菌药物选择的包括氨苄西林、阿米卡星、头孢他啶、环丙沙星、左氧氟沙星、庆大霉素、复方新诺明、哌拉西林等。

图1 技术路线

根据前文给出的明星发明人影响范围测度方法不难得到6类明星发明人的影响范围,如图3、图5、图7和图9所示(圆形节点代表发明人,方形节点代表任职单位,五边形节点代表IPC知识,六边形节点代表专利公开号)。同一任职单位的发明人合作分析见图4、图6、图8和图10(圆形节点代表发明人,方形节点代表任职单位,节点之间的链接代表发明人隶属关系)。

2017年,为了进一步推动我国科技期刊的发展,提高其整体水平,更好地宣传和利用我国的优秀学术成果,中国科学技术信息研究所对中国正式出版的各学科6154种中英文期刊进行综合科学评价,遴选出新的300种以中文出版的中国精品科技期刊,其中《冶金分析》杂志有幸入选“第4届中国精品科技期刊”。中国科学技术信息研究所在中国精品科技期刊的基础上,择优遴选顶尖学术论文,建设了“中国精品科技期刊顶尖学术论文—领跑者5000(F5000)平台”,集中对外展示和交流我国的优秀科技论文,《冶金分析》同时为“中国精品科技期刊顶尖学术论文(F5000)”项目来源期刊。

农业废弃物资源化利用是省农业现代化的重要考核目标,也是农业生态文明建设的重要内容。各地要认真总结前几年的先进经验和做法,围绕中央、省市政府下达的农业废弃物资源化利用工作目标和任务,继续把农业废弃物资源化利用列入农业农村重点考核目标作。同时结合本地实际,制定明确年度工作任务和实施方案、督查方案和考核办法,做到督查能发现问题和不足,考核能拉开分数和等次,进一步加强这项工作的督查考核力度,保证全市农业废弃物资源化利用的有效推进。

本文以专利发明人作为主体(Agent),国际专利分类号IPC 作为知识(Knowledge),专利公开号作为任务(Task),发明人从属机构作为组织(Organization),建立动态网络分析元矩阵,如表1所示。

许诺是在电视上看到海岛发生地震的新闻后,匆忙放下手头的工作赶过来的,他提着一颗心飞了一路,看到丁小慧毫发无损地站在他面前,他才松了口气,紧紧地抱了抱她,“你是想吓死我啊?”

根据四维元矩阵可构建六层子网络,根据共发明关系构建共发明网络。具体而言,主体×主体构成了共发明网络(AA)、主体×知识构成了知识网络(AK)、主体×任务构成了参与网络(AT),主体×组织构成了成员网络(AO)、任务×知识构成了需求网络(TK)、组织×任务构成了组织绩效网络(OT)。六层子网络构成要素如表2所示。

1.2.5 建立临床科室安全合理用药联络员制度 每个科室指定一名医生为安全合理用药联络员,协助科主任管控各科室安全合理用药的问题隐患,督查本科室处方医嘱,对异常用药行为进行干预,对本科室包括抗菌药物使用等合理用药问题进行自查、分析和总结。

表1 动态网络分析四维元矩阵

表2 动态网络各子网络层

由图3可以看出,Weston与13位发明人建立了共发明关系,合作发明了20项专利,拥有9种IPC知识,在共发明网络形成过程中,曾于4家单位就职。进而由表6得出,Weston所有邻居类中邻居数量百分比都显著偏离平均值,说明其合作范围较大、发明专利多、知识面广、职业流动性高,不仅主导了所有任务的30%,总动员潜力也达到28.25%,潜在影响范围是所有明星发明人中最高的。根据其他发明人与Weston的共同邻居计算可得,Weston与Guyon交互影响程度高,二者共合作了12次。通过查询Weston和Guyon的职业流动信息和专利内容,对图4呈现的合作关系进一步分析发现,2001年,Guyon担任BIOwulf Technologies副总裁,并成立了世界公认的机器学习和支持向量机专家团队,此时Weston在BIOwulf Technologies担任研究员,他们所在的团队承担了几个与大学和工业部门合作的研究项目,以分析基因组学和蛋白质组学数据,包括DNA微阵列数据和质谱数据。2002年Weston离开BIOwulf Technologies,进入Max Planck Institute for Biological Cybernetics、NEC Labs America和Google, Inc.,但仍与Guyon保持合作关系,二者仍然存在持续交互影响,并为Health Discovery Corporation申请了多项基于支持向量机方法的特征选择和识别专利。

生鲜电商的售后服务是供应链的最后一个环节,主要包括客诉处理和退换货处理等内容。为了提高顾客的满意度,增强顾客粘度,每日优鲜在产品退换货的问题上可以实行相对宽松的政策,顾客提出异议的产品,在证实了顾客收到的产品确实存在严重的问题,可以采取退换或者补偿的方式。对于一些退回来以后又无法进行二次售卖的商品,与其花费上门取件费用,不如通过售后和顾客进行沟通核实,退还部分的费用,使公司的损失降到最低。

根据发明人群体特征,定义6类明星发明人,并通过构建共发明网络、知识网络、参与网络和需求网络四层子网对其进行识别。不同子网层的明星发明人识别指标如表3所示。

2.2.3 明星发明人影响范围测度

明星发明人影响范围是指,与明星发明人相连接的其他发明人、知识、任务、组织,以及这些实体间的连接。在四层子网中识别出不同类型的明星发明人后,结合成员网络和组织绩效网络测度发明人的影响范围,对于准确识别明星发明人具有重要价值。该方法可以识别出与现有明星发明人共享相似链接的节点(发明人),分析已知明星发明人的邻居规模和动员潜力,了解明星发明人主要出现的位置,并挖掘与明星发明人处于相同位置的其他发明人,以及发明人之间的交互影响程度。明星发明人影响范围测度指标如表4所示。

老年人由于年龄的增长,对外界的感知能力和反应能力逐渐降低,自控能力也会逐年减弱,因此要求养老建筑能够考虑到这一点。出于对养老问题的重视,往往会给予养老社区较大的建筑面积,但恰恰是这一点,反而会为老年人带来不便,老年人可能不能明确区分区域功能,并且老年人的活动能力下降,在这么大范围内也可能会被迷惑。因此,现代的养老设施建筑应该重视对于区域的划分,每个区域的功能集中化,将检查、治疗、洗浴、休息区域分离开,强调每个区域的功能特性,在对有病症老年人的康复区域附近可以建设相应的休息区域或者起居室,方便老年人在完成康复训练后可以及时休息。

表3 不同子网明星发明人识别指标

表4 明星发明人影响范围测度指标

从图5可以看出,Barnhill与4个发明人建立了共同发明关系,合作发明了14项专利,拥有7种IPC知识,在共发明网络形成过程中,曾于3家单位任职。进而由表7得出,除主体类邻居规模外,其它类邻居数量百分比都显著偏离了平均值,说明Barnhill发明专利多、合作范围较小,但知识面广、流动性较强,他主导了所有任务的20%,总动员潜力达到20.34%。根据其他发明人与Barnhill的共同邻居计算可得,Guyon与Barnhill交互影响程度高,共合作了8次。通过查询Barnhill、Guyon的职业流动信息和专利内容,对图6呈现的合作关系进一步分析发现,1999年,Barnhill博士创办并担任Barnhill BioInformatics, Inc.的董事长、总裁兼首席执行官,于2003年11月担任Health Discovery Corporation的医疗主任及总裁;Barnhill博士接受过实验医学和临床病理学培训;Guyon博士自2003年11月起成为健康发现公司(以前称为无线通信公司)的科学咨询委员会成员。在他们共事期间,推动了支持向量机方法在医学、基因组学、蛋白质组学、诊断和药物发现领域的应用。

明星发明人的影响强度是指隔离具有多重身份的明星发明人对其他类型发明人地位变化的影响。在识别出明星发明人后,分析明星发明人的影响强度是很有必要的。由于发明人网络或上述多实体构成的动态网络可能发生变化,当某明星发明人离开网络时,网络结构可能因此而改变。通过测度明星发明人的影响强度,可以准确把握其对创新网络的影响,进而预测哪些发明人会引起新的关注。如果明星发明人的离开,导致网络中其他发明人的排名变化度较大,则企业雇佣中要关注明星发明人的合作伙伴;如果明星发明人的离开,不会带来其他发明人的排名变化,则企业可以只关注明星发明人的信息。现在企业基于明星的雇佣战略不仅会促进企业绩效提升而且也会提高随后的雇佣质量[24],即能雇佣到更多创新性人才。如果能够了解明星发明人对其他发明人的影响强度,就可以预测企业在招聘时如何对发明人进行选择以提高雇佣质量,进而作出正确的雇佣决策。

3 机器学习领域明星发明人识别与角色分析

机器学习(Machine Learning)是指,计算机通过模拟人类学习行为,以获取新知识或新技能,重新组织已有知识结构,不断优化自身性能。机器学习是人工智能的核心,是实现计算机智能化的根本途径,其应用遍及人工智能各个领域,是各国公司、科研机构争相发展的热点技术。在此背景下,机器学习人才成为相关机构关注的焦点和追逐的热点,机器学习人才流动更是引起媒体、公众的广泛关注和热议。以机器学习领域为例,探究明星发明人的识别与作用,可以为该领域企业用人决策提供方法支持。

3.1 机器学习领域发明人六层子网构建

本文机器学习专利数据来自DI美国专利授权数据库,检索表达式根据Tseng[25]的研究确定,即IC=(G05B001302 or G06E000100 or G06E000300 or G06F001518 or G06G000700 or G06N000300 or G06N000308 or G06N000302 or G06N000312) AND UC=((706012) OR (706013) OR (706014) OR (706015) OR (706016) OR (706017) OR (706018) OR (706019) OR (706020) OR (706021) OR (706022) OR (706023) OR (706024) OR (706025) OR (706026)) AND DP>=(19760101)。共获得1976-2015年授权的有效专利4 018条,并利用TDA生成发明人共现网络,选取共现网络中最大连接成分为研究对象,经过姓名去重、合并得到74位发明人、69项专利、11个IPC、23个任职单位,时间跨度为1997-2015年。然后,通过Linkedin、Aminer及Bloomberg社交媒体平台和资讯网站获取74位发明人在1997-2015年间的职业流动轨迹,以发明人作为主体(Agent)、以IPC分类作为知识(knowledge)、以发明人任职单位作为组织(Organization)、以专利作为任务(Task),根据前文提出的动态网络分析四维元矩阵,构建机器学习领域发明人六层子网。再次,按照前文确定的识别步骤,对相应子网络层中的明星发明人进行识别,分析明星发明人的影响范围和影响强度。

运用动态网络分析法对明星发明人进行识别与角色分析。首先,从专利数据库和社交媒体、资讯网站获取研究数据,对数据进行清洗、消歧,构建六层子网,即共发明网络、知识网络、参与网络、需求网络、成员网络和组织绩效网络。然后,从共发明网络、知识网络、参与网络和需求网络组成的四层子网中选取相关指标,用以识别发明人,并得到6类明星发明人。最后,测度明星发明人的影响范围,包括邻居规模、动员潜力和共享相似链接主体,以验证识别的准确性。此外,通过隔离拥有多重角色的明星发明人,测度其影响强度,观测明星发明人离开对网络结构的影响。研究框架见图1。

3.2 机器学习领域明星发明人识别结果

通过计算总度中心性、认知需求、潜在跨边界者、特征向量中心性、任务排他性和知识排他性指标,得到机器学习领域不同类型明星发明人得分如表5和表6所示,主要明星发明人在共发明网络层的位置见图2(圆圈标注),节点代表发明人,节点之间的链接代表共发明关系。

表5 机器学习领域明星发明人识别结果

表6 机器学习领域明星发明人识别结果

图2 机器学习领域共发明网络层明星发明人位置

由表5和表6可得,前文定义的六类明星发明人在机器学习领域均存在。

“中华传统文明历来注重以民为本,尊重人的尊严和价值。”[5]自管仲之后,许多思想家、政治家都提出了“民本或人本”思想,如“民惟邦本,本固邦宁”(《尚书·五子之歌》)、“天地之间,莫贵于人”(《孙膑兵法·月战》)、“民为贵,社稷次之,君为轻”(《孟子·尽心章句下》)、“国以民为本”(《史记·郦食其列传》)以及“民可以载舟,亦可以覆舟”(唐太宗李世民《民可畏论》)等等。这充分表明“我们今天强调的以人为本,继承了中国古代的民本思想”,[5]是植根于中华文明的思想精华。相应的,从上述语句中,我们看不出对社会、对国家以及作为国家代表的“君”、“王”的重视,而明显地是将其置于次要地位。

(1)焦点型发明人。焦点型发明人Weston。根据总度中心性计算结果,Weston共与13位发明人建立了共发明关系,合作次数达到44次。根据专利发明内容可知,Weston的专利以图像-音频联合查询方法、确定文档与查询之间相似性的方法、基于支持向量机的特征选择和模式识别方法、生物信息中的知识发现方法等为主,是AMiner2016评选出的百名最具影响力的机器学习领域学者(第16名)之一,也是计算机科学50强作者之一;焦点型发明人Vapnik。Vapnik与11个发明人建立了共发明关系,合作次数达到14次,是支持向量机方法的发明人之一。Vapnik的专利以并行支持向量机方法、扩展内核支持向量机方法及基于支持向量机的功能估计和模式识别为主。综上可知,焦点型发明人合作范围较广,更容易为人所知。

(2)领导型发明人。根据认知需求计算结果,Weston参与发明了20项专利,使用了G06F、G06K、G06T、G06Q、G06N等9种IPC知识,所有专利均是通过合作获得的。这说明Weston致力于产出复杂专利,通过努力与他人协调合作,以获取专利所需的知识和资源。由此可见,Weston在机器学习领域即将挑起大梁、发挥新兴领导作用。

(3)潜在跨界型发明人。根据潜在跨边界者计算结果,Selvaraj位于以Weston为核心的子群和以Sindhwani为核心的子群之间,是两个群体交流的唯一纽带,满足了潜在跨界发明人的定义要求。以Sindhwani为核心的子群主要研究MapReduce环境中处理机器学习(ML)算法的系统和方法,以Weston为核心的子群主要研究基于支持向量机的特征选择和模式识别方法,然而支持向量机的深层次应用受到单台计算机内存容量、运算速度限制。因此,如何提高支持向量机对大规模数据处理能力的扩展性成为支持向量机领域研究的重点,逐渐受到研究者的关注。MapReduce并行计算框架为改进数据挖掘方法提供了平台,若要实现支持向量机在MapReduce环境下的并行计算,毫无疑问Selvaraj成为双方合作的桥梁,从而决定其潜在跨界型发明人的角色。

随着工业化和城市化的加速推进,建筑、交通、金属冶炼等行业快速发展,大量的污染物也随之沉降到地面,不同区域和不同企业周边的各种重金属元素对生态环境及人体健康产生的危害程度也有所差异,因此,开展降尘中重金属的含量及其分布特征的研究有着重要的科学和现实意义。

延迟拒绝(Delayed Rejection,DR)抽样算法中,目标分布为π时,对密度为的候选值θ*,其迭代接受概率为:

(4)传播型发明人。根据特征向量中心性计算结果,Sindhwani连接着由Burdick Douglas Ronald、Vaithyanathan Shivakumar等9人组成的合作团队,一旦Sindhwani获取了机器学习领域有价值的信息,信息就会快速在9个人组成的合作团队中扩散,比起其他发明人,Sindhwani拥有网络中最快的信息传播速度,因此成为传播型发明人。

(5)任务排他型发明人。根据任务排他性计算结果,Barnhill拥有4项独立发明专利,专利以使用多个支持向量机增强来自多个数据集的知识发现方法为主,具有专业性。Barnhill是在医学、基因组学、蛋白质组学,诊断和药物发现领域使用和发展人工智能、模式识别和计算技术的先驱,他掌握的知识发现方法推动了机器学习在生物医学领域的广泛应用。

(6)知识排他型发明人。根据知识排他性计算结果,Weston、Barnhill和Guyon拥有大多数发明人很少掌握的IPC知识——G06Q,He Yunlong和Kavukcuoglu拥有大多数发明人很少掌握的IPC知识——A61m。

由以上分析可见,Weston具有焦点型发明人、领导型发明人和知识排他型发明人三重角色,说明其是共发明网络中的关键人物,不仅具备领导力,还具备独特的知识。

3.3 机器学习领域明星发明人影响范围分析

2.2.1 发明人六层子网构建

2.2.2 明星发明人识别测度

图3 Weston Jason E影响范围

表6 Weston Jason E影响范围测度结果

注:*表示邻居数量百分比显著偏离平均值,下同

图4 同一单位的发明人合作分析

2.2.4 明星发明人影响强度测度

由图7可以看出,Selvaraj与4个发明人建立了共发明关系,合作发明了5项专利,拥有4种IPC知识,在共发明网络形成过程中,于1家单位就职。进而由表8得出,Selvaraj的总动员潜力为15.82%,所有邻居类中邻居数量百分比偏离平均值不显著,说明Selvaraj的合作范围、发明专利、拥有的知识类别都不及Weston和Barnhill广泛,也未曾出现职业流动。但是Selvaraj在网络处于跨边界的关键地位。根据其他发明人与Selvaraj的共同邻居计算可得,Chapelle与Selvaraj交互影响程度较其他发明人略高,二者共合作了2次。通过查询Selvaraj和Chapelle的职业流动信息和专利内容,对图8呈现的合作关系进一步分析发现,两人在雅虎共事6年,交互影响程度较大,提出了成对偏好学习的高效算法,促进机器学习在网络搜索排名中的应用。Selvaraj连接的网络左右两部分分别集中在大规模分布式计算和采用支持向量机对多种数据进行特征识别方面,而Selvaraj目前主要研究分布式训练算法设计,开发各种类型的线性和非线性大数据模型,以及机器学习在文本问题中的应用。Selvaraj在网络中充当了两个不同群体之间的潜在合作桥梁,从而具备跨界影响力。

图5 Barnhill Stephen D影响范围

表7 Barnhill Stephen D影响范围测度

图6 同一单位的发明人合作分析

图7 Selvaraj Sathiya Keerthi影响范围

由图9可以看出,Sindhwani与10个发明人建立了共发明关系,合作发明了3项专利,拥有3种IPC知识,在共发明网络形成过程中,于2家单位就职。进而由表9得出,Sindhwani总动员潜力为13.56%,虽然专利产出少,但是Sindhwani主体类的邻居规模达到13.51%,仅次于Weston,说明他在一个较大的发明团队中工作,其对信息传播速度的控制能力更强。根据其他发明人与Sindhwani的共同邻居计算可得,Pednault Edwin Peter Dawson、Burdick Douglas Ronald、Ghoting Amol、Krishnamurthy Rajasekar、Tatikonda Shirish、Tian Yuanyuan、Reinwald Berthold、Vaithyanathan Shivakumar与Sindhwani交互影响程度较高,他们共合作了1次。通过查询职业流动信息和专利内容,对图10这一最大发明团队合作关系进一步分析发现,Sindhwani曾任职IBM沃森研究中心机器学习小组的最高领导,带领网络中最大的共发明团队推动支持向量机在MapReduce环境中的应用,在机器学习领域取得了重大突破。Sindhwani曾于2009年获得知识发现和数据挖掘(KDD)杯冠军,获得了2013年人工智能不确定性(UAI)最佳论文奖、2014年IBM Pat Goldberg纪念奖。

表8 Selvaraj Sathiya Keerthi影响范围测度

图8 同一单位发明人合作分析

图9 Sindhwani Vikas影响范围

3.4 机器学习领域明星发明人影响强度分析

通过计算认知需求、总度中心性和知识排他性,分析Weston在网络中具有三重角色,占据重要地位。现假定从网络中隔离了Weston,分析其对网络中领导型发明人和焦点型发明人的影响,结果如表10、11所示。

由表10可知,隔离Weston后,领导型发明人排序没有受到太大影响,而焦点型发明人排序变化巨大。如表11所示, Perez-Cruz Fernando、Grangier David、Collobert Ronan、Doursat René、Reiss Edward P受到的影响最大,排名下降了13位,而Makadia变为孤立的网络节点。度数中心性是节点网络地位的体现,是由该节点在多模网络中的位置、所连接的资源等因素共同决定的。上述结果表明,与Weston合作发明关系的稳定性,是保证Perez-Cruz Fernando、Grangier David、Collobert Ronan、Doursat René和Reiss Edward P合作网络正常发展的关键。对于企业雇佣来说,企业可以通过招聘Weston吸引来其他发明人,以此形成强有力的创新群体。

表9 Sindhwani Vikas影响范围测度

图10 同一单位的发明人合作分析

4 结语

4.1 研究结论

通过构建多模动态网络,提出明星发明人识别与角色分析方法,以机器学习领域为例,识别并验证了明星发明人的地位和功能。对明星发明人角色进行全面分析,得到以下结论:

表10 隔离前后领导型发明人排序变化

表11 隔离前后焦点型发明人排序变化

(1)明星发明人在创新网络中具有领导、焦点、传播、跨界、知识排他和任务排他6种不同地位,并且同一明星发明人可能同时具有多重地位。现有基于社会网络分析(SNA)的明星发明人识别研究最直接、最直观地测度出共发明网络中总度中心性最大的明星发明人(即本研究识别的焦点型发明人,在网络中具有焦点地位),只以发明人作为唯一研究对象。本文运用动态网络分析(DNA)法,综合考虑发明人个体特征和职业流动轨迹,根据发明人在创新群体中的地位、功能,识别出另外5类明星发明人,以及其中具有三重身份的明星发明人,结论弥补了雇佣企业仅依靠发明人产出绩效进行评估的不足。

(2)同时具有领导、焦点和知识排他地位的明星发明人影响范围更广,职业流动性更强,与其他发明人交互影响持续时间更长,如Weston。该类型发明人逐渐从职务发明过渡到非职务发明,但在该过程中,其合作关系没有因为职业流动而中断,创新活动具有持续性特点,其既具备领导力又掌握独特知识,能充分了解到其他发明人的想法,应该成为企业重点关注的对象。虽然传播型发明人也具有较大的主体邻居规模,合作范围广,但其功能更多体现在加快信息传播方面,对知识的利用度和对任务的参与度不高;虽然任务排他型发明人主体邻居规模较小,但对知识的利用度和对任务的参与度很高,雇佣此类发明人有助于企业获得重要方法或技术;潜在跨界型发明人的职业稳定性更高,跨界影响力显著,雇佣此类发明人有助于企业与外部主体开展良好合作。

(3)隔离具有三重身份的明星发明人对网络中焦点型发明人的影响显著。由此,有些发明人直接变成孤立节点,如Makadia与其他发明人完全隔离,失去网络合作机会;有些发明人核心地位下降幅度较大,合作范围受限,对网络中信息和资源的掌控程度降低,创新能力下降。这说明,明星发明人的离开会对网络中与之有合作的其他发明人造成消极影响,可能导致这类群体追随明星发明人而去,以期保持良好合作。因此,企业应制定相关人才政策,避免人才流失对创新绩效的不利影响。

4.2 管理启示

2016年3月,“阿尔法围棋(AlphaGo)”与李世石的人机大战,让人工智能受到前所未有的广泛关注。AlphaGo的全胜战绩表明,人工智能不再只是科幻电影中的构想,而是现实世界里正在上演的又一轮产业变革。经过60年沉浮发展,人工智能成为移动互联网时代产业发展的又一个重要机遇。人工智能的比拼本质上是人才的比拼,随机遇而来的必将是一场规模浩大的人才争夺战争。发明人作为创意的根本来源,在创新活动中起着关键作用,明星发明人更是提高创新绩效的一把利刃,为此企业需要争夺不同类型的明星发明人以提高自身研发创新绩效。

(1)企业需要确定有效的明星发明人识别方法,明确明星发明人在创新群体中的地位和功能,并根据自身需要选择明星发明人。本文采用动态网络分析法,通过构建多模网络,充分反映发明人个体特征在创新网络中的作用,有效识别出发明人的地位和功能。尽管本文研究是基于美国专利数据和社会媒体信息展开的,但提出的选人、用人方法具有较好普适性,替换为国内数据也可适用。

“唾弃你?不,你该珍惜自己的骨骼,不要憎恨自己,你的身躯将永远圣洁如莲。停尸房根本没有闹鬼,我会保护你免受他的骚扰,和你一起看守停尸房。”

(2)企业需要制定相关人才政策吸引和留住人才。明星发明人的离开会导致网络中部分发明人的核心地位下降,减少其他发明人获得知识的渠道,必然会影响创新绩效。这便是人力资源管理中面临的一个难题——如何留住人才。企业应根据明星发明人的地位,采取不同的人才激励政策以留住人才,如优秀的企业文化、足够的发展空间及科学有效的人才评估体系等。从人才招聘角度看,企业往往只根据自身所需知识进行人才选择,忽略了受聘人才的合作网络。从人才应聘角度看,应聘者是否决定到企业任职,主要考虑该企业是否存在与自己有过良好合作经历的伙伴。考虑到这一点,企业应该观测隔离明星发明人对其他发明人的影响,全面了解受聘者信息,进而为用人决策提供有力支持。

参考文献:

[1] NARIN F, BREITZMAN A.Inventive productivity[J]. Research Policy, 1995, 24(4): 507-519.

[2] ZUCKER L G, DARBY M R, ARMSTRONG J S. Commercializing knowledge: university science, knowledge capture, and firm performance in biotechnology[J].Management Science, 2002, 48(1): 138-153.

[3] ERNST H, LEPTIEN C, VITT J. Inventors are not alike: the distribution of patenting output among industrial R&D personnel[J]. IEEE Transactions on Engineering Management, 2002, 47(2):184-199.

[4] BLOMKVIST K, KAPPEN P, ZANDER I. Superstar inventors-towards a people-centric perspective on the geography of technological renewal in the multinational corporation[J].Research Policy, 2014, 43(4): 669-682.

[5] ALMEIDA P, HOHBERGER J, PARADA P. Individual scientific collaborations and firm-level innovation [J].Industrial & Corporate Change, 2012, 20(6): 1571-1599.

[6] BEAUDRYAB C. Impacts of collaboration and network indicators on patent quality: the case of Canadian nanotechnology innovation[J].European Management Journal, 2011, 29(5): 362-376.

[7] COHEN W M, LEVINTHAL D A. Adsorptive capacity: a new perspective on learning[J].Admi- nistrative Science Quarterly, 1990, 35(1): 128-152.

[8] COCKBURN I M, LACETERA N, HENDERSON R. Do firms change capabilities by hiring new people? a study of the adoption of science-based drug discovery[J].Advances in Strategic Management, 2004, 21(1): 133-159.

[9] PILKINGTON A, LEE L L, CHAN C K, et al. Defining key inventors: a comparison of fuel cell and nanotechnology industries[J].Technological Forecasting & Social Change, 2009, 76(1): 118-127.

[10] ROTA M, SCHETTINO F, SPINESI L. Key inventors, teams and firm performance: the italian case [J].Structural Change & Economic Dynamics, 2017(42): 13-25.

[11] SINGH J, FLEMING L. Lone inventors as sources of breakthroughs: myth or reality?[J].Social Science Electronic Publishing, 2010,56(1): 41-56.

[12] 高杰, 丁云龙, 郑作龙. 中国创新研究群体合作网络的形成与演化机理研究——科学共同体视阈下优秀创新群体案例分析[J]. 管理评论, 2018, 30(3):248-263.

[13] 柯江林, 孙健敏, 石金涛, 等. 企业R&D团队之社会资本与团队效能关系的实证研究——以知识分享与知识整合为中介变量[J]. 管理世界, 2007(3):89-101.

[14] 孙笑明, 王静雪, 王成军, 等. 研发者专利合作网络中结构洞变化对企业创新能力的影响[J]. 科技进步与对策, 2018, 35(2): 116-122.

[15] GRIGORIOU K, ROTHAERMEL F T. Structural microfoundations of innovation: the role of relational stars.[J]. Journal of Management, 2014, 40(2):586-615.

[16] ZWICK T, FROSCH K, HOISL K, et al. The power of individual-level drivers of inventive performance[J].Research Policy, 2017, 46(1): 121-137.

[17] LORENZO F D, ALMEIDA P. The role of relative performance in inter-firm mobility of inventors [J].Research Policy, 2017, 46(6): 1162-1174.

[18] 杨忠,文庭孝. 专利发明人影响力评价模型构建及实证研究——基于文献计量与社会网络分析双重视角[J].情报理论与实践, 2018, 41(9): 69-75.

[19] ZHANG G, DUAN H, ZHOU J. Network stability, connectivity and innovation out put[J].Technological Forecasting & Social Change, 2017(114): 339-349.

[20] MENON C. Stars and comets: an exploration of the patent universe[R].London: LSE, 2009.

[21] LI G C, LAI R, D'AMOUR A, et al. Disambiguation and co-authorship networks of the U.S. patent inventor database (1975-2010)[J].Research Policy, 2014, 43(6): 941-955.

[22] CARLEY K M. Dynamic network analysis[M].Washington: The National Academic Press, 2003.

[23] Ora: organizational risk analyzer[R]. Pittsburgh: CMU, 2004.

[24] AGRAWAL A, MCHALE J, OETTL A. How stars matter: recruiting and peer effects in evolutionary biology[J].Research Policy, 2017, 46(4): 853-867.

[25] TSENG C Y, TING P H. Patent analysis for technology development of artificial intelligence: a country-level comparative study[J].Innovation, 2013, 15(4): 463-475.

Identification and Role Analysis of Star Inventors :an Empirical Study on Machine Learning Technology

Wu Feifei, Li Qian, Huang Lucheng, Li Xin

(School of Economics and Management, Beijing University of Technology, Beijing 100124)

Abstract :Star inventors contribute to enterprises to improve the R&D innovation performance. At present, the research on star inventors lacks analysis of their status and function. Enterprises can not fully understand the information of inventors, which is not conducive to recruiting suitable talents for their R&D activities. This paper proposes to identify the functions and status of the star inventors in the field of machine learning, such as leadership, communication, knowledge or task exclusion. By using dynamic network analysis, we identify the focus inventor, the leading inventor, the potential trans-boundary inventor, the disseminated inventor, the task-exclusive inventor and the knowledge-exclusive inventor and analyze 6 kinds of roles in the machine learning technical field. Our results are threefold: ①some star inventors have multiple roles; ②star inventors with status of leader, focus and knowledge-exclusive have a wider range of effects, higher mobility, a longer duration of interaction with other inventors; ③the isolation of a triple-roles star inventor in the network has a significant impact on the focus inventor.

Key Words :Star Inventor; Star Scientist;Role Analysis; Dynamic Network Analysis; Machine Learning

收稿日期: 2019-01-21

基金项目: 国家自然科学基金项目(71774009、71673018)

作者简介: 吴菲菲(1962-),女,北京人,博士,北京工业大学经济与管理学院教授,研究方向为技术项目管理、技术未来分析;李倩(1993-),女,山东单县人,北京工业大学经济与管理学院硕士研究生,研究方向为技术创新管理;黄鲁成(1956-),男,河北徐水人,博士,北京工业大学经济与管理学院教授,研究方向为科技管理、技术与项目管理、技术未来分析、创新政策等;李欣(1980-),男,河南新蔡人,博士,北京工业大学经济与管理学院副研究员,研究方向为技术创新、技术预测、科技与创新政策。

DOI :10.6049/kjjbydc.2018100249

开放科学(资源服务)标识码( OSID):

中图分类号: G306

文献标识码: A

文章编号: 1001-7348(2019)14-0131-10

(责任编辑:林思睿)

标签:;  ;  ;  ;  ;  ;  

明星发明人识别与角色分析:来自机器学习领域的实证论文
下载Doc文档

猜你喜欢