基于多层感知机的技术创新人才发现方法论文

基于多层感知机的技术创新人才发现方法

冯 岭1谢世博1 刘 斌2

1(华北水利水电大学信息工程学院 河南 郑州 450046)2(武汉大学计算机学院 湖北 武汉 430072)

摘 要 专利数据中包含了丰富的科技信息。通过对专利数据的分析,不仅可以帮助企业快速了解当前领域的发展状况,还可以及时发现领域中的技术创新人才。当前的技术创新人才发现方法往往是孤立地从各个专利特征的角度来评估发明人的技术创新实力,而没有统一的学习模型来发现专利集合中的技术创新人才。针对该问题,提出一种基于多层感知机模型的技术创新人才发现方法。从专利数据中抽取发明人的各个特征;基于抽取的发明人特征构建多层感知机模型;采用该多层感知机模型在专利数据集合中发现技术创新人才。实验结果表明,该方法是有效的。

关键词 专利数据 创新人才 多层感知机

0 引 言

作为一种重要的科技信息载体,专利数据中包含了丰富的技术信息。根据世界知识产权组织的统计,专利数据中包含了世界上90%~95%的研发成果[1]。从专利数据中不仅可以检索到最新的科技信息,更能通过专利分析和挖掘来发现当前各个领域的技术创新人才。专利数据是评价和发现技术创新人才的重要依据之一[2]

当前已经存在了一些基于专利数据的技术创新人才发现方法。例如,文献[3]提出了一种基于合作网络的技术创新人才发现方法,通过网络中不同节点的点度中心度、中间中心度和接近中心度来找出团队中的技术创新人才。文献[4]分析了专利作为学术评价指标的选取,提出将专利的质量、授权状态、有效性以及许可和转让情况等作为评价技术创新人才的指标。文献[5]则构建了企业科技人才评价的指标体系,通过专利申请数量、专利被引次数、平均专利被引次数、著者总数、著者平均专利数等多个因素来评价技术创新人才。

然而,这些方法仅仅从各个特征的角度评估了各个发明人的技术创新实力,而没有给出统一的学习模型来发现专利集合中的技术创新人才。如何综合考虑专利数据中包含的各种专利特征,并建立统一、有效的学习模型来发现专利集合中的技术创新人才,仍是当前面临的一个重要问题。

多层感知机模型是最为常见的深度学习模型之一,它在车牌字符识别[6]、财务风险预警[7]和疾病早期识别[8]、竞争性的协同进化预测[9]等分类、识别和预测问题上得到了广泛的应用,并取得了较好的效果。因此,该模型可以用来构建技术创新人才识别的学习模型,以发现专利集合中的技术创新人才。

我今天请你吃饭,就是觉得那时亏欠你,我们都上了老田的当。你还能想起老田吗?那个天杀的老田,咱们是让他给害苦了。

多层感知机模型是最为常见的深度学习模型之一,它在车牌字符识别、财务风险预警和疾病早期识别、竞争性的协同进化预测等分类、识别和预测问题上得到了广泛的应用,并取得了较好的效果,因此可以用来构建技术创新人才的学习模型,以评估人才的技术创新实力。尽管我们也可以采用传统的机器学习模型(如朴素贝叶斯分类器、支持向量机和决策树等)来发现专利集合中的技术创新人才,但传统的机器学习模型只能基于人工定义的浅层特征用于模型的学习,而多层感知机模型通常具有多个隐藏层,可以抽取深层特征用于模型的学习,其准确率更为精确。因此,本文将采用多层感知机来构建技术创新人才的学习模型,以发现专利集合中的技术创新人才。

1 相关工作

当前的技术创新人才发现方法大体可以分为两种:一种是通过对人才合作网络中不同节点的中心性指标进行分析,以找出其中的技术创新人才;而另一种方法则通过构建专利指标体系来评估各个人才的技术创新实力。

基于合作网络的方法首先基于科技人才之间的合作关系构建合作网络,然后通过网络中各个节点的点度中心度、中间中心度以及接近中心度等中心性指标来找出其中的技术创新人才。在该方面,文献[10]提出将合作网络中点度中心度和中间中心度都较高的作者作为学术带头人的遴选指标;文献[3]则在构建的发明人合作网络的基础上,综合考虑点度中心度、中间中心度以及接近中心度等指标,以了解各个发明人对团队影响程度的大小,从而确定其中的核心成员。然而,尽管这种方法具有一定的合理性,但该方法仅考虑了人才之间的合作关系的相关特征来发现技术创新人才,技术创新人才识别的查全率与查准率不高,不能准确地评价和发现技术创新人才[11-12]

式中:m 为与发明人I 存在合作关系的发明人的数量,PN (I i )为与发明人I 存在合作关系的第i 个发明人的专利申请数量。

基于以上原因,本文在对专利发明人特征进行了充分分析的基础上,提出了一种基于多层感知机模型的技术创新人才发现方法。该方法首先从专利数据中抽取发明人的各个特征,然后基于抽取的发明人特征构建多层感知机模型,并通过训练数据集对该模型中的参数进行学习,最后采用学习所得的多层感知机模型在专利数据集合中准确地发现技术创新人才。

2 基于多层感知机的技术创新人才发现方法

基于专利数据的技术创新人才发现即在专利集合中识别技术创新实力较强的发明人。本文提出了一种基于多层感知机的方法来发现专利集合中的技术创新人才,该方法的主要步骤包括发明人特征抽取、多层感知机模型构建与学习以及应用多层感知机模型进行发明人的技术创新实力评估等。

2.1 发明人特征抽取

专利数据中包含了多种不同的特征信息。图1给出了一个专利的部分结构化特征的示例。可以看到,专利中不仅包含专利号、申请日、标题、申请人、发明人等信息,还包含了专利之间的引用信息。其中,发明人为撰写该专利的作者,而申请人则为专利权的所有者,通常为一个企业或组织。除了以上的结构化特征以外,专利数据中还包含了摘要、专利说明书、权利声明等文本信息。

图1 一个专利的部分结构化特征的示例

为了验证文中所提出方法的有效性,我们将提出的基于多层感知机的技术人才发现方法与文献[3]中的基于合作网络中心度的方法以及传统的机器学习方法(包括支持向量机、朴素贝叶斯和决策树分类算法等)进行了对比。实验中采用的专利数据集为从欧洲专利局Espacenet系统下载的“华为科技有限公司”和“电动汽车”领域的专利数据,两个数据集的细节描述如表1所示。

(1) 专利申请量 发明人所申请的专利数量反映了发明人的技术创新能力。一般来说,一个发明人申请的专利数量越多,则该发明人的技术创新实力越强。本文中,发明人所申请的专利数量用PN 来表示。

(2) 专利总被引量 专利的被引用次数反映了专利的质量和价值。一个发明人所申请专利的总被引量越高,则该发明人更可能为一个技术创新实力的发明人。对于专利集合中的任意发明人I ,其专利总被引量SumCitedNum 的计算公式为:

(1)

1.3 测定项目及方法 待15个不同品种的蔬菜移栽后20 d,取各处理展开的叶片测定各项生理指标。参考植物生理生化试验指导上的方法[5],分别测定可溶性糖(蒽酮比色法)、可溶性蛋白(考马斯亮蓝G-250染色法)、叶绿素含量(SPAD-520Plus)、青菜地上及地下部鲜重。

应用心理学专业就业“亮红牌”的办学原因分析与对策研究…………………………………………马利军,关舒婷(94)

(3)合作发明人数量 发明人之间的合作关系反映了发明人在特定领域中的影响力和技术创新实力。一个发明人所合作的发明人数量越多,则该发明人的影响力越大。本文中,我们将与发明人I 存在合作关系的发明人数量用CoNum 来表示。

如假设上三角元素的第一行中仅d11、u12、u13三个元素不为0,根据对称性可知l21、l31二个元素也不为0,因此在计算第一列的元素时,可仅计算三个元素,而元素根本无需计算,其计算顺序如图2右侧有阴影的数字所示。因此对F阵的前代计算若采用按列方式,其下三角的l元素可利用所记录的上三角非零u元素的列标来大大提高对F阵的前代计算速度。

(4) 合作发明人的平均专利申请量 合作发明人的专利申请量反映了所合作发明人的技术创新实力。如果与发明人I 存在合作关系的发明人的技术创新实力都较强,则通常发明人I 的技术创新能力也较强。我们用与发明人I 存在合作关系的所有发明人的平均专利申请量CoPatNum 来度量其合作发明人的平均技术创新实力,其计算公式表示为:

(2)

与基于合作网络的方法不同,基于专利指标体系的方法则分析了专利数据中包含的一系列专利特征,并构建相应的专利指标体系来评估各个技术人才的创新实力。在该方面,文献[4]分析了专利作为学术评价的指标的选取,提出将专利的质量、授权状态、有效性以及许可和转让情况等作为评价技术创新人才的指标。文献[5]则等以丹麦维斯塔斯风电技术集团公司专利数据为研究样本,构建企业科技人才评价指标体系,通过专利申请数量、专利被引次数、平均专利被引次数、著者总数、著者平均专利数等多个因素来评价各个发明人的技术创新实力。然而,这种方法仅仅从专利特征的角度分析了各个特征对发明人技术创新实力的影响,但却没有给出统一的学习模型来发现专利集合中的技术创新人才。如何综合考虑专利数据中包含的各种专利特征,并构建统一、有效的学习模型来发现专利集合中的技术创新人才,仍是当前面临的一个重要问题。

(5) 申请人维持的专利数量 在技术创新能力强的企业工作的发明人往往创新能力也很强。因此,发明人所属的企业或组织(通常称为专利的申请人或专利权人)的技术创新实力也是影响发明人技术创新实力的一个重要因素。我们用发明人所属的申请人(即发明人所属的企业或组织)维持的专利数量来度量该申请人的技术创新实力,在文中用AplNum 来表示。

本文讨论的探测对象是飞行速度慢、RCS小的目标,简称“慢小目标”(Slow and Small Target,SST)。随着各类满足SST特征飞行器的快速发展和我国低空开放的迫切需求[1],SST对现代防空预警系统威胁程度越来越大。由于缺乏专用于SST的探测装备,使得目前对SST的发现概率很低。即使常规雷达信号处理能够部分检测到SST,也往往会因为杂波干扰强度大和目标回波微弱等原因[2-3],导致雷达操纵员将其误当成杂波点[4-5]。

(6) 专利文本特征 专利文本中记录了重要的技术情报信息,直接反映了发明人研究主题、研究领域和技术创新实力。技术创新能力较强的发明人,其研究的主题和采用技术手段都较为新颖。而技术创新能力较弱的发明人,其所申请专利的研究主题和技术手段较为普通。因此,专利文本是影响发明人技术创新实力的又一重要因素。本文中,我们根据发明人所申请的专利文档集合,用一组关键词的空间向量来表示发明人的专利文本特征。对于专利集合中的任意发明人I ,其专利文本特征表示为(w 1,w 2,…,w n ),其中n 为关键词的个数,w i 对应于第i 个关键词在发明人I 中的权重。w i 的计算采用类似TF-IDF公式的方法进行度量,即如果某个关键词在一个发明人申请的专利文档中出现的频率高,并且在其他发明人所申请的专利文档中很少出现,则认为此关键词在该发明人的空间向量中的权重越高,其计算公式为:

式中:P (I )为发明人I 所申请的专利的集合,CitedNum (p i )为专利p i 被引用的次数。

(3)

式中:tf (t i ,d k )为关键词t i 在发明人I 申请的第k 篇专利文档d k 中出现的频率,D (I )表示发明人I 所申请的专利文档的集合,因此即关键词t i 在发明人I 申请的专利文档中出现的总频率;m 为专利集合中发明人的总数量,m i 为申请的专利文档中包含关键词t i 的发明人数量,log(m /m i )即为关键词t i 的“倒发明人频率”。

2.2 技术创新人才发现方法

如图3所示,在训练阶段,我们将作为一个过去的时间间隔,作为一个未来的时间间隔,根据内申请的专利来训练构建的多层感知机模型。首先,根据基于时间间隔内申请的专利集合对各个发明人申请专利的数量进行统计,并将申请专利数量最多的前百分之k 个发明人标记为技术创新人才,其他发明人标记为非技术创新人才。然后,基于时间间隔内申请的专利,抽取了各个发明人的特征作为多层感知机的输入,并根据标记的发明人标签采用BP算法对多层感知机模型中各层节点之间的连接权重进行训练,得到多层感知机模型。

图2 采用的多层感知机模型的网络结构

对于第k 层的第i 个神经元节点,其输出取决于该层的激活函数是该节点的输入的加权和,定义为:

由近期开展的“中英交流项目”英方领队黛比·摩根女士的以下总结可以看出,上述分析确实涉及到了中国数学教学十分重要的一些特点:“英国从与上海的交流项目中学习到的有益经验,可以用‘掌握’一词来加以描绘和概括……在观察上海的数学课堂时,让我们印象特别深刻的是:似乎所有的学生对数学学习各个阶段的不同要求都有很好的掌握.没有学生被落下.这和英国的情况截然相反.”以下则是英方对于构成“‘为了掌握而教’的有效支持策略”的具体分析:“精心的教学设计、增强课程连贯性、优化教材使用、变式教学、开发‘动脑筋’(指‘拓展练习’——注)栏目、发展学生对数字事实的熟练程度等.”[10]

(4)

式中:是第k -1层第j 个节点的输出值,是第k -1层的第j 个节点到第k 层的第i 个节点的连接权重,N k-1 是第k -1层的节点数。

对于多层感知机模型中的第一至三层,我们选用选用修正线性单元ReLU(Rectified linear unit)作为该层的激活函数,即f (z )=max{0,z }。

对于多层感知机模型中的第四层,由于我们的输出是发明人为技术创新人才的概率,即需要将输出映射到取值范围为(0,1)的区间,因此我们采用sigmoid函数作为本层的激活函数,即:

(5)

模型参数学习:

为了能够基于构建的多层感知机模型来发现专利集合中的技术创新人才,我们首先需要对该多层感知机模型进行学习。多层感知机模型的学习主要是对各层节点之间的连接权重进行学习,其学习过程通常采用基于随机梯度下降原理的误差反向传播(BP)算法[13]来进行实现。即首先给多层感知机的初始权值设置一个小的随机数,然后将训练样本集输入到多层感知机网络,采用基于随机梯度下降原理的误差反向传播(BP)算法对该网络进行训练,调整网络参数,从而使得采用多层感知机模型运算后的实际输出值尽量接近期望输出值。在文中即为使得计算出的发明人为技术创新人才的概率值与发明人是否为技术创新人才的标签尽量接近。我们采用均方误差作为训练过程中的损失函数,该损失函数J (w )可以表达为:

(6)

式中:h w (x (i) )是采用文中的多层感知机模型计算出来的第i 个发明人为技术创新人才的概率;y i 是预先标记好的第i 个发明人的标签,用来表示该发明人是否为一个技术创新人才(如果y i =1,表示该发明人是技术创新人才,如果y i =0,表示该发明人是技术创新人才);m 为专利集合中发明人的总数量。

通过BP算法,我们可以对多层感知机中的参数进行有效的学习。从而,在测试阶段,我们即可使用训练得到的多层感知机模型来计算各个发明人为技术创新人才的概率。

利用污水源热泵系统,将冷凝器侧的管网与现状供热管网的回水连接,通过提升锅炉一次管网回水温度的方式,向供热管网补充热量。热量补充原理图如图2所示。

3 实验结果与分析

为了构建多层感知机模型来发现专利集合中的技术创新人才,我们首先抽取了反映各个发明人技术创新实力的专利特征。文中抽取的发明人特征包括专利申请量、专利总被引用量、合作发明人数量、合作发明人的平均专利申请量、申请人维持的专利数量以及所申请专利的文本特征等。

表1 使用的专利数据集的描述

3.1 实验设置

我们根据发明人在未来一段时间内申请专利的数量来衡量发明人的技术创新实力,即一个发明人在未来一段时间内申请的专利数量越多,则该发明人更可能为一个技术创新人才。基于该假设,我们根据专利申请的时间将专利集合划分为四个部分:时间间隔内申请的专利,时间间隔内申请的专利,T 1(T 1=[2010,2014])时间间隔内申请的专利,以及T 2(T 2=[2015,2017])时间间隔内申请的专利。其中,时间间隔内申请的专利用于对多层感知机模型进行训练,T 1和T 2时间间隔内申请的专利用于验证文中所提出的方法的效果。

图3 技术创新人才发现方法的实验设置

根据以上抽取的发明人特征,我们采用基于多层感知机的技术创新人才发现方法来评估各个发明人的技术创新实力,以发现专利集合中的技术创新人才。如图2所示,该多层感知机模型共包括4层:第一层为输入层,该输入为从专利集合中提取的特征向量,即2.1节中抽取的各个发明人特征的权重;第二、三层为隐藏层,用来从输入层的基本特征中抽取更高层次的特征信息;第四层为输出层,用于输出各个发明人是否为技术创新人才的概率。其中,每一层神经元节点的输出都是前一层神经元节点的函数。

对于小学生而言,从小就训练、掌握良好的书写方面的技能非常关键,而且语文成绩好坏对于小学生的影响也非常重大。所以,老师在备课、讲课的过程当中,首先应该分析不同学生的学习特点和基础情况,有侧重点地去培养学生“爱读书、读好书”的习惯,督促学生在读书的同时多思考,写读书笔记等,在学习的点点滴滴当中,不知不觉地找到学习知识的乐趣。

在测试阶段,同样地,根据基于T 2时间间隔中申请的专利集合对各个发明人申请专利的数量进行统计,并将申请专利数量最多的前百分之k 个发明人标记为技术创新人才,其他发明人标记为非技术创新人才。然后,我们基于T 1时间间隔内申请的专利来抽取各个发明人的特征,采用训练阶段得到的多层感知机模型来计算各个发明人为技术创新人才的概率,并将概率最大的前百分之k 个发明人标记为技术创新人才,其他发明人标记为非技术创新人才。最后,我们将基于T 1时间间隔内的专利文档计算得到的各个发明人的标签与基于T 2时间间隔内的专利文档预先标记的各个发明人的标签进行对比,以验证所提出方法的效果。

3.2 评估方法

我们根据采用文中方法计算得到的发明人标签的准确率来验证所提出方法的效果。该准确率可以用公式表示为:

(7)

式中:为采用文中方法计算所得的第i 个发明人的标签,y i 为预先标记好的第i 个发明人的标签;为判断和y i 是否相等的函数(如果否则,m 为专利集合中发明人的总数量。

3.3 结果与分析

我们从企业(“华为科技有限公司”的专利数据集)和研究领域(“电动汽车”专利数据集)两个维度对文中提出的基于多层感知机的技术人才发现方法进行实证分析,以验证所提出方法的有效性。

表2给出了基于多层感知机的方法(Multi-layer Perceptron,MLP)与基于合作网络中心度的方法(Network Centrality,NC)以及传统的机器学习方法,包括支持向量机(Support Vector Machine,SVM),朴素贝叶斯(Naive Bayes,NB),决策树算法(Decision Tree,DT)等,在“华为科技有限公司”的专利数据集上进行技术创新人才发现的准确率。

本研究采用统计学软件对所有涉及到的数据进行检验,统计学软件版本为IBM SPSS23.0,采用P<0.05表示差异明显,具有统计学意义。

表2 “华为科技有限公司”数据集上各个方法的准确率

在该专利数据集上,我们给出了在不同的k 值下五种方法的准确率。其中,k 为被标记为技术创新人才的发明人在整个发明人集合中的所占的比例。

兴趣是最好的老师。小学生学习兴趣是提升学习品质的重要因素,小学道德与法治是一门综合性较强的学科,它不仅要对学生进行思想教育,促使学生树立正确的人生观、价值观,还要对学生认知进行改造和优化,培养他们积极乐观的生活态度,帮助学生参与社会、学习做人。教学实践中,教师要注意采用多元化教学方式,激发学生学习兴趣,进而促使学生主动学习相关知识。激趣方式众多,情境创设、故事讲述、观看视频、做实验、做游戏都比较常用。具体如何选择,教师要根据现实需要进行设计。

我们首先分析了同一种方法在不同k 值下的准确率变化。由3.1节可知,当k 较小时,采用文中方法标记为技术创新人才的数量和预先标记的技术创新人才的数量都较少,而同时被标记为非技术创新人才的数量都较多(即两种方式都有大量的发明人被标记为非技术创新人才)。因此,对于任意发明人,其通过文中方法计算得到的标签值与预先标记的标签值有较大的概率相等(即都有较大的概率都被标记为非技术创新人才)。根据式(7)可知,此时各个方法的准确率一般都较高;而当k 增大时,同时被标记为非技术创新人才的数量减少,其通过文中方法计算得到的标签值与预先标记的标签值相等的概率也相应的减小。此时,各个方法的准确率一般也会随之下降。从表2中各个方法的准确率可以看到,同一种方法的准确率都随着k 值的增大而减小。

我们也比较了不同方法在同一k 值下的准确率。可以看到,在表2中,当k =2,4,6,8,10时,采用基于合作网络中心度的方法和朴素贝叶斯方法和决策树方法计算得到的技术创新人才的准确率均低于文中提出的基于多层感知机的方法。而对于采用支持向量机的方法,当k =2,4,6,8时,该方法的准确率同样低于基于多层感知机的方法,仅在k =10时,两个方法的准确率基本相等。由此可知,在“华为科技有限公司”的专利数据集上,采用多层感知机的方法进行技术创新人才发现的准确率在绝大多数情况下都高于采用合作网络中心度的方法和传统的机器学习方法。即相对于其他方法,文中所提出的基于多层感知机的技术创新人才发现方法具有更好的效果。

第二天上午,钱多多开车去了欧阳锋单位,把欧阳锋叫到自己车里,将钱交给欧阳锋时问他这么急着用钱干嘛。欧阳锋不会撒谎,把那晚发生的事毫无保留地告诉了钱多多。

在表3中,我们给出了在“电动汽车”专利数据集上五种方法的准确率。可以看到,对于同一种方法在不同k 值下的准确率变化趋势上,同表2中的结果,大多数方法的有效性都随着k 值的增大而减小,仅朴素贝叶斯方法在k =10时,其准确率与k =8时相比略有上升。而对于各个方法在同一k 值下的准确率对比上,当k =2,4,6,8,10时,采用文中提出的基于多层感知机的技术人才发现方法的准确率均高于基于合作网络中心度的方法、朴素贝叶斯方法和决策树算法。即在不同的k 值下,采用多层感知机的技术创新人才发现方法比以上三种方法具有更好的效果。对于采用支持向量机的方法,当k =2,4时,该方法的准确率与基于多层感知机的方法相等;当k =6,10时,基于多层感知机的方法的准确率略低于采用支持向量机的方法;而当k =8时,基于多层感知机的方法的准确率略高于采用支持向量机的方法。即在总体上,采用基于多层感知机的方法进行技术创新人才发现的准确率与采用支持向量机的方法总体上相差不多。总而言之,在“电动汽车”专利数据集上,基于多层感知机的技术人才发现方法的效果仍好于基于合作网络中心度的方法和大多数传统的机器学习方法。

为了适应马铃薯主粮化产业发展,在安顺马铃薯综合试验站的大力支持下,镇宁自治县农业局引进新品种进行展示试验。初步了解各品种在我县的抗逆性、丰产性、商品性、植株性状及薯块品质等综合性状进行适应性鉴定和评价,为筛选和确定适宜的良种推广、合理引种提供准确可靠的科学依据。

表3 “电动汽车”数据集上各个方法的准确率

由以上两个数据集上各个方法的准确率对比可以看出,文中提出的基于多层感知机的技术创新人才发现方法在绝大多数情况下都比其他方法具有更好的判别效果。产生该结果的原因是,对于基于合作网络中心度的方法,该方法仅仅考虑了发明人之间的合作关系对发明人技术创新实力的影响,而忽略了发明人的其他专利特征,如专利申请量、专利总被引量、合作发明人的平均专利申请量等,造成该方法的效果不佳。而对于传统的机器学习方法,如朴素贝叶斯,支持向量机和决策树算法等,尽管综合考虑了发明人的各种专利特征,并构建了相应的机器学习模型用于技术创新人才的识别,但这些方法只能基于人工定义的浅层专利特征用于模型的学习,其准确率仍有待提高。而文中采用的多层感知机模型则具有多个隐藏层,可以从人工定义的浅层专利特征中进一步抽取深层的特征用于模型的学习,因此采用多层感知机模型来进行技术创新人才发现的结果更为精确。综上所述,在技术创新人才发现的问题上,与已有的技术创新人才方法相比,基于多层感知机的技术创新人才发现方法具有更好的判别效果。

4 结 语

本文提出了一种基于多层感知机的技术创新人才发现方法,该方法不仅抽取了反映发明人技术创新实力的多个发明人特征,而且构建了统一的模型对各个发明人的技术创新实力进行评估。与传统的机器学习方法只能通过人工定义的浅层特征进行模型学习的方式相比,文中提出的基于多层感知机的方法可以通过加入多个隐藏层来抽取更为深层的特征用于技术创新人才发现模型的学习,在技术创新人才发现问题上具有更好的效果。

参考文献

[1] 吴兴杰. 专利“商业化时代”创新商业模式[J]. 商业文化, 2014(9):89-89.

[2] 郑仁华, 杨健, 邹俐均. 专利在高校创新型人才培养中的应用价值[J].实验室研究与探索, 2017, 36(7):199-202.

[3] 王立杰. 基于Ucinet社会网络分析的专利发明人团队和核心发明人分析——以华南理工大学高分子光电材料与器件研究所为例[J]. 农业图书情报学刊, 2016, 28(10):72-76.

[4] 涂湘波, 晁蓉, 廖红四. 高校人才学术评价的专利指标研究[J]. 当代教育理论与实践, 2013, 5(6):70-72.

[5] 贡金涛, 王平尧, 刘盛博. 基于专利合著指标和引用指标的企业科研人员评价研究[J]. 科学学与科学技术管理, 2015, 36(2): 161-172.

[6] 王珏, 李洪研. 基于局部二值模式与多层感知器的中文车牌字符识别高效算法[J]. 计算机应用, 2015(S1):283-285.

[7] 张漫漫, 卢静. 基于多层感知器的财务风险预警研究——以北京市上证A股工业企业数据为例[J]. 商业会计, 2016(1):35-37.

[8] 章浩伟, 高燕妮, 苑成梅,等. 基于多层感知器神经网络的双相障碍早期识别研究[J]. 生物医学工程学杂志, 2015(3):537-541.

[9] Castellani M. Competitive co-evolution of multi-layer perceptron classifiers[J]. Soft Computing, 2017(3):1-16.

[10] 魏瑞斌, 李普, 潘云涛,等. 科研合作网络在创新团队成员遴选中的应用研究[J]. 中国基础科学, 2012, 14(5):60-64.

[11] 李纲,李春雅,李翔. 基于社会网络分析的科研团队发现研究[J]. 图书情报工作,2014,58(7):63-70.

[12] 李纲,刘先红.基于合作网络中心性指标的科研团队学带头人识别研究[J].科技管理研究,2016,36(8):127-132.

[13] 周志华.机器学习[M]. 北京:清华大学出版社, 2016.

A TECHNICAL INNOVATION TALENTS DISCOVERY METHOD BASED ON MULTI-LAYER PERCEPTRON

Feng Ling1 Xie Shibo1 Liu Bin2

1 (School of Information Engineering ,North China University of Water Resources and Electric Power ,Zhengzhou 450046 ,Henan ,China )2 (School of Computer ,Wuhan University ,Wuhan 430072 ,Hubei ,China )

Abstract Patent data contains rich scientific and technological information. The analysis of patent data not only can help enterprises quickly understand the current situation of development in the field, but also can timely discover the technological innovation talents in the field. Existing methods for technical innovation talents discovery generally evaluate the strength of the inventors by various patent features in isolation, and there is not a unified learning model to discover the technical innovation talents in the patent collection. In view of this, we proposed a technical innovation talents discovery method based on multi-layer perceptron. We extracted the inventor’s features from patent data, constructed a multi-layer perceptron model based on the extracted features, and used the multi-layer perceptron model to discover technical innovation talents in the patent collection. The experimental results show that the proposed method is effective.

Keywords Patent data Innovation talent Multi-layer perceptron

收稿日期: 2018-11-03。

国家自然科学基金青年项目(71603252);ISTIC-CLARIVATE ANALYTICS科学计量学联合实验室开放基金项目。

冯岭 ,讲师,主研领域:文本分析,数据挖掘。谢世博 ,硕士生。刘斌 ,讲师。

中图分类号 TP391

文献标识码 A

DOI: 10.3969/j.issn.1000-386x.2019.07.005

标签:;  ;  ;  ;  ;  

基于多层感知机的技术创新人才发现方法论文
下载Doc文档

猜你喜欢