专利权人关联网络的社会网络分析方法研究,本文主要内容关键词为:专利权人论文,网络论文,方法论文,社会论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G350 [文献标识码]A [文章编号]1003-2797(2011)03-0058-0g
1 引言
社会网络分析(Social Network Analysis,SNA)是对社会关系结构及其属性加以分析的一套规范和方法,源自社会学和商业领域,它主要分析的是不同社会单位(个体、群体或社会)所构成的关系的结构及其属性[1]。
社会网络分析在社会学研究中已经得到广泛的应用,如今,作为一种非常有用的方法,社会网络分析法早已突破了社会学领域的范围,为其他领域的学者所采用,其中在情报学领域主要应用在论文合著网络与引文网络分析领域。然而,专利网络与论文网络存在不同的特征[2],将社会网络分析方法引入专利分析,目前此方面的研究国内外均较少。2008年,德国学者Sternitzke等就指出,社会网络分析方法才刚刚开始进入专利分析领域,应用前景广阔。社会网络分析在专利分析中的应用是对社会网络分析方法学的有益拓展,首先,可以对技术领域或组织机构内的重要发明人或实体进行鉴别;其次,通过发明人或专利权人之间的联系网络,可以进行竞争分析或为创建联合研发项目寻找合作伙伴提供参考;第三,通过专利的引文网络分析,可以识别核心专利;最后,可以用于对抗竞争对手[3]。可以预见,将社会网络分析方法应用于专利分析中具有重要意义。
当前有关专利的社会网络分析研究较多的是专利引用网络分析,如多级专利引用分析[4]、文献耦合网络分析[5]、专利引用信息流分析[6]、专利引文网络的小世界现象分析[7]等。然而,引用网络分析仅仅是社会网络分析在专利分析中应用的一个方向,除了专利引用网络,可以以国家、专利权人、发明人为节点,从专利合作的角度开展社会网络分析,例如,国家和专利权人的竞合网络[8]、IPC之间的关联强度[9]以及基于IPC计算专利之间的相关度并用于技术路线图研究[10]。
目前有关专利社会网络分析的研究具有以下特征:专利引用网络主要以专利文献本身为节点,个别直接引用网络的研究以专利权人为节点;专利权人合作网络则主要讨论专利权人的合作关系的有无及强弱;专利主题关联网络则以IPC等代表技术主题特征的分类号为节点。而对专利文献所承载的专利权的所有者——专利权人的分析尚缺乏系统的研究方法体系,通过基于专利权人的社会网络分析,分析专利权人在创新过程中所处的位置以及发挥的价值,将是非常广阔的研究领域。
本文在研究方法上将借鉴近几年来图书情报学领域对社会网络分析方法的应用实践,特别是在基于论文的社会网络分析方法实践经验的基础上,结合现有专利社会网络分析方法,构建一套专利权人社会网络分析方法体系框架,从专利权人合作、专利权人引用和专利权人技术主题关联三个层面上构建专利权人的社会网络分析方法框架,并进行实证分析。
2 基于SNA的专利权人网络分析方法体系
网络研究,特别是复杂网络研究正在经历从发现不同网络共性到深入挖掘具有代表性的典型网络的特性这一过程,在开展复杂网络研究的最初几年,推动研究的主要力量是隐藏在各种各样网络中的统计共性,例如小世界现象、无标度效应、社团结构等等;最近三四年,大量的研究开始关注一些有代表性的网络具有的不同于其他网络的独特的性质[11]。例如公路网的强几何约束条件[12],计算机互联网独特的外围增长激励机制[13],科学家合作网的富者俱乐部[14]现象,等等。正是受这种从一般到特殊,从共性到个性的研究趋势的影响,本文将基于社会网络分析方法现有的理论与方法体系及在社会学领域特别是在论文分析中的应用,结合专利文献的数据结构特征,在方法层面研究适用于专利权人网络分析的方法,构建包括基于合作、基于引用和基于技术主题三个方面的分析体系框架(图1)。具体分析指标包括:网络分布特征、网络规模(网络密度、直径)、网络动力学、连接分析、中心性(度数中心性、中介中心性)等。
图1 专利权人关联网络分析体系框架图
2.1 基于合作的专利权人合作网络分析方法
2.1.1 基本原理
专利权人合作网络包括研发合作(无向网络)、专利权转移(有向网络)等所产生的关联关系,本文研究忽略无向图和有向图之间专利权人性质的差异,对因专利权转移产生的合作关系和基于研发合作的共同专利权人的合作网络不作区分,均纳入专利权人合作网络,按无向图处理。
2.1.2 分析方法研究与内容
本文提出的基于合作的专利权人网络主要从四个主要方面进行分析,包括全球规模的专利权人合作网络、特定学科领域(技术主题)的专利权人合作网络、特定专利权人的合作网络、自我中心的合作网络。
(1)全球规模的专利权人合作网络分析方法。在图书情报领域,与地球上的大多数其他数据相比,论文和专利数据相对“单一化”,具有数据易获取、易处理的特点。因此,基于现有数据库,我们可以获取特定时间段内的全球所有(数据库收录范围内)的论文或专利数据,进而对其进行分析。已有学者在论文分析方面开展类似研究,如Leydesdorff与Rafols基于ISI的学科分类构建了全球科学地图[15],而在专利分析领域,尚未见相关研究成果。
(2)特定学科领域(技术主题)的专利权人合作网络分析方法。基于数据库自身的分类体系,分析某特定领域的数据;或以关键词进行检索,如Judit(2008)采用关键词检索的策略对计量情报学在21世纪的发展进行了综述研究[16];利用国际专利分号或美国专利分类号进行专利检索,用于构建专利数据集。例如,OECD[17]、英国SPRU[18]和Linton[19]等采用国际专利分类号或美国专利分类号对生物技术、纳米技术、ICT或工业生物技术专利的定义。
(3)特定专利权人的合作网络分析方法。特定专利权人的合作网络的数据集构建方法主要有两种:①以行政地区为依据,分析全球、洲、国家或省市的专利权人合作网络,可以对特定国家进行比较研究;②以专利权人性质为划分依据,例如,分析高校、科研院所或公司企业的专利合作网络。
(4)自我中心的合作网络分析方法。近年,有大量的文献已经开始分析关于个人所镶嵌的社会网对个人行为的影响[20]。目前有一个论点一直未获得普遍的同意,亦即自我中心网络是否只包括那些与自身有直接连接的人即可,或是应该包括与他有连接的人的朋友,或者是其他人。强调简化个人网络的,倾向于采用前者,而后者则强调网络的实际运作[21]。鉴于此,本文实证研究中国科学院自我中心的专利权人合作网络分析方法,仅考虑与中科院有直接连接的专利权人与中科院的合作关系,在后续实证研究中,则以中国科学院为中心,研究其专利权人合作网络。
2.2 基于引用的专利权人引用网络分析方法
2.2.1 基本原理
从引文分析的基本原理角度,可以分为直接引用分析、共引分析和文献耦合分析,目前专利引用分析主要集中在对专利家族之间的引用关系方面,很少涉及基于共引和专利文献耦合的引用网络分析。基于论文引文分析内容与方法,本文提出基于专利的专利权人直接引用网络、专利权人共引网络以及基于专利文献耦合的专利权人网络三种主要的专利权人引用网络分析方法。
2.2.2分析方法与内容
(1)专利权人直接引用网络。从数据集的构建角度,首先,可以研究全球范围的专利权人引用网络,虽然这是一项非常庞大的工程,而且面临数据有效清洗的难度,但此项研究仍具价值,可以从宏观上反映出国际科技创新的关联关系,迄今还未见此方面的研究成果。其次,研究不同学科主题之间的跨学科引用网络或学科内部的引用网络[22]。第三,研究特定专利权人的引文网络,如不同性质的专利权人(如高校、企业、科研院所)之间的合作关系。最后,研究专利权人自引网络分析。从引文网络的层次角度分析,目前关注的一个重点是专利的多级引用网络,进行专利的引文流分析。
(2)专利权人共引网络。两篇专利文献被后来专利文献同时引用的次数越多,表明这两篇专利文献的关联程度越大,即说明这两篇专利文献在内容上相似性较大,也即技术内容(公司的研发领域)相似性较大。从而可用于分析专利权人之间的隐性竞争关系。
(3)基于专利文献耦合专利权人网络。从专利文献耦合角度研究专利权人的关联网络的研究报道还比较少见,基本原理与基于论文的文献耦合理论一致。特别是对技术情报价格更高的专利而言,分析专利权人的耦合网络,对分析专利权人之间的竞争关系与挖掘竞争对手,具有非常重要的作用。此方面的实证研究在在日后工作中一步步开展。
2.2.3 功能与作用
需要特别指出的是,尽管上述专利引用分析方法在一定程度上能能反映出专利权人的技术影响力、研发竞争行为等特征,但如果要借助这些信息直接对机构的技术影响力进行判断,还需慎重。首先,尽管一些研究结果证明专利引用可以用于表征知识流[23],但也有针对专利引用分析作为专利分析指标的批评[24]。其次,Alcacer & Gittelman(2006)强调,美国专利商标局和欧洲专利局的审查员在审查发明专利申请时的方法完全不同,从而对每件专利的相对引文数量产生了强烈的影响[25]。而且,美国专利商标局与欧洲专利局所依据的不同法律也影响了专利引文的数量。Michel & Bettels(2001)指出,美国专利商标局的引用数量是欧洲专利局的3倍[26]。最后,研究人员还发现,发明人更倾向于引用地理位置相对接近的发明人的专利,这也会影响到引用数据的变化[27]。
2.3 基于技术主题的专利权人网络分析方法
2.3 1 基本原理
专利文献的分类体系如国际专利分类号(IPC)、美国专利分类号(USPC)、德温特专利分类号(DPC)等是分析专利技术主题的主要切入点。本文的研究主要基于IPC研究专利权人之间的关联关系。由于一件专利一般都含有一个以上的IPC,且一个专利权人一般会有多个专利都包含某个或多个相同的IPC,因此,本文的方法重点从两个方面出发,第一,考察不同专利权人拥有多少个相同的IPC,从而分析专利权人之间的技术关联度,而不考虑相同的某个IPC所涉及的专利件数。第二,基于不同专利权人所拥有的IPC所涉及的专利件数,计算基于IPC的专利权人之间的相似度。
2.3.2 分析方法设计与内容
(1)基于专利分类号共现的方法。本文以DII数据库为例,可以选择IPC和DPC进行分析。基于不同专利权人之间所拥有的相同IPC或DPC数目进行关联分析。IPC又可以选择小类、大组或小组进行研究,对同一数据集而言,基于小类的专利权人关联网络的网络规模大,但专利权人之间的关联权重值低,而基于小组的关联网络的网络规模相对较小,但专利权人之间的关联权重值高,更适于挖掘学科重合度较高的专利权人,适用于竞争对手的发现分析。
(2)基于专利分类号相似度计算的方法。上述基于专利分类号共现的方法并未考虑所有用的相同IPC所包含的专利数量的影响,为了克服这方面的不足,本文根据IPC计算专利权人之间的相似度,构建关联网络,挖掘竞争合作关系。
(3)基于主题词研究专利权人之间的主题关联网络。在数据集的构建方面,首先,基于技术主题构建全球范围的专利权人关联网络在理论上具有研究价值,可以从整体上反映出国际技术创新的机构之间的关联关系,然而这是一项非常庞大的工程,迄今还未见此方面的研究成果。其次,此方法特别适合研究特定专利权人的基于技术主题的关联网络,如不同性质的专利权人(如高校、企业、科研院所)之间的基于技术主题的关联关系。最后,此方法不太适合特定学科主题分析,因为特定的学科主题必然在专利分类上集中于某些专利分类号,必然形成一个关系紧密的关联网络,降低方法的挖掘实效性。
3 专利权人网络分析实证研究
本文实证研究以Derwent Innovations Index[SM]数据库收录的中国科学院最早优先权年(Priority Years Earlist)为2005-2008年的发明专利数据为数据基础,从以下两个层面上研究专利权人关联网络:①专利权人合作网络,分别研究将整个中国科学院作为一个节点的自我中心网络(Ego网络),研究其与国内外专利权人(大学、公司企业、科研院所等)的合作网络;以院属各研究所为节点,研究各研究所之间及与国内外专利权人的合作网络(Global网络)。②基于技术主题的专利权人关联网络,包括基于IPC小类和IPC大组的关联网络。本文的专利权人只考虑机构专利权人,不考虑专利权人为个人的情况。
3.1 专利权人合作网络实证分析
本节以DII数据库收录的最早优先权年为2005-2008年的124件合作专利申请数据为基础,构建专利权人合作网络。DII数据下载日期:2009年10月30日。
3.1.1 Global网络分析
2005-2008年,以中国科学院院属各研究所及其合作机构为分析节点,院内共有48个研究所有专利合作行为,它们共有67个院外合作专利权人,合作专利数总计124件,其中院内研究所之间的合作25件,与院外合作99件。
表1给出了2005-2008年中国科学院院属研究所合作专利的合作网络参数,除了院外的67个合作专利权人外,院内48个研究所有专利合作行为。总计115个合作专利权人之间的最大合作次数为7,平均合作次数仅为1.42次,平均每个机构仅与1.79个机构存在合作关系,网络密度值仅为0.02。
图2展示了中国科学院院属研究所合作网络中最大的四个簇:上海药物研究所和大连化学物理研究所的网络中心性最强,其次上海光机所、化学研究所、过程工程研究所和中国科技大学拥有相对较高的合作关系数。其中,最大的簇由24个专利权人组成,以中国科学院上海药物研究所为中心,大多为药物研发及相关的研究机构或企业;其次是一个由18个专利权人组成的簇,以中国科学院大连化学物理研究所为中心,大多为化工类研究机构或企业;有两个簇分别由11个专利权人组成,一个以中国科学院上海技术物理研究所和中国科学院理化技术研究所为中心,大多为理化类研究机构,另一个以中国科技大学为中心,以物理、化学类机构为主。其他的簇(未在图中显示)依次为含有7个专利权人的簇1个、4个专利权人的簇4个、3个专利权人的簇2个、2个专利权人的簇11个。
图2 2005-2008年中国科学院院属研究所合作专利的合作网络图
相互之间合作次数最多的机构是上海药物研究所与上海特化医药科技有限公司之间的合作,以及大连化学物理研究所与新源动力股份有限公司之间的合作。
数据表明,在中国科学院院属研究所中,上海药物研究所、大连化学物理研究所、上海光机所、化学研究所、过程工程研究所和中国科技大学,拥有相对较高的合作关系数,合作活跃度较高。然而,机构间合作次数多的关系多发生于院属研究所与院外机构之间,相比之下,院属研究所之间的相互合作强度则相对较弱。
3.1.2 Ego网络分析
本实例将整个中国科学院作为一整体单元(节点),研究其与国内外专利权人(大学、公司企业、科研院所等)的合作网络。以DII数据库收录的最早优先权年为2005-2008年的99件合作专利申请数据为基础,构建专利权人合作网络。DII数据下载日期:2009年10月30日。
经统计,除中国科学院属研究机构外,2005-2008年间,中国科学院共有67个合作专利权人,合作专利数总计99件。
表2统计了2005-2008年99件合作专利的合作网络参数,结果反映,2005-2008年间仅占中国科学院发明专利申请总数不到1%的合作专利,其最大合作次数为7次,99件专利的平均合作次数仅为1.54次,主要贡献来自于合作数量排在前5位的上海特化医药科技有限公司、英国石油公司、新源动力有限公司、韩国三星电子有限公司和国家药监中心,合作专利数依次为7、6、5、4和3件。每个机构平均只与2.12个机构存在合作关系,而且该平均值的主要贡献是中国科学院作为网络的中心,其度数为67。
从图3可见,67个合作专利权人中,中科院仅与一家机构合作的专利权人有58个,与两家机构以上合作的专利权人有9个,其中上海特化医药科技有限公司分别与河南天方药业股份有限公司(1件)和齐齐哈尔大学(2件)一起作为中国科学院的专利合作者,中国药科大学与扬子江药业集团(1件)、蓝钻国际有限公司与福意国际有限公司(1件)、上海奥博生物医药技术有限公司与浙江华海药业股份有限公司(1件)分别一起作为中国科学院的专利合作者。
数据显示,中国科学院在专利合作行为上,与国内外机构的合作力度还相对较弱,虽然这在一定程度上能反映出中国科学院研发拥有相对较强的独立性,但也应看到,中国科学院还有与国内外相关机构加强合作的空间,尤其是加强与国内外一流研发机构和企业开展相关合作研究的同时,更应重视专利技术向公司企业等产业应用的转移转化工作。
3.2 基于技术主题的专利权人关联网络实证分析
本实证分析以中国科学院院属各研究所之间专利产出为数据基础,基于院属研究所专利所涉及的IPC小类构建研究所之间的关联网络,从而反映中国科学院整体的研发布局情况。表3统计了2005-2008年中国科学院研究所基于IPC小类的相关关联网络参数。
分析发现,在中国科学院2005-2008年间的所有发明专利申请所涉及的IPC小类中,至少都涵盖两个及两个以上的专利权人,所有的研究所相互形成一个紧密联系的簇(边权重≥1),网络密度高达0.48,研究所之间IPC小类相同数目最多的为70次,位于中国科技大学与上海光机所之间。为了通过可视化手段揭示相互关联强度较强的研究所之间的关联关系,本节分别对研究所之间存在相同IPC小类的数目(边的权重)在10、20、30、40和50次以上的关联网络进行可视化分析。当边权重值在10次以上时,即只有当两个研究所之间存在相同IPC小类数目超过10个以上(含10个)时,它们才呈现在关联网络中(20、30、40和50同)。从网络参数分析,整个网络即时取到边权重值在50以上时,网络仍然保持着较高的密度(0.30),网络直径为4。
图3 2005-2008年中国科学院99件合作专利的合作网络图
图4显示出,基于IPC小类的关联网络中,中国科学院的信息技术、物理与化学类研究所形成相对更为集中的研发布局,从中国科学院整体水平考虑,中国科学院在上述领域形成了具有相对较强研发基础的能力。
从整个网络结构分析,中国科技大学研究涉及领域最广,是整个网络的核心,也是一个中间连接点。与其关联强度较大的研究所形成两个主要的簇,其一是包括上海技术物理研究所、上海光机所、上海微系统与信息技术研究所、长春光机所和半导体研究所在内的簇,主要涉及信息技术领域;另一个是包括理化技术研究所、长春应用化学研究所、过程工程研究所、大连化学物理研究所和化学研究所在内的簇,主要涉及物理和化学领域。
图4(b)揭示了网络中度数较大(连线较多,即与相对更多的研究所存在相同的IPC小类)的研究所的分布情况,中国科技大学、上海光机所、长春光机所、上海微系统与信息技术研究所、上海技术物理研究所、长春应用化学研究所、大连化学物理研究所、化学研究所、过程工程研究所成为网络的几个中心点。说明在中国科学院的各研究所内,这些研究所的研究领域涉及面相对较广。
图4 2005-2008年中国科学院研究所基于IPC小类的相关关联网络
4 结果与讨论
本文基于社会网络分析方法现有的理论与方法及其在社会学领域特别是在论文分析中的应用,结合专利文献的数据结构特征,在调研现有的有关专利社会网络分析研究的基础上,在方法体系层面上设计出适用于专利权人网络分析的方法体系框架,框架包括基于合作、基于引用和基于技术主题三个方面。其中,基于合作的专利权人合作网络分析方法主要包括全球规模、特定学科主题、特定专利权人和自我中心网络(Ego网络)四种类型;基于引用的专利权人引用网络包括直接引用、专利共引和专利文献耦合网络三种类型;基于主题的专利权人主题关联网络包括专利分类号共现、分类号相似度计算和主题词共现三种类型。
从文献调研结果发现,在社会网络分析在专利分析领域的研究与应用尚不及在论文领域的应用广泛,有关全球规模专利权人合作网络、特定专利权人、自我中心网络、专利共引网络、专利文献耦合网络、专利分类号共现及相似度计算等方面的研究与实证工作非常少见或欠缺。本文对整个方法体系的具体体系的分析方法进行了系统的研究与分析,包括方法的基本原理、数据集的构建策略、不同分析方法的功能、存在的不足、分析的指标选取等方面。
本文利用实证分析工作对所设计的方法体系进行验证,实证数据选择DII数据库收录的中国科学院2005-2008年的发明专利数据,由于中国专利的引用信息著录缺失,所以实证部分未对基于引用的专利权人引用网络进行实证分析,这部分实证工作将在日后逐步开展,并对方法进行不断完善。在专利权人合作网络的实证分析中,本文分析了中国科学院2005-2008年的Ego和Global合作网络情况,前者将整个中国科学院作为一个节点,后者以院属各研究所为节点,分析结果从网络规模、中心性等角度较为清晰地呈现了中国科学院内部研究所之间及与院外科研机构、大学和企业的合作关系情况,并发现合作的强连接关系发生在院属研究所与院外机构之间,相比之下,院属研究所之间的相互合作强度则相对较弱。然而,实证分析还值得深入研究的工作至少包括自中国专利法实施以来中国科学院合作网络的演进动力学分析、中介节点分析、网络规模与密度随着时间的变化情况等。此方面的实证工作将在日后工作逐步完善。
基于技术主题的关联网络分析显示,中国科学院属研究所之间在技术主题上存在着较强的关联关系,通过提高阈值的降维方法获得了不同阈值的网络,可以分析不同关联强度层级的所级关联网络。然而,综合中国科学院院属研究所的专利合作网络以及基于IPC的关联网络分析,本文发现,中国科学院院属各研究所虽然在技术研发主题上存在较强的关联关系,即说明它们在技术研发主题上存在较大的相似性。但是,机构合作网络分析却反映出院属研究所之间的合作强度却较弱,一定程度上表明中国科学院各研究所在一些相同或相似的技术主题上还有相当大的联合研发空间,同时,通过增强研发合作,将降低各自相对独立地进行研发工作所面临的人员和技术限制,可以最大化地在全院规模提升科技创新能力。
此外,值得重视的是,本文所提出的体系框架仍是值得进一步改进和完善的,例如在合作网络中,可以通过小规模数据来验证合作的类型是有向网络或无向网络,分析合作是基于研发、基于投资或给予专利权转移等。在实证分析以及对体系的改良方面,尤其值得关注的地方至少应包括,通过基于专利权人合作的社会网络分析,能否/如何分析专利权人在创新过程中所处的位置以及发挥的价值?如何通过领域和主题的网络分析挖掘不同机构的竞争合关系?能否成为组织R&D资源分配的依据?不同的社会网络结构能否/如何成为确定研发重点、制定专利研发战略的依据?此外,专利数据与论文数据在数据结构上存在差异,如其特有的专利家族现象、转让与授权行为等都将成为专利社会网络分析的对象,如何面向这些特殊对象生成能反映真实相互关系的网络关系图、避免生成误导性的网络?这些都将是值得深入研究的方向。