我国专利文献资源亟待挖掘开发,本文主要内容关键词为:文献论文,专利论文,我国论文,资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
当今,知识产权已经构成人们经济活动中的重要内容。但长期以来,我国对专利信息资源价值的认识非常有限,专利资源的挖掘极其不足,专利信息在企业经营中的功能尚未显示;而另一方面,我们的企业却常常因不知选择什么新产品,不知当前什么技术最有发展前途,不知同行对手又有什么新产品开发动作,而丧失了竞争的主动权。因此,研究国外专利资源挖掘技术,了解其应用动态,探索我国专利信息资源在技术创新活动中应用的可能途径,开发适用于我国企业的专利利用方法有着重要的现实意义。
1 我国专利信息资源挖掘开发的可能性
就目前国外的开发研究来看,除检索外,专利资源利用形式还包括专利基本属性的计数统计、专利文本挖掘、专利的引文分析等。
关于专利统计分析研究,最早是在20世纪70年代初,由美国专利商标局进行的一种基于专利文献的研究活动。后来在各国逐渐推展开,尤其是在日本,专利统计分析与公司的经营战略研究活动结合在一起,使其更显生命力。在我国,20世纪80年代初有不少界内人士也为引进推广专利统计分析方法作了努力。但鉴于种种原因,我国专利文献信息统计研究始终未能被引起重视。原因是多方面的,首先,专利统计信息主要提供的是战略信息,似乎没有一篇说明书来得解渴,解决实际问题;二是,分析研究的技术手段太繁杂,手工操作几乎难以实现,利用计算机则需要相应的软件及其相应的使用技能,而计算机操作在前几年还是个不小的困难。一样是技术、市场预测信息,人们更愿意从市场等信息初始源以及其他方便的方法直接获得,因此专利统计分析始终未能得到我国信息用户的青睐[1]。
但有一个事实必须承认,那就是专利文献中所蕴藏的信息是其他任何文献所不能替代的,它不仅存有实用的技术信息,而且还贮存有微观的、宏观的技术经济信息,且用它来分析某领域的技术经济活动具有得天独厚的优势。目前国外一些经济学家已经开始运用专利数据或专利引用数据来测量一些组织与地区的创造发明产出状态;他们利用专利的引用强度或与引用性质相类似的数据去测量一个整体发明的重要性和影响力;他们还利用引用数据的整体流动来描述知识的流动,由此研究跨机构、跨技术领域、跨地域的知识外溢现象[2]。
我国今天面临的是一个全新环境,这无疑为我们进一步开发挖掘专利信息资源提供了良好的契机。一是因特网的发展,使得我们利用计算机网络技术来开发专利文献统计数据资源成为可能;二是随着我国加入WTO,企业将面临更为激烈的竞争大环境, 而专利信息资源深度开发有助于企业对竞争对手的分析研究,有助于对技术创新的竞争战略研究,这一事实必将大大刺激我国企业对专利信息的需求增长。
2 国外专利信息资源深度开发产品概览
2.1 专利统计分析工具
专利统计分析软件主要是基于对专利数据库中的结构化数据(不同字段信息,如主题词、专利权人、申请年度等)进行匹配统计。在国外这类专利分析工具产品有不少,具体有:为企业级的专利检索和分析需求提供一整套的集成解决方案和服务的Wisdomain;英国Winslab公司的INAS(信息分析系统)软件;可以从专利数据库中进行统计并进行知识挖掘的VantagePoint;可以对德温特WPI、CA 等数据库的信息进行报表创建以及定制分析的BizInt Smart Charts for Patents软件; 可以提供专利检索以及统计分析的Mapit产品; 可以对专利检索结果进行统计分析的MapOut Pro/MapOut软件;可以提供可视化数据的M-CAM Doors软件;Aurigin公司提供的集成了专利内容和分析的工具体系Aureka产品系统;可以对IBM 知识产权网上现有的专利数据进行分析和可视化显示的PatentLab-Ⅱ软件。其中,PatentLab-Ⅱ软件可以从Delphion Intellectual Property Network(www.delphion.com)免费下载。
PatentLab-Ⅱ通过对不同的字段进行组配分析,可以得出以下结论(见表1)。
表1 PatentLab-Ⅱ字段组配分析
2.2 专利文本挖掘工具
所谓文本挖掘,是对来自于大量文档中可用的信息和知识进行的挖掘,当前更多的是研究如何利用挖掘工具来揭示文档之间的主题相关关系,比如对文档所包含的主要概念进行聚类和分类,并用可视化的形式给予显示。这类产品目前也有不少,比如IBM公司的文本知识挖掘器(Text Knowledge Miner,TKM)以及Aurigin公司的Aureka工具,前一节中介绍的VantagePoint工具也涉及到了文本挖掘的内容。这里主要介绍一下IBM公司文本知识挖掘器的一些功能。
图1 专利聚类图
由IBM 公司开发的文本知识挖掘器主要可以用来揭示文档之间的主题相关关系,比如对文档所包含的主要概念进行聚类和分类,并用可视化的形式给予显示。该公司曾经以在1991年公布的所有3881件韩国专利为试验对象,利用TKM对这些数据进行处理,通过聚类产生了如图1所示的全局图,该图显示了这些专利的聚类主题以及它们之间的关系。
其中,气泡的大小与该气泡包含的相关文档的多少有关。例如,最大的主题领域(第一个)包含了201个专利。 气泡间连线的颜色和粗细表示了不同主题文档之间的相关关系,比如包含的共同的主题词多,则说明两个主题文档间关系密切,连线则用粗线表示。根据不同主题文档的相关度,我们可以将这些聚类主题分成不同的领域,例如半导体、逻辑设备、CRT等是紧密相关的主题,因此可以归属到一个领域中,在图1中用同一种颜色来显示。对于各聚类所包含专利文档的详细数据可以用图1所示的聚类主题排序来表示。
我们还可以进一步对前几位聚类主题文档中的主要公司进行排序,以了解有关主题领域中实力强大的公司分布。Goldstar以及Samsung 公司是韩国最大的工业产权生产者,其中有一些专利是由几家公司共同开发的[3]。
2.3 专利引文分析工具
专利文献中包含有用于分析的许多有价值的信息,其中包括专利引用信息。利用专利引用信息可以进行技术交流的经济分析。当前这类分析产品也很多。
1)Aureka产品的引文树。引文树是Aureka产品的一个功能, 见图2。
图2 Aureka引文树界面
图2是Aureka引文树的一个界面, 显示了公司之间的专利引用关系。点击、拉拽界面,用户可以从不同的角度查看、探索以及绘制专利引用关系图。通过引文树,可以跟踪一个特定的专利分支。双击引文树的任何一个结点可以调出专利文本或者图形的详细信息。
Aureka引文模型对选定的专利可以自动地显示其所有的引用专利,当选择前向引文分析功能时,系统可以给出所有引用该专利的其他美国专利的视图;当选择回溯引文分析功能时,可以帮助你查看所选定的专利中所列出的所有引用专利以及这些引用专利本身所引用的全部专利[4]。
2)MAPIT产品的引文查询功能。MAPIT是一个专利查询工具, 其中设有供引文分析用的引文查询功能,其界面如图3所示。
图3 MAPIT引文查询的双曲线浏览界面
图3显示的是一个双曲线浏览图, 它提供了美国以及欧洲专利信息的专利引文信息的图形显示,该图可以显示一个专利文献的多层次的交叉引用信息。图中的任何专利项都可以通过双击立即浏览[5]。
3 国内专利挖掘工具的开发应用概况
20世纪90年代初,南京理工大学经济管理学院信息管理系曾经开发过基于DWT专利数据库的单机版专利统计软件, 并结合南京熊猫集团的专业需求,为其所关心的电视机视频技术领域的专利数据作统计分析。其中对该领域的竞争对手开发活动状况的统计结果还被引入该系2001年12月主编的《企业信息化建设与管理》一书,所涉及的主要内容如下:
1)某技术领域里各公司的专利数统计。 这里选择的是电视机视频技术领域,这是彩电等行业的企业所关心的领域。利用该专利统计软件对相关分类号下各公司的专利数进行统计,获得前几名公司的专利分布数据(见表2)。
表2 HO4N领域各公司专利数分布
2)公司的技术开发重点分析。将上述前8名公司的专利按HO4N的分支类进行分类统计,并挑选专利数较多的类进行查看(见表3), 由此了解上述公司在这些领域里的开发重点。
表3 各公司专利数在HO4N的分支类下的统计分布
3)公司的技术开发动态分析。 上述数据反映的只是各公司的绝对数据,然而,我们更关心竞争对手的最近动态以及未来发展趋势。在上述分析基础上,我们还可以将感兴趣的那些技术类别如HO4N,按年度分布进行统计(见图4)[6]。
图4 HO4N类下,各公司专利数按年度统计分布直方图
20世纪90年代末,随着因特网的兴起,南京理工大学信息管理系又根据网络应用环境特点设计了基于中国专利数据库的专利统计软件,具体功能如图5所示。
图5 中国专利统计分析系统
其离线统计与在线传播的实用思路,见图6。
图6 离线统计与在线传播的实用思路
由此看出,就专利统计产品功能而言,我们与国外的差距并不大,而且我们所考虑的应用思路也是符合我国国情的,关键是怎么将其付诸于实施。
4 我国专利文献资源挖掘开发对策思路
通过上述对国内外专利资源深度开发工具研究以及网上专利信息资源深度服务比较分析,我们看到我国显然存在一定的差距。因此,有关部门应该着眼于面对WTO大环境, 企业与行业需要竞争与发展这一根本目标,来考虑我国专利信息资源深度开发与有效利用问题,支持我国自己的专利信息资源研究、开发与咨询服务活动。
4.1 积极开发我国自己的专利统计软件
尽管国外一些机构已经提供有专利统计工具,但使用费用昂贵。前不久,有关人员试图利用DWT 公司网上的专利统计功能对国防领域专利技术进行统计分析,结果仅统计了一部分数据,费用已达数百元。在我国,推广使用专利挖掘软件,成本问题不可不考虑。
事实上国内开发类似实用软件已有很好的基础,过去只是苦于缺乏足够的经费和政府以及社会的支持,无法将这项研究投入实际运行。因此有关部门可以适当投入一些经费,就可在过去的基础上开发出适合我国企业与科研机构信息利用的实用的专利挖掘软件。
4.2 组织我国专利信息研究队伍
推动专利资源的深度挖掘,工具开发只是一部分内容,更重要的是需要一批分析专家,他们可以是信息研究专家或经济学研究专家,也可以是法制管理研究专家。建议可以依托一个单位建立一个国家级的,或行业级的,或部门级的专利信息分析研究中心,重点利用专利挖掘工具,对我国技术创新活动有关的技术经济理论问题进行研究。
4.3 发展我国专利信息咨询服务
利用现有的专利文献服务网站,或建立专门的网站,像美国专利商标局那样,提供专利挖掘信息的传播服务。具体可以分为两大块,一部分是通用信息的主动传播,用户可以通过网站免费获取有关专利统计信息;另一部分是有偿的专题咨询服务,用户可以在网上提交有关需求,由专家提供定题服务。
4.4 培训与宣传
有关部门应该组织各种培训班,具体针对科技研发人员、企业管理人员、专利文献服务人员、专利代理等法律业务人员、专利管理人员的不同需求、不同工作任务性质,提供专利基础知识。过去我们办得比较多的是法律管理方面的知识培训,今后还应该加强各层次人员的专利信息获取知识、分析知识以及现代化的信息技术手段的培训,以培育我国的专利信息需求。