企业竞争情报系统建设中的情报信息收集,本文主要内容关键词为:情报论文,系统论文,建设中论文,企业竞争情报论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
竞争情报系统是对企业整体竞争环境与竞争对手活动信息的一个全面监测过程。它通过合法手段收集和分析商业竞争中有关商业行为的各类信息,整合企业内部信息资源,为企业的决策部门和管理者提供多种途径、方便快捷的情报信息服务,为企业战略决策提供依据。竞争情报系统包括:一个中心(竞争情报数据中心);三个网络(情报组织网络、人际情报网络、信息网络)、三个应用子系统(情报收集系统、情报处理与分析系统、情报服务系统)。
情报收集系统为竞争情报系统提供稳定可靠与丰富多样的信息资源,是实施竞争情报系统的关键环节。目前,情报收集的主要渠道与手段有:公开的信息收集渠道,如互联网与联机商用数据库;行业出版物、媒体杂志与广告;行业性会议与展会;工商企业名录等。非公开的信息收集渠道包括:企业内部及代理商、专业信息咨询服务机构及行业研究调查报告、逆向工程分解、顾客及行业供应商等。
随着网络技术与互联网应用的飞速发展,互联网上的信息资源日益丰富。因此,通过互联网收集信息应逐步成为企业收集竞争情报的重要渠道与手段。
1 网络情报收集渠道分析
互联网是浩瀚的信息海洋,是企业获取情报信息的最便捷高效的渠道。收集互联网情报的渠道与手段主要有以下几个。
1.1 网络搜索引擎
利用网络搜索引擎(如GOOGLE、百度等),根据情报规划的相关关键词进行搜索,将符合要求的信息下载下来。
互联网搜索引擎信息收集方法的优点是操作简单,容易上手;面向整个互联网数据源,信息量非常庞大;投入与采集成本低廉。缺点是搜索引擎数据更新需要一定的周期,容易造成收集的情报信息滞后;通过搜索引擎搜索到的信息质量参差不齐,需要大量的人工进行筛选过滤,收集效率低;很多富有参考价值的情报信息搜索引擎往往收录不了,比如一些商用数据库中的信息,而这些情报信息恰恰是企业所需要的。
1.2 商用数据库
利用联机商用数据库(如万方数据库、中国科技成果数据库、中国科技文献数据库等),也是比较理想的网络情报信息收集渠道。数据库在竞争情报收集中发挥越来越大的作用,企业可以从一些有利用价值的商用数据库中得到竞争情报。目前国内外比较适于用作竞争情报源的商用数据库有:中国百万商务通讯数据库、中国经济信息数据库、中国科技经济新闻数据库、中国科技成果数据库、中国科技文献数据库、中国化学文献数据库、中文科技期刊篇名数据库、中国专利数据库、中国国家标准目录与科技标准术语词典、DIALOG、DATA-BASE、BRS、NEXIS、NEWSNET等。
通过查询商用数据库收集企业竞争情报方法的优点是:这些数据库覆盖面广而细,内容定期更新,有的数据库甚至是每日更新,时效性较强;目前国内外大多数商业数据库已经与因特网联网,查询方便;这些商用数据库信息都是来源于权威的媒体与相关机构,可信度比较高。缺点是这些商用数据库每年均需支付相应的使用费,使用成本较高,尤其是一些知名的商用数据库更是如此,这就增加了情报信息采集的成本;查询这些商用数据库需要一定的专业知识,而且查询平台与浏览界面不统一,使用者不得不穿梭于各商用数据库,而且需要人工单篇下载与保存,收集效率极低;收集的信息格式不统一,需要人工整理与格式转换,这就造成了情报信息无法高效利用。
1.3 第三方情报代理
使用第三方情报代理服务,如365Agent、铱星企业情报系统、中国企业竞争情报网等,可以实时获取互联网上的竞争情报信息。第三方情报代理服务模式主要有两种:一是通过信息自动收集系统,实时收集各大门户网站、行业网站与地方新闻网站等各类知名权威网络媒体发布的信息,经过机器初步筛选后由人工筛选,按行业进行分类,通过一站式网络门户模式向订购服务的企业提供行业情报的全文检索与主动推送服务,365Agent即属于此种服务模式。二是情报代理服务机构收集各类行业与企业的信息,订购情报信息服务的企业可以根据需要,在第三方代理服务门户网站上生成如本企业情报信息、行业实时新闻、行业研究报告、竞争对手情报信息等个性化情报服务栏目,用户可以通过身份验证进行浏览与查询,铱星企业情报系统、中国企业竞争情报网即属于此种服务模式。
利用第三方情报代理服务的优点是:可以实时掌握行业动态,了解全国各地的行业、本企业与竞争对手的活动信息;信息查询与利用方便快捷。缺点是无法按照企业特定的需要进行信息收集;第三方情报代理机构提供的信息大部分是新闻报道,信息质量不高,利用价值不大;信息存储在服务机构服务器里,企业无法批量存储到本地进行信息的分析与挖掘。
1.4 智能情报信息收集系统
采用网络智能情报信息收集系统,可以快速收集企业所需要的特定网络情报信息。其特点是根据情报收集规划的需要,对特定的网站进行监测与定时扫描,将满足采集条件的信息抓取下来,另外也可以按照一个或一组关键词,对搜索引擎搜索的结果进行自动采集与过滤。系统把采集的信息通过智能处理并存储到情报信息库中进行利用。目前,企业通常都是采用智能信息收集系统采集互联网情报信息。
网络智能情报信息收集系统的优点是:企业一次性投入可以永久使用,总体而言信息采集与使用成本较低;企业可以根据特定需要灵活定制收集规则,获取特定的情报信息,使用效率高;系统可以有多重信息过滤机制,可以大大提高信息收集的质量;收集的信息时效性极强;一次性设置完毕,系统便自动根据规则主动监测、跟踪与扫描特定的网站,自动抓取满足过滤条件的信息,并批量下载下来,自动存储到情报信息库中,中间环节无须人工干预,是真正意义上的智能化情报信息收集系统。缺点是对于系统的操作人员要求比较高,初次设置较麻烦;监测的网站出现变动,收集规则需要人工进行相应的修改。
目前,应用最广泛的网络情报收集渠道是借助与利用智能情报信息收集系统。智能收集技术发展到现在已经比较成熟。
2 智能情报收集技术
智能情报收集系统采用的收集与处理技术主要包括:网页批量抓取与下载技术、自动过滤与去重技术、情报自动分类技术等。
2.1 网页批量抓取与下载技术
在互联网情报收集过程中,首先需要对目标网站上的符合收集规则的网页批量抓取下来,这就是网页批量下载技术。目前,互联网上的网页格式复杂,这就给网页批量下载带来了挑战。智能情报收集系统的网页批量下载技术必须实现如下功能:(1)能够对各种标准格式信息资源进行批量下载,如HTML页面、文本信息、表格、图片(尤其是网页正文的内联图片)、声音、视频等;(2)能够抓取由程序自动生成的网页,如由JavaScript生成的页面;(3)能抓取目标网站的后台数据库内容(如JSP,ASP,CGI等),同时也可以抓取需要通过用户身份校验的网页内容。
2.2 自动过滤与去重技术
网页抓取与下载完毕,系统会对下载后的页面进行内容的智能化提取,自动过滤干扰信息,将需要的情报信息抽取出来,并能够将重复的内容自动剔除。自动过滤与去重技术可以实现如下功能:可以设定一个或一组关键词,根据关键词过滤规则,系统对满足关键词过滤规则的网页进行内容的智能提取与干扰信息的过滤,自动剔除网页的干扰与无用信息。
2.3 情报自动分类技术
自动抓取与过滤的情报信息量往往比较大,来源广泛,这就需要对收集与处理后的情报信息进行自动分类,以提高情报的利用效率。情报自动分类技术目前还不是十分成熟,但是应用需求非常迫切。情报自动分类技术主要表现在以下几个方面:通过计算机学习自动分类规则,然后对采集的内容进行计算机自动分类;对下载的内容按照主题词分类方法,计算机辅助人工进行批量分类;用户可自定义分类规则,通过正则表达式匹配定义来进行分类。
收稿日期:2007-05-17