智能信息分析的理论基础与技术模型_人工智能论文

智能信息分析的理论基础与技术模型,本文主要内容关键词为:理论基础论文,模型论文,智能论文,技术论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

信息分析(Information Analysis)或情报研究(Information Research)作为情报学(信息学)的一个重要领域[1],在美国称为信息分析(Information Analysis),在日本称为“情报调查”,这一领域的学术水平是情报学(信息学)学术水平的重要标志,也是“智囊”的主要体现。信息分析作为信息科技的一个重要分支,在信息科技中具有特殊的地位,与主要关注信息处理的其他信息科技分支相比,信息分析的客观基础是信息和知识,并在很大程度上取决于具体学科知识。

1991年国家科学技术委员会以《国家科学技术情报发展政策》为题发表了中国科学技术蓝皮书,指出“情报研究是对情报的信息保真,属思想库范畴。”“加强情报研究,为决策科学化提供可靠依据,推动科学技术进步和经济发展,是这一工作的基本方针。”为信息分析或情报研究指明了发展方向。

为提高信息分析的效率和技术水准,系统地应用人工智能进行信息分析是一条重要途径。目前这方面的研究还很薄弱,本文探讨如下。

1 智能信息分析的概念

智能信息分析,就是运用智能信息处理的理论与方法进行信息分析的学术体系。作为智能信息处理的一个研究分支,智能信息分析应在智能信息学[2]或智能信息处理[3-4]的框架下,吸收智能信息检索[5]和智能数据分析[6]等相邻领域的研究成果,以智能化的方式对信息进行分析,并自动提供决策建议或分析报告。

自动分类、自动标引、自动摘要、自动聚类等智能信息处理技术也是智能信息分析的基础,但不必作为智能信息分析的核心构件。

下面运用智能信息学的思想观点探索智能信息分析,研讨智能信息分析的理论基础与技术架构,并建立一个可以具体化的概念模型。

2 智能信息分析的理论基础

智能信息分析的理论基础可由分析信息学[7-8]提供。其核心逻辑结构为:

物理信息I是序标或量标r的积分:

其中η(r)表达了信息密度。由(1)式决定的信息是客观信息。

真正有效的信息J是信息I的价值修正:

其中信息的价值系数V∈[0,1],当V=1时,J=I,所有信息都是有价值的;而当V=0时,J=1,只是表示有信息存有这一消息。V越大表明有效信息越多。传递着的信息是I,而真正有用的只是J,J即情报(资讯)。由(2)式决定的信息是主观信息。

而知识K则是有效信息J的积分:

其中δ是信息的知识转化系数。(3)式决定的知识就是客观知识。(3)式同时表明:当对信息施行调控时必将影响相应的知识,反之也可以通过控制信息来控制知识。

按照以上理论结构,智能信息分析就是在已知学科知识基础上,通过对输入客观信息I的综合分析,来判断、预测主观信息J的知识价值,并自动提供分析报告或决策建议。这是一个基于K,输入I,解析J,再推动K的创造(获得K′)的知识创新过程。要实现这一过程,就需要特定的技术支持。

3 智能信息分析的技术架构

对一个智能信息分析系统而言,除输入信息作为必要条件外,以下三方面是必不可少的技术构件:

(1)知识库:就是对所分析领域的知识进行系统整序并按照特定结构组织成机器可识别体系,可以采用语义网络或本体知识树结构等表达方式,其功能是作为智能信息分析的知识支持。

(2)规则集:就是将分析策略用规则的形式表示出来,可以采用if…then…结构形式,其功能是对分析的过程进行规范,使系统能根据知识库内容按照规则进行分析。

(3)分析机:就是在知识库和规则集基础上设计适当的推理软件工具,其功能是根据知识和规则对输入信息进行分析判断、并输出决策建议。

知识库、规则集和分析机相互配合,构成智能信息分析系统的内核,其体系结构如图1所示。

图1 智能分析系统内核结构示意

知识库是智能信息分析的物质基础,规则集是智能信息分析的逻辑支柱,分析机是智能信息分析的推理核心,整个智能信息分析系统可研制成一个集成软件。

4 智能信息分析的数据支持

除上述技术构件外,智能信息分析最好有定量数据支持,对此,恰好有ISI在汇集和分析学术文献所引用的参考文献基础上建立的“必要科学指标数据库(ISI Essential Science Indicators)”可以利用,该数据库现已集成整合到ISI Web of Knowledge中。

ISI Essential Science Indicators数据来源于全球8500多种高质量学术期刊中的1000多万篇文献,已有10年数据积累并每2个月更新一次,可以用来分析各个领域学术研究的发展趋势和学术影响。通过ISI Essential Science Indicators,可以分析研究机构(含大学)、公司企业、国家(城市)和学术期刊的研究绩效和发展状况,了解各研究领域中最领先的学者、期刊、论文和研究机构,评估分析特定研究领域等,提供极富参考价值的决策分析基础数据。

覆盖数、理、化、生物、医学、农业、地学、环境科学、工程技术、社会科学等22个学科领域的ISI Essential Science Indicators分为四个主要部分:

(1)引用排序:根据总被引用次数和单篇文献的被引用情况,ISI Essential Science Indicators排出了引用次数最多的作者、引用次数最多的机构(大学、公司、政府研究实验室等)、引用次数最多的国家、引用次数最多的期刊等四个系列。

(2)高引用论文:除了以上四种方式的排序外,ISI Essential Science Indicators还提供高引用文章和热点文章。高引用文章指最近10年内某学科领域中引用次数最高的论文,热点文章指在最近2年内某学科领域引用次数最多的论文。

(3)引文分析:引文分析中提供了两方面的内容,Baselines介绍了与引文分析相关的定义、概念和统计计算方法;Research Fronts提供了一组被称为核心论文的高引用论文。

(4)补充注释:是三个网站的连接,为ISI Essential Science Indicators的分析数据提供了更详尽的内容补充介绍和背景信息。

利用ISI Essential Science Indicators作为智能信息分析的支持数据源,可以较好地实现对智能信息分析的定量支持。其情形如图2所示。

图2 ISI定量数据支持下的智能信息分析过程示意

其中分析系统即图1内容,分析结果可以是决策建议或分析报告。

5 智能信息分析的模型设计

根据上述技术思想,在一个系统中,知识库、规则集和分析机三者可具体物化为学科知识、分析规则和分析软件,ISI Essential Science Indicators数据则可作为整合支持,构成一个层次模型,如图3所示。

这是一种以学科知识为核心、分析规则为中介、分析软件为界面的具体的智能信息分析系统,在设计模式上具有一定通用性。

图3 信息智能分析系统的层次模型

由于学科知识按学科分化越来越精细,智能信息分析系统只能按特定学科分别设计。以经济信息智能分析系统为例,设计思路为:

学科知识层存储的是微观经济学和宏观经济学规律;分析规则层收集的是经济分析应遵循的规则;分析软件层提供一个运行程序和界面。这样,构成一个以经济知识为核心、以分析规则为约束的智能分析系统软件,可以作为智能分析系统的一个样本。

6 小结

综上所述,知识库是智能信息分析的物质基础,规则集是智能信息分析的逻辑支柱,分析机是智能信息分析的推理核心,三者在智能信息分析系统中具体物化为学科知识、分析规则和分析软件,可在ISI Essential Science Indicators定量数据支持下整合成实用的智能信息分析集成软件。

智能信息分析是一个具有广阔发展前景的研究领域,是信息分析的重要发展方向。本文只是初步探讨,有待进一步深入研究。

标签:;  ;  ;  ;  

智能信息分析的理论基础与技术模型_人工智能论文
下载Doc文档

猜你喜欢