摘要:我们文中所阐述的所谓的知识图谱是近年来随着大数据和信息技术的进步而诞生和快速发展起来的,并进一步拓展到各个专业领域。本文重点对知识图谱在专业领域的应用情况进行梳理归纳,并对知识图谱技术的应用前景进行总结和展望。
关键词:面向;智能调控领域;知识图谱;构建;应用
引言
随着我国现代化技术的不断发展和创新,人工智能迅速发展,知识图谱作为符号主义发展的最新产物,是人工智能技术和系统中的重要组成部分,在百科知识、生物信息、社交网络、网络安全等领域广泛运用。
1调控知识图谱的构建
1)数据层,收集调控领域涉及的结构化、半结构化和非结构化数据。结构化数据可以直接使用,半结构化和非结构化数据需要在数据处理层进行整理。所涉及的数据主要由用户提供。2)数据处理层,将结构化数据和非结构化数据使用不同方法进行预处理,然后使用现行标准的BIOES规范对实体和关系进行人工标记。人工标记需要花费大量的时间、财力和物力,因此在方案中人工标记一小部分样本,剩余的数据利用数据增强工具进行标记。增强工具采用工程实现较为容易的同义词转换和K-近邻(K-nearest Neighbors,KNN)分类进行实现。3)知识抽取层,知识抽取层是构建知识图谱的核心,针对不同的输入类型的标记数据分别采用基于数据库、规则和深度学习方法提取实体和关系。基于数据库知识抽取将结构化数据通过提取-翻译-加载转化为实体和关系;基于规则的知识抽取采用中文分词工具和正则表达式实现;基于深度学习的知识抽取利用中文分词、Word2Vec将文本转化为词向量,将词向量作为输入,使用双向长短期记忆网络+条件随机场识别实体标签,使用卷积神经网络识别关系标签。为了提高中文分词准确性,在结巴分词工具中加入电力专业词典,词典采用手工和信息熵等方式构成。4)知识模型层,该层采用k-means聚类算法和余弦相似度算法将识别出来的实体和关系进行知识的融合。然后,对知识进行表示和存储,采用Neo4j和MongoDB分别存储关系类知识和属性类知识。5)知识管理层,对构建好的调控知识图谱进行管理,专业人员依据调度规定、作业指导书、运行规程等对构建的知识图谱进行审核、校验,确保其符合实际应用要求。随着时间的更替,如设备名称和运行方式发生变化时,需要专业人员对知识图谱进行扩充和维护。6)知识应用层,应用构建的知识图谱支撑运行规则电子化、故障处置、倒闸操作、对话问答和智能搜索等应用场景。
2调控知识图谱支撑场景
2.1基于层次结构的可视化查询
目前,大量的本体可视化查询通常侧重于本体的层次结构,2000年,Noy等人提出了Protégé,一款基于Java语言开发的本体编辑和知识获取软件,主要针对本体的层次结构进行可视化,并为多重继承复制概念。非层次结构在单独的窗口中以文本形式列出。这个软件目前被广泛运用于生物医学领域。树视图和欧拉图是体现层次结构最佳的可视化模型。缩进列表作为树的一种特殊形式,能够清晰的体现本体的类名以及层次关系,但是无法表达处于同一层次关系的本体间的关系。另一方面,尽管欧拉图能够通过节点嵌套的形式体现本体的层次关系,以及通过节点的大小和节点间的距离体现实体间的关系,如距离体现实体间的相似度,但是和树视图一样无法体现多层继承关系,并且不适合大规模的本体数据。
2.2市政服务场景的应用
与政务相关的自然语言问题一般包括主体与背景2个部分。主体包含地点、政策、行为等主要实体和动作,背景中则包含一些复杂的信息(如用户的个人信息等)。
期刊文章分类查询,尽在期刊图书馆在意图知识图谱上,一个意图可以由多个实体和行为连接而成的路径构成,可以由路径还原问题的主干,而实体和行为之间的联系可以透露丰富的信息。在市政服务的具体场景中,应用意图知识图谱可以更加高效地协助政府工作人员定位民众最关切、最亟待解决的问题,发现治理中存在的不足,从而及时满足民众的需求。意图知识图谱抽取的本体包含类、关系、函数、公理和实例5种元素。在政务领域下,由政务问题抽取的本体的类包含地点、政策、意图和人员背景4个部分,本体之间的关系有上下位、施加动作、相似问题等,函数和公理则对类和关系进行约束,例如某些非区域性政策,政策与地区之间的关系不能被简单地刻画,因为不同地区可能会对政策有因地制宜的调整,从而产生完全不同的子图。以本体组织指定领域的问句语料库,使自然语言变得可计算、可分析。抽取出的本体可以回溯原问句的主干部分。在意图知识图谱的本体构建完成之后,可以处理复杂多样的关联分析,例如探索政策的地区差异、比较不同城市的治理能力等。政府工作人员可以结合实际需求进行交互式、探索式的数据分析。同时,可以利用交互式机器学习技术,学习推理、纠错、标注等交互动作,不断沉淀知识逻辑,提高系统智能性,方便政府对民情民意进行及时反馈。在可视化方面,图谱可以将相关信息更加清晰地展示给非专业人员,提高数据的可理解性。在数据分析方面,图谱可以帮助政府发现人民群众最关心和亟待解决的问题以及这些问题之间的关联性,提高政府的办事效率,更好地为人民群众服务。
2.3知识图谱在搜索引擎中的应用
知识图谱起源于并仍在搜索领域发挥重要的作用。2012年,Google发布了Knowledge Graph用于优化其搜索功能,之后知识图谱蔚然成风,很快微软发布了基于知识图谱的Bing,Facebook也将知识图谱应用于其软件的搜索功能。国内的搜狗、百度也紧跟技术潮流推出了“知立方”、“知心”等,在构建搜索引擎时均使用了知识图谱技术改进搜索质量。其中搜狗通过图搜索知识索引的逻辑推理计算得到目标列表,而百度则侧重于通过查询词直接触发得出相关的实体推荐。
2.4基于改进NBA的AAG图特征提取
产品三维模型可以看作是封闭的边界表面围成的有限空间,通过提取产品的STEP AP242数据信息,将模型描述为面边邻接图,并将模型的几何和拓扑属性添加到相应的弧和顶点上,从而形成属性邻接图AAG(V,E)。同传统的AAG特征提取方法相比,从STEP知识图谱构建出发,同时利用了面面间的凹凸性和面面间的边的类型两种语义,能够解决相交复合特征的提取问题。利用改进的NBA算法可以大大提高特征提取效率和精确度,可以较好的解决某些相交复杂特征识别混乱的问题。
2.5知识图谱在科学引文分析中的运用
基于知识图谱的可视化分析工具,如CiteSpace等对文献数据库中的资料进行文献定量分析,可对学术的研究趋势、热点问题能内容进行分析。主要步骤为文献检索(如CNKI,SCI等)、文献预处理、选择知识单元(如作者、关键词等)、构建单元关系(词频分析、引文分析等)、数据分析、知识可视化和知识图谱解读,目前通过此方法已形成多个领域的综述分析。
结语
专业领域知识图谱具有领域独特、快速扩张、行业壁垒高,知识结构复杂等特点。知识图谱是一个全新的研究领域,需要做的研究工作还很多。根据调控实际需求,设计了知识图谱应用技术方案,用于支撑运行规则电子化、故障处置、倒闸操作等应用场景。最后构建了线路故障处置知识图谱,所提知识图谱能够减轻调度员工作量。
参考文献
[1]张晓华,刘道伟,李柏青,等.智能全景系统概念及其在现代电网中的应用体系[J].中国电机工程学报,2019,39(10):2885-2894.
[2]郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,55(12):20-36.
论文作者:季珍
论文发表刊物:《基层建设》2020年第2期
论文发表时间:2020/4/30