基于知识图谱的日本西南防卫力量研究
刘 香 伟
(信息工程大学 河南 洛阳 471003)
摘 要 近年来,日本防卫的重点逐渐由东北转向西南,其中对中国防范与遏制的战略意图日益明显。日本通过调整防卫体制与深化日美同盟,正在形成事实上的“西南防御”战略。通过对网站、百科知识库信息的自动采集,利用适合大数据存储的图数据库平台,将高关联数据以图的形式存储,较大提升数据的扩展性和处理效率。通过日本西南防卫知识图谱的构建,有利于辅助军事决策和军事侦查等,为日本军事战略研究提供更好的数据支持。
关键词 日本西南防卫 军事斗争 知识图谱
0 引 言
日本西南方向部队是日本国土防卫体系中最为重要的力量之一。掌握其部队信息,将有助于对日本西南防卫做进一步的分析和研究。近几年,随着东海地区紧张形势加剧,中日摩擦愈演愈烈,加强西南防卫成为日本对外战略的一个重要方面。搜集整理日本西南方向部队的数据,结合图数据库相关技术,能够帮助研究者准确梳理其武装力量体系、职能任务等,并能够通过在时间维度上的动态比对,为日本军事战略演进研究提供必要的数据支撑。
本文选用Neo4j图数据库作为存储日本西南的方向部队数据的平台。该数据库平台利用命名实体构成图中的节点,实体间的关系构成边,以此完成具有领域性的知识图谱构建。在网状知识图谱结构下,利用图数据库平台对图形处理的高效性能,方便地对各实体进行遍历、查询和处理,并能够使整个知识图谱具备较好的可扩展性和动态更新性能。
1 国内外现状
日本西南防卫一直是人们所关注和研究的一个重点。特别是在中日关系不断恶化的背景下,对于它的研究变得十分的重要。在理论层面上,不少专家学者针对日本西南防卫进行了深刻的研究,他们分析问题的角度有以下几个方面:
从日本对外战略的角度出发,日本虽然经历了第二次世界大战的惨痛失败,但其军国主义思想并没有彻底消失。随着日本经济的迅速发展,日本的实力不断壮大,称霸亚洲的野心逐渐显现出来。但是随着中国的迅速崛起,日本感受到了巨大的威胁,为此日本不断加强西南防卫,与美国联手共同打压中国,抑制中国的发展,确保日本在亚洲的霸主地位。
从中国国家利益的角度出发,日本是中国的重要邻国之一,其西南防御直接影响到中国的国家利益,并对中日关系发展造成阻碍。基于中国国家利益的视角,日本西南防御对中国的军事与能源安全利益有直接的影响,中国的领土主权利益在一定程度也受到侵害。尤其是近几年的中日钓鱼岛事件,日本无视历史,声称钓鱼岛为自己的领土,并派遣船只到钓鱼岛周围海域巡逻,这是对中国主权的公然挑衅,严重危害了中国的利益。
高校校训文化和社会主义核心价值观都是中国特色社会主义文化的组成部分,从精神内涵和价值诉求上具有内在一致性,高校思想政治工作者要切实发挥校训的载体作用,构建校训精神融入社会主义核心价值观教育的有效路径。
本文从公开来源途径上搜集涉及日本西南方向部队、人员和装备等信息,通过相关书籍和论文的阅读,确定搜集的范围。访问的网站主要有日语维基百科、防卫省自卫队网、百度百科和360百科等。如图2所示,利用网页采集工具对网站相关信息进行采集。之所以选择百科知识进行数据搜集,原因在于以下两个方面:第一,百科知识便于对命名实体进行提取;第二,百科网站的结构化和半结构化数据便于通过模式匹配的方法以极小的代价提取实体间关系。
Neo4j是图数据库的一种,属于非关系型数据库,与传统的关系型数据库相比具有很高的性能。它能够对数据进行高效的处理,并且能够以图的形式对数据进行可视化展示。
2 相关技术
2.1 Neo4j图数据库
本文在理论研究的基础上,从数据层面上研究日本西南防卫,不仅切合大数据时代的背景,而且让研究变得更加简单、直观有说服力。
本文重点对日文维基百科的知识进行采集,网页采集界面如图3所示。在数据采集过程中,用户首先需要导入包含要查询词的词表文件,然后程序通过访问指定的网站对含有查询词的网页进行抓取,生成.html和.xml的文件,存入特定的文件夹里,供用户的使用。图4和图5是采集数据的部分结果截图。
Neo4j图数据库将数据以节点和节点间关系的形式进行存储,并且节点和关系均可以附带属性。本文中,部队机构和人员作为应用中的实体,通过任职、隶属、上下级等关系关联在一起,它们本身就可以当作一种图结构构成网状的知识体系。利用Neo4j对这些数据进行存储,相比传统的关系型数据库,模型转化的代价非常小,平台自带的图形处理引擎能够更为高效地完成实体关联关系挖掘和对比的相关工作。在存储和处理离散型、高关联、大规模数据图数据库具有很大的优势。
知识图谱中,每一个节点会根据它的标签(例如“一级机构”、“人物”)显示不同的颜色,鼠标移至某节点便可以显示该节点的所有属性信息,双击某节点可以显示与该节点相关的所有节点和关系。在Neo4j数据库中节点之间的关系是有方向的,两个节点之间也可以建立多个关系。由于数据较大,只给出部分数据的展示,日本西南防卫知识图谱如图6所示。
2.2 知识图谱
通过对节点的查询以及查询结果的可视化,能够对日本西南方向部队有一个很清楚的认识,对于分析和研究日本西南防卫有很大的帮助。
2.3 安全性分析 蛋白尿、高血压、手足综合征、骨髓抑制、腹泻、乏力以及食欲减退是最常见的不良反应,发生率依次为73.91%、65.22%、56.52%、34.78%、30.43%、39.13%、30.43%。 达到Ⅲ-Ⅳ度不良反应及其发生率分别为蛋白尿21.74%(5/23)、高血压17.39%(4/23)、手足综合征 13.04%(3/23)、骨髓抑制4.35%(1/23),暂停用药并积极对症治疗后均获得缓解,随后以原剂量或下调1个剂量继续治疗。
3 日本西南防卫知识图谱
3.1 研究流程
本文主要对日本西南方向部队的数据进行采集、整理分类、知识图谱结构设计、节点与关系导入,建立日本西南方向部队知识图谱并进行信息的查询和可视化显示,其研究流程如图1所示。
图1 研究流程图
3.2 数据搜集
从中国如何应对的角度出发,针对日本加强西南防卫,首先中国要坚决捍卫自己的主权,加强海权建设和维护,绝不允许日本对于中国领土利益的侵害。其次,中国要加强与周边国家的战略合作,减缓来自日本和美国的压力。另外中国要加强国防建设,提高部队战斗力,随时应对挑战。“司马昭之心路人皆知”,日本加强西南防卫的意图很明显。中国应密切关注日本的动向,加强应对,为自身发展创造一个良好的环境。
图2 日语维基百科
经济因素与习俗变迁,也会在具体的仪式环节有反映。祭“牛王神”和“母猪神”都需要道具——鼓和芦笙。但祭“牛王神”时,所用的鼓,用陶兴文的话,就是“假鼓”。为什么用假鼓?陶兴文解释说,为了省钱,祭“牛王神”会用那些山上摔伤的牛来祭祀,“买牛一口气”。伤残或者半死的牛价格肯定便宜。但祭祀的地点就会因牛而异,所以鼓这种几十斤的道具就不方便运送,于是,干脆就用簸箕蒙一块布,当成鼓来敲。
图3 网页采集程序主窗体
图4 采集的部分结果
图5 采集海上自卫队的相关信息
3.3 日本西南防卫知识图谱的结构设计
日本西南防卫知识图谱以日本西南防卫信息为核心对象,除了清晰直观地反映日本西南防卫的基本信息外,还应从局部到整体兼顾西南防卫力量的完整性,即能显示日本西南方向部队信息之间的联系。据此,确定机构的名称、创设时间、政体、部队编制单位、所在地、所属组织、兵种、编成地、上级单位、担当地域、武器装备等和人物的姓名、职务、级别、入伍时间、上任时间、出生时间、出生地点、居住地等作为日本西南防卫的核心要素。关系是节点之外的另一关键,关系同样可以拥有属性。机构之间主要有“隶属”、“组成”、”构成”、“合作”等关系,人物之间可以有“朋友”、“同学”、“领导”等关系;人物与机构之间可以有“任职”、“领导”等关系。为了使关系图更加简单明了,本文中只建立了“隶属”、“构成”和“任职”关系,将所有节点联系起来。
3.4 数据分类及整理
根据日本西南防卫知识图谱的结构设计,本文将收集的信息分为机构和长官两类,并分别存入机构表和长官表,其中根据机构的隶属关系,将机构又分五级,各自对应一个机构表,一级机构表的部分内容如表1所示。武器装备和驻扎地等作为机构的一部分属性,存于机构表中。人员表的部分内容如表2所示。相关的统计信息如表3所示。
表1 一级机构
表2 长官表
表3 统计信息
其中,并不是每个较高级的机构(比如一级机构和二级机构)都有隶属于它们的下一级机构。一是因为部队的编制问题,二是因为公开来源的信息不完整,有些机构在网页中没有显示,在采集的过程中采集不到,导致部分机构的缺失。因部分机构长官信息不在网站中显示,所以采集到的长官数量不完整。但高级机构长官基本都包含在内,并不影响本文的研究。
3.5 数据导入
数据导入基于日本西南防卫知识图谱的节点、属性、关系等结构设计和日本西南防卫知识的搜集结果进行。数据导入的方式分为两种:一种是使用Cypher语句,在Neo4j服务器平台上导入数据和关系;另一种是将数据转化为Java代码,通过Java程序建立节点和关系。Java入库的方法与Cypher语句相比,每条属性的添加就占一行代码,入库效率没有Cypher高,所以本文采用了Cypher语句入库的方法。
3.6 日本西南防卫知识图谱构建
3.3.3 金花茶种植管理。在种植完印度紫檀后种植金花茶。因刚种植的紫檀树未能起到遮阴效果,金花茶种植前要架设遮阴网,待紫檀树长到成荫时(约1年)弃网。定点挖坑:坑的规格为40 cm×40 cm×40 cm,在印度紫檀树两旁排列成行,规格为2 m×2 m,种植密度为2 490株/hm2。
图6 日本西南防卫知识图谱
3.7 日本西南防卫知识图谱应用
日本西南防卫知识图谱可以通过Cypher语言对服务器进行操作,也可以通过编程语言调用后台图数据库。通过前台界面操作日本西南防卫数据库,除了基本操作外,还可实现数据的批量导入和批量导出,以领域知识为基础,建立原始的模式规则,采用迭代的方法扩充规则集。基于模式匹配的原则,将重要的实体和敏感信息抽取出来,如武器装备、军事演习等,可以实现动态军事行动比对。如图7所示是查询与第四师团有隶属关系的节点。
图7 与第四师团有隶属关系的节点
当用鼠标左键双击除第四师团外的任意一个节点时,会弹出所有和点击节点有关系的节点和关系,如图8所示,便于对整个师团的组织结构有一个清楚直观的了解。
图8 对查询节点的可视化操作
知识图谱于2012年5月17日由Google正式提出,用于增强其搜索引擎功能的知识库。本质上,知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。知识图谱以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。
3.8 日本西南防卫知识图谱分析
通过日本西南防卫知识图谱,可以得出日本西南方向部队种类繁多、组织结构严密、规模庞大,武器装备先进的结论。日本西南方向部队包括潜水舰队、通信群、高射群、航空群、扫海队、后方支援队等,基本上涵盖了日本海陆空三个自卫队的大部分兵种,甚至还包括一些情报部队。即使是单一师团,其下属的部队的种类也非常多,以第四师团为例,其下属机构就有15个,除了普通的连队,还包含飞行队,支援队和通信队等。部队规模由此可见一斑,并且部队配备的武器装备非常先进,特别是日本海上自卫队,资料中搜集到的驱逐舰和护卫舰等,其性能和作战能力均是世界顶级。通过上述分析不难看出,日本对于西南防卫的重视程度和建设程度之高,这与日本的对外战略息息相关。作为防卫目标的中国,应该密切关注日本西南的防卫动向,提高部队战斗力,加强与周边国家的合作,应对日本的挑战。
中国国有企业大致分为三类:一是中央所属的工业企业(特殊行业的不算),即“中央企业”(狭义); 第二类是中央所属的非工业企业和特殊行业的工业企业,这类企业被财政部称为“中央企业”(广义),不但包括中央所属的金融机构,如四大国有商业银行、烟草总公司、铁路总公司等巨无霸企业,也包括各中央部委所属的林林总总的企业,甚至某部委机关服务中心下属的地下室招待所、印刷厂都在其中;第三类是地方政府出资成立的国有企业,按属地原则由当地政府所属的国资委或指派特定机构履行出资人职责。说明一下,地方国资委与国务院国资委无直接隶属关系,它们归地方政府管。
4 结 语
通过日本西南防卫知识图谱的构建,可以将整个日本部队信息存入该系统,通过对军事行动进行建模,依托知识图谱对比分析,将有利于辅助军事决策。同时将有利于军事侦查等诸多方向,为日本军事战略研究提供更好的数据支持和技术保障。知识图谱的模式可以应用到其他国家的军事防卫力量,也可以运用到经济、体育、政治等诸多领域。下一步工作可以从以下几个方向进行:
(1) 完善数据。因公开来源信息不完整,很多机构、人员以及武器装备等信息不全,导致知识图谱中的部分数据和属性缺失。同时人员变化、武器革新、军事改革等都会导致数据的过时,使现有数据渐渐失去应用价值。因此及时更新数据,保证数据准确性和完整性尤为重要。
(2) 完善节点间关系。本文中只建立了三种关系,但是数据之间的关系有很多种,例如人员与人员之间上下级的关系、机构与机构之间的合作关系等,人物与机构之间也可以交叉任职,任职时间段可以作为关系的一条属性。这样就可以获取一张巨大的“网络图”,同时还可以导入一些历史数据,以获取更高信息价值,使知识图谱中的数据更加完整和丰富。
一是生存。在贫穷、落后之下,力气就是生存的保证。所以王福的妈妈把饭都给王福吃,因为他的力气最大,要养活一家人。二是教育。在愚昧、无知之下,王福的爸爸把饭都给王福吃,因为他识字,他的父亲希望他用文化、用知识来改变命运。所以,在贫穷、落后、愚昧、无知的生存环境之下,人们该拥有怎样的教育?他们所固有的教育模式能否被改变?对这些问题的反思和批判,在态度上,《孩子王》和《黄土地》保持了一致。
为保证人员和设备的安全,带电作业需要满足以下几点要求:1)流经人体的电流不超过人体的感知水平1 mA;2)人体体表局部场强不超过人体感知水平240 kV/m;3)人体与带电体(或接地体)保持规定的安全距离。
(3) 建立日本部队信息知识图谱系统。结合数据可视化技术,为用户定制更为简洁直观的知识谱应用系统。同时还可加入“智能分析”、“中日对比”、“人物图谱”、批量导入导出等功能,密切关注日本部队信息的变动,以领域知识为基础,建立原始的模式规则。采用迭代的方法扩充规则集,基于模式匹配的原则,将重要的实体和敏感信息抽取出来,如武器装备、军事演习等,可以实现动态军事行动比对,提高部队战斗力。
参考文献
[1] 王余蓝.图形数据库Neo4j与关系据库的比较研究[J].现代电子技术,2012,35(20):78-79.
[2] 王余蓝.图形数据库 Neo4j的内嵌式应用研究[J].现代电子技术,2012,35(22):37-38.
[3] 李涓子,候磊.知识图谱研究综述[J].山西大学学报(自然科学版),2017,40(3):454-459.
[4] 刘硚,李杨,段宏,等.知识图铺构建技术综述[J].计算机研究与发展,2016,53(3):582-588.
[5] 靳永超,吴怀谷.基于 Neo4j 处理大数据中元数据溯源的研究[J].现代计算机(专业版),2015(3):61-63.
[6] 廖理.基于 Neo4j 图数据库的时空数据存储[J].信息安全与技术,2015(8):43-44.
[7] 徐万胜,栗硕.论日本“西南防御”与中日关系[J].东北亚论坛,2012(6):48-53.
[8] 徐万胜.冷战后的日美同盟与中国周边安全[M].北京:社会科学文献出版社,2009: 133.
[9] 屈彩云.日本防卫战略的西南取向[J].太平洋学报,2012,20(10):81-90.
[10] 徐增林,盛泳潘,贺丽荣,等.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606.
[11] 葛斌,谭真,肖卫东.军事知识图谱构建技术[J].指挥与控制学报,2016,2(4):303-304.
[12] Robinson I,Webber J, Eifrem E. Graph Database图数据库[M].刘璐,梁越,译.北京:人民邮电出版社,2015:6-33.
[13] SadalagePJ, Fowler M. NoSQL精粹[M].爱飞翔,译.北京:机械工业出版社,2013:42-50.
[14] 康杰华,罗章璇.基于图形数据库 Neo4j 的 RDF 数据存储研究[J].信息技术,2015(6):115-117.
[15] 王富祥.基于知识图谱的大数据研究可视化分析[J].华北理工大学学报(社会科学版),2017,17(1):583-585.
SOUTHWEST DEFENSE FORCE IN JAPAN BASED ON KNOWLEDGE MAP
Liu Xiangwei
(Information Engineering University ,Luoyang 471003,Henan ,China )
Abstract In recent years, the focus of Japanese defense has gradually shifted from the northeast to the southwest, with increasingly obvious strategic intention of preventing and containing China. By adjusting the defense system and deepening the alliance between Japan and US, Japan is forming a virtual “Southwest defense” strategy. Through the automatic collection of website and encyclopedia knowledge base information, this paper used a map database platform suitable for large data storage to store high-correlation data in the form of graph, which greatly improved the data scalability and processing efficiency. The construction of southwest defense knowledge map in Japan helps to assist military decision making, and is conducive to military investigation and many other directions. It provides better data support for Japanese military strategy research.
Keywords Southwest defense in Japan Military struggle Knowledge map
中图分类号 TP3
文献标识码 A
DOI: 10.3969/j.issn.1000-386x.2019.01.010
收稿日期: 2018-03-26。
刘香伟 ,讲师,主研领域:数据存储,信息检索。