图书馆不同领域的电子标签敏感信息智能过滤系统设计论文

图书馆不同领域的电子标签敏感信息智能过滤系统设计

丁一琦,张 杰,周维彬,李 丰,朱梦月

(台州学院,浙江 台州 318000)

摘 要: 针对当前图书馆内电子标签存在大量敏感信息,书籍保存环境质量差的现象,设计图书馆不同领域的电子标签敏感信息智能过滤系统。系统中的电子标签信息采集模块采用RFID 技术获取图书馆借阅、管理以及检索等领域的电子标签信息;电子标签信息存储模块依照借阅、管理以及检索领域划分网关层内不同网关,各领域中均采用LHBase 数据库实时存储电子标签信息;通过本体推理方法识别电子标签语义模板内敏感信息,采用贝叶斯电子标签敏感信息过滤器,过滤电子标签敏感信息。经实验证明,所设计系统敏感信息过滤结果的正确率和召回率分别高于其他系统20.4%和15.2%以上,说明该系统能准确过滤图书馆不同领域的电子标签敏感信息,具有很好的现实应用价值。

关键词: 图书馆;网关划分;电子标签;敏感信息;智能过滤;系统设计

0 引 言

随着社会进步以及人们对知识认知的不断提升,图书馆藏书量越来越多,涉及领域越来越广泛,规模也越来越大,老旧条码管理技术不能满足当前图书馆管理人员的工作需求。无线射频识别(Radio Frequency Identification,RFID)技术通过电子标签的识别能够全面、高效管理图书馆借阅、管理以及检索领域不同领域图书信息,RFID 技术已成为图书馆管理过程采用的关键措施[1]。随着RFID 技术普及范围的扩张,发现电子标签管理面临着一个新问题——电子标签中包含大量敏感信息[2]。图书馆不同领域的电子标签敏感信息包括两种:一种是RFID 数据内的病毒和检测出恶意代码;另一种是图书中包含的正面和负面敏感词汇。电子标签的敏感信息不仅耗费有限网络资源,增强图书馆管理人员的工作负荷,还大大降低图书馆信息管理效率和精确度,对书籍保存的环境质量造成严重威胁。因此智能分析和过滤图书馆不同领域的电子标签敏感信息,具有重要应用意义[3]。本文设计图书馆不同领域的电子标签敏感信息智能过滤系统,准确、高效过滤图书馆不同领域的电子标签敏感信息,保障图书馆安全性,提升书籍保存的环境质量[4]

1 图书馆不同领域的电子标签敏感信息智能过滤系统

1.1 系统整体框架设计

图书馆借阅、管理以及检索等不同领域的电子标签敏感信息智能过滤系统,通过特制量化方法汇总来源于图书馆不同领域的电子标签信息特征,以此为依据过滤电子标签敏感信息。系统整体结构分为表现层、业务逻辑层和数据处理层,如图1所示。

上世纪由法国兴起的装饰艺术运动,极大的丰富了家具的奢华度,而这种设计从来都不是为大众服务的,展现了家具工匠的高超手工艺,直到现在这种家具仍在许多富人家里出现。日本提倡装饰极简主义与大师米斯·凡德罗的“少即是多”不谋而合,以现在风靡一时的无印良品为例。无印良品的家具设计简单,多以原木为主,其家纺方面也是很简单的素色棉质,桌子棱角、椅子扶手等进行过圆滑处理,极大提高了家具的舒适度,不仅满足了人们眼球的舒适度,更满足了使用时的舒适度,就此来看,无印良品的设计可以称为好的设计。

图1 系统整体结构设计
Fig.1 Design of system integral structure

表现层中的电子标签信息采集模块,采用RFID 技术获取图书馆借阅、管理和检索等领域的电子标签;业务逻辑层中的电子标签信息存储模块,依照图书馆不同领域划分网关,不同的领域通过LHBase 数据库存储表现层采集的电子标签信息;数据处理层是总体系统的核心[5],对业务逻辑层存储的电子标签信息进行处理,提取电子标签信息的特征生成特征向量,将特制向量存储在HDFS 文件中。HDFS 中信息分为原始样本信息、样本他特征向量与分类器参数。基于MapReduce 并行框架实现电子标签采样数据预处理后[6],采用贝叶斯分类器智能过滤图书馆不同领域电子标签敏感信息,过滤结果以文件形式存储在HDFS 内,方便管理者查看。

1.2 电子标签信息采集模块设计

系统采用电子标签信息采集模块通过RFID 技术采集图书馆借阅、管理以及检索等不同领域中的电子标签信息,模块内的读写器对信息实施加密,利用发射天线将加密后的信息传输至电子标签,电子标签吸取磁场能量激活内部微芯片电路完成电磁波转换,射频识别后形成反射回波信号。读写器获取回波信号后对信息实施处理、采集信息,并进行数据转换后,将转换结果传输到后台服务器[7]。服务器处理并管理控制这些数据。电子标签信息采集模块的工作原理如图2所示。

图2 电子标签信息采集模块
Fig.2 Information acquisition module of electronic label

RFID 技术能够识别目标并且对信息实施管理,通过识别图书附带的标签,获取图书信息,确定图书现状。通过电子标签信息采集模块获取的图书信息,图书馆管理者和借阅者均能够迅速定位图书[8],大幅度降低管理者整理图书和借阅者搜寻图书时间。

菌株:伤寒沙门菌GIFU 10007(野生株,WT),rpoE缺陷株(ΔrpoE), rpoS缺陷株(ΔrpoS),RNase E缺陷株(Δrne),RNase III缺陷株(Δrnc)由本实验室保存,缺陷株使用自杀质粒法制备.asrC启动子缺陷株(ΔPasrC),WT+pBAD(WT含pBAD/gIII),WT+pBAD-asrC(WT含pBAD-asrC)由本实验室制备[18].

1.4.2 贝叶斯电子标签敏感信息过滤器设计

1.3 电子标签信息存储模块设计

电子标签信息存储模块依照传感网络分布特征,设计信息存储架构如图3所示。

图3 电子标签信息存储模块设计
Fig.3 Design of information storage module of electronic label

电子标签信息存储模块包含三个层次,分别为网关层、LM(Local Manager)层和 GM(Global Manager)层。作为传感器信息接入层的网关层,采用不同的网关接收和处理,电子标签信息采集模块获取的图书馆借阅、管理以及检索等不同领域的电子标签信息;LM 层获取网关层内电子标签信息,采用不同LHBase 数据库实时存储这些信息;GM 层管理并记录全局信息,记录信息存储在GHBase 数据库中,依据记录信息划分电子标签信息存储位置。

分析图5能够得到,当读写器个数较少,即电子标签信息量较小时,本文系统的写入时间、读取时间与其他两个系统的差距较小。随着读写器个数上升,本文系统的效率优势开始显著,当读写器个数增长至30 个时,本文系统的写入时间为728 ms,读取时间为1 164 ms,写入时间与读取时间的增长幅度明显低于基于协同过滤推荐算法的过滤系统和基于自适应多重过滤模型的过滤系统。本文系统在采集和存储图书馆不同领域中的电子标签信息时,写入效率和读取效率均较高,说明本文效率具有较高的电子标签信息采集和存储效率。

1.4 软件设计

1.4.1 敏感信息识别流程设计

式中,贝叶斯网的条件概率表表示,经由学习与分类的训练集获取,则分类标准为:

图4 电子标签敏感信息的识别流程
Fig.4 Identification flow chart of sensitive information of electronic label

实验为验证本文系统的拓展性,在第2.1节实验条件下,分别对比三个系统写入查询时间情况,结果见图6。

基本单元活动制造能力体现在经济条件及生产资料运作下,单个制造活动所能达到的制造能力水平。制造能力的度量一般体现的是企业在一定时间、资源及稳定的技术条件下所进行的,对生产状态的度量。在生产制造过程中,制造活动是开展生产的核心,制造活动执行过程中的影响因素,有的以人为主要影响因素,有的以生产设备为主要影响因素。

实验为验证本文系统对实验图书馆中的借阅、检索和管理领域中电子标签信息的采集和存储效率,将读写器节点设置为30 个,对比分析采用不同电子标签读写器个数情况下,本文系统、基于协同过滤推荐算法的电子标签敏感信息智能过滤系统和基于自适应多重过滤模型的电子标签敏感信息智能过滤系统,采集和存储实验图书馆的借阅、检索和管理领域中电子标签的写入时间与读取时间,结果如图5所示。

若H =(h 1,h 2,…,hn )表示某电子标签E 相应的特征向量,其中由此得到以H 为特征向量的电子标签E 为负面敏感信息概率和正面敏感信息概率的表达式为:

在图书馆不同领域的电子标签内,敏感信息数量较大,同时存在动态变更现象,敏感词随着时间的前进持续更新,此时采用以往字典匹配法无法准确识别图书馆不同领域的电子标签信息。在这种情况下需采用机器学习法识别电子标签敏感信息。图书馆不同领域的电子标签敏感信息的语义模板具有稳定性,将弱化的半监督学习算法与高性能的计算机相结合[9],通过本体推理方法准确识别电子标签语义模板内的敏感信息,流程描述如图4所示。

贝叶斯分类器包含两部分,即通过设置类别(B 1和B 2)的训练集样本训练分类器,获取贝叶斯网条件概率表CPT 的分类器训练部分与基于训练结束的分类器分类待划分类别电子标签敏感信息的分类工作部分。分类标准如式(3)所示,依据该分类标准实现图书馆不同领域的电子标签敏感信息的负面敏感信息和正面敏感信息的有效分类,过滤掉负面敏感信息,提高电子标签信息的价值度,为图书馆管理提供可靠的依据。

测试时,用白纸作为背景,黑色电线模拟电缆.当没有电缆时,按下S1键,将此时的图像作为背景图像数据,同时存储背景图像.背景图像数据处理不正确时,LED灯D1将会点亮,直到数据正确时才会熄灭.背景图像数据处理正确后,将电缆置于白纸前,并上下移动,此时按下S2键,采集当前图像,后续图像开始做背景差分法的处理,并寻找电缆的中心点位置,该中心点即为电缆的位置,DA转换模块将得到的包含电缆实时位置信息的数字信号转换为相对应的模拟电信号,其结果如图6所示.

2 实验分析

实验分别从效率、扩展性和敏感信息过滤准确性三方面验证本文设计的图书馆不同领域的电子标签敏感信息智能过滤系统的性能优势,实验对象为我国某高校图书馆,结果如下。

2.1 效率实验分析

贝叶斯电子标签敏感信息过滤器的核心为贝叶斯分类器,其可将图书馆不同领域的电子标签信息划分成负面敏感信息和正面敏感信息,分别用B 1和B 2表示。样本集合是不同类型电子标签敏感信息划分的依据,因此需汇总图书馆不同领域的电子标签关键字集合,用表示,该电子标签关键字集合中涵盖最大程度体现电子标签敏感信息特征的字、词和特殊符号等,同时清除“的”“了”等低信息含量的常用字。

图5 不同系统的存储效率对比结果
Fig.5 Comparison of storage efficiency in different systems

由于图书馆不同领域的电子标签分布具有领域性,若要在一个集群数据库中存储全部领域的电子标签信息将会造成网络资源消耗大、耗时长等结果,为解决这一问题,将网关层的不同网关依照借阅、还书、管理等检索领域进行划分,采集各领域中的电子标签信息后,通过LM 层中的不同LHBase 数据库实时存储电子标签信息,以提升电子标签信息存储与访问实时性。

2.2 拓展性实验分析

一般情况下,计算电子标签敏感词的热度后,需将敏感词与待分析电子标签信息相匹配,确定最接近敏感词的词,这些词在电子标签信息内呈不均匀分布,且词语所表达意思可能存在不匹配现象。为了提升电子标签敏感信息识别的准确性与全面性,电子标签敏感信息过滤器需具有判断、推理功能,按照敏感词的语义关系,基于数据库信息,进行电子标签信息的分析、推理,判断电子标签敏感信息的类型[10],实现图书馆不同领域电子标签敏感信息的智能过滤。

图6 增加读写器个数与写入查询时间关系比较结果
Fig.6 Increase of the number of readers versus writing query time

分析图6能够得到,三个系统读取30 个读写器信息的时间均呈现出随读写器数量提升而上升的趋势,但相较于其他两个系统,采用本文系统的上升趋势最不明显,说明本文系统具有更好的扩展性。

“‘音译̕是重要的语义代偿手段。许多专有名词(包括人名、地名、物名)以及外来新概念在引进之初由于汉语中缺乏相应的称谓或词汇,人们首先想到的是采用音译法把它们译出来”(刘宓庆,2008)。[10]

2.3 敏感信息过滤结果对比

实验为验证本文系统对实验图书馆不同领域的电子标签敏感信息划分的性能优势,分别抽取不同类型敏感信息的20 个语法特征,17 个语义特征和10 个情感特征,采用三种系统对电子标签敏感信息正常信息和敏感信息进行分类,共进行50 次实验,以正确率、召回率、F 值为指标判断三个系统对电子标签敏感信息过滤性能,得到的平均过滤结果如表1~表3所示。

俄罗斯大型特种任务潜艇舰队有能力抗衡多国海军潜艇舰队,这表明俄罗斯对海底战进行了巨大投入,尤其是针对北极地区作战并在北极圈Olenya Guba地区建立了海军基地,俄罗斯海军第29中队代替深海研究总局负责指挥。

表1 基于协同过滤推荐算法的过滤系统过滤结果
Table 1 Filtering results of filtering system based on collaborative filtering recommendation algorithm

表2 基于自适应多重过滤模型的过滤系统过滤结果
Table 2 Filtering results of filtering system based on adaptive multiple filtering model

表3 本文系统过滤结果
Table 3 Filtering results of the system proposed in this paper

分析表1~表3得到,本文系统在对图书馆不同领域的电子标签敏感信息过滤时正确率与召回率的平均值为96.2%和95.2%;基于协同过滤推荐算法的过滤系统和基于自适应多重过滤模型的过滤系统的正确率与召回率分别为73.9%,80.0%和75.8%,76.0%。结果表明本文系统敏感信息过滤结果的正确率高于其他系统20.4%以上,召回率高于其他系统15.2%以上,说明本文系统过滤图书馆不同领域的电子标签敏感信息准确率较高。

3 结 论

本文设计图书馆不同领域的电子标签敏感信息智能过滤系统,系统主要包括表现层、业务逻辑层和数据处理层,采用基于RFID 技术的信息采集模块采集图书馆借阅、管理以及检索等不同领域的电子标签信息,并将采集的电子标签信息保存至信息存储模块;采用本体推理方法准确识别电子标签语义模板内的敏感信息,通过贝叶斯分类器实现电子标签敏感信息分类。经实验证明本文系统具有较高的采集和存储效率,过滤电子标签敏感信息准确率高。

通过计算可得,电动机所需有效功率为25.8W,由电机到滚筒的传动总效率为η=η1·η2·η3。其中,η1,η2,η3分别为链传动、轴承和滚筒的传动效率。经计算可得所需电动机功率为36.5W。

参 考 文 献

[1]何赫,刘涛,李丹.基于RFID 的图书馆图书定位系统研究与设计[J].电子器件,2017,40(3):688-691.HE He,LIU Tao,LI Dan.Research and implementation of a RFID-based systemfor library books positioning [J].Chinese journal of electron devices,2017,40(3):688-691.

[2]胡传志,程显毅,曹小峰.网络敏感信息自适应多重过滤模型研究[J].计算机科学,2015,42(1):272-275.HU Chuanzhi,CHENG Xianyi,CAO Xiaofeng.Reserch on model of multi filtering for adaption about network sensitive information [J].Computer science,2015,42(1):272-275.

[3]谢鲲,台立钢,于慎波.全自动过滤器控制系统的改进设计[J].流体机械,2017,45(2):50-52.XIE Kun,TAI Ligang,YU Shenbo.Automatic control system of the filter design improvements [J].Fluid machinery,2017,45(2):50-52.

[4]查志勇,罗弦,刘芬,等.智能传感器中虚假信息过滤方法优化研究[J].计算机仿真,2016,33(12):249-252.ZHA Zhiyong,LUO Xian,LIU Fen,et al.False information filtering methods in intelligent sensor optimization research [J].Computer simulation,2016,33(12):249-252.

[5]郭兰杰,梁吉业,赵兴旺.融合社交网络信息的协同过滤推荐算法[J].模式识别与人工智能,2016,29(3):281-288.GUO Lanjie,LIANG Jiye,ZHAO Xingwang.Collaborative filtering recommendation algorithm incorporating social network information [J].Pattern recognition and artificial intelligence,2016,29(3):281-288.

[6]徐九韵,管超,杨丹,等.一种基于协同过滤与BG/NBD 模型数据预测的智能手机节能策略[J].计算机集成制造系统,2017,23(5):1139-1146.XU Jiuyun,GUAN Chao,YANG Dan,et al.Smartphone energy-efficiency strategy based on collaborative filtering and BG/NBD model [J].Computer integrated manufacturing systems,2017,23(5):1139-1146.

[7]唐良瑞,李荣荣,翟峰.面向智能用电信息采集终端的访问控制协议[J].电力系统自动化,2016,40(6):113-118.TANG Liangrui,LI Rongrong,ZHAI Feng.An access control protocol for intelligent electricity consumption information acquisition terminals [J].Automation of electric power systems,2016,40(6):113-118.

[8]江波,吴永祥.图书馆RFID 系统建设中的图书定位问题研究[J].现代情报,2015,35(5):131-134.JIANG Bo,WU Yongxiang.Study on the problems of book location in construction of library RFID system [J].Modern information,2015,35(5):131-134.

[9]刘莉.智能人工搜索在图书馆信息服务中的应用[J].图书馆工作与研究,2015,1(8):91-92.LIU Li.The application of intelligent artificial search in library information service [J].Library work and study,2015,1(8):91-92.

[10]薛朋强,努尔布力,吾守尔·斯拉木.基于网络文本信息的敏感信息过滤算法[J].计算机工程与设计,2016,37(9):2447-2452.XUE Pengqiang,Nurbol,Wuxur·Islam.Sensitive information filtering algorithm based on text information network [J].Computer engineering and design,2016,37(9):2447-2452.

Design of intelligent filtering system for sensitive information of electronic labels in different domains of library

DING Yiqi,ZHANG Jie,ZHOU Weibin,LI Feng,ZHU Mengyue
(Taizhou University,Taizhou 318000,China)

Abstract: In allusion to the phenomenon existing in libraries that there are a large amount of sensitive information in electronic labels and poor quality in books preservation environment,an intelligent filtering system for sensitive information of electronic labels in different areas of library is designed.The RFID technology is used in the electronic label information collection module in the system to obtain electronic label information in the fields of library borrowing,management and retrieval.The different gateways in the gateway layer are divided by the electronic label information storage module according to the fields of borrowing,management and retrieval,in which the LHBase database is used to store electronic label information in real time.The sensitive information in the semantic template of electronic label is recognized by means of ontological inference method.The sensitive information filter of Bayesian electronic label is used to filter the electronic label sensitive information.The experimental results show that the correct rate and recall rate of the sensitive information filtering of the designed system are 20.4% and 15.2% higher than those of other systems,respectively,which indicates that the system can accurately filter electronic label sensitive information in different fields of library and has a greatly practical application value.

Keywords: library;gateway partition;electronic label;sensitive information;intelligent filtering;system design

中图分类号: TN99-34;TP391.1

文献标识码: A

文章编号: 1004-373X(2019)18-0107-05

DOI: 10.16652/j.issn.1004-373x.2019.18.025

收稿日期: 2018-12-20

修回日期: 2019-02-26

基金项目: 国家自然科学基金(21501128);浙江省教育厅科研项目资助(Y201840262)

Project Supported by National Natural Science Foundation of China(21501128),Science and Research Projects of Education Department of Zhejiang Province(Y201840262)

作者简介: 丁一琦(1982—),女,浙江台州人,硕士,高级工程师,研究方向为信息化应用,图书馆信息化管理。

标签:;  ;  ;  ;  ;  ;  ;  

图书馆不同领域的电子标签敏感信息智能过滤系统设计论文
下载Doc文档

猜你喜欢