AI技术下的图书馆机器“自动问答”信息服务探究
李建伟
(嘉应学院 图书馆,广东 梅州 514015)
摘 要: 以人工智能技术的发展视角系统阐述了现代图书馆信息推荐模式的功能特点,探讨了新一代智慧图书馆泛在式信息服务的应用方向,详细分析了机器“自动问答”信息服务运作模式、核心技术等关键要素。
关键词: 人工智能 ;自动问答;信息服务
人工智能(Artificial Intelligence,简称AI)是21世纪异军突起的革命性科学技术,近年来,世界各国政府高度关注人工智能的发展,而我国人工智能也逐渐步入了实质性的发展阶段。人工智能技术影响人类社会生活的方方面面,使社会生活更便捷,更智能、更高效;而对图书馆的影响也是全方位的,涵盖图书馆的文献资源建设、读者服务、馆员发展、图书馆建筑与环境、资源管理等各个微观应用领域;图书情报学的发展方向也悄然随着AI时代的到来而发生改变;智能情报、智能检索等将真正实现。随着智慧图书馆的相关理论方法的不断提出,人工智能技术在图书馆的应用越来越广泛,图书馆已从传统的信息资源供应者转型为知识挖掘者,服务模式正逐渐由等待服务到主动服务,面向群体服务到个性化服务,面对读者服务到网络虚拟服务,馆员服务到智能机器人服务转变。
1人工智能与图书馆泛在信息服务
泛在,由美国学者马克·威士在20世纪80年代提出,意为计算机融入个人生活空间,形成一个“无所不在、普遍存在”的学习应用环境[1]。泛在学习作为一种创新学习理念,关键是要依靠全覆盖的网络,利用移动终端、微信公众号等设备环境,让用户能够友好地、迅速高效地在任何时间、任何地点准确获取自己所需知识[2]。
虚拟现实技术在教育领域中的应用主要体现在虚拟校园的构建,目前只提供校园导航功能已经远远无法满足校园信息化建设的要求,未来综合校园导航、校容校貌展示、校园信息化管理等功能的三维虚拟校园系统已是大势所趋[3]。该次设计所完成的漫游系统沉浸感较强、交互逻辑清晰,能很方便地为学生提供相应的服务。
目前信息服务智能化建设是人工智能技术在图书馆应用的核心领域。云计算给泛在图书馆提供了强有力的架构与支撑,使个性化知识云服务成为可能[3]。基于云计算的信息挖掘与推荐可以解决互联网 “信息过载”与“信息迷失”的问题,有效帮助用户及时、高效地获取到其感兴趣的有价值信息和知识。借助大数据、深度学习框架提升了信息推荐的个性化、精准化以及智能化,同时提高了读者信息获取内容品质,并对图书馆领域的学术研究与知识发展起到了积极作用。由此可见,图书馆泛在信息服务建设就是在互联网环境下让读者随时可获取知识,让馆员可随处管理知识,让知识目标准确选择用户群体[4]。网络时代,图书馆的泛在信息服务项目类型多样,主要有以下几方面。
1.1 信息公告服务
为用户提供便捷高效的信息告知服务是图书馆最基础而又不可或缺的读者服务之一,如将新闻信息、数据库资源开放公告、图书荐购到馆通知、名师学术培训讲座、图书馆读者服务、阅读推广活动等适时推送给读者。
1.2 精准的知识服务
在整合图书馆海量数字资源前提下,借助于大数据、云计算等技术主动挖掘读者的行为利用特征,主动分析读者资源兴趣偏爱,提供精准的资源定位服务,具体服务包括标签云、分面导航、检索建议等等。
需要注意的是,采用上述计算得到泄压板面积为有效面积。在实际的工程应用中,由于泄压板多为方形开口,需根据泄压板形状将有效泄压面积转化为几何面积进行设计。
1.3 机器人咨询服务
区别于面对面、电子邮件、电话、微信咨询等传统图书馆信息咨询方式;机器人咨询服务利用人工智能技术能打造智能信息推荐体系,将图书馆的知识发现功能延伸到互联网各学术资源平台,满足读者泛在的信息需要。人工智能支撑下的咨询服务实现对不同情境下信息需求的深度分析,包括对用户的预期认知、历史行为、兴趣偏好特征等进行精准定位,在此基础上构建信息用户的知识图谱,从而自动生成满足用户信息需求特征的知识服务内容体系。目前高校图书馆纷纷以机器人的形式,引入自动问答系统实现人机对话,为用户提供资源指引、服务导航等智慧咨询服务,比如向新生推荐新书、问答有关借阅问题、介绍图书馆重点资源等等,甚至提供相关学科专业知识等等。智能系统通过语音识别将用户输入的自然语言转换为文本,通过分词处理,提取关键词作为查询输入,系统查找答案,并将答案以模拟人工语音的形式返回用户。另外机器人咨询服务越来越体现知识服务的专业性、广泛性,学术检索、专家咨询、问题自动解答、数据深度挖掘、跨媒体知识整合等服务项目正推动图书馆朝智慧化迈进。
2图书馆机器“自动问答”信息服务的技术发展环境
泛在式信息服务是未来图书馆的一种重要服务形态[5],机器“自动问答”在其中扮演着重要角色,目的是加强图书馆与用户的交互体验,吸引读者用户共同参与图书馆建设,更好提升资源的利用效率。构建智能机器人为主的信息服务环境,前提是拥有良好的互联网信息化基础设施,包括有线的、无线的、4G/5G网络;在全覆盖的高速网络环境中,用户利用计算机、智能终端、手机等工具,享受最快捷方便、畅通无阻的图书馆服务。充分整合利用射频技术和空间定位技术,构建精确的物联网,使图书馆的设备和资源构成一体的服务云。同时相关图书馆学和人工智能的关键技术也不可或缺,主要包括以下几方面。
2.1 自然语言检索
紫坪铺龙抬头无压泄洪洞洞内最大流速约45 m/s,经水工模型试验,将初步设计阶段反弧末端2道通气槽改为5道掺气坎,其中斜井段(龙抬头段)设置3道,导流结合段设置2道,使每道掺气设施保护段长度均小于200 m。九甸峡工程有压放空泄洪排沙洞在井塔式进水口采用旁通充水管和通气管,为防止高速水流冲蚀破坏,在闸门出口以后的泄槽(流速为 33~34 m/s)底部设垂直跌坎,以 1∶8底坡直至挑流鼻坎反弧段为起点,闸门后的泄槽两侧各突扩80 cm。
2.2 机器语义理解
2.2.2 高质量词典库的构建。词典库的构建关键是词汇的与时俱进,词典库要及时更新补充反映科学进展最新词汇,可以遵循图书情报学信息组织的方法通过对陌生词汇、网络流行词语进行规范加工标引。机器语义研究应用词典库技术是解决机器难于准确理解学科专业用语等难题的辅助途径,可以提高分词的精确性。此外,语料库信息与词典信息只有来源于大量原始而且真实的语料才真正全面且可信度高,只有将两种技术充分结合起,才能达到优势互补的作用。
规范语言是20世纪70年代~80年代情报语言学研究的重心[6],如今互联网信息服务越来越以提供自然语言咨询服务为主。自然语言是人类的交流语言,用户信息需求的表达也在很大程度上通过口头语言表达,机器“自动问答”要实现智能的信息分析和信息,要实现人机对话,自然语言理解(Natural Language Understanding,NLU)技术毫无疑问是最核心的技术之一,因此当前的《新一代人工智能发展规划》也已经将自然语言理解列入重要的发展方向。图书馆学中关于自然语言处理的应用理论技术也为机器“自动问答”信息咨询服务的发展提供坚实基础。“自动问答”系统要智能分析用户的自然语言,要着力探索图书情报学在自然语言机器识别中的应用方向和实现途径,如:自动语音识别的速率与准确率;句法与语义分析、关键词的切分和核心词的筛选,概念分析与词性标注;语义结构化知识表示等。当前的自然语言检索正不断融合基于深度学习框架技术的智能分类、智能标引等,应用不断发展的大数据挖掘算法成果,综合应用于图书馆信息咨询自然语言检索项目中。
女性主题的艺术作品创作总是显得那么特别又通常,特别是从古代的岩画对生殖图腾的崇拜,尤其是女性图腾,直到后来出现不断演进的艺术流派,不得不说,“女性”一直是艺术家们愿意选择抒发的题材。而对绘画这一属于视觉艺术的门类来说,女性则常常被作为很多作品表达的灵魂所在,则不管是中西方,作为一种有特别的视觉识别特征的性别,已变成艺术家们制造某种精神指向的重要符号之一。无论是“审美对象的女人”还是处于“精神化中的女人”,在特定时代的艺术家们总会把自己对于世界的看法,对独特精神功能的感知通过女性形象来传达。
2.2.1 主题信息的高效获取。机器准确理解语义的前提是高效获取主题词,主题词的提取可以从预先建设的语料库中进行筛选获得。语料库词汇的的有关固定词的搭配、专业用语之间的约束限制、语义特征等都可以由语料的加工、提炼和统计获得。机器理解面对词义不确定的情形,可以从语料中统计出各种词类、词义的出现概率以及相应的上下文约束条件,为消除分词歧义提供依据。
机器语义理解是智慧图书馆构建泛在式信息服务的关键技术。目前在机器语义研究中,基于句法-语义分析的方法以及句法分析理论已比较成熟,取得了一系列的成果。但是,单纯基于规则的结构化语义划分和基于词性统计方法的机器语义研究各有其优势与不足。在关键词与关键概念提取技过程中前者能理解并处理自然语言中的语义比较确切并且切分粒度比较大的知识,且其语义分析方法相对完备;但缺点是不能很好理解语言中的模糊性知识、口头隐语、小粒度的知识,应用范围窄,结构灵活性差。而基于概率统计的、经验性的方法则有利于处理语言的不确定性,善于表示语言中不确定的、小粒度甚至特殊的知识,但不便于反映语言中确实存在的确定的语法规律和语义知识。笔者认为解决基于规则的机器语义理解在特定领域受限的问题,可以结合语料库技术支持研究,具体包括以下方面。
另外人工智能属于新时代的创新技术,在图书馆领域的信息咨询服务不仅需要更加高效灵活的方法、模型与算法,更需要专业馆员对信息服务有关个性化推荐模式更专业化、深层次的理解。图书馆馆员的角色则转变为以大数据为基础,以人工智能为核心,利用自动咨询系统为读者用户规划建设个性化、专业化的知识服务。专业馆员对知识库学科专业方向的规划与设计,可以让智能系统更有层次性与针对性;才能更加精准预测到用户兴趣所在,提高图书馆信知识服务的专业性和科学性。
专业学科知识主题特征库建设。泛在式机器“自动问答”信息咨询系统的部署是以算法为核心,以数据和硬件为基础,着力提升感知识别、认知推理、人机交互水平,实现图书馆对大数据知识服务的管理与价值挖掘的目标。机器人自动问答的实现对社会各行业的信息服务咨询与管理中具有举足轻重的地位。机器人完成“问题——答案”主动的分类匹配,基础前提是构建高质量的专业学科知识主题特征库;机器人要基于深度学习能够同时准确自动理解读者的需求,要选择最优的特征匹配,不再仅仅限于提供问题答案的简单检索工作。
2.2.4 知识智能推送。机器“自动问答”咨询服务以大数据驱,并拥有“聪明的算法”,运用卷积神经网络以及协同过滤等人工智能技术和工具实现精准化的智能图书馆情报咨询服务。近年来不断出现的图书馆智慧知识咨询系统机器人,可以利用读者阅读行为产生的海量历史数据来关联计算用户对某一话题的兴趣强度,如果信息强度超过管理员预先设定的阈值,机器人可以自动向读者推送预期信息资讯,解决传统馆员难以完成的个性化推荐的问题,也为读者节省了信息过滤的时间。
2.2.3 跨媒体知识资源关联分析。用户在海量的数字资源容易陷入信息迷茫,智能“自动问答”咨询系统的任务是为用户实现知识抽取。所谓知识抽取是指从各种类型的数据和信息资源包括文本、图像、视频、音频等抽取出知识,从数据集中发现重要模式的过程。知识抽取的难点是从大量的数据中发现数据之间的关联规则,把人们已经显性表达出来的知识结构化、计算机化,并把知识表示成机器可以理解的知识元。知识抽取结合计算机智能算法,把不同的数据组合起来,进行关联映射分析,计算数据之间的相似度,运用关联规则、聚类分析、主题分析、向量空间模型、网络语言交叉分析等一系列分析方法,实现资源之间的相互链接与揭示、概念之间的关系发现,支持人们发现有价值的、未知的却又事实潜在的知识。
3机器“自动问答”信息服务的发展方向
录入界面是小学蒙古文教育资源管理库平台的一个不可或缺的一部分,是一种重要的模块。它的主要功能是语料的录入和存储。包括将已经收集好的预料文件和预料文献数据信息进行汇总录入和存储在特定的位置。
构建知识库要有海量的上下知识储备,如果数据库知识匮乏、单一,系统很难理解问句的含义。另外,复杂多样的知识存在形式也使其在利用深度语义表示模型进行语言处理的方法难度大大提升。解决上述问题,知识图谱、语义网络等信息组织方法可以在问答系统中被灵活应用;可以设计不同的知识融合算法有针对性地将不同的结构中抽取与问句相关的知识信息添加到问句的表示中去,以更好的对问句进行理解[7]。未来运用自然语言问答、 大数据可视化、 知识图谱化在图书馆信息服务中极具应用与推广价值,3种技术的的交叉融合推动智慧图书馆的知识服务水平朝着质的飞跃提升,可以改观图书馆的社会服务形象。
融合知识表示的“千人千面”的自动问答。随着人工智能、大数据、云计算和深度学习技术的发展,语音识别、搜索推荐、自然语言处理已经在图书馆自动问答系统取得了广泛的应用。近年来卷积神经网络是具有深度结构的代表算法之一,它在自然语言处理任务上的表现获得行业专家的一致认可。区别于基于知识数据库传统检索的咨询方法,机器人基于卷积神经网络算法有机组织语音识别、语义理解和语音合成等重要人工智能技术,实现端到端的问答系统,同时主动提供与问题相关联的主题知识。其技术核心是从海量的低层交互数据中自动地提取多层特征表示,由具体到抽象、由一般到特定,从简单特征中提取更加复杂的特征,目标是让机器不仅仅能够识别读者提交的文字、图像和声音等数据,还要能够像人一样具有分析学习的能力,能够并使用这些组合特征去帮助读者回答问题。
部分图书馆已经围绕特色专业学科构建知识自动问答平台开展虚拟咨询服务。自动问答系统预先利用大量的专业语料知识问答训练,得到问答之间的匹配模式,为自动提供问题解答奠定基础。咨询服务过程中,虚拟机器人首先进行用户的语音识别,完成内容理解和价值判断,准确理解语义进行检索,最后将输出结果转换成机器合成的语音,以对话的形式将结果反馈给用户。虚拟机器人的认知模块会分析用户的类型,调取用户静态属性以及监测用户动态行为信息,从不同维度揭示用户的个体兴趣特征与资源偏好,准确地勾勒出“千人千面”的信息需求模型,以便准确地提供个性化推荐。
人工智能下的“信息茧房”矫治。以算法为核心的信息推荐根据用户历史记录发掘兴趣模式进行知识推送,但如果机器算法不成熟完善,导致推送的内容重复度太高,可能会让用户越来越被动地倾向于接收和自己相类似的信息和观点,使他们越来越难地从“信息茧房”解放出来,越来越窄的信息环境会限制读者的视野,减少了与其它多元化信息的机会。“信息茧房”是信息推荐过程中用户对信息价值获取的障碍,会深刻影响读者的阅读行为。在未来“探索—开发”视域中,要更好实现人与机器语义交流过程中对抽象概念的理解与识别,要更科学地构建完备的语义体系,以实现智能推荐中对“信息茧房”现象的矫治。
企业全面预算管理工作是战略管理的一部分,企业必须加强对市场环境变化和经营战略变化的重视,合理调整发展的各项战略,继而对全面预算编制等各项工作进行调整,建立恰当的奖惩制度,保障各项工作落实到位,提高全面预算管理的有效性。
4结束语
人工智能技术再塑各行各业的信息服务模式,也给图书馆的信息资源建设、图书馆服务管理等各个方面带来新的变革。当前图书馆不断借力移动互联网、物联网、大数据、云计算等技术研发智能化应用软件,智能识别、智能信息处理(组织、分析)、智能信息服务(检索、推荐、咨询)在智慧图书馆建设方面产生越来越广泛的影响。大数据拓展了图书馆智慧信息服务的内涵,提升了图书馆的服务效能以及便捷化水平,促使信息服务从主要依靠专业经验进行粗放管理向泛在化、智慧化转变。自然语言检索与机器自动问答的研究为图书馆向高效、精细、个性、泛在的智慧图书馆迈进提供了新的发展方向。利用人工智能技术打造交知识互式的智慧服务生态系统,为未来的图书馆多元化、高品质变革发展提供了创新动力,促使图书馆成为更加重要的社会教育中心。
[参考文献]
[1] 陈清文,黄田青.泛在图书馆初探[J].图书馆工作与研究,2008,(8):15~18.
[2] 李显峰,柴荣军,黄昌军.基于移动智能终端的泛在学习模式的研究[J].科技风,2018,(2):111.
[3] 王红.基于云计算的泛在图书馆个性化知识服务模式探讨[J].情报科学,2012,30(08):1196.
[4] 张绍军.基于用户需求的泛在图书馆服务模式研究[J].图书馆界,2016,(5):5~8,12.
[5] 张会田.泛在图书馆:如何从概念走向现实?[J].图书情报工作,2009,53(19):40~43,87.
[6] 吴建中.人工智能与图书馆[J].图书与情报,2017,(6):1~5.
[7] 安炜杰.融合知识表示的自动问答系统关键技术研究[D].上海:华东师范大学,2018.
中图分类号: G250.7
文献标识码: A
文章编号: 1007—6921(2019)20—0067—03
收稿日期: 2019-06-28
基金项目: 本文系梅州市哲学社会科学2019年规划立项课题:现代图书馆智慧信息服务的构建与运行机制研究(课题编号:mz-ybxm-2019022)阶段性成果之一。
作者简介: 李建伟(1981—),男,软件工程硕士,副研究馆员,广东省嘉应学院图书馆。