基于NDN的知识教育服务平台构建研究
廖祝华,肖浩,易爱平
(湖南科技大学 计算机科学与工程学院,湖南 湘潭)
摘 要: 针对互联网中大量知识服务软件、数据库和平台以及教育相关的社交圈、通信群不断增长的现象,本文研究探讨了一种基于NDN(命名数据网络)的知识教育服务平台架构。首先探讨和设计了在互联网发现、挖掘地址未知知识及其相关对象的层次命名及其它语义信息的方法;然后探讨了评估知识及相关对象的NDN路由索引及其路由特征的方法,以扩展地址未知知识的路由匹配和发现的能力;最后,对个性化知识的NDN请求生成和结果汇聚技术进行了研究,以在网络中完成地址未知知识服务的个性化和教育活动。总体上,该架构能在NDN网络架构上实现互联网范围内地址未知知识资源以及知识服务提供者和消费者之间的有效合作、互动和个性化,具有在整个互联网范围内实现个性化的地址未知知识获取和汇聚以及“无界”的教学活动的潜力。
关键词: 命名数据网络;教育服务;地址未知知识;知识路由;知识汇聚
一 介绍
网络与信息技术能使人们的知识发现、社会交往、信息交流和学习讨论更加方便和快捷。然而,很多知识服务软件、数据库和平台相互孤立,知识服务相关的社交圈、通信群则散落在不同的平台和网站中,相互间缺乏开放与对外服务的支持[1]。而支撑这些组件、系统或平台的互联网络对于知识内容的访问目前主要是基于IP地址或域名,并需要先通过全局地址登录到第三方系统或平台后,再根据本地地址获取相关的知识及对象。此外,目前面向互联网的搜索引擎主要只对开放的Web信息进行搜索。网络中其它大规模应用(APP)、数据库和平台中的内容则缺乏对地址未知的远程知识的搜索策略。因而,对互联网中大规模、海量知识搜索的广度和深度仍存在局限和挑战。随着物联网、移动网络、无线传感网等新型动态网络的发展,网络范围内动态分布知识及相关对象缺乏语义全局共享与大规模复用,而对于整个互联网络则缺乏开放、合作、个性化和动态的知识服务[2]。
网络中人们对分布的教育服务需求,除了获取主题或关键词相关的知识,通常还需要获取与特定知识相关联的知识,以及在语义方面扩展的或更深度的知识。此外,还可能需要与具有共同兴趣的人员相互交流、讨论,或者连接在线的专家、教师进行答疑、归纳、总结和问题设置。为满足这种全面的网络知识及相关对象的多元综合教育服务[3],本文研究的知识服务平台将基于名字、分类和其它语义属性发现、关联互联网范围内地址未知的知识、问题和答案以及领域相关的专家和学习者群体等,以在整个互联网中实现开放、自治、互动和合作的知识教育服务。
老区革命纪念馆的发展一定要在发挥红色资源的同时依据当地具体情况,定位清晰,统一思想。革命纪念馆只有负重拼搏,与时俱进,红色旅游才将成为革命纪念馆更快发展的强劲推动力。
目前在新型网络架构的研究中,内容中心网络(又称CCN[4]、NDN[5])提供了基于层次标识的路由能力,可以基于类别、名字获取网络中动态分布的命名数据对象。本文主要基于命名数据网络(NDN)研究面向整个NDN网络范围的知识教育服务的发现、个性化和集成方案。为实现上述功能,本文首先在NDN网络边缘使用挖掘知识及相关对象的语义层次标识的方法,挖掘、分析各应用端中知识及相关对象的层次分类和命名信息,如知识、问题、答案和专家群体等。而在NDN网络中挖掘层次路由索引的访问频率、信息量级别、频繁项集等属性信息,并在兴趣路由转发和结果返回过程中对相关的、深度的或广度的知识进行智能匹配和路由挖掘,以发现与关联用户需要的知识、问题和答案,或在线联系专家或相关社交群以完成问题解答和评改等。
二 相关工作
互联网中现存在各种各样的知识服务资源库,如:电子图书馆系统、知识库、百科或博客、知识学习软件或平台、社交平台等[6]。其中,电子图书馆系统一般会将电子图书资源分类,创建电子图书的目录,登记其属性;不同知识学习软件、平台一般提供API数据访问接口,或者基于WSDL(Web Services Description Language)的服务访问接口。而通过API接口描述信息或WSDL描述文档的信息一般能获取数据对象名和属性等,甚至能抽取数据的层次分类信息;社交平台中存在很多面向专业领域的社交圈和、通信群,并具有开放的API以实现与外界的交互,支持对外服务。因而,实际上互联网中很多知识服务资源库、平台等提供了与外界交互、知识服务的能力。
NDN路由挖掘的具体流程如图3所示,它主要根据用户兴趣和返回的结果对以下特征进行路由挖掘。
本课程学习过程包括工作任务(练习)、初步评估、理论学习、案例分析、工作任务(完成)、交流分享、阶段评估(测验)、拓展学习等多个学习活动。成绩考核改变以往以期末考试为唯一的评判标准,将最终成绩分为期末成绩占50%和平时成绩占50%两部分组成,其中,平时成绩包括了课堂表现20%,实践动手能力10%,作业测试20%等部分组成,有利于培养学生的创造力、知识转化能力、语言组织与表达能力等综合素质。
在“云+端”服务平台和泛在计算、数据挖掘等技术支持下,人们已经启动研究建设基于微知识网络化、关联化、泛在化的知识资源系统[7]。但这些方案仍然是基于IP地址和远程过程调用方式来实现分布式数据分发和处理。而在获取分布式数据或调用远程服务之前,必须先通过广播或概率组播模型获知部分远程过程的地址以及函数接口和参数等。因此,当前的方案存在可扩展性不强,获取网络中动态分布式知识的正确率、召回率和效率难以同时兼顾等问题。
近几年,人们提出的NDN网络具有基于层次命名的数据分发、语义匹配和分布式任务处理能力,如基于NDN的Top-k数据查询[8]、基于NDN路由模型实现分布式任务计算的NFN (Named Function Networking)[9],以及对网络中的数据进行分布式处理的函数链系统[10]。这些研究方案具有对动态网络中地址未知对象的获取和计算服务的调用能力。
三 基于NDN的知识教育服务平台架构
NDN的路由机制可对分布式知识的层次命名进行通告,可将包含层次命名的用户兴趣转发到相关的知识服务源,并原路返回结果。本文将基于NDN构建知识教育服务平台,以发现、获取和集成网络范围内地址未知的知识及相关对象,以构建新一代知识教育服务平台,满足知识教育服务“无界”的需求。
(一) 内容中心网络(NDN)
NDN (即命名数据网络)[2,3]是一种新兴、以内容为中心的互联网体系架构。它能在分布式网络中对命名数据实现基于名字的路由和转发,而不依赖于IP地址来进行路由和转发数据,同时它采用结构化分层命名方法对数据进行命名,类似于IP地址前缀机制来迅速定位内容所在区域和主机。NDN中有消费者(Consumer)、生产者(Producer),以及两种类型的传输包:兴趣包(Interest Packet)和数据包(Data Packet)。NDN网络中的路由节点包含待定兴趣表(Pending Interest Table, PIT)、内容存储(ContentStore,CS)和转发信息库(Forward Interest Base, FIB)三个组件。其中,PIT的作用是保存兴趣包发送的请求信息,以保证当接收到数据包时可以根据这些信息将其正确地返回给请求者;CS的作用在路由中缓存内容,以备其它用户复用;FIB是用来将兴趣包发送至语义匹配的数据所在的节点,与IP路由器相比,它可以基于语义获取地址未知的远程数据。
因此,NDN能根据名字路由和转发知识数据,从而打破了当前知识共享必须先共享地址的限制,而知识地址发生变化,也不影响用户对知识的获取。
不会生活虽说缺少了许多人生乐趣,但也让他淡定的生活多了几许恬静和温馨,闲暇之余有更多的时间专研业务,使之早早地便成为省行业带头人。不论单位换多个任领导,领导的脾气秉性如何,一个个都对他另眼相看,恭敬有加。换别人,可能不会满足现况,但他却很满足,很知足。
企业管理系毕业的高材生莫高是这样解释的:企业与员工之间无所谓忠诚与否,重要的是能否彼此满足。男女之间,也是如此。他的话让青春单纯的楚墨赏了他一记狠狠的耳光,那记耳光让莫高终生难忘。
(二) 知识教育服务平台架构
基于NDN的知识教育服务平台架构主要包括用户交互模块、挖掘模块和路由模块,具体各模块要实现的功能和总体结构如图1所示。在该平台中,挖掘模块分别包括:NDN核心路由器上的路由挖掘和NDN边缘路由器上的元数据挖掘(如基于程序API挖掘、数据库访问接口挖掘和Web数据挖掘等);NDN 路由器上的路由模块主要包括NDN路由组件和扩展匹配组件;而NDN的用户交互模块主要包括兴趣生成、解答组播分发、评改反馈回送和结果接收处理等模块。
互联网范围内的知识及相关对象可以按知识类型、领域划分。其中,知识及相关对象按类型可划分为知识点、问题和解答以及专家、学习者或群体等;知识及相关对象按领域可划分为数学、物理、计算机和艺术等,而对每一领域又可再划分若干子领域。因此,在NDN中,为了方便用户基于层次命名访问边缘路由节点中各种知识及相关对象,本文提出的知识教育服务平台将对整个互联网范围内的知识或知识提供者和消费者进行分面(即知识类型划分)、分域(即知识领域划分)、分层(即领域层次划分),从而构建全局的多类别、多领域的层次分类模型。各知识及相关对象为所匹配的面、域、分层中的叶子节点,而各子节点包含有对象名、属性名等信息。另外,根据知识及相关对象的分类、属性,或其内容的语义,标注不同知识及相关对象或分类之间的语义关联关系。最终,对知识及相关对象构建一个统一的层次描述模型。因此,用户请求和返回结果中的名字通过层次模型描述,从而能为其进行全局语义路由。在进行全局语义路由之前,由用户提供路由匹配中所需要的层次命名和数据源中知识发现所需要的属性约束条件,因此用户获取知识及相关对象的请求(Quest)格式统一规定为:
这里PFIB为FIB中匹配的前缀长度,P1为与PFIB匹配的用户兴趣中层次命名的长度,Am为被评价的某个匹配项的属性、特征信息与用户兴趣中的属性、特征要求的匹配度,α,β为权重系数。
(4)语义范围、属性值域估计。根据用户兴趣中的层次名字、属性约束和对应的返回结果,挖掘分类层次命名中包含知识的属性集、属性值域、信息量级别,或其它分类数据,从而能更好地对用户知识兴趣进行有效转发。
层 = 第1层类名/第2层类名/......;
非物质文化遗产蕴藏了丰富多彩的原生态民俗文化,是提供多元化具有文化历史价值艺术的宝库,维护了世界文化的多样性,对于传统文化的传承有着不可或缺的作用。此外,非物质文化遗产所具有的取之不尽的艺术元素,启示着现代民间艺术的创作,激发了现代艺术的发展与创新,维系了人类艺术的创造力,对促进社会的可持续发展起着源流性的作用。
属性 = [属性值对1,属性值对2,......];
浓缩脱水采用造粒流化床设备设计上升流速35m/h,排泥含水率按95%~96%考虑,设备尺寸3.0m×5.1m(H),一用一备,设备内筒配机械搅拌器,底部配备机械刮泥机。
特征 = [特征名1=约束1,特征名2=约束2,......]。
因此,通过该兴趣能为NDN路由提供匹配条件,并在相关的路由缓存(CS)或数据源中发现个性化的知识及相关对象。
课题组归纳出一些具体的学生创新学习方法,如自主学习、问题学习、开放学习、案例学习、课题学习和网络学习等方法[3],增强学生探究和体验的机会。
图1 、知识教育服务平台架构
图2 NDN边缘知识挖掘流程
(三) 关键功能模块实现技术
1.网络边缘知识及相关对象挖掘
案例分析是一种基于案例基础上进行教授的教学模式,教师在教学中鼓励学生对案例进行自主观察、分析、思考与总结。相对于传统教学过程中教师讲、学生听的固定模式,通过案例分析的教学方式学生能自主查阅与案例相关的理论实践知识,通过不断地学习来给出最好的案例解决之道。该教学法目前已经在医学、经济学、管理学、法学等实践性和应用性较强的学科取得了广泛的应用。案例分析的基本思想是以教师案例为中心、学生思考为主体,使学生围绕着所举出的案例进行探讨型的研究性学习模式,注重于培养学生学习的积极性和学习的综合能力[3-4]。
面对网络中大量的知识密集型应用、数据库和平台,在网络边缘挖掘知识及相关对象的元模型信息的流程如图2所示。具体挖掘步骤为:1)在边缘路由节点中,利用现有挖掘工具或方法对可访问的各种分布式应用的数据API、数据库的访问接口(如ODBC、JDBC)或Web服务的描述文档(如WSDL文档)挖掘知识的分类信息以及对象名、属性名和属性值范围,最终获取各种知识及相关对象的语义层次标识。然后,将其语义层次标识匹配和标记到标准的语义层次分类系统,构造标准化的语义层次命名,以便为用户请求进行NDN路由。另外,根据知识及相关对象的分类、属性,甚至其内容的语义,标注不同知识及相关对象或分类之间的语义关联关系。2)在沿途每个核心路由器中,根据用户兴趣及CS缓存的返回答案挖掘FIB中相关表项对应结果的质量、特征信息等,以增强语义路由能力。然后在FIB中将前述特征信息增加到相关层次命名或前缀表项中,从而在路由匹配过程中增强NDN的语义路由能力和质量。
2.NDN知识路由挖掘
现有知识发现方法主要从地址确定的知识库或应用平台中基于给定数据API或者根据ODBC、WSDL等接口描述文档获取本地的知识。而在万维网中,很多知识发现平台是先通过Web爬取技术挖掘知识结构层次、属性名和属性值范围等,以便用户通过关键词等搜索获取万维网中的知识。
(1)匹配结果质量估计。结果返回过程中,对于FIB中的对应表项如果存在多个返回的匹配结果,则根据表项中的语义类别P和信息量A计算匹配度,从而估计兴趣中层次命名对应返回结果的质量。其中匹配度计算公式为:
本节实验中,假设采样率定义为α=M′/M,其中M′为重构利用的量测值个数,M为所有的量测值个数;重构误差计算公式为式中x为原信号,为重构结果;信噪比添加方式同文献[10].由于本文方法在方位向重构时利用了联合稀疏特征,因此本节首先分析方位向基于联合稀疏模型的重构性能,再进行二维成像性能分析.
《史记》中写道:飞将军李广喝酒喝到很晚,回去的路上走到霸陵亭,被霸陵尉拦下。李广虽然自报家门,霸陵尉却仍牛哄哄地说:“大将军尚且不允许夜行,何况你呢?”李广只好在亭子里挨了一宿。可见到了秦汉时期,夜禁制度已经颇为严格,就算是位高权重也不能逾矩。
(2)结果信息量统计。路由节点根据CS中的缓存内容也可挖掘某个FIB表项的语义类别,并对不同语义类别统计返回结果的知识量级别,对于单个知识,则统计知识的分块数。然后,该语义类别和信息量分别作为对应FIB表项的别名和特征项。
在兴趣的路由匹配中,兴趣与FIB表项匹配时或与Prefix(前缀)字段值匹配,或与别名字段值匹配。其匹配算法在改进最长前缀匹配(LPM)算法的基础上充分挖掘和扩充层次匹配算法,完成较为复杂的知识及相关对象的路由匹配。因此,具体匹配方法有:
图3 NDN知识路由挖掘流程
Quest=“面 / 域 / 层 / [名 / 属性 + 特征 ]”;
大多数开放应用中的数据模型都存在相应的数据抽取或挖掘工具,如基于Web页面的数据抽取工具,基于WSDL的Web服务数据抽取技术,针对博客和论坛的话题与舆情挖掘工具等。可是,网络中知识存在迁移、增减和语义变动,而承载知识的系统、平台则存在访问地址和时间的变化以及访问接口升级等问题。但是,现在互联网中缺少以知识发现为目标的知识分类、聚类和语义通告机制,缺乏基于名字、语义而不依赖于固定地址的网络知识访问方法。
当将上面所述的特征信息挖掘到后,添加或累加特征值到对应的FIB表项。然后,对应FIB表项的别名和关键特征项将随FIB表项一起向相邻路由器进行通告。
3.知识及相关对象的路由匹配
(3)访问频率、频繁项集统计。对FIB中各表项对应返回知识的访问频率、返回知识之间的频繁项集进行统计,统计结果用以评估FIB中层次命名表项的流行度,并挖掘返回结果中跨源或多用户之间的频繁项集。
(1)关联匹配方法。该匹配方法的目的是发现关联知识,具体过程是先采用前缀包含匹配和语义约束条件匹配的方法,查找到参考知识的路由信息,然后在相关路由CS或数据源中再获取与参照知识存在某种语义关联关系(如获取频繁项集的关联规则)的知识、知识生产者(包括社交群组、专家、智能软件),或获取相关(与给定名字的知识存在某种语义关联)知识或其它知识及相关对象。
(2)广度匹配方法。其目的是发现扩展知识,具体过程是先对兴趣中给定的层次分类在FIB中路由匹配其最下层的平行层,然后在相关路由CS或数据源中进行前缀层次匹配和语义约束条件匹配,以优先获取与给定分类最下层的平行层的热门、信息量大的知识及相关对象。
(3)深度匹配方法。该方法的目的是发现兴趣中给定分类的更加细分或下层的类别中更具体的知识,具体过程是先对兴趣中给定的层次分类在FIB中路由匹配其最下层的子层,然后在相关路由CS或数据源中进行包含层次匹配和语义约束条件匹配,以优先获取更深层的热门、信息量大的知识及相关对象。
(4)精确匹配方法。该匹配方法的目的是获取精确的知识及相关对象,即为发现或返回与兴趣中具体层次命名精确匹配的对象,具体过程是路由匹配中要求兴趣的层次化名字与FIB的前缀表项值相等,而在相关路由CS或数据源中则基于属性值或特征值约束条件精确匹配。在数据源节点精确地匹配对象命名,而返回数据包时则也精确地匹配PIT表中的兴趣名字。
对于复杂的关联查询或匹配,先采用上述匹配方法中的一种,定位到参考对象所在缓存或源节点,然后查找与缓存或知识源中的参考对象存在给定关联关系的其它知识及相关对象。
4.个性化知识兴趣处理
EG7KCH3-NA1型美的微波炉,广东美的微波炉制造有限公司产品;MB45型水分测定仪,奥豪斯仪器(常州)有限公司产品。
对于面向网络的个性化知识获取,需要考虑个性化知识兴趣的生成和处理,以让用户充分利用NDN的语义路由发现和获取个性化的知识及相关对象。图4显示了NDN语义路由支持的、在用户端发出的具体兴趣类型及格式,主要包括:
(1)知识获取:包括关联知识、深度知识和广度知识(或其相关对象)的获取,具体兴趣格式为“知识层次命名+属性约束+RK(或‘DK’、‘BK’)”。其中RK表示发现关联知识,DK表示发现深度知识,BK表示发现广度知识,它们分别采用对应的匹配方法;
(2) 问题收集:完成问题发现(如获取问题摘要、列表)和获取(如具体问题获取),具体兴趣格式为“问题层次命名+属性约束+‘CQ’”,主要通过层次命名匹配及属性约束条件匹配来聚集多个问题或获取单个问题;
(3)解答提交:完成向单一用户传送或群体组播(特定前缀匹配)问题的解答信息,具体兴趣格式为“解答者层次命名+属性约束+‘AQ’”,具体是通过层次命名匹配及属性约束条件匹配到特定专家或其他知识服务提供者,然后向其提交问题的解答内容;
(4)评改反馈:主要向单一学习者传送或群体组播要回送的评阅信息或反馈修改信息,具体兴趣格式为“学习者层次命名+属性约束+‘EC’”,具体是精确匹配特定问题发送者,并向其回送关于问题解答或知识点理解的评改内容。
图4 用户学习兴趣模式定义
此外,在本系统中还能实现知识及相关对象的发布/订阅,以及知识相关联的各种请求的NDN路由和转发处理。
上述用户请求可以通过构造的路由模块转发到相应路由节点或数据源,然后接收端将根据用户请求的层次命名、属性约束条件、特征要求(可选项)进行匹配和回送相关结果,或根据匹配情况、特征信息选择并回送最优的相关结果。
四 结论
面对互联网中海量的知识密集型应用、知识库和知识服务平台等,本文探讨和提出了基于NDN的个性化知识教育服务平台架构,以便基于NDN发现地址未知的知识如知识点、问题和答案等,以及知识相关对象如学习者和专家等,并扩展NDN的语义匹配能力,以个性化、高效地发现和获取互联网范围内地址未知的关联知识以及广度和深度知识。本文研究和设计的知识服务平台能够在现有互联网络架构上实现互联网范围内地址未知知识资源以及知识服务提供者和消费者之间的有效合作、互动和个性化,从而构建互联网范围内“无界”的海量地址未知知识的智能学习和教育服务平台。
对于艺术家来说,艺术的创作不是一件马马虎虎的事情,选择合适的方法才能创作好的作品和形成自己独特的个人风格,特别是对于肌理这种种类丰富的语言表达形式更需如此。
参考文献
[1] 包昊罡,李艳燕,郑娅峰.面向大规模在线学习的社会化推荐模型与方法[J].现代远程教育研究,2018(3).
[2] 梁云真, 朱珂, 赵呈领. 协作问题解决学习活动促进交互深度的实证研究[J]. 电化教育研究, 2017(10):87-92.
[3] 马志强, 刘亚琴, 孔丽丽. 网络探究学习社区理论与实证研究发展脉络[J].现代远程教育研究, 2018(3).
[4] V. Jacobson, D. K. Smetters, J. D. Thornton, M. F. Plass, et al.Braynard.Networking Named Content. ACM CoNEXT, Dec, 2009.
[5] Lixia Zhang, et al. Named Data Networking Project, http://www.named-data.net/, Oct, 2010.
[6] 余亮, 陈时见, 赵彤. 大数据背景下数字教育资源服务的内涵、特征和模式[J]. 电化教育研究, 2017(4):66-71.
[7] 胡畔, 柳泉波. “教育云服务+云终端”模式下的数字教材研究[J]. 现代教育技术, 2018(3).
[8] Z. Liao, Z. Teng, J. Zhang, et al. Efficient and Customizable Top-k Query on Named Data Networking[C], IEEE IPSA, 2017:761-769.
[9] M. Sifalakis, B. Kohler, C. Scherb, et al. An Information Centric Network for Computing the Distribution of Computations, ACM ICN, Sept. 2014.
[10] L. Liu, L. Xie, Mehdi Bahrami, et al. Demonstration of a Functional Chaining System Enabled by Named-Data Networking. ACM-ICN, 227-228, 2016.
本文引用格式: 廖祝华,等.基于NDN的知识教育服务平台构建研究[J].教育现代化,2019,6(27):140-145.
DOI: 10.16541/j.cnki.2095-8420.2019.27.048
基金项目: 湖南省教育厅重点项目(17A070)和国家自然科学基金项目(61370227)资助。
作者简介: 廖祝华,男,副教授,硕士生导师,研究方向:网络学习支持环境,计算机支持的协作学习等。
标签:命名数据网络论文; 教育服务论文; 地址未知知识论文; 知识路由论文; 知识汇聚论文; 湖南科技大学计算机科学与工程学院论文;