网络课件的多粒度信息提取

网络课件的多粒度信息提取

张敏[1]2003年在《网络课件的多粒度信息提取》文中进行了进一步梳理现代远程教育蓬勃发展的今天,于教学资源的建设显得更加重要。在教学资源建设中,能否对已有资源进行快速准确的检索,从而达到合理的共享与重用,是资源能否最大限度地发挥作用的关键。信息提取技术是信息检索和信息共享与重用的基础。目前网络上已经累积了大量的网络课件,如何从现有课件中准确的提取有用的资源,用于课件建设或其他应用,成为解决此类问题的关键。网络课件的特点是其内容主要由多媒体信息构成,而传统的信息提取技术多为针对文本信息的提取,因此需要设计新的信息提取算法来提取多媒体信息。另一方面传统信息提取技术往往将整篇或者整段文字作为结果返回给用户,而在信息查询、信息共享以及信息重用中,往往需要更为精确、范围更为多样化的信息。如果有一种信息提取方法,能实现对信息提取的结果提供多种粒度的选择,将有助于提高信息提取的准确度和信息的重用程度。有鉴如此,论文提出了一种网络课件的多粒度信息提取方法。随着网络远程教育日益普及,与之相关的规范化、标准化也成为国际国内广泛关注的问题。国家有关机构正在制定与网络课件相关的一系列规范和标准,在这些规范和标准中提出了网络课件应该遵循的基本模型。由于在这些规范中规定了网络课件的描述语言是XML语言,因此遵循标准的网络课件文档都将是结构化文档。为了与标准兼容,网络课件的多粒度信息提取实际上成为了对网络课件结构化文档的多粒度信息提取。以网络课件标准模型为基础,论文提出了适用于信息提取的网络课件信息提取模型.信息提取模型对标准课件模型进行了改进,突出了信息提取所需要的信息结构。基于该提取模型设计了课件的多粒度提取过程和相关算法。多粒度信息提取算法主要从两个方面考虑,即多媒体内容的提取和多粒度的信息提取。在多媒体内容的信息提取中,采用了对多媒体内容加权的方法来计算其相关度;而在多粒度信息提取中,引入了图论的概念,对文本内容的逻辑结构和语义结构进行了分析,定义了对应的概念与相关度计算方法。为了实现课件多粒度信息提取的构想和检验所提出的方法,设计开发了一个实验系统。在该系统中对算法中可能对结果产生影响的主要参数进行了测试和评估,并根据实验结果提出了改进建议与未来研究的方向。

冯儒佳, 王忠义, 王艳凤, 马彬[2]2016年在《科技论文的多粒度知识组织框架研究》文中研究说明以满足研究者对多种粒度知识的需求为出发点,对科技论文的多粒度知识组织框架进行研究。从知识多粒度和科技论文多粒度的划分出发,对科技论文多粒度的知识组织进行了建模,在该模型中把科技论文划分成粗、中、细叁种粒度的资源,并从每一种粒度的资源中抽取出粗、中、细叁种粒度的知识,并最终建立起不同粒度的资源和不同粒度的知识之间的映射,在该模型的基础上对科技论文的多粒度知识组织的流程进行了设计,探讨在知识组织的全过程中对科技论文进行多粒度知识组织的方法。

吕俊峰[3]2002年在《基于XML的可共享内容对象结构模型的研究》文中认为基于互联网的现代远程教育越来越把重点放在学习资源的建设上来,可共享内容对象结构模型就是针对网络学习资源建设提出的。它引入面向对象的观点进行学习内容的设计和开发,由内容格式模型、结构层次模型,包装交换模型和对象导航模型四个部分组成,结合XML技术对内容数据进行描述,实现学习资源的共建和共享。其中,内容格式模型描述学习内容对象的各种属性格式,突出内容用于检索和交换的属性,把表现形式和内容完全剥离开来,解决了创建学习内容的规范化格式问题,把学习内容格式化,来实现内容对象的共享和可检索;结构层次模型适应原始学习内容本身具有的层次性,有利于更好的组织学习内容,解决内容对象满足不同层次的共享问题;包装交换模型解决了实现不同系统不同平台内容对象的交换和共享问题;对象导航模型重点描述内容对象之间的联系,分析内容对象之间链接关系,解决内容对象之间遍历和“谜向”的问题,为学习者提供学习路径的策略,满足学习者“探索式”学习的需求;这个模型突破以往CAI系统中课件的概念,克服它不利于共享、模式固定的缺陷,融入了“以学习者为中心”的现代教育理念,注重学习内容与学习管理系统的分离,既保持与教育部现代远程资源建设标准的兼容,又在此基础上有所扩展。最后,提出了一个基于可共享内容对象结构模型的实现框架,为内容对象的实现提供思路。

房小敏[4]2016年在《基于Web数据的中小学网络教学资源建设现状调查》文中研究表明大数据技术为教育信息化带来了新的机遇,为研究者和管理者对教育中的诸多问题的研究提供了新的数据来源和方法。在海量的教育信息化数据中,教学资源作为一种承载着学习行为、学习活动、学习进程信息的教学数据,隐含着丰富的分析价值。网络的出现不仅改变了人们的生活方式而且传统的教学方式也正经历变化,借助网络的教学形式正如雨后春笋般涌现,教学资源的建设作为教学活动过程中尤为关键的一环越来越受到关注。在这样的背景下,调查教学资源建设现状是推进教育信息化有序向前发展的重要手段之一。本文从学科、地域和同质性叁个方面调查建设现状,其主要研究工作内容如下:(1)针对中小学资源网站上非结构化数据设计了相应的采集和存储策略并为采集和处理大量数据建立了Hadoop分布式集群。通过二次开发网络爬虫Nutch将中小学资源网站数据不断采集到本地并存储在分布式数据库Hbase中,为后续网页分析、资源数据提取提供了高性能的数据吞吐平台。(2)依据中小学网络教学资源语言特点和网页结构提出了一种建立教学资源库的方法。教学资源数据是由标题、关键字、日期、正文内容等元数据描述,利用开源工具Jsoup抽取标题、关键字等,利用模式匹配算法抽取日期、媒体类型,利用行块分布函数抽取正文内容,最终依据网站-网页-链接间关系建立网络教学资源库。(3)中小学资源网站中的资源多以学科、地域分类展示,依据资源的链接结构和标题建立VSM模型,然后利用模式匹配和向量相似度技术分析模型中学科和地域属性。在资源同质性分析中,从叁个层次界定了网络教学资源的同质性:同名的资源是初级的同质;其次是同名且同类型;第叁个层次是正文相同。第叁层次的研究中利用LDA模型,为教学资源正文建立一种主题模型,然后使用基于层次的聚类算法分析主题模型相似度。(4)为了解决大量数据计算问题,将网络教学资源抽取、VSM模型、LDA模型和聚类算法重新设计使其可以运行在MapReduce编程模型上,为整个调查奠定基础。实验结果发现语、数、外资源量占有的比例较大,且需要参加考试的科目比不需要的多:东部沿海和珠叁角地区的资源分布量显着较高;网站资源重复建设的现象依然存在且数量不容小觑。最后,设计的对比实验表明本文实施的调查是可靠且有效的。

王丽[5]2006年在《基于学习对象的标准化网络课程的研究和设计》文中进行了进一步梳理近年来,随着网络、多媒体技术的快速发展,硬件、软件方面优势逐渐弱化,与之相适应的资源建设日益受到人们的重视。在教育资源中,网络课程是非常重要的组成部分,是关系到网络教育成败的关键所在。如何开发高质量的网络课程成为当前网络教育的重要课题,而教育资源的共享性和可移植性成为新的挑战,网络教育资源的标准化建设也是必然趋势。 本文在研究了大量文献资料的基础上,依据学习对象思想和SCORM标准体系,设计和开发了基于学习对象的标准化网络课程。论文首先对学习对象相关概念和理论进行了详细的阐述,对SCORM标准体系进行概要的介绍。重点研究了设计和开发基于学习对象的标准化网络课程的过程。依据教学设计思想,对接受网络课程的学习者从学习动机、学习方式、原有知识结构等方面进行分析。在网络课程内容设计方面,依据SCORM标准,确定了SCO的大小和制作方法,规划了课程内容呈现顺序。 本论文同时也对基于学习对象的标准化网络课程进行了一定的实践研究。以一门实际课程为例,呈现了网络课程中涉及到的重要的功能页面。依据SCORM中的相关标准,对设计阶段提出的课程顺序规划进行了实现,对网络课程中的相关内容进行描述。 由于目前国内外对学习对象的研究绝大多数还都停留在理论和技术层面上,而实际应用较少,所以本论文致力于为基于学习对象的标准化网络课程在网络教育中的实际应用研究提供一个可借鉴的范本,具有一定的研究价值和现实意义。

王承军[6]2015年在《高并发大数据在线学习系统中的关键技术研究》文中进行了进一步梳理21世纪以来,随着信息技术飞速发展,教育信息化、高等教育大众化的普及,基于互联网的在线远程教育蓬勃发展,形成目前以网上交互式在线学习为主要特点的现代远程与继续教育格局[。自1999年开始现代远程教育试点工作到2014年,我国69所试点高校共计建立了17362个学习资源库,累计超过1932万学生采用网上在线学习形式进行学业学习。在线教育同时也催生了MOOC、微课、翻转课堂等的产生和发展,移动学习也应运而生。但目前的在线学习系统普遍跟不上各类资源建设和教育规模发展的速度。主要是现有系统的并发能力和数据处理能力满足不了当前的需求:为提高教学质量,各高校不约而同地推出了质量管理和监督的相关措施,诸如推出类似学习时长记录等与学习过程、学习者行为有关的考核软指标,促进学生网上学习、互动的热情;推出移动学习方案,满足学生随时随地的学习要求。开办远程教育的学校在籍学生一般都在3万至10万学生,开放大学甚至有200多万在籍生,由于成人业余学习的习惯,考试前、节假日、晚上是学习集中的高峰期,在线学习系统中同时在线学习的人数至少在数千人以上,对系统的并发能力提出了严峻的考验和挑战,每所学校的在线学习平台都崩溃过无数次,严重影响学生的学习热情。同时,各高校现有的在线学习系统基本上都是建立在传统关系型数据库之上、基于Session机制开发的信息系统。这类系统架构有着先天的不足:一是每一个用户要在内存里建立一个Session,在内存一定的情况下单个节点的并发能力大大受限;二是关系型数据库最大连接数受服务器性能和网络速度制约明显。远程教育经过十几年的发展、各高校格式化的数据在百万、千万条量级的记录,未来随着新的学习平台的推进,会继续攀升至上亿、甚至数十亿条记录的规模,数据量至少在TB级。主表的数据记录一旦达到上亿条,那么与主表关联的数据表记录就是原主表的几十倍、几百倍,数据总量甚至可能达到PB级别。在这样一个高并发、大规模数据的环境需求下,在现有的多层模型上如何构建性能稳定的Web信息系统,是在线学习系统中一个不可回避的难题。解决高并发的传统方案有六种:(1)采用高性能的服务器或者集群:(2)高效率的编程语言(SQL优化、数据库缓冲池技术等);(3)尽可能的采用静态化手段(例如信息发布系统CMS将动态发布的内容预先生成静态页面);(4)内容分离(图片服务器与其它文件服务器分开存放,实现简单分流策略);(5)WEB缓存技术(客户端、服务器端以及代理服务器端缓存机制;(6)库表散列技术(同一张信息表,通过程序将不同功能模块涉及的数据分离到不同的数据库或表中去,分析其数据特征来划分更细粒度的数据库表)。但仅采用这些手段,还是难以满足大数据模式下的高并发访问的需求。因为这些传统方案都没有涉及集群中单个Web服务器节点的Session占用内存问题。相反,传统方案中的各种集群方法需要额外采用自己特有的机制,保持集群中Session一致性。本文探索在不改变系统架构本身的原则前提下,通过调整系统层次内部元素、调度策略和增加新元素,来提高在线学习系统的各项性能指标。论文从Web系统的架构及数据库技术、现代访问控制UCON模型[9]的重构、O-Session的模型设计与应用、构建大数据量级的压力原型系统等四个方面阐述大数据量下性能稳定的Web系统构造技术。现阶段的Http协议采用的服务是无状态的,但很多Web服务的应用需求是“有状态的”。于是,人们在第叁层WEB业务应用容器层构建一个Session元素,与第一层的cookie元素组合,或者通过url重写技术,实现了目前Web信息系统“有状态”的服务,典型应用是在线购物网站的购物篮服务。然而随着用户数的急剧增多,采用Session-cookie或Session/url重写技术首先面临有限内存的问题,每个用户都需要服务器维持一个Session,而且还需要保持一段不短的时间才会释放内存,并发用户越多,所耗内存容量越大,在一段时间内并发数达到一定量,内存将来不及释放而全部占用,造成系统拥塞而拒绝访问。因此,在高并发的系统当中,减少内存消耗尤其重要。本文基于可系列化的消息(Json)及通行证策略的消息传递模型提出了O-Session模型,对需要交换或者需要向后续页面传递的消息,依据通行证策略,将通信证消息存入关系型数据库或者基于健值对的高效NoSQL数据库,需要时直接凭借通行证号从关系数据库或者NoSQL数据库中获取通信证消息,极大地减少了内存消耗。作者将O-Session模型应用于在线学习系统中的在线考试子系统后,系统并发能力随之大幅度提升。学生在线考试时,考试时间统一,人员集中,一场考试长达2个小时。如果这2个小时考试所有Session都处于保持状态,内存消耗巨大。此外,考生与服务器所在的网络环境复杂多变,Session模式必须保证考生考试本地机器与服务器之间的网络2个小时内不能有任何“闪失”,否则,可能会弄丢用户Session导致答题完毕却提交不了试卷。实施O-Session方案后,考试时间、Session等消耗内存的因素自然消失,从而提高了服务器的并发性能;考试时,只需要求下载试卷和提交答卷时保持网络畅通;至于考生答题期间,不需要与服务器有任何交互,断网或服务器中途重启都不会对考试产生任何影响。O-Session方案本质上是适当牺牲系统的响应速度来提高并发性能、用时间换空间的策略。Session机制是基于服务器内存的,其读写速度要优于O-Session的消息传递方案。O-Session的消息传递方式需要把含有通行证的消息通过网络存储到关系数据库或者NoSQL库中,具有一定的响应时间和网络开销。但这些开销,在高并发系统中,与需要长时间在内存中保持Session的方案来比较,是值得的。单台Web服务器的响应能力毕竟有限,在第二层选择Web服务器集群是缓解系统高并发访问的一个很重要的方法。集群(Cluster)把多台计算机系统通过网络联接构成一个松耦合的系统,各机器之间的进程可以相互通信。负载均衡(Load Balance)将关键任务分解成若干子任务,然后按一定的策略分摊到多个操作节点上执行,协同完成工作任务。通过负载均衡来扩展服务器的带宽、增加整个系统的吞吐量,是一种廉价有效的方法。网络数据处理能力得以倍增,灵活性和可用性获得大幅度提升[25],[26]。常用的负载均衡技术主要有叁类:基于DNS的负载均衡、基于反向代理(Reverse Proxy)的负载均衡(以JK2、NGINX为代表)和基于网络地址转换技术(NAT:Network Address Translation)的负载均衡[27],[28]。基于DNS的负载均衡是使用同一个域名对应多台服务器,每台服务器使用不同的IP地址,服务器之间无主次之分,是完全平等的个体,任意一台服务器都能处理客户端的请求;基于反向代理的负载均衡是由一台特殊的计算机(一般称为请求分配器)集中接收来自网络的所有对应HTTP请求,然后依据一定的原则把它们分配到内部网络的各台服务器上去进行处理;基于网络地址转换技术的负载均衡是通过修改网络层TCP/IP协议栈来实现的,它接受来自Internet的合法地址的客户端请求,通过网络地址转换技术,把本次的请求依据特定的负载均衡策略转发到其内部网络地址中去。负载均衡目前常用的请求分配算法主要有转轮法、最少连接法和最快连接法等。所有这些负载均衡的实施,其中会话(Session)管理是每一种解决方案中必须考虑的难题,方案不同,实施技术也千差万别。采用O-Session模型,则可以适用于每一种负载均衡方案。本文在第二层中引入NGINX实现基于反向代理的负载均衡。数据库技术基本上每10年都出现一次大的变革,历经网状数据库、层次数据库和关系数据库、对象数据库。数据库技术的变革促进了信息系统特别是Web信息系统的快速发展。Web信息系统在数据积累到一定的程度时候,海量(massive data)数据、大规模数据(VLDBvery large data)的概念相继出现,数据积累从量变到质变的飞跃过程,反过来作用于数据库技术,对数据库技术提出更高的期望。当人们的注意力从事务处理技术ACID转向Eric Brewer教授的CAP理论时,大数据(Big Data)时代终于拉开帷幕。在高并发的系统中、单纯的关系数据库存储解决方案面临不可逾越的数据库连接池[24]里的连接数的限制。为了增强数据存取能力,人们提出了基于CAP116理论的NoSQL数据库技术,针对不同的大数据应用模型,人们会选择不同的NoSQL数据库方案或者NoSQL数据库与关系数据库联合存储的方案。基于联合存储的方案,先要厘清各类数据存储的具体位置。本文依据高并发的试验结果,提出了大数据高并发系统联合储存策略解决大数据存储问题的四原则:原则1、构建核心业务主表以数据库表分区的模式存入数据生产库。原则2、与核心业务主表相关联的所有业务数据存入NoSQL数据库。原则3、用户数庞大的系统,特别是高并发的用户子系统,其涉及的与核心业务主表没有直接联系的只读业务数据部分存放在NoSQL库里,数据生产库里也应保持一份拷贝。原则4、需要统计分析与核心业务主表相关联的业务数据时,要建立独立的数据统计库。在Web多层体系结构中,用户角色权限模型属于第五层的安全认证层。传统的用户角色权限系统,需要给每一个用户指定一个角色。这使得对当前动辄数百万用户的系统管理变得不可忍受。另外,现代访问控制模型也需要新的技术实现来验证基于条件授权、过程可控的权限管理模型。针对第一个问题,本文采用用户分类的方式将其中某一个大类的用户抽取出来,作为一个用户集合来整体看待,系统统一赋予对应的角色,不再将这些用户作为系统用户进行管理。如本文研究的在线学习系统中,教师和学生类型的用户,他们不再出现在系统的用户管理中去给他们分配角色和权限。这类用户分别定义为教师集合类用户和学生集合类用户,单个教师或学生也就天然地继承了对应用户集合的所有角色和功能;同时,再根据用户类的某些具体属性值,构建基于用户类某个属性值的用户集合子系统。对基于属性值的用户集合子系统赋予角色,对应属性值的用户,自然就继承了该属性值的用户集合子系统的所有角色和功能。针对第二个问题,在原来基于RBAC权限控制的基础上,增加了权限的condition模型,实现了现代访问控制模型UCONabc[10]中可演变的权限方案。综合这两个元素,本文在Web多层体系结构的第五层安全认证层中提出了面向系统的现代访问控制模型S-UCONabc。依据我国现代远程与继续教育当前需求与长远的发展相结合的理念,在传统的多层(B/S/DB/S)体系结构基础上,通过调整系统层次内部元素、调度策略和增加新元素等手段,构建的高并发大数据支持的在线学习系统体系架构为:第一、叁层结构中引入O-Session模型,第二层中采用NGINX做负载均衡,在第五层中引入面向系统的现代访问控制模型S-UCONabc;在第四层结合关系数据库与NoSQL数据库的优势,设计并构造了一个拥有17亿用户(数据库主表达TB数据量级)的在线学习系统的原型系统。在线学习的原型系统采用关系型数据库和NoSQL数据库联合存储的方案,实现思路如下:遵照原则1,将17亿用户基本信息,放入关系数据库oracle的分区表中;遵照原则2,学生选课、学生登录信息、学生认证信息、日志等信息存放在NoSQL数据库中。因为这些数据直接与核心业务主表相关联,产生出比核心主表多数倍或者几十倍的海量数据。遵照原则3,课程代码、教学计划、课程资源、系统的角色权限列表由管理员在生产库中维护,系统自动同步到NoSQL数据库中去,主要是为大量高并发的“读”操作业务服务。当这些数据在生产库中变动时,程序会保证NoSQL库中的数据与之保持一致;而针对系统的部分树状目录数据,因为其操作一般是按树形目录异步展开的,在设计时由用户第一次登录或者第一次操作时把数据生产库的数据同步到NoSQL中去。管理员如果对该部分数据进行维护引起变动,系统自动同步NoSQL对应树形目录的数据。遵照原则4,针对学习行为记录进行业务统计分析,另外建立一个供统计分析用的统计库,包含生产库中的所有表模式,数据则根据具体的统计分析业务选择该业务感兴趣的部分即可。如针对南京市的学生对数据库设计这门课的学习兴趣进行分析。从生产库中导出南京市的所有学生到统计库中;在riak服务器(属NoSQL数据库里一种典型的键值对数据库)上配置并启动solr搜索引擎,利用Map/reduce模式查找南京市学生的所有选课记录和点击资源的学习过程记录,插入到统计库。最后利用weka联机分析统计库中的数据。在线学习的原型系统的核心业务主表采用列表分区策略,以身份证号前6位为分区键值,将17亿数据均分到3479个分区中,每个分区约40万条记录,实现在单个分区上检索任意记录的速度保持在数十毫秒级,从而不影响用户体验。系统测试数据依据身份证编码规则,自动生成17亿多身份证号;身份证号对应的姓名,则依据百家姓随机生成。该测试数据,总量达到1TB。该原型系统实现了公民身份证号登录、教学计划、师生互动、选课、课件学习、课程答疑、课程作业、课程论坛、学习进度、考试安排、成绩查询、毕业论文等功能。本文创新点在于:1、提出了面向系统的现代访问控制模型S-UCONabc,能有效降低用户管理的难度,并提高了系统设计的灵活性。2、提出并建立了O-Session模型,大幅提高了单节点服务器的并发支持能力。

赵立志[7]2004年在《基于XML的网络教学系统的研究与实践》文中认为随着信息技术蓬勃发展而诞生的网络教学,凭借其信息量大、交互性强、覆盖面广等特点,在教育领域发挥着越来越重要的作用,并日益深刻地影响着教学内容、教学方法、教学模式的变革。与传统的教学模式相比,网络教学既具有普通计算机辅助教学的各种优势,又克服了其运用于单机的的局限性。网络教学覆盖面广、教学手段灵活多样,教育资源和学习不受时空限制,可以随时、随地为受教育者提供教育服务。因此,它更能满足信息时代人才培养的要求,已广泛应用于远程教育、职业教育、学校辅助教学等领域。 网络教学系统主要由各种网络教学课件组成,目前许多计算机工作者和教育工作者都在致力于网络教学系统的研发,造成不同的课件使用不同的文档格式,不同的网络教学系统之间无法进行有效的交互和资源共享。造成这种混乱状况的原因首先在于缺乏一个统一的课件文档标准,其次在于缺乏对统一标准的强大的处理工具。XML是W3C发布的语言标准,得到业界(如微软、IBM、SUN等)的广泛支持,是一种用于网络上数据交换的语言,用其描述数据具有结构良好、易于交换、显示灵活和跨平台等优点。因此,利用XML技术建立网络教学数据结构,建立基于XML的网络教学系统成为解决这些问题的重要途径。 本文主要研究基于XML的Web数据处理相关技术,在考察和研究现有网络教学系统的基础上,引入Agent技术改进系统的智能性,设计一个基于XML的网络教学系统,并运用C#语言和ASP.NET技术,实现一个网络教学的实验系统。主要工作包括: 1、研究XML及其相关技术,提出基于XML的网络教学系统的数据模型,以提高XML数据处理的效率和适应性,主要包括XML数据模型的建立、数据存储模式、数据的提取以及传输等。 2、研究XML技术运用于网络教学系统的优势与特点,给出基于XML的网络教学系统的框架模型,该系统是基于XML的叁层体系结构,具有良好的数据结构和较强的跨平台交换数据的能力,有更好的智能性和交互性,能高效地搜索、利用教学资源,并且具有信息发布、教学辅导页面的自动生成功能。 3、引入Agent技术以提高教学系统的智能性,给出了学生Agent、教师Agent和管理Agent的结构及功能,结合树形结构的知识表示方法和难度划分给出了系统的个性化教学策略。 4、利用微软ASP.NET、C#、SQL Server等技术,利用.NET平台实现一个基于山东师范大学硕卜学位论文XML的网络教学实验系统。对系统的设计目标、开发及实现环境、设计工具及安全性等进行分析,对总体结构、用户组成、系统组成及数据库进行设计。 系统主要由四个子系统组成:信息管理子系统、网络授课子系统、网络答疑子系统及网络考试子系统。由于基于xML并引入Agent技术,本系统具有较强的数据交换能力以及较强的兼容性、可重用性、可维护性、智能性等特点。

王晓东[8]2003年在《基于Ontology知识库系统建模与应用研究》文中认为知识库系统是制约智能化教学系统有效、实用的一个瓶颈。主要原因有:一是,知识库中的知识不能满足系统的需要,因为要想使知识库的知识包罗万象,是不可能的,也是不现实的;同时,知识的表示也制约了系统的功能。二是,尽管开发了许多智能化教学系统,但很少用知识工程的方法设计知识库。这样势必影响知识的管理、获取和共享,从而影响系统的维护和扩充。因此,如何构建知识库系统是智能化教学系统研究的关键之一。 知识库系统的研究不能只侧重于知识的表示及其推理机制。对于大型知识库系统,由于需要知识共享及知识转换,必须根据建模的思想来开发。 基于Ontology知识库系统的建模,是目前知识工程界研究的热点。把Ontology建模引入到教育技术领域,意义在于,根据Ontology建模和相关知识表示标准及交换协议,建立的知识库,便于知识交流、转换和共享。Ontology形式化地表达了领域知识的基本概念、属性、处理方法和内在关系。这种表述可被重用和共享,便于知识的查找。基于Ontology建立的知识库系统可靠性高,因为,可以通过更可靠的软件对形式化表达的正确性进行检查。通过Ontology可以规范任务的形式化表达,有助于任务的解析,便于明确定义教学过程中学习者和系统的角色及智能教学过程的任务。使用Ontology进行建模,可以使其系统结构、文档和编码都更清晰,便于系统的维护。 本文基于Ontology,研究了知识库系统建模原理,并应用该建模方法建立《数据结构》领域本体模型。在对学习支持系统(SPSS)的设计中,利用领域知识本体模型,有效的支持了知识的共享、获取和管理,也支持了教学系统的开发。 第一章提出了研究的问题。论述了知识库系统的重要性,并综述了相关的研究。 第二章首先探讨了与知识库系统相关的学习技术,智能教学系统和电子绩效支持系统。分别讨论了它们的组成和特点。然后,对学习技术构架与教育资源规范进行了探讨。学习技术标准的体系结构对学科知识库系统的开发具有指导作用。 第叁章研究了知识库系统构建的原理。建立知识库涉及到如下几个方面的问题:一是,关于知识的表示。二是,关于知识库的构造。叁是,关于知识库的管理(包括知识的获取)。由于知识库的结构是由知识的表示方法决定的,因此,只要根据具体的问题或用户需求和系统的特点,选择好知识的表示方法,那么知识库的结构也就决定了。为了能准确的选择知识的表示方法,建立有效的知识库,就需要对知识进行分析。本章在对知识类型、知识组织进行分析的基础上,主要研究了Ontology建模原理。 第四章基于Ontology对《数据结构》知识库进行设计。该章使用第叁章所述的建模方法,对《数据结构》知识库系统建模,包括《数据结构》任务本体和领域本体。分析了知识库系统任务层应具有的功能,设计了推理层(功能层)的教学推理器、算法设计学习器、知识查询与编辑等功能模块,构建了《数据结构》领域本体,并用IDEF5图表和细化描述语言对部分本体进行的描述。 第五章把基于Ontology建立的《数据结构》知识库模型,应用到学习支持系统(SPSS)中。本章我们对学习支持系统(SPSS)进行了设计,并利用《数据结构》知识库系统本体模型建立了知识库,有效地支持了知识的查询和学习指导。 第六章总结研究结论和成果、指出进一步要做的工作。 研究的整体思路是:首先提出问题;然后,研究Ontology建模原理;第叁,根据Ontology建模方法建立《数据结构》知识库系统本体模型:最后,把研究成果应用到SPSS开发中。 解决的关键问题:初步建立了基于Ontology知识库系统建模的基本理论和方法体系,构建了《数据结构》本体模型,设计和实现了本体模型的知识查询算法和疑难问题答疑模块,并应用到SPSS系统中。

谢秋妹[9]2013年在《故事事件语义建模及其应用研究》文中研究表明自然语言处理是语言学和人工智能间的跨学科研究领域,其目的是研究和开发应用程序,使得计算机具有理解或生成文本、语音等类似人类思维活动的能力。近年来,人们对于基于本体技术的文本事件语义建模方法的兴趣日益浓厚,越来越多的企业和学术组织已采用万维网联盟(W3C)的资源描述框架(RDF)作为描述文本语义知识库的标准方法。将文本进行语义结构化描述,有助于推断、推理等文本的语义理解任务,同时也能提高问题回答、信息提取、机器翻译和其他自然语言处理应用程序的性能。本文以故事驱动的连环画自动生成系统为研究背景,利用事件本体模型具有较强的语义表达和推理的特点,提出了基于自然语言处理技术的故事事件语义建模方法。该方法的目标是从自然文本中得到语义模型,从而实现机器的互操作、语义查询和推理等自动处理能力。最后本文将故事事件语义建模方法应用到基于故事驱动的连环画自动生成的原型系统中。主要工作如下:首先,分析和总结国内外信息抽取的研究背景和现状,特别是信息抽取技术在语义词汇资源获取方面的应用;接着介绍了媒体数据语义结构化描述的研究背景及意义,并回顾了基于事件本体的多媒体数据标注的研究现状。然后,提出了故事事件语义建模方法。该方法主要包括以下步骤:面向故事可视化的普适性语料预处理方法;基于开放式信息抽取的故事浅层语义框架元素抽取方法;面向故事可视化的事件类型分类体系和基于触发词表与相似度结合的事件类型识别方法;事件框架元素半自动映射为多媒体数据事件标注模型实例的规则和方法。最后,本文设计了一个基于故事的连环画自动生成的原型系统,在该系统中故事事件语义建模方法得到应用。我们使用语音技术获得图片的文本内容;利用事件语义建模方法对文本和图片的文本内容进行事件语义建模,形成语义形式的事件流;利用语义web的查询和推理机制,搜索出与文本对应的图片,音频等多媒体数据信息。

参考文献:

[1]. 网络课件的多粒度信息提取[D]. 张敏. 重庆大学. 2003

[2]. 科技论文的多粒度知识组织框架研究[J]. 冯儒佳, 王忠义, 王艳凤, 马彬. 情报科学. 2016

[3]. 基于XML的可共享内容对象结构模型的研究[D]. 吕俊峰. 太原理工大学. 2002

[4]. 基于Web数据的中小学网络教学资源建设现状调查[D]. 房小敏. 南京师范大学. 2016

[5]. 基于学习对象的标准化网络课程的研究和设计[D]. 王丽. 北京交通大学. 2006

[6]. 高并发大数据在线学习系统中的关键技术研究[D]. 王承军. 中国地质大学. 2015

[7]. 基于XML的网络教学系统的研究与实践[D]. 赵立志. 山东师范大学. 2004

[8]. 基于Ontology知识库系统建模与应用研究[D]. 王晓东. 华东师范大学. 2003

[9]. 故事事件语义建模及其应用研究[D]. 谢秋妹. 湖南大学. 2013

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

网络课件的多粒度信息提取
下载Doc文档

猜你喜欢