一、视频索引技术研究(论文文献综述)
王文诗[1](2020)在《基于内容的视频信息智能搜索算法研究》文中进行了进一步梳理为了在大量的视频数据中有效和准确的搜索到用户感兴趣的信息,对基于内容的视频信息智能搜索算法进行了研究。一方面,基于内容的视频搜索算法已经成为研究的热点。它可以通过基于关键帧的语义概念检测的方法进行视频索引,从而实现查询和搜索。该方法可以搭建视频高层语义和底层特征之间的联系。另一方面,随着计算机技术的进步、人工智能技术的发展和数据的大量增加,采用深度学习方法直接对视频进行处理已经越来越受到关注。它可以提取视频的空间特征,同时保留时间信息。对视频信息智能搜索算法的研究主要包括镜头边界检测、关键帧提取、语义概念检测以及基于深度学习的视频搜索等算法。(1)针对镜头边界检测存在的冗余问题,提出了一种基于图像熵和局部关键点特征的镜头边界检测算法。镜头边界检测是关键帧提取和视频搜索的第一步,对信息索引、摘要和其他基于内容的视频数据处理来说非常重要。该方法首先利用图像熵检测视频渐变镜头和候选的突变镜头,然后利用候选的突变边界帧和它们的相邻帧之间的局部关键点特征的匹配率等技术去除冗余的候选突变边界,从而得到最终的突变边界。有效的镜头边界检测有助于提高关键帧提取等算法的性能。(2)针对关键帧提取算法特征选取单一而受视频类型多样性限制等问题,提出了一种加权的多特征的关键帧提取算法。该算法在每个检测镜头内,采用基于凸混合模型的多特征聚类算法自动地计算每个特征描述子对应的权值。这些权值用于计算视频帧间综合帧差测度,用于形成一个累积的帧差曲线。然后采用帧间曲线曲率检测算法检测曲线的高曲率点,位于两个高曲率点之间的中心帧被选择为关键帧。提取的关键帧对视频原始数据的充分表示有助于有效的信息搜索和快速浏览整个视频内容。(3)针对用户语义和底层特征之间的“鸿沟”问题,提出一种基于关键帧语义概念检测的视频索引和搜索算法。该算法首先采用优化的基于局部关键点特征的词袋模型进行视频图像表示。然后在语义概念检测部分,利用支持向量机方法构建有监督的分类器对提取的关键帧进行分类和语义概念检测。最后将查询关键词与视频摘要数据库中的语义概念进行映射,排列和返回与用户查询相关的镜头序列,其中镜头内被搜索到的关键帧数目越多,这个镜头被排列的优先权越大。(4)针对深度学习网络训练的复杂性和行为视频类型的多样性问题,在视频分类和搜索中提出了一种基于三维卷积神经网络模型的细调整算法。基于深度学习的方法可以直接对视频的时空特征进行处理。该算法首先通过三维卷积神经网络模型在UCF101视频数据集上预训练得到初始模型。然后初始模型在实验数据集上进一步训练,对已获得的模型参数进行微调,从而获得最终的模型。接着,由最终模型提取测试视频的空间特征和时间特征。在视频特征提取后,采用欧氏距离计算查询视频和测试视频之间的相似度。距离测度值越小,排列优先级越高。最终返回并排列搜索得到的视频实现视频搜索。研究工作一方面基于视频图像底层特征建立了一套视频搜索算法流程。该算法针对不同的数据类型具有可扩展性和鲁棒性等特点。它主要包括三个部分:镜头边界检测、关键帧提取和语义概念检测。另一方面,针对多样化的视频类型,构建了一个基于深度学习方法的视频搜索算法,并通过理论分析和实验验证展示了算法的有效性。基于深度学习的视频搜索算法可以使用单个神经网络模型实现视频时空特征提取和分类,并在使用视频空间特征的同时保留时间信息。综上,经过理论分析和实验验证,提出的算法可以有效的进行视频信息智能搜索等。
秦姗姗[2](2020)在《文物类微纪录片《如果国宝会说话》创作研究》文中进行了进一步梳理随着智能手机普及和社交平台的流行,新媒体时代悄然到来。新媒体语境成为了当前戏剧影视作品面对的一个重要的传播环境。新媒体意味着速度和新鲜、更年轻的受众群体和更先锋的艺术表达。微纪录片是纪录片在新媒体时代为适应受众碎片化需求进行的调整和转型。这种转变使得原本中国纪录片中的大人文、大历史的文化价值观,以更加短小的形式、更加多元的渠道来呈现,再配合大数据算法推送给目标用户,从而实现信息的精准输出与营销。2018年一部百集文物类微纪录片《如果国宝会说话》横空出世,其精妙的认知视角,注重人文内涵的解说,多种先进技术手段再现的历史场景,在每集五分钟的时长内为观众勾勒出一个关于文物的立体空间。以微纪录片的形式展现上百件国宝文物,将文物历史娓娓道来的同时运用巧妙的蒙太奇手法和先进的数字制作技术与生动有趣的动画相结合,内容耐人寻味,引人反复观看。“视频索引”将中华文明浓缩串联,文物不再是独立的陌生名词,而是成为联通时代的一段段鲜活具体的故事,从中展现出中华文明的演变。该片登录网络平台后,仅在哔哩哔哩网站总播放量达到1602.6万次,弹幕留言达11.1万条。2019年,《如果国宝会说话》获得中共中央宣传部第十五届精神文明建设“五个一工程”奖的特别奖,代表了近年来我国对微纪录片创作的认可与支持。《如果国宝会说话》的微纪录片形式使得在新媒体语境下,纪录片有了新的创作样式,该片还运用网络进行了较为成功的推广,产生的影响对于我国纪录片来说具有深远的意义。研究其创作,不仅是研究微纪录片这一新颖的纪录片形态,更加是分析如何运用叙事、影像和技术手段创作出更加受到年轻人喜爱的纪录片作品。本文以《如果国宝会说话》这部文物类微纪录片作为研究对象,运用影视艺术创作理论对该部作品的创作理念、叙事手法、视听语言等进行深度解读和系统分析。运用定量分析法对该部纪录片中的音乐类型、独特的音响以及出现文物所属的历史文化年代和文化类型进行统计分析。通过研究和论述,挖掘该片创作手法为其它同类纪录片创作的可借鉴之处,同时为影视作品如何传递民族文化精神、展现文化自信做一些有益的探索与思考。
李林峰[3](2019)在《基于电影内容索引的可视化系统的研发》文中指出自然语言处理技术已被广泛应用于很多领域,其中也包含对电影剧本的分析。近年来看电影成为人们常见的休闲娱乐方式,人们总是希望在看电影之前更多的了解电影内容,判断是否有自己感兴趣的片段,并且希望可以快速的定位到该片段。但目前常用的视频播放软件并不能满足人们这样的需求,不能进行片段的索引,在对片段进行定位的时候人们只能手动的快进或后退拉动进度条,有时候可能会错过自己想看的内容。因此,为了能让用户在比较短的时间内对电影的整体内容有一个比较详细的了解,快速定位和索引自己感兴趣的片段,本文基于电影剧本和字幕进行分析,将视频播放功能和分析结果相结合进行视频索引。首先进行电影片段的划分,提出一种基本要素抽取的方法来提取剧本中的场景、人物、对话、人物动作描述、场景描述等信息,通过剧本和字幕中人物对话的相似度进行匹配,将字幕中的时间信息融入剧本中。其次根据定义的规则将剧本的原始场景合并,划分出电影片段。然后基于电影片段进行重要片段的分析、情感分析、人物关系的分析等。最后研发了电影内容索引的可视化系统,构建了电影播放视图、索引视图、人物关系视图、电影评论视图、人物与电影片段视图,使用户通过一系列的交互操作查找、索引和定位自己感兴趣的电影片段。本文将《Forrest Gump》这部电影的剧本和字幕作为研究对象,通过在系统中进行交互操作,验证了系统的实用性和有效性。
陈建宏[4](2019)在《基于深度学习的智能监控平台设计》文中指出随着我国社会经济的不断发展,社会对安防产品的需求量越来越大,由此带动了安防行业的迅猛发展。视频监控系统作为安防产品的重要组成部分,也向着数字化、网络化、智能化的方向变革,但是传统监控系统的发展大多局限在传输方式的升级和清晰度的提升,其对监控视频的后处理大多还停留在保存视频的层面,并没有充分利用监控视频中的有效信息。目前随着深度学习算法的兴起,从图像中提取有效信息变得高效而便捷;同时随着办公场所的智能化程度的提升与物联网设备的发展,已有相当一部分公司为员工配备了人员位置信息采集装置,以便于管理员工。如何将各种监控信息利用起来,组建一个智能监控平台是一个具有现实价值的问题。因此本文将设计一个智能监控平台,旨在充分利用监控视频中图像信息的基础上,将提取出的图像信息与人员位置信息相融合,并用融合的结果建立起视频索引,以减少调取监控视频所耗费的人力资源。论文主要开展的工作如下:(1)为充分利用监控视频中的图像信息,本文调研了影响力较高的行人检测算法和目标跟踪算法,并针对大多数监控视频中存在的摄像机安装位置高、被检测目标小等问题提出了针对性的解决方案,提升了上述两种算法的性能,满足了智能监控系统的性能要求。(2)为了将人员位置信息与图像信息相融合,本文根据摄像机成像原理提出了一种地理位置坐标与图像像素坐标相转换的算法,并且通过摄像机标定,解决了监控摄像头为了追求大视野而引入的畸变等问题,并提升了坐标转换算法的精度。(3)通过对行人检测算法、目标跟踪算法和位置坐标-像素坐标转换算法的研究,本文提出了一种可以融合上述三种算法的联合算法,并对该算法进行了可行性分析与性能测试。(4)通过应用联合算法,本文设计了一个以人员姓名和时间为索引的监控索引系统和监控视频多级存储系统。本文还针对该智能监控平台编写了终端界面,便于调取视频处理结果和实时查看监控视频。综上所述,本文以视觉感知技术研究为基础,通过融合人员位置信息,提出了可以用于智能监控系统的联合算法,并且应用该算法搭建了智能监控平台,为智能监控的设计提供了新思路。
何娣[5](2017)在《基于语义的地理视频索引方法》文中指出地理视频是具有空间参考的视频数据,具有数据易获取、语义丰富、兼具时空属性、表达直观等特点,逐渐成为虚拟地理环境、智慧城市和城市安全中重要的地理信息来源。随着视频监控网络的广泛布设,动态、可持续获取的地理视频数据对地理视频快速检索提出了前所未有的挑战,如何从海量的地理视频数据中快速准确地检索出满足需要的地理视频,成为地理视频空间索引需要解决的关键问题。地理视频具有丰富的语义信息,现有空间索引方法没有考虑到地理视频蕴含的丰富语义,难以发现地理视频数据之间的时间、空间和语义关联性,不支持地理视频与地理环境的时空语义关联检索,因而难以实现地理视频关联分析和深度挖掘,因此,急需发展顾及语义的地理视频索引新方法。面向地理视频数据的高效索引需求,本文研究地理视频的时空语义一体化索引方法。论文的主要研究内容包括:(1)提出了时空语义一体化索引结构STSR(Spatio-Temporal Semantic R-tree)树。本文面向地理视频数据的时间、空间和语义关联检索需求,融合R树、MAP21时间索引方法和倒排索引结构,设计了时空语义一体化索引STSR树,详细定义了STSR树索引结构和树节点设置;(2)研究了STSR树时空语义一体化索引算法。本文基于STSR树索引结构,研究了时空语义一体化STSR树的索引项插入、删除和查询算法;针对不同的时间、空间和语义查询需求,实现了基于STSR树的时空查询、空间语义查询和时空语义查询;(3)实现了基于STSR树的多路并行查询算法。根据树状索引固有的并行性,本文基于可并行任务单元,设计了STSR树多路并行查询算法,实现了时空语义一体化的地理视频数据高效索引。最后,本文使用杜克大学提供的开源地理视频数据集,对本文提出的时空语义一体化索引STSR树及索引算法进行了实验分析与验证,针对不同的时空语义查询条件,对比分析了STSR树和混合式索引IR树、RT树的索引性能,实验结果表明STSR树具有良好的索引查询性能和并行查询加速比,验证了时空语义一体化索引STSR树的有效性。
孙艺萌[6](2017)在《基于内容的视频索引及应用研究》文中研究表明目前,直升机和无人机巡检已成为电力线路巡检的重要方式,对维护电网安全稳定运行具有至关重要的作用。现在对巡检视频的处理方式多以人工方式为主,缺点是工作量大、漏检率高、效率低;若能为其建立相应的索引系统,就能够极大地提高处理效率并降低漏检率,所以本文采用基于内容的视频检索方法,实现了对输电线路航拍图像的视频检索。本文在研究基于内容检索方法的基础上,建立了包括杆塔和绝缘子的视频索引,实现了航拍电力巡检视频的自动检索。针对巡检视频的特点,提出了一种基于傅里叶描绘子的镜头分割方法从而提取出视频关键帧;然后,利用LSD直线检测算法、Harris角点检测算法和卷积神经网络的方法对关键帧中的杆塔和绝缘子镜头进行识别,用基于内容的检索方法建立起了包括杆塔和绝缘子的视频索引;在此基础上,建立了针对航拍电力巡检视频的索引与检索系统,系统包括了视频索引模块、视频检索模块和系统数据库;最后,以某实际电力巡检的视频为例对该系统进行测试,实验结果表明该系统确实可以提高工作效率、减少工作量并降低漏检率,验证了本文提出系统的有效性和可行性。
孙开新[7](2016)在《基于全景感知度的视频时空检索方法研究》文中指出随着移动互联网、物联网等技术的发展,视频应用越来越广泛地出现在社会生活的各个领域。从城市中的监控摄像头到人们的智能手机,甚至无人机、Google Glass等传感器,每天都在产生海量的视频。如何在这些视频中准确、快速地查询到感兴趣的视频越来越成为一个挑战。为了应对这个挑战,人们先后使用了文本标注和视频内容分析等方式对视频进行组织和检索,以期将非结构化的视频结构化,进而满足人们的检索需求。然而,由于各应用中视频数量巨大,内容复杂,使得这两种方式分别遭遇了来自人工层面和技术层面的限制。文本标注的方式简便易行,但人工的工作量大,且受工作人员的主观性影响。视频内容分析的方式受制于图像和视频的分析技术的发展,其分析结果与人类所能理解的形式存在着巨大的“语义鸿沟”。因此,亟需一种语义描述准确,且易于自动获取的视频元数据对视频进行组织,使得人们可以更加准确、快速地获取所需查询的结果。时空数据是一种理想的视频元数据。除去由人们后期制作的视频,大多数视频内容与其拍摄所在的时空密切相关,而人们对视频的查询语言中,时空条件的出现频率非常高。这构成了时空数据成为组织视频的一种理想元数据的必要性。随着传感器技术的发展,GPS、WiFi定位等位置传感器,电子罗盘、陀螺仪等姿态传感器以及电子时钟已经与视频传感器广泛集成,实时获取视频传感器的位置信息和姿态信息的技术已经成熟,这构成了时空数据成为组织视频的一种理想元数据的可能性。这两个条件的具备使得利用时空数据对视频进行组织和检索逐渐成为当前的研究热点。基于以上的背景和意义,本文定位于视频的时空检索方法研究,致力于回答“什么是更好的视频时空检索结果集合,怎样构建更好的视频时空检索集合”这两个问题,研究了视频时空特性、评价方法、检索方法和应用。本文的研究内容和成果如下:1)全景感知度。本文结合视频传感器覆盖和网络优化的相关理论,提出了一种以视频集合整体感知情况的评价机制——全景感知度。研究全景感知度及其所代表的最优视频集的概念和特性,从感知对象、感知作用、感知源三个方面综合分析建模,设计全景感知度及其所代表的最优视频集求解算法。2)基于全景感知度的视频时空检索。以全景感知度评价机制为依托,本文结合时空模型和索引相关研究成果提出了基于HR树的视频时空索引,并基于此设计了其时空检索方法。3)基于全景感知度的视频时空检索应用。研究基于全景感知度的索引和视频时空检索方法的搜索引擎实现,然后以搜索引擎所发布的服务为基础,以安防领域和社交网络领域为例,分析这两个领域中视频时空检索的应用需求,然后针对这些需求设计相应的应用模式,满足相关行业需求。
吴玲生[8](2015)在《足球视频索引结构与检索算法研究》文中指出随着视频搜索技术的发展,基于内容的视频搜索近年来受到越来越多的学者关注。通用视频索引往往只使用视频图片的低层特征,对图片内容描述不够充分,搜索结果不太理想。为解决这个问题,本文研究如何把视频的低层特征和语义特征相结合,改进现有索引结构,设计一个高效的足球视频索引。视频检索包括特征提取、索引结构建立和检索算法设计三个步骤。在特征提取方面,针对现有语义特征提取方法的不足,提出了识别足球视频镜头类型的波动检测法,该方法使用一个滑动窗口在图片中间滑动,记录滑动窗口内球场像素比例在远镜头阈值上下波动次数,根据波动次数判断镜头类型;提出了使用高低位识别球场区域类型方法,该方法使用高斯混合模型识别出球场后,通过一定的预处理,仅根据球场在图片中左右边界坐标的高低判断球场区域类型。在索引结构方面,改进现有ERVQ向量索引结构,将镜头类型和球场区域类型语义特征引入到索引中,根据语义使用树形结构分割倒排链表。在检索算法方面,提出了使用投票法快速筛选候选集和使用颜色特征对候选集排序。实验结果表明,提出的波动检测法识别镜头类型和高低位法识别球场区域类型较现有的方法在准确率和召回率上有较大提升,并且满足实时性要求;索引方面,提出的结合语义特征的足球视频索引在查询时间和查询结果两个方面都优于现有索引。要进一步提高搜索体验,下一步的研究是考虑加入更多的语义特征并在大数据平台上使用分布式索引。
杨美娟[9](2013)在《基于Hadoop的杰赛安保视频管理系统设计》文中认为目前大多数安保视频管理系统都是基于传统的视频管理系统架构:视频存储使用操作系统的文件系统或者专用的多媒体数据库作为底层存储的基础。然而,使用操作系统的文件系统存在着读取效率低下、海量数据管理困难以及使用多媒体数据库存在着数据检索以及处理效率低下等问题。为了提高海量视频的管理效果以及安保系统安全监控监控工作的效率,杰赛集团决定放弃使用旧有的安保视频管理系统架构,转向以Hadoop云计算技术为基础开发一套适用于安保海量视频数据管理系统。而管理系统如何在Hadoop框架下实现高效率高质量的视频检索,如何将Hadoop云计算技术和视频管理系统相结合,成为迫切需要解决的问题。以杰赛安保视频管理为背景,首先分析目前各种视频管理系统的现状和技术架构,以及分别列出其优劣点,明确基于云计算技术的海量视频数据管理的新系统建设的必要性和系统需求。针对提出的需求设计管理系统核心流程,包括视频数据存储流程、视频数据索引流程、视频数据查询流程。在此基础上,讨论杰赛视频管理系统视频数据存储和检索的主要功能,分析视频分布式存储,处理和检索等主要技术细节。然后分析系统架构,对视频储存,视频索引的建立以及视频检索等核心子系统进行详细设计,其中基于Hadoop的分布式框架技术重点讨论视频文件的存储以及检索的过程及实现。最后总结使用云计算技术的视频管理系统在公共安全方面的重要作用。
彭欣[10](2013)在《基于视频信息分割分类的索引方法的初步研究》文中指出对视频内容的隐含结构进行分割(分割为帧、镜头、场景、故事单元、节目等);分割后具代表性的对象赋予数据特征;对视频内容按检索要求进行分类(层)(外部、结构、低层、中间层,高层);分割对象与检索类型建立对应关系,从而建立索引和检索体系。
二、视频索引技术研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、视频索引技术研究(论文提纲范文)
(1)基于内容的视频信息智能搜索算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景和意义 |
1.2 研究现状 |
1.2.1 视频搜索系统研究现状 |
1.2.2 基于内容的视频搜索技术研究现状 |
1.2.3 基于深度学习方法的视频搜索研究现状 |
1.3 论文主要研究内容 |
1.4 论文结构 |
第2章 视频图像特征描述 |
2.1 引言 |
2.2 颜色特征 |
2.3 CENTRIST特征 |
2.4 SIFT特征 |
2.5 SURF特征 |
2.6 本章小结 |
第3章 基于局部和全局特征的镜头边界检测算法研究 |
3.1 引言 |
3.2 镜头边界检测中存在的主要问题 |
3.3 基于局部和全局特征的镜头边界检测算法 |
3.3.1 渐变边界检测 |
3.3.2 突变边界检测 |
3.4 本章小结 |
第4章 基于加权的多特征的关键帧提取方法研究 |
4.1 引言 |
4.2 特征提取与帧差测度 |
4.3 特征描述子权值估计 |
4.3.1 基于标本的混合模型(CMM) |
4.3.2 加权的多特征描述子CMMs |
4.4 基于谱聚类的关键帧提取 |
4.4.1 谱聚类 |
4.4.2 聚类数目估计 |
4.5 基于帧间相似度曲线曲率检测的关键帧提取 |
4.6 本章小结 |
第5章 基于语义概念检测的视频索引和搜索 |
5.1 引言 |
5.2 BoW特征表示选择 |
5.3 支持向量机(SVM)概述 |
5.4 视频索引和搜索 |
5.5 实验结果与讨论 |
5.5.1 镜头边界检测评估 |
5.5.2 关键帧提取评估 |
5.5.3 视频索引和搜索评估 |
5.6 本章小结 |
第6章 基于深度学习方法的视频信息搜索方法研究 |
6.1 引言 |
6.2 基于深度学习方法的常用模型 |
6.2.1 卷积神经网络 |
6.2.2 递归神经网络 |
6.2.3 无监督的自编码器 |
6.3 基于深度学习网络的行为视频分类和搜索 |
6.3.1 常用框架和数据集 |
6.3.2 基于卷积神经网络(CNNs)的行为视频搜索 |
6.3.3 实验结果与分析 |
6.4 本章小结 |
结论 |
参考文献 |
攻读博士学位期间所发表的学术论文 |
致谢 |
(2)文物类微纪录片《如果国宝会说话》创作研究(论文提纲范文)
摘要 |
Abstract |
绪论 |
一、研究缘起 |
二、研究现状 |
(一) 关于微纪录片的研究 |
(二) 微纪录片《如果国宝会说话》的文献研究 |
三、研究目标 |
四、研究思路 |
五、研究方发生 |
第一章 《如果国宝会说话》的创作背景 |
第一节 国宝文物承载文化自信 |
第二节 新媒体环境下的微纪录片浪潮 |
第二章 《如果国宝会说话》的创作理念 |
第一节 创作理念来源与演变 |
第二节 “旁观”与“介入”融合 |
第三节 写实与写意结合 |
第三章 《如果国宝会说话》的叙事手法 |
第一节 丰富且层次分明的叙事内容 |
一、新石器时代到春秋战国时期 |
二、战国时期到秦汉时期 |
第二节 三种人称并存的叙事视角 |
一、拉近距离的第二人称“你” |
二、文物拟人化的第一人称“我” |
三、解说者介绍的第三人称“他” |
第三节 叙述节奏和结构技巧 |
一、短平快的叙述节奏 |
二、非线性的叙述节奏 |
第四章 《如果国宝会说话》的视听表达 |
第一节 禅意文案,言有尽而意无穷 |
一、标题凝练 引人入胜 |
二、解说精妙 链接时空 |
三、关键字幕 升华主题 |
第二节 数字动画,为古老文物注入生命力 |
一、风格多变的蒙太奇手法 |
二、现代手段令国宝“开口说话” |
三、影像资料的运用 |
第三节 丰富音响,让文物发出专属声音 |
一、多元的音乐风格 |
二、精准的音效运用 |
第五章 《如果国宝会说话》对微纪录片创作的启示 |
第一节 文物类微纪录片的发展 |
一、平民化视 角碎片化结构 |
二、节奏明快 叙事多元 |
三、微纪录片细节“刺点”化 |
第二节 对于传统文化的正向传播 |
一、以深厚的内涵底蕴展现文化价值 |
二、历史文物故事传播的新视野 |
三、坚定文化自信增进民族认同感 |
结语 |
参考文献 |
致谢 |
(3)基于电影内容索引的可视化系统的研发(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要工作及创新 |
1.4 论文的组织结构 |
第二章 相关技术研究现状 |
2.1 自然语言处理 |
2.2 文本相似度算法 |
2.2.1 Word2Vec模型 |
2.2.2 Gensim库 |
2.3 视频索引技术 |
2.4 自动摘要技术 |
2.5 关键词提取 |
2.6 情感分析 |
2.6.1 基于情感词典的方法 |
2.6.2 基于机器学习的方法 |
2.7 本章小结 |
第三章 电影片段的划分 |
3.1 剧本和字幕的预处理 |
3.2 剧本和字幕的融合 |
3.3 电影片段的划分 |
3.4 本章小结 |
第四章 基于电影片段的分析 |
4.1 重要电影片段的分析 |
4.2 情感分析 |
4.2.1 情感的分类标准 |
4.2.2 使用BERT模型进行情感分析 |
4.3 人物关系分析 |
4.4 本章小结 |
第五章 可视化系统 |
5.1 电影播放视图 |
5.2 索引视图 |
5.3 人物关系视图 |
5.4 电影评论视图 |
5.5 人物与电影片段视图 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
发表论文和参加科研情况说明 |
致谢 |
(4)基于深度学习的智能监控平台设计(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.3 本文主要内容和安排 |
1.3.1 本文主要研究内容 |
1.3.2 论文各章安排 |
2 行人检测算法 |
2.1 目标检测算法的比较与选择 |
2.2 检测算法数据集构建 |
2.3 实验结果与分析 |
2.3.1 实验的软件与硬件环境 |
2.3.2 目标检测算法评价标准 |
2.3.3 目标检测算法实验结果 |
2.4 本章小结 |
3 目标跟踪算法 |
3.1 常见跟踪算法的比较 |
3.2 跟踪算法的选择 |
3.3 跟踪算法数据集的构建 |
3.3.1 视频序列开源数据集 |
3.3.2 自制视频序列 |
3.4 实验结果与分析 |
3.4.1 目标跟踪算法评价标准 |
3.4.2 目标跟踪算法实验结果 |
3.5 本章小结 |
4 像素坐标-经纬度坐标转换算法 |
4.1 摄像机坐标转换原理 |
4.1.1 像素坐标系-图像坐标系的转换 |
4.1.2 图像坐标系-摄像机坐标系的转换 |
4.1.3 摄像机坐标系-世界坐标系的转换 |
4.1.4 像素坐标系-世界坐标系的转换 |
4.2 单目摄像机的标定及畸变修正 |
4.2.1 摄像机的参数标定 |
4.2.2 图像畸变的矫正 |
4.3 实验结果与分析 |
4.3.1 摄像机标定与畸变修正结果 |
4.3.2 坐标转换矩阵的求解 |
4.4 本章小结 |
5 智能监控平台的搭建与调试 |
5.1 监控平台功能概述 |
5.2 监控视频处理算法流程介绍及实验效果 |
5.2.1 处理算法流程介绍 |
5.2.2 实验效果 |
5.3 多级监控视频存储与视频索引系统的建立 |
5.4 客户端监控界面的建立 |
5.5 智能监控系统在现实场景中的应用 |
5.6 本章小结 |
6 总结与展望 |
6.1 本文工作总结 |
6.2 后续工作展望 |
参考文献 |
作者简历及攻读硕士/博士学位期间取得的研究成果 |
学位论文数据集 |
(5)基于语义的地理视频索引方法(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 空间索引研究现状 |
1.2.2 时间索引研究现状 |
1.2.3 全文本索引研究现状 |
1.2.4 地理视频索引研究现状 |
1.3 论文主要研究内容与组织结构 |
第二章 时空语义一体化索引STSR树设计思想 |
2.1 R树空间索引 |
2.1.1 R树索引结构 |
2.1.2 R树基本操作 |
2.2 MAP21时间索引方法 |
2.2.1 MAP21索引概述 |
2.2.2 MAP21时间索引查询算法 |
2.3 倒排索引方法 |
2.3.1 倒排索引结构 |
2.3.2 倒排索引基本操作 |
2.4 时空语义一体化索引方法 |
2.4.1 STSR树设计思想 |
2.4.2 STSR树索引结构 |
2.4.3 STSR树节点设置 |
2.5 本章小结 |
第三章 时空语义一体化索引STSR树基本操作 |
3.1 索引项插入算法 |
3.2 索引项删除算法 |
3.3 索引查询算法 |
3.3.1 时空查询方法 |
3.3.2 空间语义查询方法 |
3.3.3 时空语义查询方法 |
3.4 索引查询并行算法 |
3.5 本章小结 |
第四章 实验测试与性能分析 |
4.1 实验环境与参数设置 |
4.2 实验数据 |
4.3 STSR树索引构建性能测试 |
4.4 STSR树索引查询性能测试 |
4.4.1 STSR树索引查询测试 |
4.4.2 STSR树并行索引查询测试 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 研究工作总结 |
5.2 下一步工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(6)基于内容的视频索引及应用研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 论文的研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文组织结构 |
第2章 视频索引研究和镜头分割方法 |
2.1 视频索引研究 |
2.1.1 视频索引的基本概念 |
2.1.2 视频索引的分类 |
2.1.3 索引信息的存储方法 |
2.1.4 视频数据结构 |
2.2 镜头边界检测常用方法 |
2.2.1 非压缩域视频的镜头边界检测方法 |
2.2.2 压缩域视频的镜头边界检测方法 |
2.3 本章小结 |
第3章 基于傅里叶描绘子的压缩域视频镜头分割 |
3.1 压缩域视频特征描述 |
3.2 基于傅里叶描绘子的镜头分割方法 |
3.2.1 小波去噪 |
3.2.2 傅里叶描绘子 |
3.2.3 镜头分割及关键帧提取步骤 |
3.3 实验结果与对比分析 |
3.4 本章小结 |
第4章 航拍电力巡检视频关键部件识别 |
4.1 引言 |
4.2 杆塔识别 |
4.2.1 杆塔概述 |
4.2.2 LSD直线检测算法 |
4.2.3 Harris角点检测算法 |
4.2.4 实验结果 |
4.3 绝缘子识别 |
4.3.1 绝缘子概述 |
4.3.2 卷积神经网络 |
4.3.3 卷积神经网络的构建 |
4.3.4 实验结果 |
4.4 本章小结 |
第5章 基于内容的航拍电力巡检视频索引与检索系统的建立 |
5.1 系统总体结构介绍 |
5.2 视频数据库的构建 |
5.2.1 视频数据库的特点 |
5.2.2 数据库的生成 |
5.3 视频索引与视频检索模块 |
5.3.1 视频索引模块 |
5.3.2 视频检索模块 |
5.4 实验结果 |
5.5 本章小结 |
第6章 结论与展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表的论文及其他成果 |
致谢 |
(7)基于全景感知度的视频时空检索方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 选题背景与意义 |
1.2 国内外研究现状 |
1.2.1 视频检索研究现状 |
1.2.2 视频时空检索研究现状 |
1.2.3 现状分析 |
1.3 研究目标与内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.4 技术路线与关键技术 |
1.4.1 技术路线 |
1.4.2 拟解决关键问题 |
1.5 论文组织结构 |
第二章 地理对象的视频感知 |
2.1 视频时空模型 |
2.2 视频的感知问题 |
2.3 视频的感知要素 |
2.3.1 感知对象 |
2.3.2 感知源 |
2.3.3 感知作用 |
2.4 本章小结 |
第三章 全景感知度 |
3.1 全景感知度的概念和特性 |
3.1.1 全景感知度的概念 |
3.1.2 全景感知度的特性 |
3.2 算法框架 |
3.3 感知对象单元划分 |
3.3.1 感知单元结构 |
3.3.2 静态感知对象划分 |
3.3.3 移动感知对象划分 |
3.4 感知单元填充 |
3.4.1 算法流程 |
3.4.2 单位感知度算法 |
3.4.3 方向分类 |
3.4.4 时间作用 |
3.5 全局全景感知度和最优视频集算法 |
3.6 实验分析 |
3.6.1 实验数据 |
3.6.2 单位感知度分析 |
3.6.3 全景感知度和最优视频集实例分析 |
3.6.4 感知单元划分尺度 |
3.7 本章小结 |
第四章 基于全景感知度的视频时空检索 |
4.1 全景感知度应用于视频时空检索的关键问题 |
4.2 视频时空索引 |
4.2.1 时空索引 |
4.2.2 HR树索引 |
4.2.3 基于HR树的全景感知度视频时空索引 |
4.3 视频时空查询 |
4.3.1 算法框架 |
4.3.2 感知单元填充 |
4.3.3 全局优化 |
4.4 实验分析 |
4.4.1 检索效率分析 |
4.4.2 精度分析 |
4.5 本章小结 |
第五章 原型系统及应用 |
5.1 系统架构设计 |
5.2 视频时空搜索引擎 |
5.3 监控探头管理与检索系统-安防领域应用 |
5.3.1 安防领域视频检索的特点 |
5.3.2 系统简介 |
5.4 Mirror-社交网络领域应用 |
5.4.1 社交网络领域视频检索的特点 |
5.4.2 系统简介 |
5.5 本章小结 |
第六章 结论与展望 |
6.1 主要研究结论 |
6.2 研究展望 |
参考文献 |
致谢 |
(8)足球视频索引结构与检索算法研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究目的及意义 |
1.2 国内外研究现状 |
1.3 研究目标及所做的工作 |
1.4 论文的组织结构 |
2 足球视频语义特征提取 |
2.1 镜头类型特征提取 |
2.2 球场区域特征提取 |
2.3 实验结果与分析 |
2.4 本章小结 |
3 足球视频索引构建 |
3.1 残差量化编码 |
3.2 ERVQ索引结构 |
3.3 足球视频索引结构 |
3.4 足球视频索引与ERVQ索引对比分析 |
3.5 本章小结 |
4 足球视频检索算法设计 |
4.1 索引项查找 |
4.2 多链表排序 |
4.3 实验结果与分析 |
4.4 本章小结 |
5 总结与展望 |
5.1 全文总结 |
5.2 存在的问题 |
5.3 研究展望 |
致谢 |
参考文献 |
(9)基于Hadoop的杰赛安保视频管理系统设计(论文提纲范文)
摘要 |
ABSTRACT |
第一章 引言 |
1.1 国内外安保视频管理系统发展现状 |
1.2 杰赛安保视频管理存在的问题 |
1.3 本文的主要内容 |
1.4 本文的篇章结构 |
第二章 Hadoop分布式计算基础 |
2.1 HDFS分布式文件系统 |
2.2 MapReduce并行计算框架 |
2.3 REST Web服务技术 |
第三章 杰赛安保视频管理系统需求分析 |
3.1 杰赛安保视频管理系统的主要功能 |
3.1.1 用户信息管理 |
3.1.2 后台系统管理 |
3.2 杰赛视频管理系统的核心流程 |
3.2.1 视频数据存储流程 |
3.2.2 视频数据索引流程 |
3.2.3 视频数据查询流程 |
3.3 杰赛安保视频数据安全性管理需求 |
第四章 基于Hadoop的杰赛安保视频管理系统设计 |
4.1 杰赛安保视频管理系统总体架构 |
4.1.1 系统架构的设计 |
4.1.2 Hadoop在安保视频管理系统中作用 |
4.2 视频存储子系统设计 |
4.2.1 分布式安保视频存储 |
4.2.2 视频存储负载均衡 |
4.3 视频检索子系统设计 |
4.3.1 视频特征索引提取插件 |
4.3.2 视频特征索引目录存储 |
4.3.3 视频检索结果访问控制 |
4.4 与同类系统的比较 |
4.5 基于Hadoop杰赛视频管理系统应用效果 |
第五章 结论 |
5.1 基于Hadoop杰赛安保视频管理系统特点 |
5.2 不足与展望 |
参考文献 |
致谢 |
(10)基于视频信息分割分类的索引方法的初步研究(论文提纲范文)
0、研究背景与研究思路 |
1、分割视频信息结构, 选取索引对象 |
1.1、视频信息的隐含结构 |
1.2、视频索引对象的分割与选取 |
1.2.1、帧对象的选取 |
1.2.2、镜头分割 |
1.2.3、场景分割 |
1.3、故事单元分割 |
2、构建视频索引对象的数据结构标记 |
3、对视频内容进行分类, 构建相应的索引模型 |
3.1、视频内容分类模型 |
3.2、根据用户需要, 对视频信息进行描述 |
3.3、根据视频信息的描述, 构建视频索引分类模型 |
3.4 视频对象 (分割后) 与索引类型 (层次) 的对应关系 |
5、结语 |
四、视频索引技术研究(论文参考文献)
- [1]基于内容的视频信息智能搜索算法研究[D]. 王文诗. 北京工业大学, 2020(06)
- [2]文物类微纪录片《如果国宝会说话》创作研究[D]. 秦姗姗. 扬州大学, 2020(05)
- [3]基于电影内容索引的可视化系统的研发[D]. 李林峰. 天津大学, 2019(01)
- [4]基于深度学习的智能监控平台设计[D]. 陈建宏. 北京交通大学, 2019(01)
- [5]基于语义的地理视频索引方法[D]. 何娣. 电子科技大学, 2017(02)
- [6]基于内容的视频索引及应用研究[D]. 孙艺萌. 华北电力大学, 2017(03)
- [7]基于全景感知度的视频时空检索方法研究[D]. 孙开新. 南京师范大学, 2016(05)
- [8]足球视频索引结构与检索算法研究[D]. 吴玲生. 华中科技大学, 2015(05)
- [9]基于Hadoop的杰赛安保视频管理系统设计[D]. 杨美娟. 复旦大学, 2013(03)
- [10]基于视频信息分割分类的索引方法的初步研究[J]. 彭欣. 江西通信科技, 2013(03)