论新闻视频数字图书馆的建设_数字图书馆论文

试论新闻视频数字图书馆的构建,本文主要内容关键词为:试论论文,数字图书馆论文,新闻论文,视频论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在媒体行业和学科专业领域中,视频信息的采集、处理与传播服务正在促成信息组织理论、信息处理技术与方法的不断创新,形成了一系列的研究热点。在图书馆各类文献资源的数字化建设中,音像资料的数字化转化工作是一个值得探讨的问题。本文通过新闻视频数字图书馆的研发论证,以浙江传媒学院图书馆的项目研究与工作实践为实例,来研究新闻视频数字图书馆的构建。

1 研发论证1.1 研究背景

目前,电视台、图书馆等单位收藏了数以万计的视音频信息资源,保存、流通和使用是一道难题,越来越多的图书馆开展了视音频信息资源的采集、组织、管理、服务等工作。随着视音频资源收藏量的迅速增加,图书馆收藏的视音频信息资源类型呈现多样化发展趋势,从胶卷、模拟信号磁介质逐渐发展到光介质,先后出现了影片、模拟录像带、录音带、数字带以及DVD视盘、LD视盘、VCD视盘,CD唱片等视音频信息资源。纵观媒体资源管理领域,死库资源开发、信息孤岛现象、网站信息陈旧等问题普遍存在,视音频信息资源的组织问题日益突出。

业界的研究则表明,我国特色数据库建设中缺少全文、图形图像及事实型数据库,需加强全文型、数值型数据库等源数据库的建设。多提供图形图像、动画、声音等多媒体信息,以缩小我国与发达国家的信息化差距,满足不同用户的需要。[1]

顺应新闻学科的发展与科研创新进程的推进,以及媒体行业的服务提升之需求,为促进媒体信息资源的开发利用,新闻视频数字图书馆的创建已刻不容缓。

1.2 研究现状

视频信息属于时变媒体,是最复杂的多媒体信息。近年来的研究涉及视频信息的存储组织、内容分析、特征抽取、索引方法、匹配算法、检索算法、检索结果的评估和视频信息的表现形式等诸多方面。

国外早在1996年就开展了许多学术活动来研究探讨视频元数据。1999年由IBM和Sony公司联合创建了CNN的媒体资产系统。此外,著名的数字影片制作商Digital Film works专门从事数字影片的后期制作,系统可以有效支持SAN环境中的文件级共享。

国内项目有国家社科基金项目“视音频信息元数据与检索创新研究”等。广电行业编目规范标准《广播电视音像资料编目规范:电视资料》(GY/T 202.1-2004),已于2004年开始实施。中央电视台新闻共享系统在规模和技术上均达到了国际领先水平。[2]中央音像资料馆媒体资产管理系统独创采用了全流水线的控制管理模式,采用工作流引擎进行业务流程的衔接和调度,实现了多人协同、负载均衡、并行工作等大型流水线生产系统的核心功能。[3]香港TVB电视台授权采集的2000年以来的新闻节目构成的视频资产库的管理和检索是依托开放架构的数字视频管理系统iView平台来设计实现的。[4]

1.3 需求分析

1.3.1 系统需求分析

以数字视频检索为例,[5]数字视频文档分为四个逻辑层次——整个视频文档、故事单元(或场景)、镜头和帧。其中,文档和帧是数字视频固有的自然层次,故事单元(场景)和镜头则要通过对视频内容的分析、采用各种算法对视频进行分割。检索要求较高,总体来说,视音频资料的主题内容较为模糊,范围也比较广泛,例如,某个镜头的运用,某种特殊的拍摄手法等。

在实际应用中,对于视频语义的检索,采取的方式主要是基于文本的视频检索。通过视频内容分析得出的低级特征(颜色、形状、纹理、音强等)、中级特征(对象、事件等)和高级特征(语义、情感等)均需要以文本方式进行表述并用于视频的索引和检索;基于视觉内容的视频摘要、故事板、关键帧等主要用于视频浏览和检索结果的展示。[6]由于低码率活动图像浏览的概念已经被广泛接受,通常将低码率活动图像文件存放在硬盘上,以便获得最高的检索响应速度。[7]

视频信息是一种无结构的流式媒体,在存档格式、压缩编码方式、内容组织形式等方面呈现多种不同的类型。根据MPFG-7的目标要求。[8]对视频信息的描述至少应包括如下信息:(1)有关内容的产生和发展进程的描述信息(如导演/作者、标题等);(2)与内容使用有关的信息(如版权、使用历程、宣传计划等);(3)有关内容存储特性的信息(如存储格式、编码等);(4)有关内容的低级特性的信息(如颜色、纹理、音质、音调描述等);(5)从内容捕捉到的实体的概念化信息(如对象和事件、对象间的交互作用等);(6)关于如何用有效方法浏览内容的信息(如概要、变更和频率等);(7)关于用户和内容交互作用的信息(如用户选择、使用历史等)。

以上描述可分为一般性描述和基于内容的描述。一般性描述是指从视频文档外部导出的、不依赖于其内容的信息用于视频文档的标识和检索,如标题、作者、时间、文档大小、存储格式与编码格式、使用信息等等。基于内容的描述又可分为结构性描述(用于描述针对视频内容的逻辑结构,包括节目、场景、镜头、帧之间的层次结构以及所包括的对象之间的结构与关系等)、低级特征描述(用于描述视频信息的物理特征信息,如颜色、纹理、运动、音质、音调描述等)和语义描述(用于描述视频中包括的对象和事件)。[9]

1.3.2 用户需求分析

不同的用户、不同的应用对视频信息有不同的管理和检索要求,因此,视频信息的描述体现多角度与多层次。国内学者根据不同用户对数字视频检索的不同需求,将用户分为消费型、研究型、创作型和应用型四种类型。[10]

消费型用户是指以获取信息和娱乐消遣为主要目的的用户。一般以整个视频文档作为消费对象,主要检索数字视频的信息内容,往往检索一部影片、电视片或一场体育比赛的视频等。一般是基于语义的抽象描述,数字视频信息的索引和检索应以文本方式为主,采用元数据描述和针对视频内容的文本注释。

研究型用户是指某领域内的专家或学者将视频作为研究素材,以获取信息为主要目的的用户。一般以文档或场景作为对象,是基于语义的抽象描述。以文本检索为主,主要检索感兴趣的各种视频片段(故事单元)。

创作型用户是指视频创作或编辑人员。一般以镜头作为消费对象,将镜头作为创作素材或研究对象;检索要求有时是基于语义,有时是基于特征的。创作型用户是视频专业人员,往往比较关注视频的物理特征,因此,需要使用基于示例的检索以查找相似的镜头或片段。

应用型用户是指一些特定应用领域的视频用户,其应用具有特定的应用模式和明确的视频检索目标。一般以视频片段或关键帧为检索对象,如银行、交通管理的视频监控等。

艺术类院校如传媒学院是以广播电视专业为特色的院校,在教学实践中比如学生作业这个环节,往往都涉及影音和视频文件、多媒体作品、平面作品、摄影、绘画等作品,在作品的创作过程中存在着很突出的素材重用问题,充分利用各类素材日益重要。只有先进的内容管理系统才能为高效、充分地利用各类资源提供保证。同时为教师对作业的点评和学生间作品的交流与展示提供便利。立足本校、植根行业、面向社会,我们的读者与用户涵盖了以上四种类型。因此,在选择检索策略时必须兼顾不同用户的不同需求。

1.4 研发思路

新闻视频数字图书馆的建设目标是:以新闻视频资源为内容特色,以数据库技术、数字视频压缩技术、存储技术、流媒体技术、计算机网络技术、检索技术等为技术基础,建成一个开放式的硬件和软件的集成平台,以网站形式组建,实现收集、保存、查找、发布等功能,整合了资源检索、在线点播、下载、教学素材、热门排行、留言评论、编辑推荐、上传、网上互动等服务项目,能提供简便的访问方式,并高效地保存与共享新闻视频资源。

新闻视频数字图书馆硬件架构包括:采集/上载工作站、数据库服务器、WEB服务器、视频点播服务器、磁盘阵列或其他网络存储系统等。采用分层次,逐步实施的方式。形成一个学科特色明显的系统工程。系统的软件架构则主要致力于模块间的交互,使系统在高效运行的基础上尽量少占用系统资源,鉴于网站的大信息流量,模块间的通信方案和业务流程的设计尤为重要。可共享的资源包括:媒体资产管理系统、电视专题研究、网络平台百草园、传媒文库等等。

2 构建方案

2.1 依托多项目课题合作,共同研发的宏观构建模式

浙江传媒学院图书馆以促进图书馆特色馆藏的进一步发展,实现多媒体资源的共建共享,服务于教学、科研为主要研究方向,成立了校级科研机构多媒体研究开发中心。通过中央与地方共建项目投资人民币200余万元,配备各种设备:Web服务器、数据库服务器、数据迁移服务器、上载、编辑、检索工作站电脑、多格式放像机、专业DV格式录像机/放像机、RMG820E编辑控制器、双卡录像机、刻录机等等。

以多媒体研究开发中心为平台,展开广泛的项目课题合作研究,有广播电影电视总局高等院校人文社会科学研究项目——“中外广播电视节目形态及成因的比较研究”、“图书馆媒体资产管理系统应用研究”;浙江省新世纪高等教育教学改革研究项目——“艺术类专业实践教学互动式网络平台的构建与开发”;“高教园区数字图书馆多媒体资源共享研究”;浙江省社科联课题——“新闻视频数字图书馆的创建研究”;浙江省图书馆学会——“数字媒体知识库实证研究”以及院级课题——“网络环境下文献信息资源个性化服务研究”、“外语视听文献的数字化开发与利用研究”、“电视专题研究”等等,形成了横向课题与纵向课题交错互补、多学科交叉的综合研究态势。

如图1所示,新闻视频数字图书馆构建略图较为直观地反映了项目课题与新闻视频数字图书馆之间的构建对应关系。

图1 新闻视频数字图书馆构建略图

2.2 媒体资产管理系统

紧紧围绕教学科研的需求——在海量的非结构化文档中又快、又准、又全地找到用户所需的文档以及素材的重用与共享,在建设图书馆特色馆藏的思路下,内容管理系统的研发与设计力求凸现传媒特色。

系统采用硬盘阵列和数据流磁带存储音像资料,通过数据库技术提供视音频素材的检索,以取代传统录像带存储方式和单机检索环境。系统主要由数据库服务器、数据流磁带库服务器、采集工作站、记录工作站和检索工作站组成。数据库服务器为管理系统提供数据库支持。数据流磁带库服务器在线连接一个或多个数据流磁带库,用于存储视音频素材。采集工作站完成视音频流的上载,压缩为文件,并实时生成一路对应的预览文件。记录工作站负责录入视音频素材数据库信息。检索工作站提供素材的检索、预览和下载,用户可以通过全文索引、多条件组合索引等各种检索手段来检索资料,可以在网上预览该资料低码率的MPEG-4文件,并根据需要,选择下载功能高码率的MPEG-2文件。

由于视频数据具有数据量大、分散性、时序性等特点,数据库系统在设计时应更多地考虑到数据的存储管理、数据共享、并发控制、事务处理。此外还要解决好多用户访问、数据管理、数据安全性、数据查询等问题。其中资源共享是媒体资产管理系统的一个重要特征。根据媒体资产的构成,资源共享包括:素材、节目文件、文档文件、编目信息共享,编目数据的一致性尤为重要。

2.3 电视专题研究数据库

为了使信息服务向学科纵深领域拓展,图书馆组织人员展开调研,积极探索电视研究专题文献自建电子数据库的实现方案。

首先,在资深专家教授的指导与直接参与下设计了专题的类目框架,包括与电视相关的各类资料:电视节目、电视节目主持、节目制作、理论研究、业务活动、电视人物资料、电视网络、电视知识、电视法规、电视史、外国电视、港澳台电视、中外交流、电视创作谈、电视评论(国内、国外)、解说词、电视广告、观众调查、观众参与、节目编排、节目播出、领导人言论、节目市场及其他与电视相关的参考资料。剪报资料均来自公开发行的报刊。

其次,检索平台的选用是关键。依照统筹兼顾、资源整合的原则,经过协商与研究,与本地的系统开发商联系升级了原有的人大复印报刊资料数据库检索系统,高效率地达到目标。

再采用外包方式数字化所有剪报资料,登陆院图书馆主页点击“电视节目资料”即可进行检索、在线浏览、下载等。全文以PDF格式传输。

2.4 网络平台百草园

对于高校图书馆而言,如何发挥资源优势,促进教学科研是永恒的宗旨。

针对艺术类院校的专业特点进行了积极的探索,创新了服务方式与手段,推进了教育信息化。在校园网络环境下,遵循数字化校园总体规范,通过充分调研、分工合作、细化实施方案和步骤,调动和发挥相关部门和院系积极性,利用并开发学生作品资源,尤其是原创的获奖音视频资源,以充分挖掘学院特色资源的潜力。

探索一种艺术类专业实践教学互动式网络平台学习的网络模式,开发一个以教改为主线,以教师为主导,以学生为主体,以网络为载体,以媒体资源库为实现形式的学生多媒体教学作品“设计制作—提交发布—展示交流—批改讲评”的师生互动教学实践的网络实现平台。通过该平台,学生可以将DV作品、动画FLASH作品、摄影作品、平面作品、文学作品、新闻作品等进行上传,全院学生进行互动式交流,教师可以通过“作业库”的形式方便地进行作业批改和点评,形成一条适合艺术类院校师生作品、作业的交流途径。以此将网络多媒体引入教学改革,来强化教师利用现代教育技术手段的能力,提高教学水平,使教师利用该平台顺利实现对教学效果的检验和评测。为高校师生提供了一个科研、实践交流及学习的平台。其中媒体资源库由文本库、图片库、动画库、声音库、视频库构成。

3 结语

从学术研究和实践应用来考察,数据库建设中内容和类型不平衡的问题依然存在,尤其是视频数据库,有许多有待进一步探索的学术难题。数字化带来的技术复杂性不容低估,必须建立与现代信息技术的良性互动机制。在起步阶段,实施中存在很多理论和技术问题。提升资源价值,共建共享创造效益,实现快速检索服务,构建一个行之有效的信息支撑系统,以促进教学科研的发展。这既是业界资料管理的发展趋势,也是目前必须面对的现实问题,需要理论上深入研究以及实践中不断探索。此外,要高度重视对未来发展具有重要意义的高新技术,紧紧追踪现代科技发展的脚步,对手机广播、移动电视、宽频电视等新媒体信息要有积极的前瞻意识,开拓数字图书馆的服务领域。

收稿日期:2008-01-18

标签:;  ;  ;  ;  ;  ;  

论新闻视频数字图书馆的建设_数字图书馆论文
下载Doc文档

猜你喜欢