数字媒体知识管理研究,本文主要内容关键词为:知识管理论文,数字论文,媒体论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G250.7 [文献标识码]A [文章编号]1008-0821(2008)01-0152-03
通过计算机存储、处理和传播的信息媒体称为数字媒体,也称为数字媒介。
随着信息技术突飞猛进的发展,基于数字技术的大众传媒形成了完整级的数字媒体阵容:数字广播、数字电视、数字电影、网络媒体、数字图书、数字报刊等,经过近10年的发展,业已成为信息传播的重要组成部分。从学科角度来看,数字媒体是个跨学科的学术领域,是从各门学科中提取相关要素而综合起来的系统学科。数字媒体学科包含美术、音乐、舞蹈、戏剧、雕塑、建筑等艺术基本元素,还包含了出版、影视、网络等大众传播媒介,又运用计算机和信息等工程技术,以上元素的搭配组合构成了数字媒体的学科体系。基于数字媒体学科发展,面向数字媒体行业运用,数字媒体知识管理技术面临的重大挑战是如何在海量的非结构化文档中又快、又准、又全地找到用户所需的文档。本文以知识管理理论为指导,把握数字媒体的发展需求,了解技术前沿动态与实际运用,研究数字媒体资源的优化配置。
以中国期刊网和维普咨询数据库为主要检索工具,其中数字媒体的文献类型分布如下:博士论文(6262条)、硕士论文(39165条)、报纸文献(56238条)、会议论文(2873条),学科分类分布如下:软件及应用(369条)、新闻传媒(238条)、教育理论(49条)、戏剧影视(38条)、互联网(45条)、图书情报(35条)、出版(24条)等等,从以上的检索数据可以看出,数字媒体是当前的热门话题之一,不少专家学者对此给予了积极的关注。顺应数字媒体学科的发展与科研创新进程的推进,以及数字媒体行业的服务提升之需求,从图书馆的知识服务出发,采用以下框架为研究脉络展开数字媒体信息资源的知识管理策略研究。
1 数字媒体知识库
1.1 数字媒体资源定位研究概述
根据美国加州大学伯克利分校信息管理与系统学院的科研项目统计,2003年,全球范围内拥有21264个电视台、47776个电台,播放节目共计为3100万小时、7000万小时,分别按每小时节目1.3~2.25GB、50MB存储量计算,可达62769~108638TB、3488TB的数字化节目资源,10TB的节目信息相当于美国国会图书馆全部纸质馆藏数字化转换后的存储总量。媒体信息资源数量之大,由此可见一斑。如何快速有效地进行媒体资源的查询?首先,电子节目指南EPG的视频导航功能不容忽视,电子节目指南EPG也称电子节目单,从数字电视信号码流中提取数据,经过软件分析处理提取出来。为用户提供一个容易使用的、界面友好的、可以快速访问节目的一种方式,还可以通过该功能收看一个或多个频道,以及近期将播放的节目。还可提供分类功能,供浏览和选择各种类型的节目。其次,图像检索在媒体中有着广泛的实际应用。随着现代影像和图像处理技术的深入发展,可供教学和研究使用的图像数量以指数速度膨胀。图像搜索引擎是专门用来查询图形、图像(照片)的搜索引擎。提供分类目录,并提供关键词检索。可以通过分类在网上浏览,或者使用关键词检索相关图片,检索结果是图片及其网站链接。图像检索搜索引擎有:Image Surfer (http://ipix.yahoo.com)、 Excite (http://www.excite.com)、 AltaVista (http://www.altavista.com)、QBIC (http://www.qbic.almaden.com)、WebSEEK (http://www.ctr.columbia.edu/web2seek)、 Mamma (http://www.mamma.com/)等等。再者,专业期刊是研究者必不可缺的学习和研究工具。国外传播学期刊数量大、种类多,查阅国外传播学领域的核心期刊,可利用《国外人文社会科学核心期刊总览》(2004版)、《国外科学技术核心期刊总览》(2004版),《中文核心期刊要目总览》中选入的“新闻学、信息传播、广播电视”类期刊共有15种;属于“出版事业”类的期刊有10种。专业期刊数据库如:中国期刊网、万方数字化期刊、中国科技期刊数据库、中国人民大学书报资料中心复印报刊资料全文数据库等。此外,开放资源的获取也很重要,如综合性新闻传播学术网站、新闻传播教育机构和研究机构网站、新闻传播管理机构和行业组织机构网站、新闻传播专业报刊网站、传媒界个人网站、BBS及电子邮件刊物等。
1.2 数字媒体网站资源分类列举
这里仅就数字媒体网站资源作简单列举,提供学科导航与文献检索应用参考,具体内容与功能容另文进行详细描述。
1.2.1 新闻媒体网络指南
(1)搜狐.媒体导航目录http://www.sogou.com/c004/c004.html
(2)虚拟公共图书馆报纸阅览室http://www.ipl.org/div/news/
(3)英国http://www.Newsnow.co.uk/
(4)加拿大http://www.newshub.com/summary.php
1.2.2新闻媒体数据库
(1)《人民日报》网络版全文数据库http://search.people.com.cn
(2)光明网http://www.gmw.com.cn
(3)中国新闻网http://www.chinanews.com.cn
(4)世界新闻数据库WNC http://wnc.fedworld.gov/
(5)美国Burrelle' s Luce广播电视新闻文稿数据库http://www.burrellesluce.com/
(6)美国CNN http://www.cnn.com/
(7)美国广播公司新闻网http://abcnews.go.com/
(8)纽约时报http://www.nytimes.com
(9)中央电视台音像资料馆http://www.cctvlib.com/
(10)新华社多媒体数据库http://www.info.xinhuanet.com
1.3 数字媒体研究数据库列举
(1)NewsBank世界各国报纸全文库http://infoweb.newsbank.com
(2)EBSCO公司传播学全文数据库http://search.epnet.com
(3)国际表演艺术期刊索引数据库与全文数据库http://iipaft.chadwyck.com/public?XXrequest=/home
(4)国际电影索引数据库http://fii.chadwyck.co.uk/home
(5)美国电影学院电影目录数据库http://afi.chadwyck.co.uk/home
(6)美国哥伦比亚新闻评论网站http://www.cjr.org/
(7)美国新闻博物馆http://www.newseum.org/
(8)传播学期刊文摘http://www.cios.org/
(9)传播文摘http://www.sagepub.co.uk/journals/details/j0162.html
(10)报纸文摘http://www.umi.com/ps-search.shtml
(11)报纸全文数据库Lexis-Nexis/Academic Universe
2 数字媒体知识环境
2.1 元数据
元数据(metadata)是关于数据的组织、数据域及其关系的信息。随着数字媒体的发展,数字视频的应用日益普遍,需求日趋多样化。数字视频信息的元数据研究在不断地深入,形成了许多国际性的合作项目,出现了一些基于不同目标的元数据模式或标准。1996年10月活动图像专家组(MPEG)提出了MPEG-7国际标准,即“多媒体内容描述接口”(Multimedia Content Description Interface),其目标是制定一套标准的描述符合描述方案,用来描述各种类型的多媒体信息及它们之间的关系,以实现快速有效的搜索与过滤。鉴于视频信息的复杂性——包含视觉特征、听觉特征、运动特征、文本特征等等,根据视频元数据的发展现状,有学者指出,在研究和制定元数据标准时,应注意将元数据标准整合在统一的框架之内,在统一的视频元数据框架基础上形成面向不同应用的子集,视频元数据标准应适应MPEG-7标准,采用通用的XML语言语法。任何一种元数据标准都是基于特定领域发展起来的,基于内容的元数据描述呈现多态性。在多种元数据并存的环境下,实现元数据的互操作,做到对用户一致性的服务尤为重要。
2.2 视频信息索引技术
视频信息是最复杂的多媒体信息,依据信息管理原理,信息的组织是信息处理系统中所有技术实现的基础。只有科学有效地组织和构建视频信息索引结构,才能实现快速检索与获取。
视频索引研究内容包括视频信息标引(手工文字标引、自动文字标引、自动视频图像标引等)、视频信息的分类(电视节目的分类、基于视频信息内容的分类等)、视频信息的摘要(分场景分割、场景筛选、关键镜头的选取、截取关键镜头的核心部分、选取镜头段按一定规则排序、按摘要播放时间要求、选择排序在前的镜头段、将选取镜头段按源影片的先后次序排列、组成摘要视频信息等过程)。镜头分割、关键帧的抽取是视频索引的关键技术。
从视频信息用户检索需求的多样性出发,根据MPEG-7的目标要求,在对视频信息进行索引时,应尽可能地从各个层次和侧面进行全方位的描述。视频索引分为外部信息索引和基于内容的索引。
外部信息索引是指基于视频文档外部的、不依赖于其内容的信息索引,用于视频文档的标识和检索,如标题、作者、时间、文档大小、存储格式与编码格式、使用信息(软硬件要求、使用要求、版权等)等等。
基于内容的索引又可以分为结构索引、低层特征索引、中间层对象索引和高层语义索引。结构索引是指节目、场景、镜头、帧之间的层次结构与关系等;低层特征索引是基于视频信息的物理特征信息(如颜色、纹理、运动、音质、音调等)进行索引;中间层的索引是对视频中可识别对象(如时间、地点、人物等)的索引;高层语义索引用于描述视频中包含的事件及相关的感受。
2.3 可视化信息检索
信息可视化是在计算机的辅助下,对抽象数据进行交互式的、可视化的表示,以增强人们的认知能力,信息可视化将隐藏在信息资源内部的、复杂的、抽象的语义以直观的图形或图像的方式呈现,利用人能够快速识别这些可视模式的自然能力,帮助用户更好地接受和理解信息。信息检索可视化是信息可视化技术的一种,其核心是把文献信息、用户提问、各类信息检索模型以及用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形,展示在一个低维的可视化空间中,向用户提供信息检索服务。实际上,可视化信息检索是提供一种可见的语义关系,使提问与检索结果以及检索到的各文献之间的关系可视化,提供一种有效的信息检索和反馈机制。
根据可视化对象、方式、目标的不同,可视化技术可划分为多种类型,其中最基本的可视化技术包括关联更新、广角与聚焦、聚焦加上下文、滤镜技术、空间显示、动态查询与过滤等,现在的可视化检索技术都是以这些技术为基础发展而来的。
3 数字媒体知识资产
3.1 数字媒体知识资产系统功能
数字媒体知识资产系统作为一个知识管理系统,其功能是围绕着显性知识管理、隐性知识管理及两种知识的相互转化而展开的。德国学者罗纳德·迈尔(Ronald Maier)对此作了较全面的总结与分类,包括可扩展的数据获取和导入功能、知识分类机制、强大而灵活的分布式搜索功能、分级权限管理功能、多种发布方式、全面知识展现功能、实时的知识容纳功能、协同工作功能等。
IBM公司媒体资产系统的建设目的,较好地概括了对于资产系统建设的功能要求:最大化资产的价值;减少分类、检索和保管素材的费用;提供跨企业获取的能力,加速制作周期;更好的安全防护,提供授权、水印等;能够更灵活地应对技术和企业业务的发展变化;集中化、统一的媒体资产管理。
面对不断增加的多媒体资源,如何能快速有效地查找到所需的信息,实现已有资源的再利用,是构建媒体资产系统的关键技术问题。灵活、方便、准确的检索功能是系统成功的关键。
主要的检索路径以文本检索为主,通过增加辅助措施,以增加检索的准确性,避免增加从后备归档磁带中反复调阅的操作,从而提高系统性能。
同时充分考虑检索系统完成本地和远程两种不同访问方式时,对网络带宽要求的不同。
基本检索方法有以下几种:①基于关键字;②提供静止关键画面;③提供活动图像。其中,活动图像浏览是认定查找目标的根本方法,也是最终的方法。活动图像浏览是文字检索和关键帧静止图像索引所不能替代的。系统的检索策略是:通过关键字检索,解决查全问题;通过活动图像,解决查准问题。实现节目或素材检索的关键在于标引编目,准确而规范的编目将能提高检索的查准率。编目标准是目前存在的主要问题。
基于文本的检索与基于内容的检索相结合的混合方案,能够兼顾速度和精度两方面的基本要求,是一个可行的检索方案。
3.2 案例研究
3.2.1 CNN的媒体资产系统,于1999年由IBM和Sony公司联合建设,由IBM提供媒体资产管理系统的主体,包括咨询、系统集成服务、数字图书馆软件、MQSeries工作流软件、Tivoli系统管理软件、Lotus Notes以及第三方应用软件等;Sony提供视、音频系统集成和咨询,包括PetaSite海量存储库、DTF磁带驱动器、MPEG-2编解码设备、视音频制作服务器以及传输服务器。
3.2.2 Digital Filmworks——著名的数字影片制作商,专门从事数字影片的后期制作。
系统采用了ADIC公司的CentraVision文件管理系统,可以有效地支持SAN环境中的文件级共享。
3.2.3 Paramount Domestic TV Entertainment Tonight
系统主体采用了IBM公司的内容管理软件Content Manager,包括Virago VideoLogger和AudioLogger,能够处理并对视频磁带读出和编码。可以数据化、分类、存储和检索ET将近20年的视频档案和脚本,并且能够支撑附加的超过10万小时的存储量。
3.2.4 中央电视台新闻共享系统
在规模和技术上均达到了国际领先水平。系统领先之处突出地表现在全系统低码率设计,以及与媒体资产系统无缝连接上。基于归档方式的数据存储管理和自动化编目工具首次在国内实用系统中应用。
3.2.5 浙江传媒学院图书馆多媒体研发中心媒体资产管理系统
该系统基于国家广电总局课题,由浙江传媒学院电子信息学院与图书馆合作研发完成。采用硬盘阵列和数据流磁带存储视听资料,通过数据库技术提供视音频素材的检索,以取代传统录像带存储方式和单机检索环境。系统主要由数据库服务器、数据流磁带库服务器、采集工作站、记录工作站和检索工作站组成。数据库服务器为管理系统提供数据库支持。数据流磁带库服务器在线连接一个或多个数据流磁带库,用于存储视音频素材。采集工作站完成视音频流的上载,压缩为文件,并实时生成一路对应的预览文件。记录工作站负责录入视音频素材数据库信息。检索工作站提供素材的检索、预览和下载。
4 结语
以上主要从数字媒体学科角度来研究其知识管理机制。给出了一个基于数字媒体学科知识集成的知识管理框架,由三层面构成——数字媒体知识库、数字媒体知识环境及数字媒体知识资产。通过文献评述、资源定位研究、元数据研究、信息可视化检索等前沿研究的综合分析,实例列举来实施知识集成、构建有效的知识管理系统,抛砖引玉,以期为数字媒体学科发展提供信息支撑,为数字媒体行业运用提供资源管理的全球视野和理论依据,为图书馆信息管理与知识服务提供典型的个案分析与理论补充。