网络多媒体信息检索分析_信息检索论文

网络多媒体信息检索分析_信息检索论文

因特网多媒体信息检索探析,本文主要内容关键词为:探析论文,因特网论文,信息检索论文,多媒体论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号]G354.47

1 引言

因特网从产生到发展,一直牵动着全球关注的目光,它以信息生产、传递和利用为依托,促进了全球经济的繁荣和发展。在网络信息中,多媒体信息极为典型,因为它打破了语言的障碍,克服了信息交流长期以来依赖单一的文本形式的缺陷(如难以理解、不准确、呆板等),满足了人类最朴实的信息交流需求。与一般的文本信息相比,多媒体信息不仅直观、形象、内容丰富,而且在某种程度上相当于实物信息。例如,科研人员可能从一段实验过程的视频信息中挖掘出科学原理或理论,技术人员可能从一条产品生产线的视频信息中琢磨出加工、制作的技术和诀窍,艺术工作者可能从一个图像或一段音频信息中透视出美学思想……这些信息满足了各种类型和层次用户的需要,是单一的文本信息所无法替代的。

因特网上的多媒体信息包括文本、图形、图像、视频、音频等形式。随着这类信息的迅速膨胀,信息生产与利用之间的矛盾日益突出,人们非常迫切地希望能拥有新型的信息检索技术。在这种情况下,因特网多媒体信息检索技术逐渐成为各国研究的重点课题。

2 多媒体信息检索的基本方式

信息检索服务的基本任务是根据用户的需求提供相关信息并最大限度地满足用户的需求。在很多情况下,用户或者由于缺乏专业的知识而无法表达自己的需求,或者由于不了解检索系统而不能提出更细致的要求,而且,对于检索结果的相关性,也难以做出正确的判断,因此,有关这方面的研究,焦点主要集中在如何提高效率上。目前,人们已经研制成功了基于文本(text-based)方式和基于内容(contet-based)特征的两种多媒体信息检索方式。

2.1 基于文本方式的多媒体信息检索技术

由于计算机技术及其他相关技术的制约,早期的多媒体信息检索是基于文本方式的。当因特网逐渐发展起来后,这种技术被直接引入到因特网的多媒体信息检索领域。这种方式的基本做法是:首先对多媒体进行人工分析和抽取反映该多媒体物理特征和内容特征的关键词,然后对这些关键词进行文字著录或标引,建立类似于文本文献的标引著录数据库,从而将多媒体信息检索转变成对上述关键词的检索。在这种检索方式中,多媒体信息与数据库中的特定字段(如VFP中的通用字段、ACCESS中的OLE对象等)建立链接,从而可以通过检索这些数据库中的文本关键字段来获取多媒体信息。这是目前组织多媒体信息的常用方法,其检索关键字段主要有:①文件扩展名,如图像文件常以gif、jpg作为扩展名,影像文件以mpeg、avi等作为扩展名,声音文件常用Wav等作为扩展名;②多媒体标题和文字解说;③其他检索关键字段,如某些Web页的页标题、由人工选择或指定的某些标引多媒体信息内容的关键词等。

2.2 基于内容特征的多媒体信息检索技术

基于文本方式的多媒体信息检索不仅缺乏直观性,而且还有一定的主观性,因此无法充分揭示多媒体信息的内涵,从而影响检索效果。基于内容特征的多媒体信息检索正是为克服这一缺陷而产生的,其主要依据是图像画面、声音和影像的内容特征。其中,图像画面的内容特征主要包括颜色(如不同色彩之间的比例、主体与背景颜色)、纹理(如木纹、布纹)、形状(如某产品的轮廓)、结构(如目标的空间位置关系);声音的内容特征主要包括音频、响度、频宽、音色和节奏;影像的内容特征主要包括对象运动特征(如某生产流程线上产品的制作过程)、颜色和光线的变化等。在组织多媒体信息时,组织者根据媒体的上述内容特征进行分析,建立基于内容特征的标引信息,将其存储在特征信息索引库中,并与实际多媒体数据联系起来。当用户检索时,系统一方面接受用户规定的图像画面、声音和影像的内容特征信息(即用户的检索提问),另一方面接受特征信息索引库中的特征信息,然后进行两者之间的区配,以找出符合用户需求的多媒体信息。这一过程与一般的信息检索在本质上是相似的。

3 因特网多媒体信息检索实例研究

因特网上有很多搜索引擎都具有多媒体信息检索功能。在上述两种信息检索方式中,基于文本方式的多媒体信息检索应用得较广且较成熟,如Alta Vista、HotBot、Image Surfer等有影响的搜索引擎都采用这种方式。基于内容特征的多媒体信息检索目前尚处于试验和兴起阶段,主要以静态图像为主,而动态图像比较罕见。另一方面,多媒体信息是一种宝贵的资源,但人们对它的组织和利用目前还不够充分。例如,很多现存的多媒体信息,包括通过太空望远镜拍下的宇宙图像、显微镜下生命微妙探究中的分子结构、高尖医学手术的视频记录等,对它们的组织和检索对于科学研究与应用有着非常重要的指导作用,而这方面的数据库建设几乎是空白。至于网络上的多媒体信息检索,大多仍停留在艺术、娱乐等方面。下面简要介绍几个典型的网络多媒体信息检索实例。

3.1 Image Surfer(http://ipix.yahoo.com)

Image Surfer是Yahoo!公司提供的基于文本方式进行图像检索的多媒体信息检索服务,其主页列有“艺术”、“娱乐”、“人物”、“休闲”、“科学”、“运输工具”等大类及相关子类。Image Surfer采用关键词进行检索,并具有自动截词检索功能。例如,当输入关键词“child”,检索结果(与child和children有关)就会以略图形式列出,每条结果给出图像标题,点击图像就可链接到相关的图像文件。

3.2 Excite(http://www.excite.com)

Excite采用文本方式进行多媒体信息检索。用户可检索视频和音频信息,并能对全部、AVI、MIDI、MPEG/MP3、Real、QuickTime、WAV、其他等媒体格式进行选择,然后通过关键词进行检索,每条检索结果除了可进行相关的超级链接外,还提供有关该结果的简单说明。

3.3 Alta Vista(http://www.altavista.com)

在Alta Vista的多媒体信息检索页,用户可对图像、MP3/Audio、视频等进行选择检索,并可对检索结果、来源进行限定。

3.4 QBIC(http://www.qbic.almaden.com)

QBIC(Query by Image Content)是IBM Almaden研究中心于20世纪90年代研制的,可支持因特网上的图像和动态影像的基于内容的检索。用户可从IBM软件下载站点下载QBIC软件包(免费使用90天),下载软件包括图像索引和搜索引擎、网络前端、API(用以将QBIC嵌入到其他应用程序或扩展QBIC新的检索功能)和图样集。如果用户想利用QBIC技术开发自己的系统,可在下载后安装到本机上,并按照自己的意愿建立一个初始工作模型,最后发送Email到tedl@admaden.obm.com以获取QBIC开发光盘和OEM注册。因此,用户只需花少量的钱便可查阅到IBM的QBIC专利技术。另外,QBIC提供多个图像数据库供检索实验,如美国1995年以前发行的邮票图案、世界著名商标、旧金山美术博物馆图像数据库、法国文化部图像数据库、美国加州大学戴维斯分校艺术和艺术史图像资料。QBIC建立较早,技术成熟,功能全面,为基于内容特征的图像检索技术的验证和推广做过很大贡献。QBIC系统提供了多种检索方式,包括:①利用标准范图进行检索;②绘制简图或扫描输入图像进行检索;③选择色彩或结构进行检索;④输入动态影像片断和前景中运动的对象进行检索。在用户输入简图、图像或影像片段时,QBIC对输入的图像进行色彩、纹理、运动变化等特征的分析和抽取,然后根据用户选择的查询方式分别进行不同的处理。同一图像采用不同的检索方式得到的结果常常存在较大的差异,这种差异是由对不同检索方式进行不同的特征分析和抽取所造成的。下面以QBIC美国发行的邮票图案为例进行分析。

QBIC能够按用户要求的颜色比例、用户图案和性能特征进行检索。用户在提出颜色比例时,先在绘图区域用鼠标点击出你所希望尺寸的矩形(占整个区域的百分比),所有新区域开始都为白色,用户可在颜色区选取所希望的颜色进行填充(或直接在文本框填入RGB值)。按照同样步骤操作,可选取其他颜色区域,用户最多可选择5种颜色,并可调整某个区域的颜色或改变其尺寸大小。用户可选择关键词以缩小检索范围。每个检索结果上都有I、C、L、T和S几个字母,点击I可获取该图的有关信息,如面值、文本、年代和全图,点击C可检索与该图有相同颜色比例的其他邮票,点击L可检索与该图有相同图案结构的其他邮票,点击T可检索与该图有相同纹理的其他邮票,点击S可检索特别杂合颜色的邮票。

以图案草图进行检索,较之以颜色比例进行检索,有以下几点更值得注意:第一,用户每次必须在背景上绘制新的矩形区域,然后将它移动到自己所希望的地方(如另外一已绘制好的区域)。第二,对任一矩形区域,用户可进行改变颜色、移位、删除、前置(放在其他所有矩形区域的前面)、后置(放在其他所有矩形区域的后面)等修改。第三,每个选定区域的性能值显示在底部,R表示矩形,第一对数值代表区域左上角的坐标值,第二对数值代表该区域的尺寸值,第三对数值代表RGB值。另外,性能特征允许用户根据邮票面值区域值和某年代(或某年代区域)值进行检索。

3.5 WebSEEK(http://www.ctr.columbia.edu/webseek)

WebSEEK的信息来源是万维网上的图像和影像,因而是真正意义上的因特网多媒体信息检索工具。目前,WebSEEK已从万维网上搜集了65万多幅图像和影像,并从分类、文本方式和内容特征3个方面对其进行了标引和整理,用户可从这3个方面对图像和影像进行检索。其中,基于内容特征的图像检索允许用户从图像的颜色、纹理、色彩构成等方面检索图像信息,并运用形状识别和相似性计算等方法,为用户提供更多的相关信息。系统还提供了包括动物、建筑、艺术、地理等46个主题的主题分类检索,用户可根据兴趣逐层浏览。检索结果以略图形式出现,点击略图可获得实际图像。

收稿日期:2000-10-17

标签:;  ;  ;  ;  ;  

网络多媒体信息检索分析_信息检索论文
下载Doc文档

猜你喜欢