数字资源发布网站质量控制原则研究,本文主要内容关键词为:质量控制论文,原则论文,数字论文,资源论文,网站论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[分类号]G250.76
信息资源数字化是一项比较复杂的系统工程,数字资源发布是其生命周期的最后一个环节,也是面向用户提供服务的重要窗口。发布的媒介是网站。因此,数字资源发布网站的质量将直接影响用户服务的水平,进而影响整个数字化项目目标的实现。
数字资源发布网站的质量控制原则有[1]:透明性原则、有效性原则、维护性原则、可访问性原则、用户中心原则、应答性原则、互操作性原则、产权保护原则和长期保存原则等。
1 透明性原则
透明性原则是指网站能够清晰地表达构建者的目的,并具有明显的可识别特征,具体体现在:
1.1 网站内容表达的清晰性
因特网上有数以亿计的网站,即使采用非常优秀的搜索引擎,检索结果也往往成百上千。内容表达清晰的网站有助于用户快速判断其相关性,降低不确定性。衡量“快速判断”的标准是,用户在无任何导航指引下,就应知晓网站的内容和拥有者以及网站是否包含用户真正需要的信息。实现“快速判断”的基本方法是,网站首页必须拥有关键识别信息,最理想的情况是这些关键识别信息出现在网站名称之中,最糟糕的情况是这些关键识别信息需用户点击—个超链后弹出。因此,数字资源发布网站的名称应该避免使用那些容易让人联想的成分,因为“联想”会带来误导,从而降低网站的透明度。
1.2 网址的可识别性
一般来讲,IP的可识别性很差,那些仅体现机构部门而不体现网站内容的URL的可识别性也不高,反映网站内容的网络实名的可识别性相对较高。所以,投资注册一个实名是增加网站透明性的理想选择。
1.3 网站宗旨陈述的简洁性
网站宗旨陈述的目的在于对其主题和重要内容进行描述,而不是对网站进行促销。简洁的网站宗旨陈述一般要控制在50个字之内,且尽可能采用多语种对照。有时,为了增加网站的生动性,在首页上使用图片等非文字材料,简单点击后弹出网站宗旨描述页面,这种方式对网站透明性具有负面作用。如果这种方式的使用不可避免,那么,应该提供一种跨过主页直接进入网站宗旨陈述信息页面的简单链接。
2 有效性原则
有效性原则是指对收藏的文献资源进行选择、数字化加工与发布,以方便用户有效利用。其核心在于网站内容,高质量的内容必须是经过精心选择的、与主题相关的、有效的、正确的、配有合适注解和辅助信息的,具体体现在:
2.1 数字化内容选择
数字资源发布网站大多数都是由文化机构创建的,这些机构收藏的信息资源非常丰富。但通常情况下,它们没有足够的资源也没有必要将收藏的所有信息资源都进行数字化,因此,内容选择不可避免。虽然不同数字化项目的选择标准不尽相同,甚至差别很大,但一个良好的选择标准至少应体现5个方面的价值:①用户需求,选择利用率较高的信息资源进行数字化;②目标用户群,选择对用户最有价值的信息资源进行数字化;③数字保存,选择物理载体易碎的信息资源进行数字化;④项目主题,选择与数字化项目主题最相关的信息资源进行数字化;⑤合作机构,在合作型数字化项目中,选择实现合作机构价值的信息资源进行数字化。
2.2 发布内容的准确性
数字资源发布网站同时具有教育和研究功能,发布的内容是所在领域中的重要信息资源,任何错误都会降低网站质量。数字化生产和发布的技术人员通常不具备专业知识背景,因此,内容发布前需要本领域专家对其正确性和准确性进行审查。当然,原始信息本身也会有差错,这就需要在发布前加上注释。
2.3 背景信息的添加
这类网站发布的信息常常是独有的资源,提升其使用价值的有效方法之一是提供背景信息,如出处、相关历史事件、同一机构或其他机构中相关信息资源的链接和参考文献等。
2.4 展现方式的合理性
虽然展现方式的选择具有很大程度的主观性,但一些基本原则有助于提高网站的有效性,包括:图片应有清晰标注;图片与注释信息之间的关系应清晰、准确;所有内部和外部链接都应有效,不产生死链;图片的显示分辨率应合适,高分辨率图片要确保知识产权;大幅图片应使用低分辨率的图标,同时提供下载大幅图片的链接等。
2.5 导航的合理性
导航是一个宽泛的主题,但在数字资源发布网站中,导航的设计应遵循的基本规则有:避免用户访问出现迷航;可清晰地显示用户所在位置;提供返回最近访问页面的方式;提供页面内导航;避免使用滚动条;提供站内搜索;提供网站结构示意图等。
3 维护性原则
维护性原则是指网站应及时更新,以确保网站内容的时效性。其体现在:
3.1 技术维护
网站设计技术必须与技术更新步伐相一致,确保因特网环境下网站的可访问性。技术维护要求对过时网站进行备份,并采用新技术以发挥网站平台的性能。
3.2 过时信息存档
数字资源发布网站也存在一些时间敏感性信息,如主页上设计的最新动态、最新进展等栏目。这些信息一旦过时,就要及时存档,方便日后访问。过时信息的停留会对用户访问产生负面影响。
3.3 静态信息刷新
数字资源发布网站中,静态信息常常占很大比例。为了吸引用户,这类信息也应周期性地(即使几个月一次)进行外观维护。由于这类维护常常被忽视,因此,应作为网站管理计划中一个有机组成部分加以实施。
4 可访问性原则
可访问性原则是指网站必须对所有用户都是可访问的,无论用户采用什么技术,也不管他们的身体状况存在有哪些访问障碍。其体现在:
4.1 访问技术的保障性
数字资源常常是社会文化遗产的重要组成部分,任何公民都有访问的权利,包括各类存在访问障碍的用户,如视力障碍、听力障碍、神经障碍和肢体活动障碍等。技术进步已使这个特殊群体的用户访问成为现实,适合他们访问的新型界面设备可代替传统的“浏览器—鼠标—键盘”标准访问模式,盲人屏幕与键盘以及相应的软件可以浏览Web页面。实现可访问性原则的核心是网站设计要提供这些设备的访问接口。这类接口的设计要遵循可访问性的国际标准,如W3C的Web可访问计划指南(WAI)[2]。另外,也可采用一些工具,将正常网站界面自动转化为适应特殊用户访问的其他类型界面。目前这类工具有很多,在W3C网站中[3] 有一个清单,可供下载测试与试用。
4.2 网站所有内容的可访问性
这些内容不仅包括当前的,而且也包括已经过时的;不仅包括静态的,而且也包括动态的。这就要求对过时内容进行存档,并提供访问链接。
4.3 支持网站浏览技术的多样性
用户访问网站所用的浏览器可能有多种,如IE、Mozilla、Netscape和Opera等,用户访问的终端平台可能多样,访问终端与因特网的连接方式也可能存在差异,数字资源发布网站的设计应支持用户的各种访问技术,避免使用专用技术,提醒用户慎用安装插件。
5 用户中心原则
用户中心原则是指网站设计与维护必须考虑用户需求,并通过网站评估和信息反馈等方式收集用户意见和建议,确保网站的有用性、易用性和对用户的吸引性。其体现在:
5.1 网站的用户保障
选择有代表性的用户全程参与网站生命周期每个阶段(包括网站规划、设计、实施与测试等)的运作,这将有助于网站实施的针对性,问卷调查和用户访谈等咨询形式有助于摸清用户的真正需求和对网站的期望值所在。与因特网上普通网站相比,数字资源发布网站大多具有很强的专业性,包含大量相应领域知识,如专业术语和专业方法等,因此,在影响用户使用较大的方面广泛征询意见尤其重要。
5.2 用户使用效果的反馈
在正常运行过程中,网站应提供用户意见的反馈机制,反馈方式可以是在线问卷调查,也可以是自由评论。
5.3 内容的可添加性
网站应该充分利用交互性,在严格的用户身份验证基础上,提供用户添加内容或对已有内容添加链接的功能。通常情况下,用户添加内容和链接具有很强的独特性和吸引力。但这种功能要应用适度,否则会适得其反。
6 应答性原则
应答性原则是指用户应能与网站直接交流,并对所提问题和建议能够收到合适的回应。比较理想的情况是,这种回应安排在一个开放的论坛中,以便用户之间相互交流,相互学习。其体现在:
6.1 网站的交互能力
交互机制的设置可使用户提出问题,共享理念。这类网站的主要功能在于教育和研究,因此,用户所遇到的问题比一般网站要多,需要相互交流和专家帮助的期望值也高,交流的价值也大。
6.2 网站的咨询能力
网站要有固定的咨询人员,且拥有时间和资源来回答用户提问、管理用户论坛和提供用户在线交互。这类咨询人员应具备本领域的专业知识,甚至要与本领域的专家保持密切联系,需要时能够及时获得帮助。
6.3 网站内容管理方针的制定
数字资源发布网站具有很高的文化和学术水准,有的甚至代表一个国家、一个地区的文化形象,其发布内容必须根据有关规定进行审查。所以,必须制定相应的管理措施,使得用户对网站内容的编辑功能限定在合适层面,并对增加的内容进行严格的审查。
7 互操作性原则
互操作性原则是指该网站与其他文化网站之间相互访问的能力。互操作的实现将有助于用户在更广范围内查找所需信息。其体现在:
7.1 元数据的标准化
互操作的实质是网站之间实现信息共享。采用相同或相似的数据模型和元数据描述元素集合对实现互操作至关重要;目前W3C已针对不同领域推荐了相应的元数据标准。
7.2 网站设计技术的标准化
网站的设计和展示形式要采用先进的标准化的技术,也要避免使用标准Web技术以外的专用工具,还要避免用户使用网站时下载和安装额外插件。
7.3 元数据收割
网站发布数字资源的元数据应支持OAI元数据收割。这类元数据不仅包括对单件数字资源进行描述的元数据,也包括对数字资源集合进行描述的元数据。
7.4 网站的可被发现性
作为一个整体,数字资源发布网站无论是对人工搜索工具还是对自动搜索工具(如搜索引擎)都必须是开放的。为此,网站的描述应该采用W3C推荐的RSLP数据资源集合描述元数据框架和DC网页描述标准,并在网页的META标记中内嵌这两种类型的元数据。如果所在专业领域中已存在网站目录,还应为网站目录提供所需的元数据描述。
7.5 分布式检索
分布式检索有两个层面:站点本身的分布式检索和站点数据库的分布式检索。前者可通过META标记实现,后者则需要Z39.50协议或SRW/SRU的Web服务界面。
8 产权保护原则
产权保护原则是有关网站使用过程中涉及的伦理和法律因素,包括网站发布内容的知识产权管理与用户个人隐私的保护两个方面。其体现于:
8.1 发布内容拥有者的产权保护
在很多情况下,网站拥有者并不拥有所发布内容的产权,这在一个发布多个文化机构数字资源的整合型网站中尤其突出。因此,保护内容持有者的产权有时意味着保护网站拥有者的产权,但更多情况下是保护第三方的产权。这里的产权不仅涉及著作权,而且还涉及未经授权对站点图像的复制及使用。
8.2 网站构建者的产权保护
网站构建者常常拥有网站结构的产权和新建数据库的创建产权,尽管数据库的内容可能归第三方所有或属公共领域的信息。因此,严禁整个数据库复制,设置用户访问条件。
8.3 网站拥有者对发布内容侵权的防止
任何网站都要合法,如果所发布内容的产权归第三方所有,那么,就必须签署正式的法律合同,以确保内容发布的合法化,并应在网站主页上清晰地陈述用户使用条款。
8.4 用户个人隐私的保护
如果用户访问网站内容时需要注册,那么这些注册信息(如姓名、地址等)有的属于个人隐私,网站必须予以保护。应在网站主页上清楚地陈述用户个人隐私的保护方针,并尽可能少地获取和维护用户个人信息。
8.5 网站内容下载的合法性
教育功能是数字资源发布网站的重要功能之一,为了教育的目的,网站内容可以免费下载使用,但严禁用于任何商业目的。网站用户要严格遵守国际许可框架《创新共同许可协议》[4],确保非商业性的、以教育为目的的信息资源下载使用。
9 长期保存原则
长期保存原则是指采取一定的保存策略和标准确保网站和其内容能被用户长期访问。所有网站面临的一个非常现实且充满风险的因素是技术快速变革,使目前用于网站设计的主流技术很有可能在不太久的将来被淘汰,导致的结果是网站将无法访问。这对数字资源发布网站的影响尤显重大,因为这类网站肩负着文化遗产长期保存的使命。其体现在:
9.1 网站构建选用标准的技术和方法
虽然未来采用的技术和方法具有难以预测性,但纵观技术的发展轨迹,几乎可以得出的结论是:未来的支撑技术大都基于当前的主流技术和标准技术。因此,网站的设计与实现应尽可能地选择使用标准技术,包括数据模型、文件格式、展示技术和存储介质等。相对于互操作原则是关于现行网站之间的相互访问来说,长期保存原则可以理解为现实与未来系统之间的互操作。
9.2 保存技术和方法的制定与实施
保存技术和方法的制定与实施包括:①网站数据的备份与恢复;②灾难性恢复计划,用于处理火灾、涝灾及地震等不可抗拒因素导致的数据不可逆转的损坏;③高质量存储介质的选用;④网站内容的Web存档,这要考虑知识产权许可;⑤存档介质的定期检查与测试;⑥存储介质的迁移等。
9.3 长期保存策略的制定
目前常用的长期保存策略有数字迁移和数字仿真。根据网站的性质,选择保存策略,并对所选策略的风险进行评估。
10 网站生命周期的质量控制分析
数字资源发布网站是文化遗产网站的重要组成部分,担负着文化遗产的长期保存和用户服务的重要使命。与一般网站相比,该类网站更重视数字资源的生产、存储与使用。根据一般网站的开发过程,结合这类网站的特点,其生命周期可划分为下述几个主要阶段:
10.1 网站规划
网站规划包括:确立网站理念,识别目标用户群,建立服务宗旨,确定发布的数字资源类型,制定用户个人隐私保护和网站数字资源长期存取的方针等。
10.2 网站设计
网站设计包括:确定网站服务方式,构建网站内各级网页的展示体系,选择网站技术平台等。
10.3 数字化内容选择
应根据文献资源状况、目标用户群和网站规划等因素,制定数字化内容选择标准,并依据此标准选择要进行数字化的文献资源。
10.4 数字化生产
将选出的文献资源进行数字扫描和加工,生产数字主文档,并为数字主文档图像加注说明信息。
10.5 数字图像保存
数字图像保存包括:数字主文档数据库的建立,各种图像副本(如用于Web发布的图像副本)的生成与存储。
10.6 元数据抓取
用于描述数字主文档图像的元数据析出,元数据与主文档图像之间链接的建立,元数据数据库的设计等。
10.7 网站制作
它的具体内容有:制作技术的选择,数字化主文档存取副本数据库与元数据数据库的访问与浏览界面的设计与测试,网站整体的测试、修改与完善等。
10.8 网站发布
网站发布包括:Web服务器的连接,网站上传等。
10.9 网站的维护与更新
依据网站内容时效、用户反馈和建议等,对网站实施维护与更新。
根据Minerva(欧盟文化与科学信息资源数字化部长级网络)的调查与分析[5],上述9项质量控制原则在数字资源发布网站生命周期的各个阶段影响不同,表1列出了影响程度的权值分布,“★”号的数量表示影响程度的大小。
表1 网站生命周期中不同阶段对应的质量控制原则重要性分布
质量是网站的关键特征,数字资源发布网站尤其如此。因为这类网站发布的内容是信息资源数字化的产品,业已实施的数字化项目大都集中在文化遗产领域(如美国国会图书馆的“American Memory”和欧盟的“欧洲文化遗产数字化项目”等,文化遗产网站的重要功能在于教育和研究,而这两项功能的实现都视质量为重点。网站的质量必须在一开始就要规划。在众多影响因素中,用户是核心,因为这个因素涉及到了网站生命周期的每一个阶段。如果规划合理,且有现成的标准和良好的实践可供参考,那么,构建一个高质量的网站并不比构建一个低质量的网站更困难、成本更高、效率更低。
收稿日期:2006—04—03 修回日期:2006—04—15 本文起止页码64—67,109
标签:元数据论文;