我国农业信息资源开发利用标准体系架构*,本文主要内容关键词为:开发利用论文,架构论文,我国农业论文,体系论文,标准论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
农业信息资源作为科技创新、科教兴农和农业现代化的一个基本要素,是农业和农村经济发展的一项重要战略资源。自2004年起,中央“一号文件”连续7年强调农业信息化建设,强调“信息强农”的农业发展战略方针。由此,基于互联网络的农业信息资源开发利用,越来越得到各级政府和职能部门的高度重视,全国和地方性的农业网络信息服务平台建设初具规模,发展速度很快。从近年来的理论研究和发展现实情况来看,农业信息资源开发与利用过程中的“最初一公里”、“最后一公里”、资源分散、质量不高、“‘水’多不解渴”等问题依然突出。农业网络信息资源在数据采集、组织加工、质量控制、存储管理、服务应用等方面的标准化、规范化问题,是制约和影响农业信息资源建设质量与服务效果的重要因素。因此,认真研究和分析我国农业信息资源建设存在的问题或不足,实现农业信息资源开发利用体系的标准化、规范化,对于促进农业信息化健康可持续发展具有重要现实意义。
1 现状及其相关研究综述
我国农业信息资源开发利用已经渗透到农业的各个方面,进入网络化、综合化、产业化发展阶段。“十一五”以来,覆盖部、省、地市、县的农业网站群已基本建成,各级农业部门初步搭建了面向农民需求的农业信息服务平台,为农民提供科技、市场、政策等各类信息。据统计[1],目前我国农业网站数量已达3.1万多家,其中政府建立的有4000多家。农业部相继建设了农业政策法规、农村经济统计、农业科技与人才、农产品价格等60多个行业数据库。通过对现有相关研究及应用实践的调查分析,更多的研究成果突出反映了目前我国农业信息资源开发利用的主要矛盾和问题[1-3]:(1)农业信息网站建设初具规模,但总体质量水平不高。信息资源规模小,缺乏时效性、准确性和权威性,辐射带动能力弱;(2)信息资源建设条块分割,各行其道、资源分散、内容重复,缺乏统一的开发整合规划,信息集成共享程度低;(3)信息形式单一,缺乏深层次挖掘与开发,分类组织标准不统一,服务农业产业发展的功能弱;(4)资源建设政策体制、宏观管理和调控机制不够健全,缺乏系统性的资源建设标准与规范,导致农业信息资源重建轻管、重建轻用、建设无序,资源质量与服务效果不够理想。
此外,具有代表性的相关研究成果有:吴建寨[3]等运用辩证思维、系统理论对农业信息资源开发利用理论进行了论述,提出了农业信息资源开发利用的具体措施。孙艳玲[4-6]主持的国家社科规划项目对农业网站信息资源开发利用效率、评价指标与方法进行了系统性研究。常青、宋立荣[7]等学者提出了农业信息资源开发、共享与利用的相关问题与对策。孟宪学[8]、梁川[9]、周蕾[10]、梅瑞峰[11]等学者对农业信息资源的数据挖掘、资源配置、资源整合、服务模式等问题进行了研究。
综合来看,现有研究更多地关注于农业信息资源建设的现状、存在问题、建设策略、服务利用模式与效率等显性问题,而对于制约或影响农业信息资源开发与利用的关键性、潜在性原因——调控政策与标准化问题少有论述。我国农业信息资源建设与服务缺乏具有实质性调控和指导意义的相关标准与规范,缺乏面向应用的政策法规调控机制,从而导致资源的采集、组织、加工、管理和服务等没有形成相对统一的专业技术标准与应用模式,没有形成科学有效的协作共建体制。
2 农业信息标准化:概念及其研究意义
农业信息资源开发利用标准化(简称“农业信息标准化”),就是对农业信息活动的各个环节实行标准化管理,将信息获取(内容和方法)、传递、存储、分析和利用等不同活动阶段有效地衔接,从而切实有效地开发和利用农业信息资源,提高资源使用效率,扩大资源共享范围[12]。郭新宇[13]等学者在对农业信息标准化进行定义时表示:广义的农业信息标准化是指对农业信息及信息技术领域内最基础、最通用、最有规律性、最值得推广和最需要共同遵守的重复性事物和概念,通过制定、发布和实施标准化,以便在一定范围内达到某种统一或一致,这种统一或一致是推广和普及信息技术和实行信息资源共享的先决条件,将有利于农业信息资源得到较好开发利用和农业信息产业的形成;狭义的农业信息标准化指农业信息生产、管理与传播利用过程的标准化。
从20世纪80年代开始,发达国家和国际科学组织就开始重视和加强信息资源采集、管理、发布与服务的标准化工作。各国根据本国农业发展情况,积极研究适于农业科研生产对应信息标准时,也实时地发布相关的标准规范[12]。例如:联合国为了描述和发现农业信息资源,在2000年发布了元数据标准,即农业元数据元素集(AgMEs);为了提高农业系统之间的互操作性编制了农业本体服务(AOS);为促进信息分享,协调农业信息系统管理的方法、标准和应用,克服因资源专利和不同数据模式而产生问题进行的农业信息管理标准(AIMS)行动;通过国际农业科技信息系统(AGRIS)的系统交流及传播的元数据规格的AGRIS应用纲要等。
农业信息资源标准化是国家农业信息化建设中最重要的基础工程之一。标准规范建设是信息资源开发利用的基础,尤其是现代网络信息技术环境下,涉农网站、农业数据库、涉农服务平台等信息资源建设应遵循信息加工、资源描述、资源组织、资源互操作和用户服务等方面的标准与规范,遵循信息资源内容编码、著录格式、数据采集、标识格式等标准与规范,从而保证所建立的资源或服务具有:(1)高可用性,即能够在广泛的网络环境和不同的技术条件下为用户方便、有效地使用;(2)互操作性,即能够避免信息资源重复建设和低水平重复开发,消除“信息孤岛”,实现不同系统环境下的数据共享与整合,为用户提供逻辑上的集成服务;(3)可扩展性,即能够兼容未来发展变化的技术与运行环境。
3 我国农业信息标准体系建设的原则与思路
3.1 建设原则
根据GB/T1.1-2009《标准化工作导则》,农业信息资源标准的制定应遵循以下原则:
(1)开放性原则。标准制定应以系统工程为指导思想,重视与现有国家或国际标准的一致性或兼容性,尤其在术语、信息采集、存储格式、编码、计量单位等方面要遵照和采用现有的国家或行业相关标准。同时也要考虑网络信息技术与应用的未来发展,使标准体系具有一定技术前瞻性和开放性。
(2)系统化原则。标准体系必须结构清晰、层次分明,形成各层次标准之间、各类别标准之间相互补充、相互促进的有机整体。
(3)模块化原则。每个标准项都是信息资源标准规范体系中的一个逻辑模块,各模块要满足标准体系中的一定纵向层次或横向环节的功能或应用上的互操作要求,不能试图去通过自身的“完善”或“扩充”来解决属于整体或属于其他模块的问题。
(4)实用性原则。标准体系要紧紧围绕农业信息资源开发利用的现实情况、面临的突出问题,既要强调规范统一,又要避免过于教条、限制太死。项目界定既要清晰准确、简明完整,又要突出重点,易于实施。
3.2 建设思路
(1)以总体框架为指引。网络信息资源建设通常以信息生命周期为基础,围绕信息资源的创建、描述、组织、检索、服务和长期保存,建立层次清晰的总体框架[14]。按照这个逻辑框架,一方面便于系统地认识和组织从信息资源创建到服务利用整个进程中的各种标准规范,全面认识标准规范的内容、层次和关系,为网络信息资源建设提供系统化基础性的指导和约束;另一方面有利于标准体系制订的全面性和准确性,体现标准规范的开放性和互操作性,从而保障信息资源及其服务在网络环境和整个生命周期中的长期保存和可持续利用。
(2)面向分布环境,以互操作为核心。我国农业信息资源无论从建设主体、资源类型,还是从资源分布、体系结构上来说,都有极强的复杂性和随意性。制订资源建设标准的最大目的之一,就是促进信息资源开发利用各环节的标准化、规范化,实现不同体系信息资源的共享与整合。因此,建设相应的标准规范,要充分考虑到资源和服务的可使用性、互操作性和可持续性。只有按照整体环境的标准与规范来组织资源、提供服务,才能保证自己系统的可使用性、互操作性和可持续性,才能有效地利用其他资源与服务来提高自己的服务能力和效率。
(3)注重应用,突出实践指导性。首先,标准体系应充分支持信息资源或服务能够在复杂的环境和技术条件下为用户最便捷有效地利用,以最低的成本适应更多层面的应用,允许个性化定制,保证开放扩展,支持应用工作流。其次,标准体系建设应由各建设主体共同参与,突出重点,简单易行,既能适应网络环境下信息与文献领域各项业务工作的发展和需要,注重资源开发利用各环节的业务指导性、实用性和可操作性。第三,应建立标准体系的动态维护机制,以满足农业信息资源开发利用对标准的时效性和动态性需求。通过标准符合性测试、验证工具开发、标准符合性验证评价机制的建立和完善,形成以相关法律和法规为依据,以标准和有关程序为准则,加强标准实施力度。
4 农业信息资源开发利用标准体系框架
按人类信息交流的方式、类型和特点,通常将网络信息资源分为[15]:(1)正式出版信息,指传统意义上的文献信息,往往受到一定的产权保护,信息质量可靠,利用率较高。例如以产品化的商业数据库形式存储管理的电子图书、期刊、报纸、专题文献等。(2)半正式出版信息,又称“灰色”信息,指受到一定产权保护但没有纳入正式出版信息系统中的信息,如政府、各种社团组织、社会企事业单位等机构的政策法规、技术报告、产品描述、设计方案等信息。(3)非正式出版信息,指流动性、随意性较强的,信息量大、信息质量难以保证和控制的动态性信息,如以分散性文件或网页形式存在的各类网站信息、网络虚拟社区信息等。农业网络信息资源同样也可以划分为这三大类型。
正式出版信息由于知识产权、开发专业技术条件等限制,其开发与利用具有明显的产业化特征,数据提供商的信息组织加工、存储管理与检索利用等核心业务,通常遵循基本的行业标准和规范。非正式或半正式出版的信息则具有多元化的资源开发主体,开发人员、技术条件参差不齐,信息的组织加工、存储管理与检索利用等业务模式与质量千差万别。因此,农业信息资源标准体系建设的重点应面向非正式或半正式出版信息。
农业信息资源的开发利用涉及资源的采集、加工、存储、管理、共享与存取利用等各个方面。通过综合考量、归纳分析,农业信息资源标准体系可概括为:数据采集加工标准、信息组织分类标准、信息质量管理标准、网络服务应用标准四个基本维度。标准体系框架如图1所示。
4.1 数据采集加工标准
数据采集加工标准主要涉及数据类型格式标准、资源描述元数据标准、Web数据库应用标准。
(1)数据类型格式标准。数据是信息资源构成的基本元素,涉及“类型”和“格式”两个基本特征。类型是指信息以何种外在形态展现,即我们通常所说的文本、图像、音频、视频、动画、程序软件等。格式是指信息以何种计算机编码与文档形式存储,如文本信息的常见格式包括txt纯文本、htm/xml超文本、pdf文本、office文本等,图像信息包括bmp、gif、jpg、tif、png等格式,音频、视频信息则由于编码、压缩技术标准的不同而有更为多样的数据格式。信息服务应用的软硬件技术环境不同,对于不同类型信息(尤其是音视频信息)对应的数据格式要求有所不同,例如:RM格式的音视频需要用户浏览器安装Real Player插件才能正常播放,基于Web的音视频资料宜采用流媒体格式。不规范的数据格式难以保证基本的用户服务效果。因此,数据格式标准的制定,应根据不同数据类型及其应用环境,以主流或通用格式为基准,兼顾用户环境及技术前瞻性,满足基本的服务应用与交换共享要求。
(2)资源描述元数据标准。元数据(Metadata)最本质、最抽象的定义为:data about data(关于数据的数据),它是一种广泛存在的现象,在许多领域有其具体的定义和应用。在农业信息资源建设实践中,元数据是一组能够唯一的描述和标识一个具体的农业网络信息实体,并能够帮助用户发现和获取相关信息资源对象的数据。元数据通过对信息资源对象进行结构化的描述,能够集成整合各类复杂繁多的信息,帮助最终用户理解信息的内容,提高信息采集和使用的质量。元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具,便于分布的、由多种数字化资源有机构成的信息体系(如网站集群、数字图书馆)之间的资源链接、检索、交换、互操作和整合。
(3)Web数据库应用标准。基于Web数据库的网络信息资源开发与服务应用模式能够轻松实现信息的存储、管理、重组、维护、查询、定制、交换、共享等任务,已成为网络信息资源建设与服务应用的主流模式。创建Web数据库是实现信息资源规范化加工、结构化存储、高效化管理与服务的重要基础。Web数据库设计标准主要包括:数据库系统类型标准、数据库结构设计标准、服务应用接口标准。数据库系统类型标准用于规范网络资源存储所采用的后台数据库管理系统类型,如常用的有Access、SQL Server、MySQL、Oracle等。不同类型的数据库系统,应用成本、运行效率各有差异,具体选用类型需要根据资源建设与服务应用实际情况制订相应的标准。数据库结构设计标准主要规定用于存储不同类型资源的数据表及其逻辑结构、物理结构等。服务应用接口标准主要规定Web与数据库之间可采用的主流接口模式(如cgi、idc、isapi、asp、java-applet等)、不同类型用户访问的安全控制策略、数据共享接口等。
4.2 信息组织分类标准
信息组织分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序,以实现信息资源的有效获取和管理。信息分类的基本方法是线分类法(即层次分类法)和面分类法(即组合分类法)。对于图书、报刊等传统文献信息而言,信息资源的组织分类是以主题词法、分类法(如《中图法》、DDC、LCC)等作为基本标准,对信息的外部特征和内容特征进行揭示和描述,使信息从无序集合转换为有序集合,方便获取利用的过程。而对于以网络(网站)作为传播媒介的信息资源服务体系来说,目前尚无系统化、成熟化的信息分类组织标准或规范。就现实情况来看,几乎所有的信息服务网站或搜索引擎采用自编的分类体系进行信息组织,普遍存在类目划分不合理、概念表述含糊不清、信息著录项目不完整、信息组织编排随意等问题。
网络信息的组织分类主要涉及类目体系设置标准、信息分类编码标准、类目名称术语标准。
(1)类目体系设置标准。农业信息网站建设中,资源的类目或频道设置、类目层次划分,应根据农业信息资源的科学体系以及用户访问资源的思维习惯、行为特点综合考虑,遵循基本的信息组织分类标准框架。例如,按照农业生产的范畴或行业类别,可将信息资源分为种植、畜牧、水产、林业、生产资料、矿产资源、贮藏加工等。类目或频道设置方面,既要体现资源分类体系的相对稳定性和完整性,又要指代意义明确,布局结构清晰,方便用户快速查阅。为此,需要在建立总体资源类目体系的基础上,确定网站资源体系的基本类目或核心类目,其余类目可指定为特色类目或参考类目,各网络站群可根据自身隶属层次及服务应用方向的不同,灵活组织其基本类目和特色类目。网站类目层次设置方面,主页一级类目数量应控制在10个以内,每个一级类目下属二级类目数量宜控制在5个以内,各层类目避免交差重复、涵盖内容或隶属关系混乱。
(2)信息分类编码标准。信息分类编码是指对已分类的信息对象赋予易于计算机和人识别与处理的符号,以便管理和组织信息。在网络农业信息分类中,信息编码的功能是指作为类目信息的代号,用于实现类目和信息记录的定位,建立相关的索引数据库。为了便于信息处理、交换、检索及管理员理解,可采用英文字母与阿拉伯数字相结合的方式对信息进行编码。在符号设计方面,应考虑其容纳范围,如一位英文字母,可编码26项;双位阿拉伯数字,可编码90项。每级类目的编码符号经预先设计后,还应根据实际情况预见性地在同级预留空位号,以利于类目增减及未来的扩展。进行上述合理的编码方案设计,可避免束缚分类体系的发展,以及不合理代码设计带来利用管理的诸多不便[16]。
(3)类目名称术语标准。农业信息术语是农业信息领域最基本、最常用的概念,是信息表达、存储、传递和交流的基础。对农业基础性资源的类目名称进行规范统一,对于用户查找、定位所需信息资源非常重要。类目名称表述不能有太大的随意性,应将专业性和通俗易懂性相结合,语词简明清晰(一般为4字主题短语),概念准确、易于理解、无歧义。类目名称术语标准应参考有关国内外标准、农业词典等权威可靠的资料来确定,并根据实际情况及发展需要进行剔除、修改和增补。
4.3 信息质量管理标准
信息质量的管理与控制是信息资源开发利用工作中非常重要的环节。在开放自由的网络信息环境下,非正式出版信息是农业类信息网站的资源构成主体,因此这类资源是质量管理与控制的重心,具体包括信息内容质量标准和文档编辑质量标准。
(1)信息内容质量标准。目前,专门针对网络农业信息资源的质量审查制度尚未明确,信息的正确性、合理性、实用性、规范性等方面都存在问题或不足。许多农业信息资源建设不结合本地区资源利用实际,网站原创信息少,转载信息多,缺乏专业评审,极易造成以讹传讹的不良后果。信息内容质量反映在信息本身的真实性、准确性、全面性、权威性、实用性等方面,通常以用户使用资源的整体满意度调查、评审主观感知、查看数据采集来源标引信息等方式进行评判。真实性和准确性反映信息内容是否客观正确、合理有效,是否符合标题涵盖的范围、是否有超出、有无知识性错误、能否反映事实真相及数据是否处于有效期。全面性反映信息的深度和广度,深度主要指反映某主题信息的详细程度,广度则是指反映某主题涉及本领域及相关领域的范围。权威性反映信息来源是否可靠。实用性反映信息对于用户是否具有可利用价值,是否能够帮助用户解决实际问题。
(2)文档编辑质量标准。文档编辑质量反映在文档所含信息内容是否符合通行的字符编码、特殊符号编码标准,是否遵循通行的网页结构语言(htm/xml)、文档对象模型(DOM)及CSS样式标准,是否兼容主流的Web浏览软件或移动阅读平台等。例如:①字符编码标准化。字符编码要求遵循ISO/IEC10646/UNI-CODE国际普遍标准,文本信息中的汉字宜采用较常用的GB码统一编码和存储,英文字母和符号使用ASCII编码和存储。③特殊信息编码标准化。主要指信息对象中数学符号和公式、化学符号、地理坐标等。对于公式符号的标准参照GB3100~3102-93《量和单位》的有关规定。地理符号坐标则参照GB/T16861-1997《地理点位置的纬度、经度和高程的标准表示法》中的规定。③文档内容编排标准化。如超文本页面所涉及的正文字形、字号、行距、URL链接等是否符合互联网普遍采用的格式或标准,是否应用了CSS样式表格式化网页,是否存在内嵌广告、调用插件等。
4.4 网络服务应用标准
网络服务应用标准用于规范采集加工后的信息资源最终以什么样的屏幕视图格式和技术服务模式向用户提供服务,主要应包括网站设计标准、数据更新维护标准、用户访问标准、数据共享交换标准。
(1)网站设计标准。农业信息网站栏目设置过于具体繁杂、结构层次或访问导航不清晰、站内搜索功能缺失、信息浏览显示款项不完整等问题容易给用户访问造成一定的困难或障碍。因此,很有必要从网站的结构化设计、栏目导航设计、站内搜索设计、信息内容整合与屏幕输出视图设计等方面制订基本的网站设计标准与规范。同时,为保证不同类型终端设备能够便捷顺畅地访问资源,网站的文档结构类型、网页编程语言、音视频媒体服务应用也需要以主流应用类型为基础,数据与图像格式、播放模式等应遵循相对统一的服务应用标准与规范。
(2)数据更新维护标准。一些农业信息服务网站资源更新很不及时,或者网站建成后很少有内容更新,无效链接太多,适合本地特色的实用性资源太少,网络转载或简单复制资源太多,文本类信息太多,图像视频类信息太少等等,这些都会严重挫伤用户访问网站的信心和热情。因此,有必要对资源建设与管理维护工作制订基本的控制标准或规范。例如,根据资源建设主体隶属级别以及网络系统服务范围和层次,对特定类型或栏目的资源更新间隔时间及信息更新量拟定相应的参考标准,并通过系统记录相应的更新日期。
(3)用户访问标准。农业信息网站在提供用户访问过程中通常会涉及以下情况:①受知识产权保护信息资源的版权声明、访问权限控制策略;②电子书籍、音视频等特殊类资源是否提供用户自由下载;③用户能否根据自身实际需要,自由定制某些特定类型的资源,以实现手机等移动设备方便快捷地获取更新的信息资源;④农业资源网站或服务平台是否提供面向移动终端用户的最简化访问支持;⑤为便于调查统计资源利用效率,是否针对网站和栏目内容设置了访问流量统计。这些与用户访问有关的问题需要通过制定相应的标准与规范,对网站建设及用户访问的具体细节进行明确和统一。
(4)数据共享交换标准。为实现资源的集成整合,需要建立跨系统、跨部门的农业数字信息资源共建、共享联合体,数据共享交换体系建设是很好的解决方案。为使不同的信息系统间能够交换和共享数据,需要从以下五个方面对交换信息予以规范[17]:①用户信息规范。明确用户信息构成、表示顺序、字段数,为内部各应用系统用户信息同步奠定基础;②授权管理规范。明确授权各应用系统授权应遵循的规则,为信息交换与信息共享奠定安全基础;③业务交换规则。明确业务之间交换术语、表示方式、信息格式等内容;④信息交换规则。信息标准组织方式上,采用XML语言作为信息描述的载体,以XML格式文件作为系统之间信息交换媒介;⑤交换格式转换规则。设计统一信息传输格式及交换方式,方便各系统的信息格式转换与信息识别,为应用系统之间的自由交换奠定基础。
标签:数据标准化论文; 组织环境论文; 农业类型论文; 分类数据论文; 信息存储论文; 农业发展论文; 互联网农业论文; 信息加工论文; 编码转换论文; 网站架构论文; 服务标准化论文;