电子文件分类方案的设计与实现,本文主要内容关键词为:文件论文,方案论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号:G272 科学的分类方案是对电子文件实施前端控制的前提和关键,亦是电子文件智能管理的核心。从大数据环境下知识组织的需求来看,电子文件分类方案若一成不变地沿用传统纸质文件的一维分类,是无法适应社会实践发展需要的。考虑到电子文件分类手段、过程、时机等与纸质文件分类的差异性,以及电子文件分类方案应用方式、应用对象、表述要求和功能与传统载体文件分类方案的区别,建立一个集实体分类、信息分类、自动鉴定、处置、整理于一体的多功能电子文件分类方案已成为必然要求。由于电子文件分类方案、保管期限表和处置表的相互关联性较强,在电子文件集成管理的背景(即系统集成、数据集成和服务集成)之下,将电子文件分类方案以及基于此的电子文件保管期限表和电子文件处置表集成起来管理,有助于保持电子文件分类方案、保管期限表和处置表的一致性,有利于提高其维护效率。从国际最佳实践前沿看,电子文件分类与处置方案已成为一个综合性的大纲,包括文件类目标识符、类目名称、存放地点、保管期限和处置指令[1][2][3]。 1 适于电子文件的分类方法 通常纸质文件的分类,在较高层级上根据全宗、时间进行划分,在较低层级上根据文件内容进行划分。电子文件数量快速增长,使得自动分类成为必然的实践需求。由于机器在自然语言理解中的障碍,如果坚持要求计算机软件系统来自动分析文件内容,其准确率是难以得到保障的。于是,职能分类再度引起了人们的重视。 职能是人类社会或政权组织(如国家)赋予一个立档单位的社会功能或主要工作任务。在业务分类体系中,职能处于顶层,是一个组织机构为达成其目标而履行的职责。职能由若干业务活动构成,而业务活动则由具体的事务组成,事务为最小的职能单元。职能作为组织机构为达成其目标而承担的主要职责,常常出现于整个组织机构的职责声明、工作计划和目标之中。在英国、美国和澳大利亚等国的文件管理专家意见调研中,有83%的专家认为“基于职能的分类方法是唯一高效的文件分类方法”[4]。从我国电子文件前端控制的需要来说,基于职能的文件分类方法是电子文件分类的首选方法,即“凡是来源于特定职能活动的文件应归于一类”,由此而形成基于组织机构职能活动的文件分类方案。基于职能的电子文件分类方案是在全宗划分的基础上,依据职能活动对某一个(或某一类)具体立档单位电子文件进行细分。 2 基于集成的电子文件分类方案基本结构 在电子文件管理系统中,通常将电子文件分类方案、保管期限表和电子文件处置表集成在一起,成为电子文件管理实施前端控制的核心,它是普通电子文献转化为电子文件的重要支撑。基于集成的电子文件分类方案由电子文件分类方案、文件保管期限表和文件处置表三个部分组成,其基本结构由分类方案的结构体系决定。 电子文件分类方案是一个类目体系,由总到分、由抽象到具体地逐级揭示事物对象,以规范的类目名称、明确的内涵、外延和适用范围、易于理解的注释和说明帮助实现电子文件的分类。电子文件分类表是电子文件分类方案的主体,一个系统、完整的分类表应将立档单位在全部职能活动中所形成的电子文件按照类目划分、排序,以图表或文字形式表现出来;编制说明中包含编制目的、编制依据、基本分类方法、分类规则、体系结构、类目及其标识符的设置,以及其他需要说明的重要问题;使用说明中主要阐明电子文件分类方案的类目注释、使用方法和适用范围等。 基于此,电子文件分类方案采用的是多层次树形结构,即为组织机构级、职能级、活动级、事务级等层次,具体的层次设置需要结合组织机构电子文件的实际情况而定。职能由具体业务活动实现,而业务活动则由具体事务构成,因而基于职能的电子文件分类方案至少包含职能层、活动层和事务层三个层级。各类目术语以层级显示出来,相关术语链接在一起,职能级术语链接至活动级术语,活动级术语链接至事务级术语,每个层级的术语以一定顺序排列。 3 基于集成的电子文件分类方案构建原则 电子文件分类方案的编制十分复杂,是一项集科学性、技术性、实用性和规范性于一体的工作,实现起来具有一定的难度。鉴于此,基于集成的电子文件分类方案的构建应遵循以下原则: 3.1 科学性原则 主要体现在客观性、逻辑性、系统性和发展性原则上。客观性是指电子文件分类方案中所选列的类目及其排列应符合客观现实,准确地映射人类实践活动,遵循客观规律;逻辑性是指整个分类方案应遵循同一分类标准,类别划分应具有严密的逻辑性;系统性是指全面分析立档单位的职能,充分考虑由此而产生的所有电子文件,建立起完整的电子文件分类体系,系统地反映立档单位的职能活动和还原历史面貌;发展性是指电子文件分类方案应具有较强的包容性、适应性和前瞻性,对事物发展有一定预见性,可根据需要从逻辑和物理两个角度进行扩展和动态更新。 3.2 标准化原则 电子文件分类方案中所使用概念、概念间关系应遵循相应标准,不可随意变更。第一,在时间上具有前后一致性,尤其不能在基本结构和分类标准上频繁变动;第二,具有明确的规则和指南,对不一致性操作进行必要干预;第三,支持电子文件分类方案的模块化,在实现电子文件分类方案、文件保管期限表和处置表模块化的基础上,进一步实现电子文件分类方案的模块化,以利于在更高层面上实现电子文件分类的规范化和标准化。 3.3 便于检索原则 电子文件分类方案,应选用先进的形式化描述语言实现形式化描述,可以融合至电子文件管理系统,以支持电子文件创建、捕获、分类、鉴定和处置的自动化,即智能化管理需求。便于检索原则即从类目名称、标识符、注释等多途径实现电子文件检索,支撑电子文件的密级分类需求,以实现电子文件的安全利用。 3.4 实用性原则 实用性原则一方面指分类方案中的概念体系(职能、活动、事务等术语名称、定义及其相应标识符)应具有规律性、易于理解,所使用的物理或逻辑结构简洁明晰,支持电子文件分类方案的可视化,以多维视角展示类目之间的关联,可提供直观的导航,帮助业务工作人员选定类目。另一方面指通用性与针对性的适度,即强调同类型立档单位电子文件分类方案共性的同时,还要确保各立档单位的电子文件分类方案能够适应本单位的文件分类实践需求。 4 基于集成的电子文件分类方案构建路线 构建基于集成的电子文件分类方案需在充分调研电子文件分类方案需求的基础上[5],科学地进行顶层规划,集中优势资源,充分发挥领域专家的作用,依据标准化的构建路径,制定出规范的、具有较强可操作性的基于集成的电子文件分类方案。其构建路线主要包括:收集信息→形成业务分类方案→制定电子文件分类方案→构建基于集成的电子文件分类方案。 4.1 收集信息 信息收集的具体步骤有:第一,完整地收集组织机构法规、任务和职能文献。第二,开展调研。对业务工作人员进行访谈,了解职能活动方式、内容和基本特点。不仅要掌握常规职能活动,还要了解临时性、突发性职能活动情况。第三,列出电子文件形成和接收的完整清单。根据职能活动产生电子文件的规律和特点,掌握立档单位电子文件种类、数量,列出电子文件创建和接收的清单。第四,收集电子文件保管期限和处置需求的相关文献。 4.2 形成业务分类方案 在文献分析和对业务工作人员调研的基础上,采用“自顶向下”的方法,即依据职能→活动→事务的顺序逐级深入分解各类目,形成业务分类方案。其具体步骤包括:第一,识别和确认工作流程与其业务背景之间的联系;第二,识别和确认工作流程与相应业务系统管理规则之间的联系;第三,工作流程的逐次分解;第四,具体工作流程或单个事务的有序排列。 业务分类方案是组织机构所执行业务活动的概念模型,是业务活动分析的产物,用以确保文件及其元数据准确地描述相应业务过程。它是组织机构进行社会活动的一个层级模型,是制定文件分类方案的基础。例如,规章制度的制定职能由建议、起草、评估、发布和应用等活动组成。在业务分类方案的范围说明中,定义职能、活动和事务术语。活动,即为组织机构为履行每一项职能而需要完成的主要任务。一项职能可以由几个活动构成,例如,人事管理职能由招聘、培训、考核、晋升和福利等活动组成;事务,是业务活动的最小单位,事务应基于活动而不是主题,例如,公务员招聘活动可包含发布广告、接收简历、审查资格、笔试、面试、确定人选和签订合同等事务。在制定业务分类方案时,应尽可能全面、详细地将业务职能分解。 4.3 制定电子文件分类方案 依据业务分类方案,分析每项职能、活动乃至事务可能产生的电子文件及其保管、处置需求。这项工作可根据国际标准技术报告ISO/TR 26122:2008《信息与文献—基于文件视角的工作流程分析》,结合现有电子文件的调研和预测,以及对工作规划和工作总结报告等文献的分析,详细列出电子文件基本类目。一般情况下,电子文件分类方案与档案各层级实体对应关系如图1所示。按职能、活动、事务构建完整的类目体系、分配标识符、撰写文字说明。在确定类目标识符时,一般应包括全宗号、职能标识、活动标识、事务标识四个方面要素。 图1 基于职能的电子文件分类方案与档案管理级次对应关系 在制定电子文件分类方案时,可根据立档单位职能活动所生成电子文件数量情况决定细分度。一般来说,电子文件数量越多,其分类方案粒度应越细。 4.4 构建基于集成的电子文件分类方案 综合电子文件分类方案、相关类目保管期限和处置要求,形成基于集成的电子文件分类方案,如图2所示。 图2 电子文件分类方案集成过程模型 第一,依据档案保管期限相应的国家标准或行业标准(如2006年由国家档案局第八号令发布的《机关文件材料归档范围和文书档案保管期限规定》),判定相应类别电子文件的保管期限,包括保管期限代码和触发条件。为更好地适应大数据建设需要,可适当放宽保管期限规定。第二,组织机构业务活动所形成文件的处置,主要是依据保管期限对相应类目文件进行销毁或移交等操作。这样,基于集成的电子文件分类方案就可以在电子文件创建节点上支撑电子文件管理系统对其进行智能化管理。 综上所述,基于集成的电子文件分类方案是由各级类目构成的概念体系,其类目主要由类目代码、类目名称、类目定义、类目描述、保管期限、保管期限触发事件、密级、处置代码和处置授权等构成。基于集成的电子文件分类方案,其维护主要是依据组织机构职能变化、文件保管期限授权或处置授权变化等情形进行动态更新。在其应用于电子文件管理系统过程中,可以根据系统升级等需要进行迁移。 5 基于集成的电子文件分类方案形式化描述 基于集成的电子文件分类方案构建完成后,可利用本体工具Protégé实现其形式化描述,即利用本体语言对其进行表述。基于集成的电子文件分类方案的本体构建主要分为三个阶段:第一阶段,电子文件分类方案概念体系的建立;第二阶段,基于第一阶段所建立的概念体系,利用本体工具创建本体,包括类、属性和实例的创建;第三阶段,依据实践应用情况,不断完善。构建本体时,要系统地进行分类方案的语义描述和语法描述。 5.1 基于集成的电子文件分类方案语义描述 基于集成的电子文件分类方案类目元数据可归结为三大类,即类目标识、类目语义描述和类目关系描述,如表1所示。 针对一个具体的电子文件管理元数据方案来说,其“类目标识符”元素应具有完整的语义描述,具体如表2所示。 5.2 基于集成的电子文件分类方案语法描述 电子文件分类方案实质上就是电子文件的分类元数据控制体系,并可以进一步以人工语言方式进行描述,它可以克服自然语言难以被计算机理解的缺陷。基于集成的电子文件分类方案赋予电子文件的类别元数据、保管期限元数据和处置元数据等,可由Protégé自动生成描述代码,以本体语言OWL、RDF等标准格式进行输出,直接应用于电子文件管理应用系统之中。标签:事务管理论文;