摘 要: 高校应该重视数字档案的建立、操作和管理。如果在构建电子档案之初未能很好地评估自己机构的需求,将会带来潜在的资源浪费。因此,合理地评估自己的需求并选择适合自己的数据结构是尤其重要的。本文推荐的两种常见的数据结构,一种为基于实体的数据结构,另一种为基于关系的数据结构。
关键词: 电子档案 数字档案 数据结构
背景介绍:对于一套完整的数字档案系统而言,其应当至少包含学生档案、教职工档案、课程档案、选课信息以及各类相关申请表格。在电子档案普及之前,部分纸质档案需要专门的档案室来储存。部分流通的申请表则会储存在各自相关的储存场所。譬如学生选课表可能会储存在学院办公室。对于跨学院的流程来说,传统的纸质档案会成为一种阻碍,这种弊端包括:1.无法及时获取信息;2.纸质档案难以追踪修改路径;3.难以备份(一个著名的例子是2008年的汶川地震中大量纸质档案损毁无法复原)。因此,普及并落实电子档案技术已是一种趋势。
引入数字档案系统的同时,需要规划好符合自身数据需求的数据结构。在这里,并没有最好的数据结构,只有最合适的数据结构。对于组织规模较小、数据结构较为简单的教育机构,本文推荐使用基于实例的数据结构;对于组织规模较大、数据结构较为复杂的教育机构,本文推荐使用基于关系的数据结构。
一、基于实体的数据结构
电子档案的部署有多种方式,其组成包括前端的用户(档案管理员、校方工作人员以及可能的学生访问和外界访问)以及后端数据库。数据库的选择对于电子档案系统的稳定性、可访问性均具有直接的影响。对于基于实体的数据结构而言,其构建思路、结构设计均会以需要的实体为中心,随后再通过主键与外键来构建实体间的关系。
高校的组织架构可以分为学术教育单元以及行政单元。学术教育单元通常包含学院及学校,行政单元则可能包括保卫部门、IT部门、人事部门等。对于这种常见的组织架构,基于实体的数据结构会有六个常见的表:学生表(StudentID, ……),学院表(CollegeID, ManagerID……),员工表(EmployeeID,College ID……),行政部门表(DivisionID, ManagerID……), 课程表(CourseID,LecturerID……),选课表(CourseID,StudentID……)。这样构建数据库的优势在于清晰与易于管理,对于IT技术的依赖较小。但是缺点也很明显,这种数据结构会导致查询效率低下以及缺乏必要的灵活性。假如高校发生较大的组织结构变动,譬如引入校董事会作为组织结构的一个新的层级,那么该模型将面临非常大的改动。
期刊文章分类查询,尽在期刊图书馆
二、基于关系的数据结构
上文中的例子在高校数据系统中的应用很广泛而且很常见。在此基础上,若是查询“某老师的所有在读学生”以及“某老师教过的某学院的所有学生的信息”,查询会变得更加复杂。虽然有其他种类的数据库譬如图形数据库可以帮助缓解这种结构的复杂性,但是同时也有办法优化数据结构来实现效率的提升与引入灵活性。若在系统构建之初便将数据库设计为以关系为中心,对于部分查询来说会增加一个调取关系的步骤。但是对于复杂的查询来说,这种方式能大大简化数据查询的脚本,亦能提供良好的可拓展性。
基于关系的数据结构对比基于实体的数据结构有两个主要变化:
1.合并所有中间表格(譬如选课表)并将中间表格中央化。这一步的目的是提供灵活性,很多新的需求均可以通过添加新表来实现。这个中间表格的主要目的是实现统一的关系管理。其中仅需储存数据类型的ID(Type, Linked Type)以及数据自身的ID(ID, LinkedID)。后文中的例子会更好地阐述这一变化。
2.合并学生表与员工表。使用统一的人员ID来进行管理可以大幅优化数据库的响应以及减少复杂性。相对应的,则是需要在人员表中引入一项新的属性,叫作人员类型(PersonType)以及人员权限(PersonRight)。如此一来便可以区分出该人员为学生还是教职工以及对应的访问权限。
三、总结
本文所描述的两种数据结构均可以很好地服务于高校。其关注的侧重点不一样导致了其使用效率、拓展性均有较大的差异。对于不同规模的教育机构来说,选择适合自己的数据结构尤为重要。可用的选择标准包括现行组织结构、中长期组织战略对组织结构的影响,学校对数据的依赖程度等。在对自己的组织进行系统的评估之后,数据结构的选择将会更好地服务于现在以及中长期的未来。
参考文献
[1]Alhajj R Extracting the extended entity-relationship model from a legacy relational database.Information Systems,2003,28,(6):597-618。
[2]Brunie L & Kosch H Control strategies for complex relational query processing in shared nothing systems.ACM Sigmod Record,1996,25,(3):34-39。
[3]李烨 浅谈现代化手段在档案管理中的应用.电力档案,2001,(4):30-32。
[4]李映天 从四川地震看电子档案信息的容灾与备份.兰台世界: 上半月,2008,(10):28-28。
[5]张占武 吴月莉 浅谈高校档案信息化建设研究.档案天地,2013,6,022。
论文作者:于红丽
论文发表刊物:《教育学》2019年7月总第183期
论文发表时间:2019/7/17
标签:数据结构论文; 档案论文; 自己的论文; 实体论文; 关系论文; 高校论文; 数据库论文; 《教育学》2019年7月总第183期论文;