国外档案数据管理流程研究述评
刘庆悦 杨安莲/国防大学政治学院
摘 要: 在档案管理由传统管理模式向数据管理模式转型的过程中,国外档案数据管理流程研究的经验可以为我国档案数据管理研究提供借鉴。通过将国外档案数据管理流程研究划分为档案数据计划与采集、整合与存储、分析与挖掘、数据共享和数据利用五个部分,可以发现其研究呈现偏重具体环节,整体性研究较少;重视实践问题,理论研究较弱;注重新兴技术,但范围影响有限;突出专业特色,但具有广泛适用性的共性研究不足等特点。基于此,提出了我国档案部门应完善档案数据管理流程基础理论、推动新兴技术的应用与创新、借鉴推广专业特色领域相关经验的建议。
关键词: 档案数据管理;档案数据管理流程;外国档案管理
档案数字化转型的深入使得档案管理的颗粒度逐步由文件尺度细化至数据尺度,档案数据管理的重要性日益凸显。国外较早开展档案数据服务与开放的探索,在档案数据管理流程方面具有相对丰富的成果和经验,可为我国档案数据管理研究提供一定借鉴。
在国外现有研究中,档案数据是一个笼统的范畴,没有确切的概念范围。本文中,笔者将档案数据概念界定为承载档案信息的数据,以及在档案管理和利用活动中产生的数据。具体来说,档案的具体内容、标题、保密期限、目录等,档案的操作日志、库房温湿度、统计数据等,档案利用者的姓名、年龄、利用时间、检索轨迹、利用评论等都包含于档案数据的概念范畴之中。档案数据管理是指利用数据管理等多种方法,控制档案数据及档案数据活动,以最大限度地实现档案数据价值、促进档案工作发展的活动。档案数据管理流程是指一系列连续的档案数据管理活动,旨在集中管理大量复杂的档案数据,在维护其真实性、完整性、可用性和安全性的同时,促进档案信息及相关知识的获取和提炼。与以手工管理思维主导的传统档案管理流程不同,档案数据管理流程更强调档案数据与技术的结合,强调服务于以用户为中心的深层次档案数据价值挖掘。
1 研究现状分析
基于以上概念,笔者对LISA数据库(Library and Information Science Abstracts Database)进行了检索,检索时间范围为1999至2019年,检索式为TI="archiv*data" OR TI="document data" OR TI="record data" OR TI="electronic record data" OR TI="digital file*data"。截至2019年9月,检索到文献451篇。经去重、降噪后,最终得到文献347篇。经初步分析发现,在时间上,近20年国外档案数据管理流程研究数量总体稳定,在2012年至2014年间具有一定的热度。主要原因是云计算、大数据等技术的兴起引发了国外学界对档案数据管理方法的探索。在内容上,有关档案数据共享、利用的成果类型十分丰富。主要原因在于国外档案数据公开度较高,公开获取、利用档案数据已成为较多学者的研究路径。在领域上,近85%的文献分布于医疗卫生领域,还有大量文献分布于天文、气象等领域。档案领域较少对档案数据管理流程进行专门研究。总体上,笔者认为国外档案数据管理流程研究可分为档案数据计划与采集、档案数据整合与存储、档案数据分析与挖掘、档案数据共享和档案数据利用五个部分。
1.1 档案数据计划与采集
档案数据计划与采集研究强调提高档案数据对未来研究的有用性。相关学者明确了档案数据计划的要素及档案数据的采集范围、采集方式和质量评价。对于档案数据计划的要素,Bishoff等人认为档案数据管理计划应包含管理目标、数据背景、备份保密、知识产权、责任认定、检测审查、数据质量、真实性保证等多方面规定[1]。对于档案数据的采集范围、采集方式和质量评价,Doods等人认为档案数据采集的范围不应无限扩大,要事先遴选形成档案核心数据清单[2]。Cars等人认为可以通过半自动化的方式采集档案数据,因为该方法在完整性和一致性上效果更优,可以兼顾档案数据采集的效率和质量[3]。Weiskopf和Weng设计了评估档案数据质量的维度和方法,确定了包括完整性、正确性、一致性、合理性和流通性在内的五个维度,以及七种数据质量评估方法,包括黄金标准比较法、数据元素协议法、数据源协议法、分布比较法、有效性检查法、日志审查法和元素存在检查法等[4]。
在“互联网+”时代,要想促进护理专业内涵式发展,提升护理专业学生自主学习能力,就需要积极推动教育信息化的发展。要求护理专业学生在学校学习过程中,充分利用现有的互联网资源,利用当前的慕课平台、网易公开课等资源,实现护理专业教学资源的共享。
档案数据整合与存储研究具有较强的实用性。在档案数据整合方面,Fresa等人为档案数据标准开发了一组高模块化工具,以便档案馆统一档案数据进馆时的格式[5]。在档案数据存储方面,研究人员追求永久高效地存储大量不可变的档案数据,使其具有高可靠性和可访问性。相关研究方向可根据存储档案数据的软、硬件进行细分。档案数据存储硬件研究包含档案数据的存储载体和记录方法研究,如Holzner等人提出一种高密度多级录制档案数据的方案,以支持档案数据的超长期保存[6]。档案数据存储软件研究包含“怎样高效地压缩数据”“何种数据存储在何种数据库”“怎样从数据库中获取信息”等问题,如YOU等人研究了大型数据库中的档案数据压缩方法[7]。Freire等人比较研究了某种分布式非结构化数据库与传统结构化数据库在特定环境下的优劣等[8]。Marco-Ruiz等人描述了档案数据建模、转换、集成和标准化所需的技术和步骤[9]。
1.2 档案数据整合与存储
(2)人力资源管理的差异.国际化经营企业在人力资源管理上遵循一系列管理制度,有的是人本原则,有的是严格科学的人事管理制度,这也造成了企业文化的冲突.跨文化管理者之间的文化冲突会使管理团队缺乏凝聚力,导致决策效率降低,企业目标无法顺利达成.
在领域上,某些专业特色领域的档案数据管理流程研究较为深入。如,由于医疗卫生领域迫切需要利用公民电子健康档案,因此相关学者已在档案数据计划、档案数据挖掘以及档案数据共享等多方面进行了较深入的探索。科研档案、天文档案及气象档案等专业特色领域也对相关领域内的档案数据管理流程进行了一定的研究。但与此同时,档案领域对档案数据管理流程的关注相对较少,导致相关共性研究不足,专业特色领域的研究与实践经验难以促进完善更多领域的档案数据管理流程。
1.3 档案数据分析与挖掘
在视角上,档案数据管理流程研究偏重具体环节,切入点往往“小而深”。国外档案数据管理流程研究分工精细且角度多元,一般涉及一到多个流程环节,但包含档案数据管理流程全部环节的整体研究较少。这导致档案数据在某一流程环节内具有很好的可用性,但当其进入档案数据管理流程的其他环节后,可能出现通用性不高、互操作性不强等问题。
1.4 档案数据共享
对文献进行深入研究后发现,国外档案数据管理流程研究总体呈现研究视角偏重具体环节,整体性研究较少;研究内容重视实践问题,理论研究较弱;注重新兴技术的利用,但范围影响有限;研究领域突出专业特色,但具有广泛适用性的共性研究不足等特点。
1.5 档案数据利用
与档案数据分析与挖掘相比,档案数据利用更强调利用,而非数据分析方法。国外的档案数据利用研究范围广泛、方式多样,主要可依利用主体分为档案机构利用和用户利用两部分。对档案机构而言,档案数据可用于研究档案利用者、利用方式和利用率。如Adams将档案数据利用者分为两类,一类是事实信息寻找者,即利用档案数据探寻事实的人群;另一类是数据分析员,即利用档案数据进行分析研究的人群[18]。英国国家档案馆通过提取和可视化档案数据中的历史事件参考位置,不仅完善了其服务,而且提升了档案数据的利用率[19]。对用户而言,档案数据能助推部分专业特色领域的发展。有学者利用档案数据进行预测,有学者通过档案数据众包项目拓展研究能力,还有学者利用档案数据分析结果推动决策的制定。如Muhling等人根据档案数据预测了某海域蓝鳍金枪鱼幼虫事件的发生[20];Paneth-Pollak等人利用某类电子健康档案数据反映的规律,推动了纽约市公共卫生项目决策的制定等[21]。
2 研究特点
档案数据共享研究的视角丰富多样,包含了档案数据共享意识、档案数据共享方法及档案数据共享保障等多个方面。在档案数据共享意识方面,Poole认为背景和年龄是最重要的影响因素,此外信任和动力等也会影响档案数据共享意识[14]。在档案数据共享方法方面,Xia等人基于区块链技术设计了档案数据共享的技术框架,解决了“云存储”中敏感数据共享的访问控制难题[15]。在档案数据共享保障方面,Ray和Smith认为档案数据共享需要通用的数据使用协议、权利信息、许可条款、教育材料、信用机制和执行实践等进行共同保障[16]。另外,网络基础设施、组织、规划和政策等也是保障的重要因素[17]。
2.1 研究视角偏重具体环节,整体性研究较少
档案数据分析与挖掘研究注重与信息技术的结合。Gray指出了其原因,认为这是快速大量处理档案数据的时代要求决定的[10]。宏观上,学者运用数据分析方法辅助档案数据的管理利用,如Lemieux探讨了使用可视化分析方法支持档案管理的可能性,认为可视化和视觉分析法可作为档案工作者分析复杂任务(如描述档案)的认知辅助[11]。基于此,Choo等人设计了适用于大规模档案数据的交互式视觉信息检索和推荐系统,该系统能以散点图形式显示检索到的档案数据及其主题摘要[12]。微观上,学者有针对性地优化分析算法,使其在特定研究方向上更加精准,如Mathias等人优化了老年人预期寿命指数预测算法等[13]。
2.2 研究内容重视实践问题,理论研究较弱
随着云计算、大数据等新兴技术对社会的影响愈发深入,档案数据的重要性将愈发突出。为适应变化、抓住机遇,笔者认为我国必须加快完善档案数据管理流程相关的理论,推动先进技术在档案数据管理流程中的应用与创新,并强化专业特色领域成功经验的借鉴推广。
2.3 注重新兴技术的利用,但范围影响有限
在技术上,档案数据管理流程研究思维开阔,能够灵活地利用新兴技术提升档案数据管理的效率和效果。对于云计算和可视化等新兴技术在档案数据管理流程中的使用,国外研究显现出了积极性高、创造性强、应用性好等特点。新兴技术的引入、创新与融合不仅促进了国外学者对档案数据价值进行深层次、精细化挖掘,还推动了国外档案管理迈向智慧化和现代化。但不足之处在于,国外相关研究的实践范围较小、影响范围有限,规模化、系统化的应用模式尚未形成。
2.4 研究领域突出专业特色,但具有广泛适用性的共性研究不足
马奴托海实际上指的就是伏尔加河与阿赫图巴河之间的河滩地。当然,阿赫图巴河左岸高坡上的大片区域也都在马奴托海的范围之内。可以想象,到了夏日,河滩里一定是草木茂盛,河水丰沛,柳树成荫,郁郁葱葱。而我们到来的这个时节,正好是俄罗斯的春末,树木刚刚吐露春呀,尚未长出绿叶。河滩里,榆树和柳树相互参杂,枯枝残叶,黑压压一片。而这一天,天公也不作美,天气阴冷,乌云密布,而且云层很低。远处的伏尔加格勒市,隐隐约约,隐藏在春日伏尔加河河面弥漫的烟雾之后。我们眼前看到的这一景象,正好映证了新疆一首土尔扈特民歌里所唱的情景:
3 对我国的启示
在性质上,档案数据管理流程研究偏重实践,侧重解决具体的实际问题。一方面,这是因为国外研究普遍具有较强的实用性和问题导向性;另一方面,也因为以美国为代表的发达国家现有的档案数据管理流程较为通畅,可以支持现代化的档案数据管理利用。学者可以基于档案数据管理利用时暴露的问题,不断优化档案数据管理流程中的各环节。不过国外档案数据管理流程基础理论研究相对薄弱,大量经验和做法未经体系化和理论化,这影响了研究的整体性。
3.1 档案数据管理流程相关理论的完善
国外的档案数据管理流程研究虽然丰富,但在理论性和系统性等方面仍有不足,较难为我国相关研究提供直接的参考。由于实行集中统一的档案管理体制,我国的档案数据管理范围庞大、情况复杂,因此必须先从理论上进行梳理,然后再借鉴国外的相关思想展开实践。首先,明确档案数据管理流程管什么。即研究档案数据的概念、分类及特征,界定档案数据管理的范围,深入了解和剖析档案数据管理对象。其次,分析档案数据管理流程是什么。从概念上厘清档案数据管理及档案数据管理流程的含义及目标,分清档案数据管理流程和传统的档案管理流程的区别。最后,梳理我国档案数据管理流程有什么。定义档案数据管理的环节,确定各环节的功能、作用、主要方法及要求,找到可能阻碍档案数据准确、高效传递的因素并进行优化。
3.2 新兴技术在档案数据管理流程中的应用与创新
国外对于云计算等新兴技术的灵活运用,在一定程度上推动了档案管理的转型和发展。因此,我国的档案数据管理流程研究需要进一步解放思想,加强新兴技术的引入、创新与融合,利用技术手段规范档案数据管理流程;并借鉴参考国外档案数据管理流程研究和实践的经验,基于我国实际对这些技术做出适应性改变。此外,我国还应发挥优势,不断跟踪新兴技术的试点,并在评估效果良好后进行推广。推广时,要从宏观上系统思考新兴技术应用后带来的影响,配套给出相应的制度等保障条件,使我国档案数据管理流程真正适应新时代中国特色社会主义发展的需要。
3.3 专业特色领域经验的借鉴与推广
首先,从医疗卫生领域到气象领域,国内外多个专业特色领域已形成或正研究适合该领域的档案数据管理流程。其次,图书馆学、计算机科学等领域也探索出了各类适用于特定情境的档案数据管理流程。再次,在长时间的实践研究中,我国文件档案管理领域也总结出了一系列管理流程和经验。因此,深入学习借鉴这些领域的研究成果,有助于提炼形成普遍的、公认的档案数据管理流程。与此同时,档案部门还要结合档案数据管理实践,不断充实、完善适于档案数据管理各环节的方法和应用,使档案数据管理流程切实发挥作用,推动我国档案事业发展。
相比对照、单独施加腐殖质和单独施加零价铁,土壤中施用适量腐殖质和零价铁复合调理剂对中轻度镉砷复合污染稻田具有良好的修复效果。稻田土壤分别施加2250 kg·hm-2复合调理剂后:
(2)石炭系。测区石炭系出露齐全,分布广泛,面积约266.19 km2,占测区面积的31.0%。下统在南部为碳酸盐岩;北部及东南隅则以碎屑岩为主夹硅质岩及碳酸盐岩。上统全为碳酸盐岩。广西区调队及石油队已做过不同比例尺的地质调查工作,其中下石炭统岩性变化较大,岩石地层单位之间的变化关系复杂。
注释与参考文献:
[1]BishoffL.Digital preservation plan: ensuring long term access and authenticity of digital collections[J].Information Standards Quarterly,2010,22(2):20-25.
[2]DoodsJ,BotteriF,DugasM,etal.A European inventory of common electronic health record data elements for clinical trial feasibility[J].Trials,2014,15(1):18.
[3]Cars T,WettermarkB,etal.Extraction of Electronic Health Record Data in a Hospital Setting: Comparison of Automatic and Semi-Automatic Methods Using Anti-TNF Therapy as Model[J].Basic & Clinical Pharmacology & Toxicology,2013,112(6):392-400.
[4]Weiskopf N G, WengC.Methods and dimensions of electronic health record data quality assessment: enabling reuse for clinical research[J].Journal of the American Medical Informatics Association,2013,20(1):144-151.
[5]Fresa A, Justrell B, PrandoniC.Digital curation and quality standards for memory institutions: PREFORMA research project[J].Archival Science,2015,15(2):191-216.
[6]Holzner F, Paul P, Drechsler U, et al.High density multilevel recording for archival data preservation[J].Applied Physics Letters,2011,99(2):513-606.
[7]You L L, Pollack K T, Long D E, et al.PRESIDIO: A Framework for Efficient Archival Data Storage[J].Acm Transactions on Storage,2011,7(2):1-60.
[8]Freire S M,Teodoro D, Wei-KleinerF,etal.Comparing the Performance of NoSQL Approaches for Managing Archetype-Based Electronic Health Record Data[J].PLOS ONE, 2016,11(3):1-20.
[9]Marco-RuizL,MonerD,Maldonado J A,etal.Archetypebased data warehouse environment to enable the reuse of electronic health record data[J].International Journal of Medical Informatics,2015,84(9):702-714.
[10]Gray J, Liu D T, Nieto-Santisteban M, et al.Scientific data management in the coming decade[J].ACM SIGMOD Record,2005,34(4):34-41.
[11]LemieuxVL.Visual analytics, cognition and archival arrangement and description: studying archivists' cognitive tasks to leverage visual thinking for a sustainable archival future[J].Archival Science,2015,15(1):25-49.
[12]ChooJ,LeeC,KimH,etal.VisIRR: Visual analytics for information retrieval and recommendation with large-scale document data[C]//2014 IEEE conference on visual analytics science and technology (VAST).IEEE,2014:243-244.
[13]Mathias J S, Agrawal A, Feinglass J, et al.Development of a 5 year life expectancy index in older adults using predictive mining of electronic health record data[J].Journal of the American Medical Informatics Association,2013,20(e1):e118-e124.
[14][17]PooleAH.How has your science data grown? Digital curation and the human factor: a critical literature review[J].Archival Science,2015,15(2):101-139.
[15]XiaQ, et al.BBDS: Blockchain-based data sharing for electronic medical records in cloud environments[J].Information,2017:44.
[16]Ray J M.Research data management: Practical strategies for information professionals[M].Purdue University Press,2014.
[18]Adams M N.Analyzing archives and finding facts: use and users of digital data records[J].Archival Science,2007,7(1):21-36.
[19]Willett P, Clough P, Tang J, et al.Linking archival data to location: a case study at the UK National Archives[J].Aslib Proceedin gs,2011,63(2/3):127-147.
[20]Muhling B A, Lamkin J T, Roffer M A.Predicting the occurrence of Atlantic bluefin tuna (Thunnusthynnus) larvae in the northern Gulf of Mexico: building a classification model from archival data[J].Fisheries Oceanography,2010,19(6):526-539.
[21]Panethpollak R, Schillinger J A, Borrelli J M, et al.Using STD Electronic Medical Record Data to Drive Public Health Progra[J].American Journal of Public Health,2011,100(4):586-590.
Reviews on Foreign Archives Data Management Process
Liu Qingyue Yang Anlian
Abstract: In the process of the transformation of archives management from traditional management mode to data management mode, the research experience of foreign archives data management process could provide references for the research of Chinese archives data management.By dividing the research of foreign archives data management process into five parts: archives data planning and collection, integration and storage, analysis and mining, data sharing and data utilization, it could be found that the related research shows four features: focus on specific links,and overall research inadequate; attach importance to practical issues, weak theoretical research;focus on emerging technologies, limited scope of impact; highlight professional characteristics, lack of universal research with wide applicability.Based on this, it is proposed that Chinese archives department should improve the basic theory of archives data management process, promote the application and innovation of emerging technologies, and draw on the relevant experience in characteristic field.
Keywords: Archives Data Management; Archives Data Management Process; Foreign Archives Data Management
分类号: G270.7
本文系2019年国家社会科学基金青年项目“‘互联网+’背景下多媒体档案知识发现研究”(项目编号:19CTQ033)阶段性研究成果。
标签:档案数据管理论文; 档案数据管理流程论文; 外国档案管理论文; 国防大学政治学院论文;