摘要:档案是人类活动的真实记载,也是人们把握和认识客观规律的重要参考。通过档案我们可以更多的了解过去,掌握好当下,并且更好的走向未来。就目前而言,大数据时代的发展使得档案的管理逐渐向着统一化、数字化、网络化的方向发展。因此,加强数字档案管理,不断更新管理技术对人们以后的持续发展有着至关重要的意义。
关键词:档案;重要参考;大数据时代;统一化;网络化;数字化
1 信息技术推动档案管理技术的发展
随着信息化的高速发展,计算机不断与现代通信技术结合起来,共同促进了各个国家的档案管理工作的进步,使得档案管理不断朝着网络化、数字化的方向发展。国际档案信息化建设通过加速对档案资料的标准化、数字化管理,大大促进了各个地区档案事业的快速、健康、持续发展,进而积累了大量的国家信息资源,保存了大量的社会信息,实现了档案信息资源的共享。随着国家档案局相关重要法律法规的颁布,档案信息化建设迎来了新的机遇和挑战。云计算、大数据、物联网、移动互联网等等相继发展起来。在“十二五”期间,围绕着“电子文件管理”和“建设档案馆”,档案信息化工作在全国范围内开展起来。
2 数字档案管理新技术不断深化发展
2.1 网上数字档案大数据的特点
论坛、博客、档案网站等等都有大量的数据信息存在,比如英国国家档案馆网站设计的虚拟展览、澳大利亚国家档案馆的在线网展、美国档案文件署创建的档案信息导航系统等等。我国的数字档案馆注重用户的信息需求,比如福建省网上档案馆、青岛档案馆的网络社区等等。这些档案信息资料都符合目前大数据多样性、规模性等基本特点。
2.2 数字档案大数据的需求和挑战
就数据量而言,大数据一般以TB、GB或者PB作为基本的处理单位,较大的数据量并不能说明数据价值上升,在对档案数据进行分析之前要清洗数据,通过并行分布式改造数据的挖掘算法。就特征维度而言,未来的Web档案微博数据等等,其对象的数据量是非常巨大的,远远超过了当前算法能够处理的特征维度等级,这样很容易导致维度灾难的出现。从数据关系的角度来看,关注实用选择、提取、合并等方式获取档案有关数据信息,进而有效揭示分散在不同数据源中的档案信息和知识。从算法性能角度而言,比如Google的翻译方法比计算机语言更具有优势,这主要是归功于数十亿的Web的训练数据,挖掘档案大数据需要对算法的扩展性、伸缩性等性能进行全面的考虑。从语义理解方面来说,目前信息检索、文本聚分类中挖掘知识的方式在处理档案微博、识别词语语义联系等短文本的时候存在着语义特征稀疏、质量较低等漏洞,还需要人工的帮助和干预。就数据解释来说,目前通过可视化试图展现信息多是呈现一种分析的结果,而档案数据处理和分析的过程还是一个黑匣子,会对知识挖掘的效果产生一定的影响,甚至会对使用者的理解产生一定的误导。就数据的因素来说,大数据分析能力的不断提高严重威胁了档案数据的隐蔽性,我们可以通过重构算法对原始数据进行估算,以保障在挖掘数据的同时可以确保数据的隐私。
2.3 学术界对于数字档案信息资源管理的讨论
目前,我国对于档案新媒体大数据开展知识挖掘是十分迫切的,但是,现在在学术界还存在不同声音的争论。比如,学术界一部分人认为“新媒体信息不是档案信息,所以不属于档案的管理范畴”。事实上,Web2.0早已经走进了广大群众的视野,信息的关键来源就是社会记忆。例如,新浪的用户已经远远超过了五亿人口,大量的社会信息和政府、企业、名人通过微博来发布消息,这就是社会记忆中最为关键的内容,并且具有一定的归档意义。另外,国际上的一些核心网页归档项目纷纷提出了对新媒体数据的关注这一论述,并对其进行归档。
期刊文章分类查询,尽在期刊图书馆所以,对于新媒体如何进行归档这一问题还需要进一步的研究和讨论。再比如,学术界有的人认为“新媒体信息数据量较大,对于档案界缺乏研究的意义”。事实上,是新媒体信息在档案界首先创建了档案论坛、微博等等媒体信息来源,从档案工作利用的角度来看,经过整合的档案数据其价值主要展现在知识服务方面,通过对各种不同种类新媒体资源数据的整理来进行知识的关联,为档案的使用提供更高水平的服务;可以为其提供档案学术跟踪和研究,通过数据的采集来发现档案学者的合作关系网络、讨论主题的演变等等。总而言之,大资源、大档案的新媒体数据需要不断对知识进行挖掘,科学合理的挖掘可以产生与之有关联的数据,但是,如果是过度的对档案信息进行挖掘就需要采取一定的保护措施。在对基于大数据平台的档案信息资源整合进行研究的时候,集成有关的课题成果是大数据时代档案信息发展的重要方式。
3 新媒体环境下数字档案管理新技术的具体应用措施
3.1 具体应用的建设构想
互联网档案信息资源的开发是网络环境下合理、全面开发并且充分合理利用网络档案信息资源的必经之路,也是档案信息化建设的重要一步。互联网新媒体档案信息资源开发系统和研究共享平台是为了将档案信息资源利用和开发的新方式、新思路付诸实践,使得互联网实现资源的合理开发和使用,以及当前档案信息网络资源的增值服务,有效提升使用者获得信息的速度和水平,为档案使用者快速查找到需要的档案信息提供高水平的服务。
3.2 具体应用的目标功能
根据互联网信息资源使用和整合过程当中对技术、方式等等有关问题的实践以及研究,可以 做到精确的收集、分析档案信息页面、博客、论坛等等,对档案信息的关键词进行提炼,形成多维度、多层次的档案信息服务系统。其主要的功能要求具体为:收集档案信息资源、挖掘和解析档案信息、将档案信息网与互联网档案信息结合起来、检索档案信息、对用户和权限进行科学管理。
3.3 系统的具体工作过程
互联网档案信息收集工具、档案信息分析工具、档案信息服务引擎、档案信息发布系统、档案信息集成接口五个部分共同组成了互联网新媒体档案信息资源开发系统和研究交流平台,该系统的工作流程为:(1)通过信息采集器将信息从档案论坛、博客中收集起来,同时将收集到的信息保存至AIS当中;(2)通过档案信息分析工具分析和加工储存在AIS中的档案信息;(3)将经过AIS处理之后的信息通过档案信息发布系统发布至web页面;(4)使用者在交流研究平台上浏览档案信息或者通过专报生成等方式进一步对信息进行加工;(5)通过信息集成接口将档案信息网络资源和AIS结合起来。
4 结束语
随着我国社会的高速发展迎来了大数据时代的到来,这一时代的转变使得很多个行业都发生了变化,在大数据时代背景之下,给档案工作带来了新的机遇和挑战,我们需要对我国档案管理工作过程中出现的问题进行认真细致的分析,并且,积极解决问题,改善档案工作中的不足。同时,抓住时代改变带来的机遇,不断迎接新的挑战,为档案管理工作不断开拓新的天地,促进我国社会的进一步发展。
参考文献:
[1]张恩成.新媒体环境下数字档案管理新技术发展与应用[J].黑龙江科技信息,2017,(13):246.
[2]王兰成.新媒体环境下数字档案管理新技术发展与应用[J].中国档案,2017,(01):64-66.
[3]李小红.社会化媒体应用环境下我国档案管理的发展趋势研究[J].新闻战线,2014,(08):156-157.
[4]宋萍萍.美国社会化媒体应用环境下档案管理的最新发展及引发的思考[J].四川档案,2013,(02):51-52.
论文作者:曹金良
论文发表刊物:《基层建设》2017年第29期
论文发表时间:2018/1/2
标签:档案论文; 数据论文; 信息论文; 媒体论文; 档案管理论文; 互联网论文; 信息资源论文; 《基层建设》2017年第29期论文;