论我国实现“互联网+档案”的关键问题_互联网+论文

实现我国“互联网+档案”关键问题刍议,本文主要内容关键词为:互联网论文,刍议论文,关键论文,我国论文,档案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       “互联网+”的内在含义

       在2015年3月5日的全国人大十二届三次会议上,李克强总理在政府工作报告中提出了“互联网+”行动计划。随后,2015年7月4日,经李克强总理签批,国务院印发了《关于积极推进“互联网+”行动的指导意见》。这标志着“互联网+”成为一项重要的国家战略,其将深刻地促进各行各业的发展与变革。

       在这样的时代背景下,实现“互联网+档案”应成为我国档案界的战略目标。那么对于档案人来讲,我们当前应充分理解“互联网+”的内涵,并探索以实现“互联网+档案”为目标的创新与发展措施,这具有重要的理论意义和实践意义。

       要实现这一点,我们首先应对“互联网+”的科学内涵加以正确理解和把握。通俗来讲,“互联网+”的含义就是“互联网+各个传统行业”。但这种“+”并不是两者简单的组合,而是利用现代信息通信技术及互联网平台,将互联网与传统行业实现深度融合,从而创造新的发展生态。

       从当前的相关研究与实践来看,“互联网+”总体上具有六大特征:

       跨界融合。“+”本身的含义就是多领域跨界,同时也意味着变革,意味着开放,意味着重塑融合。互联网与相应行业有机地融合协同,群体智能才会实现,创新的基础就更坚实。

       创新驱动。当前我国粗放的资源驱动型增长模式日益显现出种种弊端,必须转变到以创新驱动发展的新模式上来。而创新正是互联网的特质,用创新的互联网思维来推动各行业自我革命。

       重塑结构。信息革命、全球化、互联网业已打破了原有的社会结构、经济结构、地缘结构、文化结构。随之权力架构、议事规则、话语权等都在不断发生变化。

       尊重人性。人性的光辉是推动科技进步、经济增长、社会进步、文化繁荣的最根本的力量。互联网的力量之所以强大,最根本原因在于其对人性最大限度的尊重、对人体验的敬畏、对人的创造性发挥的重视。“互联网+”将进一步深化这一趋势。

       开放生态。对于“互联网+”,生态是非常重要的特征,而生态的本身就是开放的。我们推进“互联网+”,一个重要的方向就是化解过去制约创新的环节,将孤岛式创新连接起来。

       连接一切。典型的表现即是物联网的发展,将可想见的事物皆连人互联网世界。虽然连接是有层次的,可连接性也是有差异的,连接的价值是相差很大的,但是连接一切是“互联网+”的目标。

       实现“互联网+档案”的突破方向

       由以上的分析可见,“互联网+”的实质是各行业基于互联网深度融合的换代升级。“互联网+”绝不是简单地将商品或服务从线下搬到线上,而是借助互联网实现传统产业的转型升级。故而“互联网+档案”也绝对不仅是先将档案数字化再挂到档案网站上即万事大吉。我们认为,“互联网+档案”是以档案数字化为基础,依托现代信息技术所形成的智慧化、知识化、个性化、人性化的档案服务互联网平台。因此,对于实现“互联网+档案”模式的目标而言,当前应深刻把握“互联网+”的基本特征,密切联系当前档案业界实际,着重在以下几个方面实施研究与实践上的突破:

       1.在“数字化”的基础上向“数据化”迈进,实施档案数据自动化整合

       当前,我国的档案馆多数处于数字化建设阶段。在此基础上,要注重进一步完成“数据化”工作。数据化的定义一般是指将数据结构化后存入计算机数据库系统中,从而实现可以利用数据库管理系统对这些数据进行管理和利用。可以说,数据化既内生于数字化,又是对数字化的进一步拓展与推进。在“互联网+档案”的视域下,实际上更加要求档案部门实现“数据化代替数字化”。主要包括两方面的内容:

       一是档案部门将自身数字化工作成果切实转化为数据化资源。当前我国档案馆多数的数字化工作实际上是以扫描图像的形式储存档案资源,但所得数字化图像没有建立档案全文数据库,并不能通过关键词检索其反映的内容,即档案数字化成果没有数据化。造成这一点的原因,除了思想认识问题之外,还有一个很重要的原因就是当前的图片文字识别技术问题。鉴于当前OCR技术的发展水平,尚不能保证对各类档案数字化成果进行大规模自动化的、准确的识别转化,因此很大一部分数字化档案的文字识别与内容提取仍需人工完成。在档案部门数字化成果数量众多或是人员力量不足的情况下,易造成档案数据化工作的滞后。因此,档案部门应对该问题予以充分重视,避免使“互联网+档案”因缺乏有效数据而陷于无源之水、无本之木的境地。

       二是档案部门应推进实施跨部门的档案数据自动化整合。从总体上讲,我国信息化建设过程中产生的“信息孤岛”和“烟囱工程”问题较为普遍,其主要的原因在于我国信息化建设的进程是在分散体制下走过来的,各单位在信息化建设上缺乏统一的规划和标准,各干各的,导致逐渐形成了局限于本部门、本系统之内的纵向“烟囱式”信息系统。因而造成档案信息系统与其他部门的信息系统难以有效交换数据,难以实现自动归档及充分利用,极大地影响了档案工作效率。这与“互联网+”的跨界融合、开放生态等特征是背道而驰的。因此,档案部门当前应与归档对口单位、部门密切联系,通过管理与技术等方面的协调,实现从应归档信息系统中直接获取相关档案电子数据源,并通过建设一系列相关信息系统对其转换和处理利用,从而实现自动化融合。

       2.建设档案数据个性化推荐系统,推动档案服务进入“后检索时代”

       尊重人性亦是“互联网+”的一项重要特征。就目前的实践而言,在互联网化比较成功的行业领域,其互联网的模式是差异化的,但共同的是都准确地找到了其消费者和行业的“痛点”。对于档案服务来讲,这最关键的“痛点”莫过于在档案的海洋中有效找到用户所需的资源。因此,就发展“互联网+档案”而言,档案个性化服务是必须实施的重要工作,也就是要实现根据档案用户特征对其提供具有针对性的信息内容。而这正是当前档案服务所亟待提高的方面。

       “工欲善其事,必先利其器。”对于档案个性化服务这个“事”而言,这个必不可少的“器”就是档案数据的个性化推荐系统。这个系统最主要的作用就是弥补当前档案信息系统的普通检索方式(如关键字匹配)造成的档案查找困难、检索不充分等问题,将档案服务推进到“后检索时代”。正如图1所示。

      

       图1 “后检索时代”档案服务模型

       模型(图1)清楚地描述了个性化服务与传统档案服务之间的关系与结合方式,描述了个性化服务能够提供的服务拓展,描述了档案数据个性化推荐系统功能框架,明确了个性化推荐系统对实现“互联网+档案”的重要意义。“后检索时代”的意义正如图1所揭示的:档案个性化服务极大地扩充了传统档案服务只依靠单一检索提供档案数据的方式。我们说“互联网+档案”绝非仅是“档案上网”的含义亦在于此,无论是当前档案部门内部的检索方式还是现有档案网站的搜索功能,都不能充分保证档案用户需求,并使很多档案处于“沉睡”状态。该问题的实质在于当前档案数据资源无法智能化地到达档案用户,故而对档案数据个性化推荐系统设计与部署、实现后检索时代的档案服务刻不容缓。

       然而,纵观当前国内档案个性化服务的研究,在这方面的工作基本还是空白,特别是基本没有对个性化推荐系统进行实用建模(如对T1、T2、T3推荐策略)、具体设计、效果实验等方面的研究成果,这实际上使档案个性化服务无法真正落实。即使在计算机等专业研究领域,也极少有研究者关注如何建立档案领域所适用的个性化推荐系统问题。其对个性化系统的研究,基本集中在对推荐技术(以协同过滤技术为典型)的指标改进、新方案探讨等方面,且应用领域多为电子商务、图书、电影等。这造成当前对档案个性化推荐系统的研究“约等于零”。面对当前层出不穷的信息推荐技术改进研究和相邻近的图书馆学领域方兴未艾的图书个性化推荐系统研究成果,档案学领域应当奋起直追,消除对于技术的畏难情绪,积极借鉴相关学科成果,结合档案工作自身实际,设计出实用的档案个性化推荐系统。

       3.建立档案用户需求感知引擎,实现档案部门循数管理

       正如一些企业家所指出的,互联网思维的本质就是“群众路线”,就是要从群众中来,到群众中去。而互联网思维要与传统产业更好地融合,最关键的是深刻理解所在行业的顾客需求。因此,作为实施“互联网+档案”来讲,也就是要使档案部门有效感知档案用户需求,并据此调整优化档案工作。前者是“从群众中来”,后者是“到群众中去”。“互联网+档案”必须建立对档案用户数据进行有效收集、分析判断、知识抽取以及据此采取相应行动的机制,这就是档案用户需求感知引擎。这里引擎的含义是既包括相应的信息系统,也包括与之配套的管理机制、思维模式。

       为此,我们提出一个档案用户需求感知引擎设计框架,如图2所示。

      

       图2 档案用户需求感知引擎

       其中,存储层主要负责实施对档案用户数据收集、存储和对上层调用控制。档案用户数据主要包括档案用户特征、档案利用行为、用户对档案评价等,通过数据整理清洗模块清除数据噪声、规范化数据。隐私保护和密级保护规则模块负责对档案用户隐私保护和档案信息密级的保护。所收集到的档案用户数据存储至档案用户数据库中。

       知识提取层根据收集存储的用户利用数据,运用数据挖掘工具提取出有用知识。主要包括以下几个功能单元:(1)分类模型。对档案用户和所利用档案数据资源进行分类和聚类。(2)推荐引擎。主要根据档案用户数据为用户推荐档案数据资源。(3)评价分析。对档案数据资源所获得的评价进行整理和统计分析,得出用户对所利用的档案资源、服务情况等方面的信息。(4)关联分析。对档案用户数据中所体现的规律和联系进行分析。(5)异常检测。识别档案用户数据中不常见的、反常的实例,提供给感知引擎的上层进行鉴别与决策,判定这是新的档案利用趋势,还是需要特殊服务的用户,或是对档案利用数据的恶意干扰等。

       知识表示层将知识提取层所抽取的知识,表达成为对于档案服务提升、支持决策有用的、可理解的知识形态。主要包括:(1)用户特征表征。例如对用户的身份特征、利用目的等进行分析和展现。(2)档案利用特征呈现。主要展现档案资源所获得的评价信息、档案数据资源获得利用的情况、用户属性与档案利用项目和种类的关系等。(3)趋势变动及预估。主要表现在用户利用档案及评价档案的时间特点、随时间变动的档案资源所获评价、对用户未来档案利用行为的预计,等等。

       行为提示层根据感知引擎所表示的知识规则,提示档案馆应采取策略。主要包括:(1)服务提升。如档案用户间交流群及相应好友推荐、档案数据智能检索等内容。(2)资源建设。根据感知引擎提供的知识来改进档案数据资源的收集与构成。(3)支持决策。应用感知引擎提取的知识支持档案馆的管理决策,实现循数管理的思想。

       “互联网+档案”的根本理念,是建设以用户体验为中心的档案服务系统。因此,用户满意度是对引擎效能的最终极评价指标。本引擎在设计上设置了反馈层,用以收集档案用户对于引擎驱动的“互联网+档案”服务的满意度信息,根据用户满意度来调整和完善感知引擎的架构与技术方案等。

       另外,还应看到,档案用户需求感知问题与档案数据个性化推荐问题,是“同一枚硬币的两个面”。这“一枚硬币”就是档案用户数据。“两个面”中,个性化推荐着重于实现基于上述数据的“用户到用户”的智能资源推荐服务,而档案用户需求感知则着重于“用户到档案管理方”的循数决策机制实现。也就是说,当建立了良好的档案个性化推荐系统后,随之也易于实现对档案用户实际需求的有效感知,这两点对于“互联网+档案”的真正实现皆具有重要意义,也彰显了档案个性化服务技术的战略价值。

       4.注重档案网络安全漏洞测试,增强档案网站安全性

       尽管多数档案网站往往是依靠档案部门外部力量建设的,但是保障档案网站的安全性应当是档案部门自身关注的责任。“互联网+档案”网络安全性的一个重要方面,就是防止黑客利用网站安全漏洞进行攻击。与一般网站相比,档案网站对安全性的要求更加严格。由于档案网站后台数据库中所蕴藏数据具有的珍贵性、凭证性等特质,一旦遭到攻击破坏,造成的后果往往是灾难性的。

       因此,档案部门应通过对自身网站开展安全测试,确定其是否存在安全漏洞。对网站系统的测试主要分为三类:功能测试、性能测试和安全测试。前两者一般是在网站建设阶段由相关技术人员实施完成的,属于“正向测试”。安全测试则比较特殊,是一种“反向测试”,也就是模拟攻击者向被测网站发动攻击,通过观察网站反应确定其是否存在安全漏洞,其可以在网站建设阶段由技术人员实施,但更为重要的是在网站投入使用之后需定期开展,以不断确定安全漏洞存在性。由此,“互联网+档案”时代,档案部门应更多关注档案网站的安全漏洞,承担更多的安全测试任务。

       首先,档案部门要了解当前网络安全漏洞的基本情况。如OWASP(Open Web Application Security Project)研究组织发布的最严重的10种网站(Web应用)安全漏洞,如表1所示。

      

       表1中列举的是当前较为主要的网站系统安全漏洞,而实际存在的Web漏洞种类和形式还不只如此。在实际应用环境中,诸如Microsoft、Apple Computer、EBay、Yahoo、FBl.gov、CNN.com等著名网站都曾经存在过严重的安全漏洞。档案部门应对此问题给予充分重视,积极关注诸如CVE(Common Vulnerabilities & Exposures)等安全漏洞公告,实时了解安全漏洞状况。

       档案部门应与相关技术人员密切配合,应用安全测试软件确保自身网站的安全性。档案部门既可以委托专业技术人员对档案网站进行安全测试,也可酌情自己实施该项工作。当前性能较好的网络安全漏洞测试软件包括:Acunetix Web Vulnerability Scanner、IBM Rational AppScan、HP WebInspect、X-Scan、NBSI等,这些工具基本都属于“爬行—攻击—分析”(Crawling-Attack-Analysis)三阶段式安全漏洞自动测试系统,且从总体上来看,这些软件系统的安装及使用均不复杂,多数档案管理人员经过一定程度的学习与练习,完全可以实现对其较为熟练地掌握。所以,通过应用这些软件工具,档案部门在平时就可以实施对自身网站漏洞的测试,如果发现安全漏洞迹象,应及时与相关技术人员联系,研究解决方案,修复安全漏洞,消除安全隐患。

       对于实现“互联网+档案”,我们应该在现有的网站建设成果基础上,“先打扫屋子再请客”。即先确保现有及在建的档案网站的安全性,消除其安全漏洞隐患;再根据自身实际,采取前文所述的策略,提升档案互联网功能。“安全第一”对于档案互联网事业有着特殊的意义。因此,不同于一般的网站系统,档案网站的安全测试应优于其功能测试、性能测试实施。当然,我们亦不可因噎废食,因为确保网站安全性而阻碍当前档案网站层次的提升。

       我国档案的信息化与数字化建设已经开展多年,档案部门积累了不少相应的建设成果。在这些成果的基础上,当前我们应当抓住“互联网+”国家战略的契机,把握档案发展进步的方向,实现“互联网+档案”的目标。当前一些档案部门已经开始尝试实践“互联网+档案”模式,取得了一定的成效。为了进一步将“互联网+档案”推向深入,本文提出了若干突破点:以“数据化”扩充优化档案数据资源、以“个性化”提升档案网站检索智能化水平、以用户需求感知引擎提升档案部门决策水平、以漏洞测试确保档案网站的安全程度。这四点都是基于当前档案信息化与数字化建设成果,推动“互联网+档案”实现的切实策略,档案部门可根据自身实际情况采纳实施。同时,也可对这些策略进一步完善研究,以不断提高“互联网+档案”的层次,并形成该领域的学术共同体,产生优秀的研究成果。

标签:;  ;  ;  ;  ;  ;  

论我国实现“互联网+档案”的关键问题_互联网+论文
下载Doc文档

猜你喜欢