国内外信息生命周期管理研究综述,本文主要内容关键词为:生命周期论文,国内外论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
所谓信息生命周期管理(ILM)就是依据不同的信息在不同阶段的价值实施不同的管理策略,以简单、可靠、经济、有效的方式使企业获取信息的最大价值,从而有效降低企业的总体拥有成本。信息生命周期管理是一种信息管理模型,对信息进行贯穿其整个生命周期的管理,从创建和使用到归档和处理,它是一种针对信息进行主动管理的过程策略。
本文在对国内外信息生命周期管理研究现状简要介绍的基础上,对国内外研究特点进行对比分析,以期找出信息生命周期管理研究中存在的问题和未来的研究方向。
1 国外研究现状
通过对EBSCO、IEEE、Spring Link等数据库和Google进行检索(2007年9月10日),分别以information lifecycle management、digital resource lifecycle management、electronic resource lifecycle management、 ILM、DRLM、ERLM等为关键词和题名,共得到有效文献192篇,其中学术专著一部,专利文献8篇。
1.1 文献时间分布
如图1所示,国外信息生命周期管理研究始于2003年。2004年文献量急速增长,为2003年的8倍多。2005年和2006年文献都维持在50篇左右,为2003年的近7倍,研究进入了一个相对稳定的时期。由此可见,信息生命周期管理已经受到越来越多的关注,可以预见以后将会有更多的文章对其做深入研究。
1.2 文献作者和机构分析
如表1所示,就个体作者来说,EMC公司的数据存储专家Kovar Joseph F发表了5篇论文,成为发文量最多的学者。美国加州大学圣地亚哥分校信息存储工业研究中心(ISIC UCSD)研究室主任James E Short教授以4篇的发文量位居第二。就研究团队来说,EMC发表了11篇文献,SUN发表了8篇企业白皮书。仅从数量上就可以看出这两家企业在ILM技术上的主导地位。
图1 国外相关文献时间数量分布柱状图
此外,发文在2篇以上的企业有4家,学者有6位。可以看出国外学者对ILM研究还处于初级阶段,没有进行连续和更深层次的研究。
表1 国外ILM研究的主要学者和机构的分布表
1.3 国外研究项目
国外涉及到信息生命周期管理研究的项目主要有:①美国加州大学圣地亚哥分校信息存储工业研究中心(ISIC UCSD)的“信息生命周期管理”研究项目,负责人为J.E.Short。项目开始于2005年10月,目前有研究成果文献3篇,旨在通过调查高层管理人员对“ILM对业务和技术推动作用、ILM的商业价值和易实施性”的态度,考察当前相关行业对ILM的应用评价,以期指出ILM的发展方向[1-3]。②加拿大Hydro One Networks公司的“信息生命周期管理”[4]研究项目(项目编号:ANDERSOD-06010),该项目为了寻找一种基础框架来最大限度的解决企业的存储问题,包括E-mail和老化文件存储。③美国加州大学洛杉矶分校CENS(Center for Embedded Networked Sensing)正在进行“数据管理”[5]项目研究(2007年),Christine Borgman为项目负责人。④国外大型数据存储公司(如IBM)等的科研部门也对信息生命周期管理进行了研究,并取得了一定的成果。
表2 国外相关论文主题分析
1.4 文献主题分析
从表2中可以看出,国外对信息生命周期管理的研究主要集中于五个方面,其中前两项为主要研究方向。
1.4.1 信息生命周期管理综述
综述性的文献主要从宏观和微观角度对ILM阶段划分、实现步骤、实施ILM带来的益处、作用和意义等方面进行研究。主要文献有:Tom Petrocellt的专著《Data protection and information lifecycle management》[5],该书首先对ILM进行详细的论述,主要介绍了数据保存技术在ILM中的应用。Anne Mac Farland主要介绍了ILM的10条特征,并且论述了在ILM中不能忽视对数据的彻底删除和数据保护[7-9]。
James E Short通过调查和实验的方式对ILM分三个层次进行研究,得出ILM在企业中的应用情况和优缺点,并且预测了ILM的发展前景[10-13]。Ying Chen建立了价值变化模型,论述了基于BSA(Business-Semantic-Aware Storage Solution)的集成ILM解决方案[14-15]。
1.4.2 信息生命周期管理的相关技术
从信息存储的角度看,整个ILM涉及信息存储的各项技术。包括网络存储平台、存储基础设施软件、信息复制、备份和恢复软件、基于策略的存储管理软件,以及存储和数据优化服务等。
M Drakard阐述了动态存储结构在ILM的作用,并详细论述了分级存储管理和可视化存储技术[16]。Gauri Shah,Kaladhar Voruganti等提出了ACE(一种ILM的框架模型),论述了ACE的结构、数据分类技术、存储分类技术、数据归档等[17]。
这部分文献还涉及美国专利7篇(均为2006年通过专利认证)、1篇专利申请书(2007年4月1日提交)。从2003年提出申请的System for information lifecycle management model for data migration and replication[18]到2006年的Information lifecycle managing system and its data arrangement determining method[19],再到最新的2007年的专利申请书Restoring A File To Its Proper Storage Tier In An Information Lifecycle Management Environment[20],这些专利涉及到ILM技术的许多方面,如数字迁移和复制、分级数据管理、基于策略的数据备份和恢复系统、适当的数据归档、ILM中的元数据管理等,有的还做出了系统模型。
1.4.3 行业与信息生命周期管理
这部分文献主要论述ILM在相关行业的应用。涉及到金融业、通信行业、医院等行业。
Mearian Lucas阐述了存储区域网络和分层存储技术给银行企业的数据管理带来的便利,以及摩托罗拉公司采用ILM技术以应对数据的爆炸式增长并取得了一定的成果[21-22]。Chen Anne论述了ILM帮助金融企业应对数据危机,管理好日益增多的客户信息和数据[23]。Baffa Chet论述了ILM帮助生命科学公司管理有效的归档数据[24]。Marc Davis论述了多媒体数据的ILM,帮助音响和电影(胶片)企业管理CD唱片和VHS录影带[25]。D.R.Voell着重论述了对病人CT数据的管理,体现了ILM在医院信息管理中的重要作用[26]。
1.4.4 数据存储公司的产品和策略
数据存储服务公司是ILM的主要推动力量,涉及的主要存储厂商有SUN、EMC、IBM、HP、NetApp、StorgeTek等。这部分文献大都是各个公司宣传自己的产品、介绍ILM实施策略、技术创新、数据分类方法、数据迁移技术和自动磁带控制技术等方面。在这36篇中仅SUN公司发表的白皮书就有9篇,占25%。此外,EMC在该领域也有较多的文献发表。
1.4.5 目前信息生命周期管理中存在的问题
ILM作为新兴的信息管理策略有着前所未有的优点,但是由于ILM理论提出时间较短,还存在许多不完善之处。
Bahazar Henry指出是否任何具有数据分析和迁移功能的解决方案都可以标称为ILM?究竟什么样的软件和系统才能称为ILM?ILM需要一个标准[27]。Marks Howard阐述了ILM需要一个统一的标准规范,需要整合文件分类系统、E-mail自动归档系统和数据库,需要制定政策减少采用ILM的花费[28]。James E Short在其调查研究报告中也指出了ILM应用中所存在的问题:没有整合应用多种技术;费用过高、系统较为复杂;较为关注技术而忽略了系统的易用性;缺乏标准来保护用户的利益等等[29]。
2 国内研究现状
通过检索CNKI、维普、万方、超星等数据库以及GOOGLE(2007年9月10日),以信息生命周期、信息生命周期管理、网络信息生命周期、信息资源生命周期、数字资源生命周期管理、IL、ILM、IRL、DRLM等为关键词和题名进行检索,共得到有效文献51篇,其中全国硕士优秀毕业论文1篇,学术专著1部。
图2 国内相关文献时间数量分布柱状图
2.1 文献时间分布
如图2所示,我国信息生命周期管理研究也始于2003年,有文献2篇(其中一部为专著)。2004年进入研究高峰,发表文献数量为2003年的6倍,2005年达到顶峰。从2004年开始每年的论文发表量维持在15篇左右,表明我国学者开始关注信息生命周期管理,进入了相对稳定的研究时期。
2.2 文献作者分析
在国内进行信息生命周期管理研究的学者较少,成果还不集中。目前,索传军和苏新宁等四位学者各发表有两篇论文。可以看出,我国学者在信息生命周期管理方面还没有进行系统和深入的研究,并且这些论文的作者基本都为图书情报界的学者。
2.3 国内研究项目
国内专门研究信息生命周期管理的项目还很少,目前有郑州大学文献信息资源研究中心的“基于信息生命周期的数字馆藏管理”项目,主持人为索传军教授,相关成果有——基于ILM的数字馆藏管理策略。
涉及到信息生命周期管理的项目有:①国家自然科学基金资助项目“基于秘密共享的可扩缩多播密钥管理算法及协议研究”(项目编号:90304015)的研究成果之一——信息生命周期管理的分层模型及实施方法,何俊、戴浩、马琳茹等著。②国家社会科学基金项目“图书馆信息资源数字化建设模式研究”(批准号:05BTQ007)研究成果之一——信息资源分级存储实现信息生命周期管理,白光思著。③国家自然科学基金资助项目(项目编号70373028)、南京工业大学优秀学术团队建设项目“电子政务中信息资源管理对政府辅助决策的研究”成果之一——政府信息资源生命周期管理总体模型与实证分析,朱晓峰、苏新宁著。④国家自然科学基金重大研究计划子项目(项目编号90412010)和教育部中国网格工程基金资助项目“网络计算应用支撑中间件/网络计算安全支撑环境”的研究成果之一——FDSSS:An Efficient Metadata Management Scheme in Large Scale Data Environment,金海、熊慕舟等著。
2.4 文献主题分析
表3 国内相关文献主题分析
(注:因某些文献涉及多个主题,数据存在累计叠加)
如表3所示,目前我国对信息生命周期的研究主要集中于五个方面。其中行业与信息生命周期管理为研究的重点。
2.4.1 信息生命周期管理综述
这方面的著作有杜国强的《信息生命周期管理》[30]。这是我国第一部从整体上研究信息生命周期管理的专著。翁佳在半衰期和文献寿命的基础上,引入了ILM的概念[31]。粟湘,郑建明等同样在半衰期和文献寿命的基础上,分析了ILM的概念、特点,创造性的提出了信息生命周期管理模型[32]。何俊,戴浩等在粟湘和郑建明的研究基础上针对ILM进行深入研究,设计出ILM的分层模型,提出信息生命周期管理实施的方法并对具体案例进行分析[33]。
2.4.2 图书馆行业与信息生命周期管理
索传军探讨了利用ILM理论对数字馆藏的科学管理问题[34]。该作者还依据数字资源在其生命周期中价值的变化规律,提出了针对不同类型的数字馆藏制定不同管理策略的新理念。从而指导图书馆实现对数字馆藏的建设与管理,使其以最低的成本获得最大的服务效益[35]。
楼宏青分析了三种主流存储系统的特点及网络存储系统的优势,以及利用自动化网络存储实施信息生命周期管理的三个要素,并提出一个基于SAN的高校数字图书馆存储解决方案[36]。史敏鸽运用数据信息生命周期管理理论,分析分级存储技术在数字图书馆建设中的应用与管理[37-38]。
2.4.3 其他行业与信息生命周期
朱晓峰,苏新宁在分析生命周期方法的基础上,提出了政府信息资源全生命周期管理的思想,并构建了链状、环状和矩阵型三种政府信息资源的全生命周期管理模型[39]。该作者还构建政府信息资源生命周期管理总体模型,通过具体实例进行实证分析,进而验证政府信息资源生命周期管理的价值[40]。
彭若愚主要把ILM应用于工程项目管理中[41]。李全凯论述了ILM理论在医院信息系统数据管理中的应用[42]。汪琼阐述了采用分级存储的技术来实现各类基础测绘数据的存储[43]。何涛针对电子商务数据存储管理现状及企业在电子商务活动中ILM及应用进行了论述[44]。崔可升,孟祥武以山东移动为例,分析了ILM在电信运营支撑系统中的应用[45]。
2.4.4 信息生命周期管理的相关技术
金海,熊慕舟等阐述了元数据的查询和检索性能很大程度上影响了存储系统的效率,特别是ILM这种大型数据系统,并在此基础上提出了一种元数据管理方案(FDSSS)[46]。台湾“国立高雄大学”的Ching-Hung Lin、Shou-Jen Wey论述了一种新的快照(Snapshot)数据管理方式来代替以往的ILM方式[47]。白广思论述了三级存储是存储系统的发展方向,是保证大数据量数据管理的有序性和控制存储预算的有效方法[48]。
2.4.6 网络信息生命周期管理
罗贤春提出了一个新概念:网络信息生命周期,分析了每个阶段(从网络信息的发布、采集和组织管理、开发、利用到最后的更新处置)存在的必要性和相应的实现方法以及这几个阶段之间的关联性,最后总结了其与传统的信息生命周期的不同点[49]。
3 电子文件生命周期
信息生命周期管理在档案学界被称为电子文件生命周期管理(Electronical Records Lifecycle Management)。通过检索相关数据库,共得到相关论文13篇。其时间分布见表4。
1997年国际档案理事会电子文件委员会制定的《电子文件管理指南》,把电子文件的生命周期划分为三个阶段,即:概念阶段、形成阶段和维护阶段。国内目前对于电子文件生命周期的研究大多是探讨电子文件生命周期的划分、电子文件生命周期和文件生命周期的区别等方面。
何嘉荪详细论述了文件生命周期理论也是电子文件管理的基础理论,提出要依据文件在运动过程中价值变化的规律,找出适合电子文件和传统文件的生命阶段划分方法[50]。刘永提出了电子文件的螺旋生命周期[51]。于丽娟提出了对现在的电子文件生命周期阶段划分的质疑[52]。张魁从四个方面论述了电子文件生命周期中的元数据管理[53]。潘连根在对比分析目前档案学界对电子文件生命周期阶段划分的基础上,提出了四个阶段的划分方式[54]。
4 国内外研究的对比分析
从研究整体和研究内容上来看,国内外存在很大的相似之处。研究都起步于2003年,2004年达到文献量的峰值,文献量随着研究的深入保持平稳发展的态势,并凸显了重点研究领域。但是,国内与国外在研究方式、研究范围及研究成果形式等方面存在着以下的不同之处。
4.1 研究时间和研究成果
①国外与国内的研究几乎同时起步,都取得了较大的发展。
②从研究成果数量上来看,国外相关文献数量192篇,国内仅有51篇(不包含电子文件生命周期),是国内的近4倍。
4.2 研究机构和研究者
国外核心团队、核心研究人员多,且结构多样化,主要为大型数据存储公司的技术人员,还包括高等院校科研人员、图书馆资深工作人员等专家学者;国内研究人员较少,力量单薄,多为高校信息管理院系或图书馆研究人员,相关科研机构和部门很少参与,还没有形成有力量的研究团队。
4.3 研究内容
从表2和表3可以看出国内外的研究集中于信息生命周期管理综述、信息生命周期管理的相关技术、信息生命周期管理的应用等方面。国外和国内在研究内容上各有千秋:
①国外信息生命周期管理综述的文献占44.7%,其次是关于技术方面的研究占28.6%,国外的学者主要关注于在数据管理中引入信息生命周期管理和相关技术的实现方式;国外的大型数据存储公司对自身的产品和技术也发表了大量的研究报告;对于信息生命周期管理存在的缺点,国外学者也进行了一定的研究。②国内的研究主要集中于信息生命周期管理在相关行业的应用,这部分文献占了45.4%,其中与图书馆相关的占21.8%,这与大多数学者的图书情报工作背景是分不开的。国内的研究信息生命周期管理综述和相关技术方面的文献,都以转述国外研究成果为主,鲜有独创性研究。
4.4 研究方法
①由于信息生命周期管理还是个新的管理策略,国内外的研究还都不够深入和彻底,还缺乏对其的实证性研究。
②国外研究大都以企业集团、科研机构等组织形式进行研究。采用调查和模型分析的方式进行研究,注重研究过程的实践性。我国研究者大多以理论分析为基础,一般都局限于个体范围内,处于较为感性的阶段。
4.5 研究成果形式
①国外的研究成果较为多样化:有公开发表的学术论文、技术专利、实践性较强的研究手册、报告、白皮书,还有公开出版的专著。
②国内的研究成果从形式上来说较为单一:绝大多数是以理论性较强的学术论文形式发表于国内图书情报刊物上,也有公开出版的专著。
总之,与国外的研究相比,虽然我国学者在信息生命周期管理研究方面已经取得了一些成果,但是还是比较肤浅,处于起步阶段。既缺少进行全面系统研究的学者,也缺乏相对新颖和独创性的理论。国外学者比较注重知识产权的保护,对相关技术申请了专利,可以更好的将研究成果转化为现实生产力。值得肯定的是,我国学者在信息生命周期管理与相关行业的应用方面的研究有了很大进展,尤其是在图书馆行业的应用上做了深入研究。
5 信息生命周期管理方面有待研究的问题
5.1 加强信息生命周期具体内容的研究
目前国内外的这些研究,对于信息生命周期管理价值的核心部分——信息价值的评估和测度、信息价值的变化规律还缺乏定量分析,而真正进行ILM各阶段时间长度的划分、各阶段信息价值的确定、各阶段信息价值的变化规律、何时进行数据迁移和归档,以及用定量的方式对ILM进行研究还未曾见到,这也是当前研究的重点。
5.2 深入对信息生命周期管理的技术研究
信息生命周期管理中技术方面目前存在以下问题:没有完善的数据分类引擎和分类方法;缺乏整合E-mail的系统和数据库文件的ILM系统;数据存储的安全性不够好;技术在实际应用中过于复杂给用户增加了很多负担;数据迁移和归档技术不完善等等。目前我国在上述方面的研究还是空白,这是亟待加强研究的一个领域。
5.3 注重信息生命周期管理的应用性研究
虽然目前许多国际著名的数据存储公司都提供了ILM服务,但是用户在使用过程中花费过多,系统较为复杂不利于使用;过多的ILM解决方案也使得用户无所适从,也无法合理保护用户的利益。这方面需要有更多的数据存储公司、企业单位和图书情报部门参与进行研究。
5.4 加强信息生命周期管理规范性研究和评估体系研究
①各大数据存储公司都有各自不同的ILM策略,给用户的实施和应用带来了一定的困难,这就需要建立一个统一规范,来确定ILM的具体内容、价值、技术和实现方式等。
②ILM是个长期的过程,不能一蹴而就,但是企业的管理者往往过度关注短期成果和效益,不注重ILM给企业的长期发展带来的益处,所以建立长期的、跨阶段的ILM评估体系极为重要。
对信息生命周期管理的规范性和评估体系研究是我们对信息资源实施自动化科学管理的基础,因此加强该方面的研究有着十分重要的意义。目前国内外在这两个领域的研究还尚属空白。
总之,信息生命周期管理研究还有许多有待研究的问题。除上述应加强研究的四个方面外,在研究中要加强合作,加大研究的合作范围。①我国要积极参与到国际相关研究中去,借鉴国外研究成果,加快我国信息生命周期管理的研究进程,提高研究成果的规范性和科学性,注重知识产权的保护。②研究人员要与社会相关单位加强合作,尤其加强与数据存储公司的合作。③要加强研究的广度和深度,多进行原创性研究,避免简单地转述国外的研究成果。
收稿日期:2008-03-29