自动化技术条件下的图书馆统计分析系统,本文主要内容关键词为:统计分析论文,条件下论文,图书馆论文,系统论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
图书馆统计工作是通过各种数据准确、及时、客观、全面、历史地反映图书馆运行状态,并通过科学的统计指标体系和管理模式来评价、分析图书馆的运行状况,为图书馆各项工作的计划、决策提供科学依据的过程,在现代图书馆管理工作中有着举足轻重的作用。
自动化技术的发展对图书馆统计工作在深度和广度上都产生了深远影响,使管理人员从烦琐的手工统计工作中走了出来。利用图书馆管理系统可以对图书馆工作的各个方面工作进行历史的、全面的统计、分析和评价。统计出来的数据为比较分析奠定了基础,通过比较分析和综合研究,从而掌握和反映各项工作的特点、联系与运行规律,从而起到指导、改进工作的管理效果。
现行图书馆统计系统虽然功能较强,但其设计还基本停留在按各指标统计数据的罗列枚举方式上,一方面不能适应灵活、多变的统计需求,另一方面对于统计分析功能的设计考虑还不够充分。虽然管理人员可以通过统计模块提供的数据导出功能或通过数据库将各种数据导出,利用其他表格处理软件进行分析研究, 如Excel,但其效率低、困难多、不规范,随意性大,且需要操作人员具有较高的计算机应用能力。因此利用图书馆管理系统高效、安全地进行各种运行数据的比较分析就成为图书馆管理工作的迫切要求。若在现有系统中加入庞大的比较分析功能是不可取的,且会对现行系统的正常运行产生干扰,应独立建立一个图书馆统计分析系统。基于此,本文对图书馆统计分析系统中的数据基础、统计分析理论及方法等方面进行了一些探索、研究。
1 自动化技术为图书馆统计分析提供了良好的数据基础
图书馆自动化系统是以数据库技术为核心的信息管理系统,已经覆盖了图书馆工作的所有领域,并忠实地、每时每刻记录着图书馆运行中的各种基础信息。这就为图书馆的统计分析提供了前所未有数据基础。
(1)表、记录、字段不同数据为多层次统计提供了多样性选择。数据库技术是以不可分割的数据项(即字段)为基本单位记录信息,而这些信息真实地反映了图书馆运行过程中各个业务工作进行中的基本状态。数据库技术所提供的字段、记录、表三个层次的信息查询功能为图书馆统计分析提供了多层次统计选择的技术基础。
(2)数据的多样性组合提供了统计灵活性组配基础。强大的查询功能(SELECT语句)是当今流行的关系数据库的显著特点,它可以灵活组合数据库中的各种信息,提供多样化的统计信息。它既可以提供表内信息的灵活组合查询,也可以提供表间信息的灵活查询组合,从而可以提供满足图书馆所有统计需求的基本信息。但由于相关技术的制约,目前还不能提供高层次的统计分析信息。
(3)实时性为统计提供了丰富的统计时段选择和历史分析基础。 数据库技术可以将图书馆运行中所产生的3W(即What、where、when)实时地记录在数据库中。尤其是时间信息可以秒为计时单位进行运行状态记录,极大地丰富了统计信息的时段选择。年、月、旬、周、日、时、分、秒均可成为自动化系统中统计时段的选择。同时,也使得自动化系统进行三维统计信息的分析成为可能,人们可以利用不同时段的统计数据进行历史地对比分析。
(4)为电子信息资源的统计提供了技术支持。 电子信息资源已成为当今图书馆越来越重要的资源,其利用率在整个图书馆业务中所占比例在逐年上升,对电子信息资源的利用信息的统计应成为图书馆业务统计的重要组成部分。不断出现的新的计算机技术和网络技术为电子信息资源的利用统计提供了技术支持。
2 在统计理论的基础上建立灵活的统计模型及指标体系
通过对图书馆自动化系统及图书馆统计工作的研究,作者认为,现代图书馆统计工作的任务是:深入研究现代信息技术、图书馆自动化系统、统计学和当代图书馆运行、管理的理论和方法,探索现代图书馆统计工作的理论和方法,并依此为理论指导,开发现代图书馆统计模型、统计工作模式及统计软件,切实反映图书馆运行状态,为图书馆各项业务工作、管理工作提供科学的决策依据。在此基础上,应研究和建立统计、分析指标体系和灵活的统计分析模型。
(1)如何建立准确、 完善和可操作的图书馆统计指标体系是一个长期以来困扰着图书馆理论界的问题,也是影响统计工作不能很好地发挥作用的主要因素。在指标体系中,根据统计数据的作用和粗细程度可划分为:管理决策级统计指标、业务管理级统计指标和业务运行级统计指标。在所有的指标体系设计、制订中应紧紧围绕着“采、藏、用紧密联系”和“最大限度发挥文献的利用价值”的原则。在所有分析指标体系中,应着眼于各个指标体系在时间上的对比分析和同类及相近业务状态的对比分析。管理决策级统计指标着眼于整个图书馆运行状态的宏观信息,统计时间间隔较长(如月、季、年),如馆舍年增加量、年读者进馆数、年经费递增数、文献年利用率等。业务管理级统计指标的统计范围围绕着部门进行,其统计时间间隔较短(如月、旬、周、日),如阅览部月接待读者人数、读者日图书借阅量、科技类图书日平均借阅量、某学院读者月进馆人数等。业务运行级统计指标主要针对某业务岗位或业务处理流程进行信息统计,其统计时间间隔更小(如月、旬、周、日、小时),如编目人员日均编目量、流通人员日借书量等。在统计分析指标中有三类统计范畴:数量、均值和比率。数量主要反映了某一时段某种业务统计对象实际发生的数量。均值主要反映了某时段、某个统计范围的某种业务统计对象平均发生的状态水平。比率反映了某时段、某统计范围的某种业务实际发生数量在应该发生数量中所占的百分比。
(2)在建立了能够真实、准确地反映图书馆的工作状态,并有实际的对比、 分析和指导意义指标体系的基础上,即可根据各馆的实际业务需求设计和建立自己的统计分析模型,并在相应的软件上实施。灵活的统计、分析模型的建立需要相应的统计软件技术支持,它完全克服了现有软件在统计功能上简单罗列的模式,而是提供了对自定义统计指标的支持,从而可以满足用户的多种特殊统计需求。软件系统是由用户界面,查询、统计自定义,报表输出自定义,SQL查询、统计组配,数据字典,数据库六部分组成。
数据库中存储了图书馆运行中的各种原始数据,是系统统计数据的来源地。在系统的设计和实现中应充分考虑到DBMS的差异和数据库中存储信息的差异。由于当前主流DBMS均是关系系统,并支持SQL查询和ODBC技术。这是克服DBMS 平台差异的基础。
数据字典用来存储各数据库及表、字段的命名、类型、储存位置等描述信息,是源数据的元数据描述。关于数据库模式的描述信息可以通过各数据库管理系统中类似于生成SQL脚本的方式得到,并通过相应的解析器将这些信息规范化地存储到数据字典中,以便提供后续统计分析和报表生成中所需的数据路径信息。
查询、统计信息的自定义是一个查询、统计信息的模式定义语言,它负责将用户界面所描述的用户查询、统计需求解释为SQL的条件和结果集描述。通过该模块用户可以灵活地根据需要自定义查询、统计、分析项目。用户统计、分析需求的表达,计算公式的编制,数据源支持数据的基础需要使用计算数据链路来加以联系。即用户可以一定的方式给每一项统计、分析进行命名(即统计、查询策略),每一项统计、查询策略可用公式元素和运算符加以组合计算,而每一项公式元素必须是从源数据能够加以计算的。每一项统计、查询策略能否成功的关键在于是否能够找到从数据源到公式元素的数据链路。
报表定义输出自定义需以查询、统计信息的结果集为依据进行相关操作,完成报表格式的交互定义和输出信息的报表解释工作。
用户界面负责与用户的交互输入与输出,一方面通过该界面用户可以定义所需的查询、统计条件和报表输出格式,另一方面统计结果也是由该部分向用户展现。
3 图书馆统计分析系统的功能展望
(1)统计分析功能的深度与广度。现在的图书馆统计系统多是以部门为范围进行独立统计,这就在统计信息的全面性上大打折扣。事实上图书馆很多业务统计分析是需要跨部门进行的,这样才能较为全面地反映图书馆工作的内在联系。交叉统计分析主要将图书馆各业务部门的内在关系作为统计分析的基础,进行多侧面、多时段、不同类型的统计分析,以便反映图书馆运作中的采、藏、用三者之间规律。如:
①读者量与借阅量及馆藏量三者的统计分析。交叉统计可以统计出在一个时段或多个时段中,本馆注册读者中有多少读者使用图书馆,其中有多少为在馆阅览;有多少为借阅,各类读者借阅哪一年代段的馆藏及数量,且占各类馆藏总量的比例等。通过分析可以进一步了解阅读动向、读者分布以及馆藏分布的关系,从而科学地提出馆藏补充方案,同时可对不同的读者采取不同的服务方式。
②读者借阅量与馆藏量及采访的统计分析。交叉统计可以统计在一个时段或多个时段中,不同层次读者借阅该时段内新购置文献的数量以及其在新购置文献中的比例等。通过统计分析了解读者的各种阅读倾向和科研动态,针对读者需要、采购质量建立起一个为读者所需的藏书体系。结合其他因素及时调整订购文献的比例,控制馆藏方向,达到藏书体系的最佳模式。
图书馆工作中具有内在联系的工作还很多,通过交叉统计分析研究可以推动图书馆的统计分析工作向深度和广度发展。
(2)统计分析功能的灵活设置。 现在大部分统计系统中统计功能是系统人员预设好的。由于各个图书馆管理水平和关注内容在不同时期会有所变化,尤其是各个图书馆的统计分析在分析测度和标准上有所区别,作为图书馆软件使用者很难在固定不变的功能设置下增加新的内容。由此,研究、开发具有统计分析功能的灵活设置的计算机软件可以克服这一问题。
(3)灵活的报表输出。报表是统计分析结果的最佳表现形式。 报表格式的交互式自定义功能可以完成对某统计、查询结果输出报表格式的灵活定义。可根据结果表现的需要选择数据表现形式。
4 小结
尽管目前各图书馆均利用图书馆自动化系统开展了大量的统计工作,但该方面的工作仍停留在表面,还缺乏深入的统计分析和研究,因此在指导图书馆工作上还缺乏科学性。全面、深入、细致的图书馆统计分析指标体系仍是图书馆学研究中的薄弱环节,而科学合理的指标体系是开发更为灵活的统计分析系统的基础,这些方面的研究还需图书馆界的同行付出更多的努力和探索。