采用因子分析法构建数字资源选择标准体系,本文主要内容关键词为:因子论文,分析法论文,体系论文,数字论文,标准论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
馆藏资源是图书馆功能发挥与服务效益实现的基础。数字环境下,信息资源的状态、用户需求、图书馆运行模式等正在发生转变,传统环境下发展的资源选择标准应用于数字资源的选择具有很大局限性。开展数字资源选择标准研究,既有利于提高图书馆数字资源选择工作的科学性和规范性,也有利于实现图书馆资源配置的最优化,同时有利于提升数字资源建设的效果和效益,最终为图书馆创新服务模式、拓展服务空间、实现持续发展提供支持和保障。数字资源选择标准研究为国内外图书馆理论与实践界所重视。然而,如何建立既能反映用户需求,同时又具有代表性和实际应用价值的数字资源选择标准体系,目前仍处在不断探索中。本文在结合已有学者及机构的相关研究、国内外馆藏发展政策中的现行选择标准的基础上,提出数字资源选择标准初始集合,继而采用因子分析法,通过实证研究的方式,验证其在图书馆资源选择业务实践工作中的重要性及适用性,最终构建数字资源选择标准体系。
2 研究方法
2.1 建立数字资源选择标准体系初始集合
数字资源选择标准体系初始集合建立在对已有研究及馆藏政策的考察基础之上。数字资源选择标准研究是国内外相关研究的热点问题之一。霍里曼(Curt Holleman)认为,资源选择的四个基本标准——质量、与图书馆的关联性、功能技术以及成本在数字环境下依然有效。但它们的实际含义、判断方法发生了变化,而且数字资源的选择将变得更加复杂和困难[1]。它涉及授权许可协议、多样化的定价模式、设备、空间、资源类型的取舍、技术支持、供应商支持等多种因素[2]。此外,数字资源选择与本地馆藏的实际状况相符合也是选择决策中需考虑的重要因素[3]。李(Leslie A.Lee)和吴(Michelle M.Wu)认为根据不同图书馆战略发展目标、馆藏发展政策中陈述的不同需求,数字资源的选择决策也应有所不同。但他们同时指出,数字资源的内容、功能、长期使用、用户以及成本标准在众多数字资源选择决策中是通用的。随着新技术的发展,数字资源的表现形式可能日新月异,图书馆必须定期评估审核数字资源的选择标准,并根据环境的变化适时调整[4]。国内学者罗春荣、曹树金认为应从用户需求、资源内容、使用的方便程度、使用与运行环境、成本效益、后续服务6方面考察数字资源选择问题[5]。肖珑和张宇红从数字资源内容、检索系统及功能、使用情况、价值与成本核算、出版商/数据商服务、长期保存6个方面提出选择评估数字资源的指标[6]。张晓林等结合中国科学院国家科学数字图书馆数字资源建设的需要,提出了数字资源采购的总体原则、资源内容要求、资源利用要求、支持性服务的要求、支持互操作与集成的要求、长期保存要求等[7]。该研究突破了仅考虑数字资源内在价值的局限,对于实践具有重要的参考价值。
此外,一些研究组织、图书馆联盟等在该领域的研究也很活跃。如图书馆共同体国际联盟(ICOLC)发布并两次修订了《关于当前电子资源选择与购买及首选策略的声明》[8],数字图书馆联盟(DLF)发布《商业电子资源选择与保存:问题与实践》报告[9],就数字资源选择的多项重要问题展开讨论,包括:许可制度、价格模型和购买模式、长期保存与使用、选择政策与策略计划、机构经费及组织、用户支持、持续评价及使用统计信息、数字资源管理的综合系统等。
从国内外图书馆组织、图书馆制定的馆藏发展政策、资源引进等政策来看,现行数字资源选择标准主要涉及以下方面:资源内容的评鉴、系统功能及技术的要求、资源成本的评估、资源许可协议的规定、资源供应商及其服务的考虑和资源长期保存的考察等[10][11][12][13][14][15]。如针对资源内容,美国国家农业图书馆《电子资源选择政策》就提出了如下标准:“资源需反映准确性、完整性、客观性及权威性或包含提供指向这类信息的链接;资源的责任机构应易于确定;资源应来源于公认的权威人士、出版者、协会或政府机构;资源应及时更新从而足够有用,无论何时,资源的时效性对于资源本身的主题而言都是十分重要的。”[16]
对上述研究及馆藏政策中提出的数字资源选择标准进行内容分析,可将其归纳为资源质量、资源使用、资源服务、资源契合、资源成本、资源风险六个维度,并提炼出相关的测评标准(见表1)。其中,资源质量、资源使用、资源服务是从微观角度提出的选择标准维度,属于对资源本身特质的考察;资源契合、资源成本、资源风险是从较为宏观的角度提出的选择标准维度,即主要兼顾数字资源自身特征以外的外部因素影响。宏观和微观是相对的,完整的数字资源选择标准是两者的有机结合。
2.2 调查的设计与实施
本次调查的目的在于:明确调查对象对本研究提出的各个图书馆数字资源选择标准重要程度以及适用性的认知,实现数字资源选择标准的复选和优选过程,并由此确立最终的图书馆数字资源选择标准体系,从而验证研究假设:“尽管不同群体对数字资源选择标准的认识存在差异,但寻找和确立一套具有代表性和适用性的图书馆数字资源选择标准体系是可能的。”
2.2.1 调查对象的确立
以中国国家图书馆主页以及中国教育和科研计算机网提供的导航为样本获取的途径,两者去重后共计303家图书馆。这些图书馆分布于中国内地各个地区,涵盖了“211工程”高校,省级、直辖市或部分副省级城市的公共图书馆以及科研图书馆。此外,还包括很多各地区具有代表性的中型图书馆。在此基础上,通过网站调查的方式了解这些图书馆订购数字资源的数量,其中订购数字资源在3种以上的图书馆为273家(见表2),由此确定抽样框调查对象来自于这些图书馆。
抽样框内各图书馆一般在网站提供了馆长联系方式或各部门联系方式、服务电话等,笔者以这些联系方式为基本途径,以邮件及电话访问的方式了解该馆负责数字资源建设的馆长、部主任或馆员的联系方式。部分图书馆直接提供了数字资源建设部门或采购部门主管数字资源建设主任的联系方式(如华中农业大学图书馆、武汉大学图书馆等),这些部门的部主任直接确定为调查对象;此外,通过与图书馆相关数字资源建设馆员的交流,获得了国内部分图书馆负责数据库选择采购馆员的电子邮件。原则上是每家图书馆确定一位调查对象,另考虑到网络调查问卷回收率普遍较低的问题,部分图书馆如果能够获得超过一位业务涉及数字资源建设专家的联系方式,均将其列为调查对象。
2.2.2 调查问卷的设计
问卷共分为三个部分:(1)第一部分是调查对象的基本资料。(2)第二部分调查图书馆数字资源选择业务的基本情况。(3)第三部分考察调查对象对本研究提出的图书馆数字资源选择标准重要性以及适用性的认知。依据提出的图书馆数字资源选择标准初始集合所设计的问题,每一问题均涉及选择标准的重要性和在图书馆的适用性两个方面。其中,适用性是指该标准在调查对象所在图书馆应用的可能性,它与图书馆现实条件限制、数据的可得性相关联。采用李克特(Likert)五分量表,设置五个评分等级供调查对象选择。分数越高,表明重要程度越高或适用性越强。通过小规模调查测试,依据一些调查对象提出的意见对问卷进行了多次修改,最后确定正式的调查问卷。
2.2.3 调查的实施
设计网络调查问卷,通过电子邮件将问卷的链接地址发送给调查对象。2008年12月1日至15日,为第一个调查周期,根据问卷回收的情况,于2008年12月15日至30日,向调查对象再次发送问卷。本次调查共发放问卷300份,回收132份,回收率为44%。依据答题数超过40道(即≥总题数的2/3)即为有效问卷的判断标准,回收的有效问卷为125份,有效率为41.47%。其中,国家图书馆共征集了5位数字资源建设专家的意见,回收问卷涉及的图书馆共计121家。
2.3 统计分析方法
因子分析(亦称为因素分析)主要用来研究多个变量之间的相互关系,是多元统计分析的一个重要分支。它运用对诸多变量的相关性研究,剔除多余变量,从而实现用假设的少数几个变量来表示原有变量的主要信息[17]。因子分析所具备的这种特点和优势,使其在社会学、经济学、管理学、医学等领域都得到了广泛应用。如宋健采用层次分析法和因子分析方法构建地区信用环境的评价指标体系和评估模型[18];刘举等运用因子分析法构建我国综合大学创新能力评价指标体系[19];徐革运用因子分析中的主成分分析法重新构建电子资源综合评价指标[20],但其仅从数学角度考察了其可行性,并未开展相关的实证研究。本研究将根据选择标准重要性调查结果,运用因子分析方法提取选择标准,再结合选择标准的适用性调查结果实现选择标准体系的优化。
3 研究结果分析
3.1 调查问卷的信度和效度分析
应用SPSS软件计算Cronbach内在信度系数值,得到各维度下选择标准的重要性和适用性的Cronbach系数均大于0.8,这说明本次调查测度问题具有内在一致性。采用独立样本T检验测度本次问卷调查的外在信度(即不同时间进行测量时调查表结果的一致性程度)。将第一次和第二次问卷发放后回收的有效问卷进行独立样本T检验发现,除“资源风险”在适用性方面两次调查的P值小于0.05外,每一标准维度重要性和适用性的P值均大于0.05,可以认为总体上两次调查结果不存在显著差异,调查样本所在总体分布一致,本研究设计的问卷及调查实施具有一致性和稳定性。
一般认为,效度考察的是研究所使用的工具及方法能否有效反映研究的问题,以及在多大程度上有效反映。问卷样本的重要性和适用性效度的AVE系数分别为0.71和0.73,均大于0.5,符合统计学对于问卷结构效度的要求,表明研究工具真实体现了研究所依据的理论结构。
上述调查结果的信度和效度分析表明,调查问卷设计及调查结果具有较好的一致性、稳定性和有效性,能够反映样本所在总体的分布情况。
3.2 选择标准的重要性因子分析
利用因子分析方法实现复杂变量的简化,往往是利用一组观测值实现的。考虑到选择标准适用性是标准体系制定的参考依据,因此,本研究将调查对象对选择标准重要性感知得分作为因子分析的观测值,实现选择标准初始集合的第一次优化。具体过程如下:
首先,评估运用调查数据进行因子分析的可靠性。因子分析的受试总样本数量一般来说不得少于100人[21]。本研究获得的样本量为125人,符合因子分析对样本量的要求。再对调查数据进行KMO取样适当性度量和Bartlett球形检验。因子分析的KMO值为0.861,大于0.80,说明适合进行因子分析。此外,Bartlett球形检验的近似卡方值为4096.339(自由度为1128),达到0.05的显著,代表各变量(每一选择标准即为一个变量)间有共同因素存在,适合进行因子分析。
其次,运用SPSS软件的因子分析功能,选择主成分分析法抽取因子,并采用最大方差旋转法旋转主轴,以取得选择标准体系主要的因子结构。以特征值为1作为抽取因子的标准。表3说明共抽取出11个共同因子,其中总和栏为特征值,“初始特征值”中“总和”栏的总和刚好等于变量数48。
确定抽取的因子数(即11个因子)后,得到旋转后的成分矩阵,整理各个因子及其相关的变量、因子负荷量的值,得到表4。
旋转后的成分矩阵根据各共同因子中变量(在调查问卷中以题项表示)的因子负荷量的大小排序,各共同因子所包含的变量见表4。同一共同因子下各变量的因子负荷量绝对值均大于0.4,表明共同因子对这一变量的解释度足够,关系紧密度较好,符合因子分析的要求。根据多数研究者编制层面的实际经验,一个层面的题项数最少在3题以上,否则题项太少,无法测出所代表的层面特质,其内容效度会不够严谨。因此在因子分析时,如果共同因子所包含的变量数目只有2个或1个,可以考虑将此共同因子及相关变量删除[21]。此外,考虑到越靠后的因子敏感度愈小,即最后一个因子对整体的贡献率最小,因此,将第11个共同因子及其变量“收录的数据量”和“收录内容的时间跨度”删除。重复上述步骤,直至共同因子所包含的变量数大于或等于3。相关结果见表5。
第四次因子分析因旋转后的成分矩阵中,各共同因子包括的变量均大于3个,数目适当,符合内容效度的要求;此时共同因子数量由11个简化为9个。通过上述因子分析得到的各因子之间的变量(即选择标准)关联度最强,能够较好解释原有标准体系所要测度的目的。上述分析过程共删除5个选择标准,这也从一定程度上说明提出的图书馆数字资源选择标准初始集合已经具有较好的代表性和关联度。
在未能辨析若干变量之间相互关系的条件下,通过获得这些变量的实际测度值,以因子分析为主要途径,能够实现对各个变量关系的归纳和综合,这也是部分研究将隶属于共同因子的变量归为同一类别的原因。与上述研究不同的是,本文在借鉴已有研究的基础上,已经提出了图书馆数字资源选择标准体系的6个维度,并分析提取若干选择标准分别解释这6个维度,即归类这一过程已经完成。本研究运用因子分析法,主要目的在于分析各选择标准之间的相关关系,以各变量形成的共同因子内容效度较强、对整体选择标准体系解释能力强为标准[5],根据这一判断依据,每次因子分析后变量数(即选择标准数)少于3个的共同因子不符合要求,将其删除,从而使得保留的各变量之间相关性和代表性最强。
3.3 选择标准的适用性分析
本研究采用李克特五分量表测度选择标准的适用性,选择标准适用性得分为1,表明其在调查对象所在图书馆无法应用;若得分为5,表明其在调查对象所在图书馆非常适用,即得分越高,适用性越强。以选择标准的适用性得分大于或等于4作为筛选的阈值(因为大于或等于4分即表明该标准在调查对象所在图书馆数字资源选择实践中能够较好地应用)。统计经过因子分析筛选的选择标准适用性得分,结果如表6所示。
很多数字资源选择标准虽然非常重要,但是由于缺乏支持数据等现实条件的限制,并不能在实践工作中得到很好的应用。表6中共有9个选择标准在图书馆资源选择工作中适用性相对较弱。以“人均使用量”(检索或下载总次数与目标用户比值)为例,该指标是测度资源使用效益的重要支持性数据,但由于一些客观因素的存在,使得现实中获得相关数据存在一定困难。如部分资源供应商未提供使用统计数据,部分图书馆数字资源管理系统不具备资源访问统计的功能;此外,目标用户的范围界定存在模糊性,其具体数量难以确定,对于公共图书馆、国家图书馆而言更是如此,因此,以“人均使用量”作为选择比对的标准也就存在一定困难。
本研究以选择标准适用性调查结果平均数大于4作为一个衡量的尺度,但各个图书馆的实际情况存在差别。对不同类型图书馆的统计发现,除了“尊重用户隐私”和“用户对该资源满足需求的总体感知”这两个选择标准的适用性得分均低于4分以外,表6中所列的未能符合适用性的选择标准在一些图书馆是可以应用的。以“支持资源集成与整合”标准为例,调查的科研图书馆专家对于该标准在其图书馆适用性的感知得分就为4.14,这可能与调查对象所在图书馆开发了数字资源统一检索平台,已经对数字资源相关标准及协议是否支持集成整合有了较为深入的认识和详细的规定有关。如中国科学院国家图书馆就规定资源提供商必须支持数据内容、数据组织和数据利用的标准化和开放性要求,应该积极协助中国科学院国家科学图书馆建立开放的集成应用环境[7]。因此,图书馆可将调查结果中未能符合适用性的选择标准作为参考性标准,依据实际情况决定是否选用。
调查对象结合自身工作实践也提出了一些其他影响数字资源选择的因素,如资源使用方面,提出要考虑“利用率统计功能”、“利用效果”、“并发用户数限制”,“使用的方便性问题应是资源使用首要标准”;资源成本方面,提出应考虑“外文数据库是否需要支付国际流量费”,“不同学科资源的评价标准难以统一,如新学科的使用成本肯定较高,但没有开始,永远也不可能有高利用率,用户的需求和使用积极性还要靠培养”;资源服务方面,专家指出仅考察资源供应商是否提供使用统计数据是不够的,还应要求其直接提供使用分析报告;此外,有关合同风险方面,专家指出“因不可抗拒造成的使用中断的补偿:如地震、光缆中断、数据维护等导致的数据库实际使用时间低于合同规定的时间,应有延期或退补偿机制”,“数据库商家对影响用户使用情况的赔偿措施应作为考核标准。数据错误、不全、对方服务器问题造成服务中断等情况经常发生。但由于未能在合同中详细约定,出现这种状况以后图书馆得不到任何赔偿。”
此外,也有部分专家指出,虽然研究提出的选择标准涵盖面较广,但过多的选择标准反而会增加数字资源选择实践工作的复杂性,增加工作成本。为使选择标准体系在实践中具有更好的应用性,结合专家提出的评论性意见,最后修订的图书馆数字资源选择标准体系在层次划分和标准表述方面均进行了修改和简化。考虑到在不同图书馆应用时还需确定各个选择标准的权重,而在层次划分上,多一层级就会带来工作量的增大,故将原有三级选择标准体系简化为两级:第一级为标准体系的维度,第二级为具体的选择标准。此外,对部分内涵相近、能够揭示同一现象的选择标准加以归并处理,以避免标准数量过多带来资源选择过程应用的复杂化,具体包括:
(1)将“资源质量”维度下“与对应纸本资源相比出版的及时性”归入“内容更新频率”。
(2)将“资源使用”维度下“授权用户的界定”和“授权使用地点界定”合并为“授权适用范围”;“允许文献传递”归入“授权使用方式”标准的考察。
(3)将“资源服务”维度下“提供规范的使用统计数据”修改为“提供规范的使用统计数据报告”;将“资源供应商提供资源的长期保存”和“长期保存方式满足本馆要求”合并为“数字资源长期保存方式”。
(4)考虑到现有数字资源定价方式的复杂化及其对资源选择工作带来的影响,“资源成本”维度下增加一个标准——“资源定价模式”;“软硬件购置成本”归入“资源价格”标准中;“全文下载成本”修改为“全文下载成本/检索成本”,从而全面反映全文数据库、二次文献数据库等的使用效益。“数字资源的检索和下载次数”的适用性得分为4.27,但考虑到仅考察检索和下载次数在测评资源使用效益方面的实际意义并不大,而检索和下载次数事实上是考察“全文下载/检索成本”的基础数据,故保留“全文下载/检索成本”即可达到测评目的。
(5)将原有的“版权风险”标准细化为“版权争议材料的处理”和“对资源非法使用的界定和控制”;将“合同风险”细化为“合同对双方责任义务约定的合理性”和“合同文本表述清晰”。最终修正后的图书馆数字资源选择标准体系包括6个判断维度、31个选择标准(见图1)。
图1 图书馆数字资源选择标准体系
4 研究结论
从国内外已有研究及图书馆馆藏发展政策中提出的数字资源选择标准来看,虽然不同群体对于数字资源选择标准的认识存在差异,但综合来看,可将其归纳为六个方面,即:资源质量、资源使用、资源服务、资源契合、资源成本、资源风险。本研究以这六个方面为图书馆数字资源选择标准体系设计的维度,结合图书馆发展实际,提出相关选择标准,得到图书馆数字资源选择标准体系的初始集合。在此基础上,通过专家问卷调查法验证各选择标准的重要性和适用性,采用因子分析等统计分析方法提炼、确立一套关联度、代表性和适用性均较强的图书馆数字资源选择标准体系。本研究的调查对象来自于高校图书馆、公共图书馆、科研图书馆和国家图书馆从事数字资源选择相关工作的实践专家,最终确立的图书馆数字资源选择标准体系是在综合其意见的基础上得出,在不同类型、规模图书馆均有较为普遍的应用价值。