信息资源检索结果质量影响机制研究——用户满意度评价视角,本文主要内容关键词为:信息资源论文,满意度论文,视角论文,机制论文,评价论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着信息检索系统的广泛应用,信息资源检索结果的质量成为人们关注的焦点,尤其是移动终端设备的普及,信息检索需更具有针对性和个性化。Markel Vigo等[1]人通过案例分析,从信息检索结果的web可访问性来研究传统搜索引擎是如何处理web可访问性,并提出了一种新的检索模型,包括内容分析模块、可访问性分析模块和结果收集模块,以执行信息的内容分析、自动的网络可访问性分析和检索结果的易用性分析三项任务,实现将信息的web可访问性纳入检索系统考虑的范畴。Myongho Yi[2]通过对40个参与者基于任务的评估调查,研究了基于本体的主题地图方法是如何影响用户的检索效果,其中因变量包括检全率和查询时间,并证明了本体主题地图方法的有效性。Keβler Carsten[3]基于用户的认知差异性对信息检索结果集进行测量,以研究不断变化的用户情境对信息检索结果的影响,帮助检索系统开发者识别情境中的重要影响因素,并将其作为用户与系统交互设计中关注的焦点。Surajit Chaudhuri等人[4]研究了数据库查询结果的排序问题,提出了一种概率模型方法,并通过对某一真实数据库的用户调研评价了该方法的应用效果。Zhang Jin等[5]提出一种高效的增量法以形成检索结果的等价组,来提高检索结果质量;Chirag Shah等人[6]研究了协同信息检索中如何基于不同用户角色进行检索结果的再分配,以提高信息检索的针对性。Parham Moradi等人[7]提出应用可扩展模糊概念模型实现信息检索系统的个性化检索,提高检索效果。总之,这些研究大多从技术角度提出改进检索结果、优化结果排序的方法与模型,以提高用户检索结果质量。本文主要研究数据库信息检索结果质量的影响要素与机制。在前期研究中,我们将CNKI学术期刊全文数据库信息资源的质量划分为完整性、权威性、及时性和检索结果4个维度,并细化为13个质量指标[8]。本文将以信息资源的检索结果质量为内容,通过实证研究构建检索结果质量满意度模型,并分析影响用户质量满意度的内在机制及其关键因素。
1 信息资源检索结果质量满意度概念模型
根据广泛应用的ACSI(美国顾客满意度测评模型)模型,并结合信息资源质量维度的划分,来构建检索结果质量满意度概念模型。在满意度的不一致比较标准上,本文选择“顾客期望”和“公平实绩”两个标准[9],“顾客期望”通过用户的“期望质量”来体现,“公平实绩”是以个人花费的成本或投资与期望的回报之间的潜在关系为基础,考虑了用户的成本因素,通过“感知价值”来体现。根据这两个标准,用户对质量满意度的评价会通过期望质量与感知质量的对比、感知价值的高低两个方面来衡量。对于质量满意度,笔者根据质量划分的层次,将其分为检索结果质量满意度和总体质量满意度,且检索结果质量满意度影响着总体质量满意度。
根据前期对信息资源质量维度的划分,检索结果质量维度包括检全率、检准率、相关性判断的描述信息和质量判断的描述信息4个指标,其中前两个指标是对检索效果的评价,后两个指标是关于检索记录中所提供的描述信息的有用性,即这些描述信息是否可帮助用户有效判断文献的相关性,是否可有效判断文献的内容质量。在本概念模型中,用户对质量的期望和感知均通过这四个指标来测量。对于总体质量满意度,根据前期的研究结果发现,既可将其作为观测变量“总体满意度”来直接表示用户的总体满意情况,又可作为潜变量由3个观测变量——相对于期望的满意度、相对于需求的满意度和总体满意度来表示。基于这一结论,本文选择构建两种概念模型,并通过实证数据分别检验,且进行对比分析,以深入研究信息资源检索结果质量的影响机制及关键因素。
本文采用结构方程模型中的观测变量和潜变量形式来描述各要素之间的因果关系,检索结果质量满意度概念模型如图1、图2所示。图中椭圆形表示潜变量,长方形表示观测变量;模型中期望质量、感知质量、感知价值、检索结果质量满意度和总体质量满意度之间的假设关系如变量间有向线所示,且我们假设这些关系为正向相关。潜变量与观测变量间的有向线表示潜变量作为构念特质由观测变量来反映。
两个概念模型中的潜在变量和观测变量如表1所示。观测变量通过问卷中设计的题项来体现,每一个观测变量对应一个题项,并采用Likert 5级量表对其打分,通过问卷调查法来了解用户对各观测变量的认知。
2 概念模型的检验与修正
本文实证研究的数据来源是通过对CNKI学术期刊数据库进行问卷调查收集到的268份有效问卷,研究方法采用结构方程模型分析及相关软件,通过检验与修正检索结果质量满意度模型,分析检索结果质量的影响因素和影响机制。
图1 概念模型一
图2 概念模型二
2.1 数据的信度与效度检验
信度检验[10]是对量表工具所测得结果的稳定性及一致性的检验,大多采用Cronbach α系数表示。我们应用SPSS19.0软件对概念模型中涉及的14个题项进行信度检验,其Cronbach α系数值为0.883,大于0.7这一标准[11],说明这些题项具有良好的内部一致性。
效度检验是对量表能够测到所欲测心理或行为特质程度的检验。我们采用因子分析进行效度检验。因子分析结果中,KMO检验值为0.899,大于统计学家Kaiser给出的0.7这一标准,说明样本数据适合作因子分析。表2成分矩阵中显示了变量的因子负荷量,它表示变量与公因子的相关程度。从表中数据可知,除“质量判断的描述信息感知”的因子负荷量(0.43)小于0.45这一标准外,其他变量均通过效度检验,说明它们所测度的行为或心理特质具有一致性。对于“质量判断的描述信息感知”这一题项,由于未通过效度检验,考虑弃用。
根据信度与效度检验结果,弃用“质量判断的描述信息感知”这一变量数据,故在上述概念模型中删除这一变量,并进行模型检验。
2.2 概念模型一的检验与修正
我们使用结构方程模型分析软件——AMOS17.0进行参数估计和模型验证。在构建概念模型一的基础上,导入数据,并根据样本大小、正态性与独立性等因素,选择采用极大似然法对模型进行路径分析并计算估计值[12]。经过多次修正概念模型,最终得到模型与样本数据拟合良好的检索结果质量满意度模型图。
模型一的标准化路径系数图如图3所示。由图中右上角的整体适配数据可知,卡方值为67.335,其显著性概率为0.089>0.05,表示模型的适配度良好。各潜变量与观测变量间的因子负荷量如图中它们之间的路径系数所示,表示观测变量对潜变量的相对重要性。从路径系数值可知,因子负荷量均介于0.67~0.89之间,表示模型的基本适配度良好,这些观测变量能有效反映其要测得的概念特质。图中斜体加粗数字为各变量的多元相关平方,表示变量被解释的变异量。通常被视为是信度的最小界限估计值,其值大于0.5,表示模型的内在质量检验良好。模型中大部分变量的解释变异量大于0.5,只有“感知质量”这一潜变量被解释的变异量(0.24)明显小于0.5,说明它被“期望质量”解释的变异量较低。模型的内在质量检验较好。
图3 模型一的标准化路径系数图
图中潜变量间(包括“检索结果质量满意度”这一观测变量)路径上的数值表示两个变量间的标准化回归系数,数值符号表示变量间正向或负向相关关系,数值大小表示自变量对因变量的影响因素大小。这一路径系数值是否获得样本数据支持,需进行显著性检验。表3为采用极大似然法所估计的标准化回归系数的检验结果,这一检验是确定回归路径系数估计值是否等于0。若显著性概率p值小于0.05,表示回归系数显著不等于0;若大于0.05,则回归系数未达显著性,样本数据不支持这一路径关系。“***”符号表示显著性的概率值小于0.001,即达到0.001显著水平,数据模型支持这一路径。由表中数据可知,所有路径系数均通过检验,该模型通过数据验证。
表4为模型的适配度检验结果。由于卡方值易受到样本数大小的影响,因此也应考察其他适配度统计量。本模型的其他主要适配指标如表4所示。这些指标中包括绝对适配测试指标,如CMIN/DF、p值,它们是基于假设模型隐含的协方差矩阵和样本方差矩阵的指数[13];也包括相对适配测试指标,如GFI(拟合优度指标)、RMSEA(近似误差的均方根)、CFI(比较拟合指数)等指标。从检验结果与适配标准看,这些适配指数均通过检验,因此可以认定该模型能够很好地拟合样本数据,上述检验结果具有可信性。
从图3中的路径关系及系数值可知,感知价值的两个观测变量中,感知价值一和感知价值二呈负向相关,且相关度较高,说明二者逆向相互影响,其中感知价值二(相对于努力成本所获取的信息资源质量)更能有效反映感知价值的涵义。在总体满意度中,其观测变量“相对于需求的满意度”的重要度大于“相对于期望的满意度”,说明在用户质量满意度的比较标准选择中,需求标准更能体现用户的感知判断。
2.3 概念模型二的检验与修正
同样对概念模型二进行检验。运行AMOS17.0软件,导入数据,并通过多次修正,最终得到与样本数据拟合良好的模型二标准化路径系数图,如图4所示。由图中右下角的整体适配数据可知,卡方值为36.199,其显著性概率值p=0.412>0.05,AGFI、GFI均大于0.9,RMSEA=0.011<0.05,这些指标表示模型的适配度良好。图中三个潜变量可被观测变量较好地反映其构念特质,总体满意度中52%的变异量可在模型中被解释,感知价值中62%的变异量可得到解释,表示模型的内在质量检验较好。
图4 概念模型二的标准化路径系数图
表5为模型中标准化回归系数的检验结果,以确定回归路径系数估计值是否达到显著。从p值可以看出,所有路径系数均通过检验。根据模型中适配度检验指标可知,CMIN/DF=1.034,PGFI=0.517,CFI=0.999,均达到适配标准,故模型的适配度良好。该模型通过数据验证。
3 检索结果质量的影响机制分析
根据2.2和2.3中两个概念模型的检验与修正,得到了两个经过数据验证的检索结果质量满意度模型,即图3和图4。对比两个模型,来分析检索结果质量满意度模型的影响关系与机制。
对比图3和图4可知,二者变量间的路径关系大致相同,其不同之处在于总体满意度。模型一(图3)中总体满意度包含的内涵大于模型二(图4),故模型一中的总体满意度被解释的变异量(0.66)高于模型二中总体满意度被解释的变异量(0.52),说明模型一能更好地反映总体满意度的影响因素。从适配度指标看,两个模型均达到了适配标准,但从p值大小看,p值越大,说明模型与数据的适配度越高,故修正后的模型二与调研数据的适配度比模型一高,即模型二更接近于实际模型。
总之,由两个模型中潜变量之间的路径关系可知,“总体满意度”无论是作为潜变量还是观测变量,均受到感知价值和检索结果质量满意度两方面的直接影响,且感知价值的影响度远大于检索结果质量满意度的影响。而“检索结果质量满意度”受到期望质量较小的负向影响、感知价值和感知质量的正向影响,其中感知价值的影响程度均大于感知质量的影响程度,说明感知价值具有重要地位。“感知价值”受到期望质量和感知质量两方面的影响,其中感知质量的影响程度远大于期望质量的影响程度,而期望质量对感知质量又产生较大的直接影响,因此期望质量和感知质量共同影响着用户的感知价值,它们共同解释了感知价值62%的变异量。由图3和图4中潜变量与观测变量间的路径系数值可知,在“期望质量”的观测变量中,“相关性判断的描述信息”对潜变量的相对重要性较高;而在“感知质量”的观测变量中,三个指标的相对重要性差别不大,这说明用户期望与用户实际质量感知的不一致性,它在一定程度上体现了在检索结果设置上存在供需不一致现象。在“总体满意度”的三个观测变量中,“相对于期望的满意度”的相对重要性略低,说明用户更侧重于从需求角度来衡量满意度。值得注意的是,两个模型中感知价值一和感知价值二之间都存在较强的双向互动关系,且为逆向关系。两者作为感知价值的观测变量,具有相同或相近的因子负荷量,说明用户既重视感知价值中的成本因素,又重视所获取的资源质量。
上述分析结果对数据库信息资源建设工作具有一定的实践意义。具体表现在:(1)数据库开发者在设置检索结果项目时,应以用户需求为导向,提供用户所需要的检索结果内容,以提高质量满意度。(2)在用户满意度的众多影响因素中,感知价值对质量满意度的影响程度最大,因此数据库开发者应提高用户对信息资源检索结果的感知价值,即一方面减少用户获取信息资源的努力成本,另一方面提高信息资源检索质量。
4 结语
数据库信息资源质量直接影响科研人员的创新成果与产出,它在一定程度上决定了科研人员创新起点的高低。本研究从用户满意度模型出发,通过实证数据检验并修正了数据库检索结果质量满意度模型,分析了用户质量满意度的影响因素和影响机制,及检索结果质量满意度对总体质量满意度的影响程度。由于本研究处于探索性阶段,观测变量选择、数据处理方法选择等方面仍需进一步完善。此外,用户个体特征和高校数据库购买情况也必然影响着信息用户满意度的形成。在以后的研究中,我们将进一步细化并完善研究工作,以深入分析信息资源质量的用户需求和存在的不足,为数据库质量控制提供依据。
标签:用户研究论文; 关系模型论文; 数据库概念模型论文; 标准模型论文; 路径分析论文; 用户分析论文; 数据检索论文; 变量论文;