共同体视角下的旅游学术类型划分——继张凌云等人h指数测度成果的再探讨,本文主要内容关键词为:等人论文,共同体论文,视角论文,成果论文,学术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 问题的提出 张凌云等人连续发表了两篇文章,全面探讨了中国旅游学术共同体的整体状况[1~2]。其意之所在,即努力为国内旅游学术共同体的整体状况进行“画像”,并尝试着向学界注入新鲜活力元素。关于后一点我们知道,任何一个组织假如长期得不到改变,必然会产生组织惰性,需要通过组织结构再造、组织创新或引进新鲜元素等才能克服那种惰性[3]。张凌云等人的第一篇学术共同体文章主要以论文数量为最基本测度指标,对期刊、机构与学者进行了贡献排序与初步评价。进而在借鉴了有关批评意见和建设性建议的基础上,发表了第二篇相关文章,运用h指数作为评价指标来测度,调整后的结果更具客观性与科学性。可认为这两个排序标准有高低之分,即后者排序方法是对前者的弥补与深化,但两者也各具利弊,并非第二篇在各个方面都优于第一篇。观察h指数排序表不难发现,该排序与论文数量非完全同序,虽然总的说来,发表的论文数量越多,排序位置就越靠前,但论文多而位置相对靠后的现象也时有发生。针对这种反序现象,虽然不难解释其为何,但本文在这里不认为那是个问题,反而认为那种反序可作为一种数据资源,据此可进行具有深度性的再探讨研究,并很有可能产生一个新的学术语境:学术风格与学术类型划分,这个新语境也应属于学术共同体研究范畴。由个体排序到聚类分组,这种转变可被认为具有丰富研究成果之意义。 2 研究综述 关于旅游学术研究的类型与风格,迄今为止发表的研究成果并不多。我国当代旅游学术研究先驱申葆嘉先生,早年就将旅游文献分为业务与学术两种类型[4]。青年学者宋子千近年也曾专门撰文,阐述了实证主义与现象学在旅游研究应用中的特点差异与各具利弊[5],充分彰显了学术批判的核心价值。张凌云等人在上述两篇文章中都有强调,地理学者在当代旅游研究中占据着主导地位,对旅游基础理论及其应用作出了重大贡献,还进一步将研究分为两种类型,一种是以学术带头人为核心的团队协作型,另一种为个人的努力钻研型。由这些既有成果可知,多数学者基本上持二分法世界观,甚至还有冲突范式在其中,还鲜有学者将学术风格分成若干种类型的研究。事实上,存有哪些类型和那些类型都是什么这是两个问题,本研究关注前者,至于这些类型各具怎样的本质特征,虽然也进行了些许探讨,但更为深刻的认识还有待今后研究工作的全面展开。 3 理论与技术:分列排序法 如Hirsch教授给出的h指数定义,即一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的h指数就是N。本文给出的类型划分原理即是,将原本按照h指数高低排成一列的数据按照新规则做调整,重新将其排成几列,每一列代表一组,要求每一组内排列位置在前面的学者不仅其h指数高,其论文数量也要不少于排在其后的学者。具体而言,该方法主要基于以下两点内容:①一个人的h指数越高,发表的论文数量越多,则其拥有的学术影响力就越大,如此也符合人们在大尺度上的认识规律;②当一位学者发表的论文数高于另一位学者,但其h指数却低于后者时可将其视作异常者挑出来,最后将这些异常者置入应该归属的组并放到组内合适的位置上。此方法的核心就是让每组内的成员都满足以下条件,h指数高的学者在论文数量上也多于排在后面的学者。 关于聚类技术已有较为成熟的研究成果,聚类技术及其应用的研究论文不计其数[6],一些学者还出版了含有聚类方法的统计学专著[7]。在聚类技术中,最为关键的技术往往被认为是样本相似性指数设计,常见方法有几何距离法、矢量夹角计算法等,但针对既定量也定性的数据如何进行聚类,虽然也有学者进行了研究,可目前尚无公认的简单易行的方法。在迄今的旅游研究中,经常使用SPSS计算软件进行统计与聚类,许多硕博学位研究生在研究中也多用此软件进行统计分析,但却少有追问该软件的计算原理。这也说明了主成分分析、因子分析等技术确实很复杂,方差贡献原理对非理科背景的旅游学者而言确实难懂。在统计应用中也出现了对定序数据(ordinal data)的研究成果[8],即以可秩序化的描述数据为对象,有些类似于本研究中的学术排序,但本文还涉及到了定量化的论文篇数。更为重要的是,本研究在原理上不是对定量数据进行数字处理,也不是对描述数据进行赋值,以及赋值后再进行算术处理,而只是将原数据序列按照某种规则进行移动,是一种数据移动技术,研究的基础是并不改动数据本身。广义上讲,数据移动其实也是一种另类的数据处理技术,其可能属于较为专业的数学问题,本文作者因专业背景限制而对此不做深入探讨。 本文的分列排序法具体操作步骤如下:以张凌云等的研究数据为基础,对其以h指数的排序进行自上向下观察,首先以排位第一者为参照对象,考察第二位的论文数量是否低于第一位,如果是则接着考察第三位,这时的参照对象要换为第二位,即接下来要进行第三位与第二位的比较。在整个比较过程中,参照对象与被比较对象都在向下滑动,这种做法在一定程度上有点类似于统计学的滑动平均法。被比较对象如满足条件就可成为下一步的新参照对象,而满足条件的老参照对象则留在原位而不改变序列。将这种滑动比较进行下去,直至 h指数排序中的最后一位成为被比较对象。在与参照对象的比较过程中,当被比较对象的论文数量高于参照对象时,则将之视作异常者,也即h指数与论文数量出现了反序情况,此时要将该被比较对象旁置,选择下一位作为新的被比较对象,用其与老参照对象进行比较。当完成了第一遍比较之后,会得到两列数据,被留下的那列即为符合本规则的集合,可视为第一组类型,也可称A组,第二列不符合本文规则的集合即为旁置列。旁置列也可谓通过比较而生成的余集,在旁置过程中要注意保持其原有的先后顺序,保留列当然也要保持先后顺序。接下来要针对生成的余集按照本方法的原则重复以上操作过程,当完成第二遍比较后,又可得到一组新的保留列和新的旁置列,新的保留列视为第二组类型(B组)。如此再对新的旁置列进行又一轮的比较,即不断地对生成的新的旁置列重复以上操作,陆续会得到第三组(C组)、第四组(D组)等,直至不再有旁置列生成方可停止。 本文将此思想及为之设计的操作步骤命名为分列排序法,或分组排序法,意思是指通过此方法最后可得到好几列的排序。也可将该方法称作排序分组法,这种命名即是强调分组过程而非结果,结果是过程自然而然产生的。迄今,作者尚未见到与此方法十分接近的旅游统计学研究成果。本技术的优势在于可被常人理解,在原理上略有复杂性,通过计算机编程甚至通过纸笔的手工运算皆可获得结果。分列排序法这一概念可见于Excel算法研究,分组排序法这一概念可见于计算机算法研究[9~10],但这两种情形与本研究既相似也不同,不同点就在于规则的设定上,本研究针对的是h指数应用于旅游研究时实际出现的问题,要将已经有序数据的映射关系也满足有序,这就引发了不得不进行分组的考虑。 就方法而方法而言,推出本技术具有一定的探索意义。与任何技术皆有利弊一样,暂且搁置本技术有哪些优点的讨论,本分列排序法的不足有两点:第一,当被比较对象的论文数量大大低于参照对象时,决定了后面许多成员将被认作异常,旁置多了就会让当前组的成员数量缩水,由此也引发了质问,为什么参照对象有权力决定后面成员的归属;第二,当被比较对象的论文数量只是略微高于参照对象时,即被看做是稍微异常者,依照算法也将被旁置。对于第二点,在实际应用中可设定较宽的判断条件,如1~2篇的差异可不算做异常,以此来降低算法中的不合理处。对于第一点不足,本文认为此方法重在进行分组,考虑后者到底归属于哪一组合适,随意性的结果些许不是很影响整体意义,因为每一组的特征以排在前位者为代表。前位者之间哪怕很微小的差别,也可能孕育着很大不同,就如同很多旅游学者虽说都是地理学出身,如保继刚、吴必虎、陆林、张捷、张凌云、马耀峰等,但研究风格却不一样,虽然目前还难以给出各自的准确定位。 4 应用讨论 4.1 人数分布 基于张凌云等人此前给出的数据,本文采用上述分列排序技术进行处理。张凌云等人就旅游学术期刊、论文作者和学术机构3个方面进行排序研究,本文为能更好地说明问题而只对学者的排序数据进行再处理。从某种意义上讲,是对张凌云等人研究成果的丰富,在旅游学术共同体研究领域中自取支持位置,扮演烘托角色,因而本研究关注的只是一个方面,成果的全面性还有待提高。对于张凌云等人所写学术共同体文中有关作者h指数排序的总表,运用本文提出的分组排序法进行处理,进而得到了11种类型(表1)。其中C组成员最多,为23人,占17.83%,在C组两侧呈现了不对称分布特征,D组人数迅速下降,D组以后各组人数呈缓慢下降的趋势,最后两组的人数分别为3人与1人。而在C组之前,B组人数比C组仅少1人,A组人数相比于B组人数较少,但仍保持着16人,占12.40%。ABC三组总人数达到了61人,占总人数的47.29%。前4组人数为76人,占总体人数的58.91%(图1)。据此可知在人数上,前4组基本代表了中国旅游学术共同体的主要特征,按照人数的多少这4组总的排序为C组>B组>A组>D组,而在D组之后的其余7组人数依次减少。 4.2 学术排位 从表1看出,张凌云等文章中排名第1位到第13位的学者皆在本文的ABC这3组中,可认为这3组对于中国旅游研究而言担当着领军重任,A组在先,B组其次,C组随后,但组内人数的多少却正好相反,排在第3位的C组人数最多。这里以每组人均排位平均值进行验证,A组人均排位是40.25,B组为49,C组为60.35,D组到最后一组的排位分别为53.20、71.31、93.10、90.44、96、72.88、81.67、94.00。虽然ABC三组的人均排位保持递增,但有趣的是并不是越往后的排位就越低(排位低的数值较大),中间会出现波动,如D组的排位甚至高于C组,这说明从A组到K组的平均排位呈现着某种不规则性。为了便于观察,这里用100减去各组平均排位得到每组人均排高指数(ranking points)(图2)。 4.3 单篇排高分布 依据表1可见,不仅每组所发表的论文总数不同,而且单篇被引用或下载的频次也应该不同。 ABCD这4组各发表论文数402、613、685、343篇,人均发表分别为25.13、27.86、29.78、22.87篇,从E组到K组发表论文数分别为326、175、191、213、255、92、33篇,人均分别为25.08、17.5、21.22、23.67、31.88、30.67、33篇。用各组人均排位高度除以这里所得到的人均发表篇数,实际上也就是针对每组排位总数做某种反向转换(因排位总数小意味着排在前面),再除以每组发表的论文总数,可以得到相当于每篇论文被引用下载的程度差别。可以观察到,图3与图2的曲线在形状上很相似,但两组数据来源却不尽相同,差别是图2使用了排位数据(只表示相对顺序),而图3使用的是篇数(精确数据),说明人均排位的顺序确实参考了发表的论文数。图3还给出了一个图2不能给出的结论,排位确实与引用下载的数据有关,A组人均发表论文数虽然不是最高,但人均排高却占据第一位,这与单篇排高也占据第一位很有关系。另一个很值得注意的是,D组的单篇排高甚至超过了B组,说明D组论文质量的平均水平仅次于A组,由此看出D组是一个值得关注的学术群体。 在图2中可以看到,E组与I组的排高指数非常接近,可知两组的学术贡献似乎可进一步归为一类,但从表3中又发现了不同,两者间的距离被拉开了,E组人均发表论文25.08篇,I组人均发表论文31.88篇,E组人均论文少却排位高于论文多的I组,从单篇数量来看,E组与A组很接近,而I组人均论文数量很接近C组。社区视角下的旅游学术类型分类--张凌云等人指数测量结果的再探讨_论文发表论文
社区视角下的旅游学术类型分类--张凌云等人指数测量结果的再探讨_论文发表论文
下载Doc文档