老年精神状况量表(GMS)及其计算机诊断系统(AGECAT),本文主要内容关键词为:量表论文,老年论文,状况论文,精神论文,计算机论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在精神科流行病学研究中,不同时期、不同地区的研究结果差异较大,原因之一是使用的测查工具不同[1]。 英国利物浦大学精神病学系的Copeland于1976年专为老年精神疾病的流行病学研究设计了老年精神状况量表(Geriatric Mental State Schedule,GMS),并于1986年开发了计算机诊断系统(Automated Geriatric Examination forComputer Assisted Taxonomy,AGECAT)[2]。目前, 该量表已有二十余种不同语言的版本,在世界各地正得到广泛使用,并日益成为国际交流中的通用测评工具。
一、老年精神状况量表(GMS)概况:
1、量表的制订:GMS的541个原始条目来源于精神现状检查(PSE)第八版的268个条目、Present Status Schedule(PSS)中64 个条目及附加的209个条目。PSS 中的条目可将患者按不同症状群区分。 附加的209个条目包括对认知功能的客观评定。除了询问被试部分, 还包括有关被试在检查中行为表现的观察条目,需在询问完病人后评分。GMS 为半定式量表,每个条目分为五级评分,无反向评分。评估被试一个月以内的情况。大部分问题都列出数个相似问法。对重要的问题把被试承认不知道答案和回答错误分成不同的条目计分。完成一例检查需30—45分钟。[3]
2.信、效度:联合检查法(检查者—观察者法)所有条目k=0.50-0.89[3、5],平均权重kappa(k)=0.78[3],phi=0.81-0.83[4、6],阳性条目总数的相关系数=0.87[3]。其中询问被试部分平均k=0.80-0.84,观察评分部分平均k=0.46-0.56[3、5]。重测法阳性条目总数的相关系数r=0.78,总权重k=0.45[3],所有条目k=0.11-0.71[4、5、7],phi=0.66-0.75[4、6],其中询问被试部分平均k=0.48,观察评分部分平均k=0.34[3]。 从阳性条目总数的相关系数看,医生在检查中扮演的角色(询问者、观察者或重测者)对评定无影响。阳性条目总分和总数的结果几乎相同。曾观察英、美医生组间和组内的平均kappa 值未发现差异。对阳性条目总数进行多变量分析,发现英、美两组病人间、同一国家医生间及两国医生间无显著差异[3]。不同语言版本的信度相当[4]。患者的年龄、性别、诊断对评分一致率无显著影响。以获得病史及其他资料后所做的ICD-8诊断为金标准,诊断符合率达80%[3];与DSM-Ⅲ-R比较, 对精神障碍的灵敏度为98.4%,特异度为76.5%[7]。在对GMS试测后三个月进行重测,发现情感障碍症状分显著下降,痴呆的评分无改变,表明量表对变化敏感并与初始诊断一致[3]。
3.不同版本:根据不同的需要,形成了GMS的不同版本。 如:Gurley 将GMS所有条目收入有1500个条目的GARE,除较全面评定精神状况,还涉及躯体症状、社会问题和所接受的卫生及社会服务等方面的情况[2、8];小版本(GMS-6)由Henderson等从GMS中凭直觉抽出条目组成,但应用不广,尤其AGECAT对亚病例的诊断不理想[9]; 社区简版GMSA,目前应用最广,其条目反映了社区常见的老年期精神病和神经症的重要症状[8];GMSB:仅评估老年期痴呆和抑郁[10]。
二、GMS计算机诊断系统(AGECAT):
1.条目组成及诊断过程:也是目前应用最广的社区简版GMSA的形成过程
Copeland等通过对伦敦社区样本GMS 五百多个条目的一系列判别函数分析,选择出能区分1)抑郁和痴呆;2)抑郁、痴呆和其他精神科疾病;3)所有精神科疾病和非病例诊断的条目,共157个条目281 个问题,作为询问被试部分。这些条目包括了在社区常见的老年期精神病和神经症的重要症状[9]。将这157个症状分成31个症状组,反映8 个综合征群。再参考对被试外表、情感、行为的观察评定部分共25个条目94项,将8个综合征群按症状组及不同的严重等级按顺序排列, 分为:器质性精神障碍、精神分裂症及与心境不协调的偏执状态、躁狂、抑郁、强迫、疑病、恐怖及焦虑。其中器质性精神障碍包括急性及慢性两种,急性一般反映谵妄状态,慢性反映痴呆。在社区中如患者无严重躯体症状及意识障碍,所报告的病例一般被认为是痴呆病例,但不区分为何种痴呆。另外,将抑郁分成两类:神经症性抑郁和精神病性抑郁,分别相当于DSM系统的恶劣心境和重性抑郁, 但神经症性抑郁的病程不要求达到2年。在数据录入计算机后,在诊断报告的第一行会出现8个综合征群的名称及严重程度。一般来说, 如果严重等级为0的表示被试完全正常,1-2级表示为亚病例(可疑病例),3级及以上则认为是病例, 因为临床医生认为这时候的被试需要治疗。如果只有一个综合征达到病例水平,则报告上第二行的最后诊断为该障碍。但如果同时有两个或以上的综合征达到病例水平,计算机会按照器质性障碍优先于功能性障碍、精神病性障碍优先于神经症的原则进行比较,报告出最后诊断,并显示其是否确切,如有疑问,是否有与第一诊断并列的备选诊断[8]。 AGECAT针对的对象、评定时限及询问方法与GMS相同。
2.信、效度:
1).信度:①联合法:1986年9 名英国精神科医生经培训后AGECAT诊断一致率达85%[8]。1993年2名英国老年精神病研究人员对16名正常被试及患者进行同时评定,对11名诊断完全相同;1 名被诊断为不同综合征亚病例;另4名综合征相同,但严重程度不同[11]。②重测法:Saunders等 1993 年报导三个月内精神科医生对经培训的护士已查过的503例被试进行重测,总一致率达77.5%,kappa(k)=0.63, 其中器质性精神障碍与非器质性精神障碍k=0.70,抑郁与非抑郁k=0.40[ 1 2]。1996年Saz等对西班牙Zaragoza1080位社区老人进行测查, 第一阶段由非专业人员对所有老人进行GMS-AGECAT诊断, 第二阶段由精神科医生对其中324例MMSE异常的老人进行GMS-AGECAT诊断。比较两次结果,总病例/非病例区分k=0.59,痴呆/非痴呆k=0.68[7]。
2).效度:①1985年Kua对新加坡612例 65 岁及以上老年华人进行GMS测查,比较ICD-9及AGECAT诊断,总k=0.85,痴呆k=0.87, 抑郁k=0.88,神经症k=0.58,偏执性精神障碍k=1.0[13]。② 1988 年Copeland将三个不同地区的研究资料综合分析,总社区样本数为 647,比较DSM-Ⅲ与AGECAT诊断,总符合率89%,k=0.71;抑郁总符合率79%,k=0.73;器质性精神障碍诊断符合率90%,k=0.83;神经症符合率44%[14]。③1994年澳大利亚Ames等对老年医院和综合医院的老年患者236例做GMSA测查,比较DSM-Ⅲ-R与AGECAT诊断,总k=0.78;器质性精神障碍诊断符合率97%,k=0.91, 灵敏度97%,特异度97%,阳性预测值91%;抑郁诊断符合率86%,k=0.66,灵敏度80%, 特异度89%,阳性预测值71%;精神分裂症及偏执性精神障碍k=0.57, 灵敏度50%,特异度100%,阳性预测值67%;其他神经症k=0.72,灵敏度22%,特异度100%,阳性预测值67%[15]。④1996年Saz等对西班牙Zaragoza的一个老年社区324例MMSE异常的老人进行GMS- AGECAT 及DSM-Ⅲ-R诊断。比较两者,对病例的总灵敏度90.6%,特异度89.3%;对痴呆的灵敏度86.4%,特异度94.3%[7]。⑤1998年Sorensen 等用丹麦文版的GMSA对一护理之家的100位老年人进行GMSA-AGECAT及ICD-10诊断。比较两者,得出AGECAT对痴呆诊断的最佳界值为2/3,灵敏度96%,特异度73%,阳性预测值77%,阴性预测值95%[16]。
3.特点及发展:
(1).AGECAT为老年精神状况的流行病学调查提供了标准化的症状采集和记录方法,也提供了标准化诊断过程。计算机的严格逻辑运算总能将具有相似症状的被试归入一类,具稳定性,不会受经验、情绪、环境的影响。而医生的诊断要靠经验和更多的信息,有时甚至凭直觉。有研究表明医生之间的诊断一致性不高,如器质性精神障碍k=0.77, 精神分裂症 k=0.57;
况且每个医生的状况也不能总保持不变[8]。AGECAT消除了评定者对诊断标准理解不同造成的低信度,并显示出与已有诊断标准的良好诊断一致性。不同地区所做AGECAT的效度差别不大,故不同地区的医生对GMS使用方法的掌握无显著差异[14]。AGECAT 对每一被试都给出了8个最常见综合征的严重等级及最后诊断, 不但能确定病例,还可以找出亚病例或合并疾病,为预防、早期诊断和疗效评定提供了可能, 也为确定患病危险因子及预测疾病转归提供了方便[9]。AGECAT软件在笔记本电脑上的运用节约了大量的资金和时间[10],一项社区样本的研究表明AGECAT在笔记本电脑上使用可靠并受到被试和评定者的欢迎[17]。这种方法还避免了传统流行病学研究中病例筛查及确诊两阶段的模式,可以在调查现场一步完成。
(2).AGECAT一直随实际的需要不断发展和改进。最早AGECAT诊断一部分有明显抑郁症状的被试为非病例,可能因为被试否认抑郁心境。现在,只要根据诸多观察条目的阳性评定,即使被试未感觉到或否认抑郁心境,也可诊断抑郁症。在临床上常可以见到医生将同时有抑郁性神经症和其他神经症症状的患者诊断为抑郁性神经症病例,这可能是因为对抑郁进行治疗的重要性使然。AGECAT也据此进行调整。而对焦虑症的诊断很严格,因各疾病的焦虑程度都可能很高。因此除非只有焦虑综合征的等级突出地高,而又无精神病性症状,才考虑焦虑症[8]。 因病史资料对诊断的重要性, 在第二版AGECAT 中引入病史和病因学检查(HAS),包含了Hachinski缺血指数量表的所有条目。HAS 对被试的知情人进行调查,从而获得有关发病、疾病演变过程、家族史、既往史、头部外伤和酒药滥用的信息,可将器质性精神障碍分为痴呆和急性谵妄状态,又将痴呆分为AD、MID及慢性酒中毒所致痴呆[9],还可将居丧反应与抑郁加以区分[18]。针对ICD研究用诊断标准的需要, 增加了社会状况量表(SSS)以及继发痴呆量表(SDS)[10]。GMSA-AGECAT第三版已开发了适合DSM-Ⅲ-R、DSM-Ⅳ及ICD-10的诊断软件。[2]
(3).AGECAT中观察评分部分的信度尚不如人意,对焦虑的诊断率很低[13][15]。患病率调查的结果存在地区差异,如新加坡华人的抑郁患病率比欧洲人低,生活在英国的非英语人群(如黑非洲人及华人)的痴呆患病率明显高于当地人,提示可能与文化背景有关[19][22]。研究者发现在文化程度低的地区,让老年被试说出国家元首的名字可能不太合适。另外,在检查记忆功能时让被试记住检查者的名字可能也不合适,不如改为记四位数字。对于华人还有一个突出的问题,即农历与公历的换算,国外学者对此尚未提出有效解决方法[13]。侨居海外并且不会说所在国语言的老年人很少能正确说出出生日、目前住址及国家元首,对认知功能检查产生影响。但语言种类似乎对时间定向无影响[19]。
三、GMS及AGECAT的实际应用:
从1982年Copeland等对利物浦1070名社区老年人进行GMS 检查及诊断开始,至今已有大量以GMS尤其是AGECAT 为评定或诊断工具进行的流行病学研究,报导老年期各类精神障碍患病率、发病率及随访研究结果,为不同时期和不同地区的结果比较提供了统一的标准工具[4、10、 12、13、18、24]。
总之,GMS和AGECAT 为老年精神状况的检查和诊断提供了一个标准的工具,为比较不同地区和不同时期老年人的精神状况提供了可能性,在老年精神卫生日益受到重视的今天有着特别重要的意义。为进一步推广和完善GMS, 目前世界各地有二十余个中心正在做试测和进一步的应用,以期能解决存在的问题,为老年精神病学提供一个方便、实用和通用的测查工具。北大精研所是我国大陆第一个参加国际协作项目的中心,正在进行GMS—AGECAT的信、效度研究。