ASA‑PS分级及其他术前评估系统在儿科麻醉实践中的争鸣
胡洁 白洁
上海交通大学医学院附属上海儿童医学中心麻醉科 200127
国际麻醉学与复苏杂志,2020,41(10):986-990.
DOI:10.3760/cma.j.cn321761-20200427-00134
REVIEW ARTICLES
【综述】
术前对患者进行风险评估,实现分级管理,是控制风险和提高麻醉安全的有效措施 ,美国麻醉医师协会全身状态(American Society of Anesthesiologists Physical Status, ASA‑PS)分级系统是目前使用最为普遍的术前评估工具之一。尽管它只是单纯地对患者术前身体状态进行评估,却常常被用作预测围手术期死亡和不良事件风险的工具 。ASA‑PS分级系统简洁明了,便于记忆,且无需实验室辅助检查以及复杂的数据收集过程,但过于主观、简单,因此在对成年人的研究中,不同医师对于同一患者的分级一致性差强人意 。在成年人研究中的结果尚且如此,那么ASA‑PS分级系统在小儿应用中的情况又会如何?是否存在比ASA‑PS分级系统更适合于小儿的术前风险评估系统?本文将就此进行综述。
1 ASA‑PS分级系统概述
1941年,ASA委托Meyer Saklad、Emery Rovenstine和Ivan Taylor三位麻醉医师设计一个收集和汇总麻醉数据的统计系统。他们依据术前身体状态将所有患者分为6个等级,每一等级的描述中均附有具体病例以帮助指导那些使用该评分系统的医师,这便是ASA‑PS分级系统的雏形 。1961年Dripps等 提出用前缀E替代第6类急诊手术的情况,并修改了部分措辞,删除了附录病例,最终于1963年被ASA采纳。1980年ASA‑PS分级系统再次变更,将脑死亡器官捐献者列为第6级。2014年ASA‑PS分级系统又进行了修订,恢复了附录病例;这就是今天我们所使用的ASA‑PS分级系统。
ASA‑PS分级系统设计之初只是为了便于统计麻醉管理数据,从未被设计成预测围手术期死亡与不良事件发生的工具。但许多研究提示ASA‑PS分级与术后病死率及严重并发症发生率具有相关性 。目前,它已然被当作围手术期风险预测的工具应用于临床实践和研究中,甚至在某些国家被用于政策制定、绩效评估、资源分配、麻醉服务费用报销的决策中 。
稳健的风险评估工具应具备良好的评定者间信度。Sankar等 对10 864例大于18岁择期非心脏手术患者进行了回顾性队列研究,结果几乎所有患者(>98%)被评定为两个相邻ASA‑PS级别中的一个,只有67%的患者ASA‑PS评级一致,评定者间信度仅为中等(κ=0.61)。Riley等 研究发现,对于ASA‑PS分级较低的模拟病例评定者间信度往往较高,可能因为这些病例没有合并症存在,所以评定者间容易达成一致,当有严重合并症存在时就容易发生分歧。而患者功能能力的客观评估指标,如6 min步行测试有助于提高评定者间的一致性。由此可见,ASA‑PS分级系统主观性太强,每个等级类别缺乏精准的定义是造成其在成年人中评定者间信度不高的主要原因。
2 ASA‑PS分级系统在儿科应用中的信度
ASA‑PS分级系统应用于儿科患者时,其评定者间信度仍然不容乐观,甚至比成年人更差。
Jacqueline等 选取了10个真实的儿科手术患者病例制作成问卷,随机抽样邮寄给100名儿科麻醉医师协会(the Society of Pediatric Anesthesiologists, SPA)成员,要求他们对这些病例进行ASA‑PS分级。同时,研究者从所在科室选取5位工作年限超过10年的小儿麻醉医师也对这些病例作出分级,然后以多数麻醉医师的分级作为参照标准。问卷回复率为56%,评定者间信度仅为中等水平(κ=0.471)。Aplin等 报道了130名SPA成员对15个情境模拟病例ASA‑PS分级的情况。这些病例涵盖了从出生2周到15岁总共5个年龄跨度(新生儿、婴儿、幼儿、儿童和青少年)的患儿,模拟了各种日常儿科实践(如外伤、急症、先天性畸形以及综合征)。结果60%的病例得到了4种不同的ASA‑PS分级,没有1例病例只有2种分级。但在类似的成年人研究中,仅有17%的病例得到4种不同的分级,70%的病例为3种,13%的病例为2种。这项研究清楚地表明,在儿科实践中ASA‑PS分级评定者间信度极差,甚至比成年人还要差。另一项规模更大的研究中,267名SPA成员对10个情境模拟病例进行了ASA‑PS分级,几乎所有病例分级差异都很大(3种或更多的评分结果),只有1个病例仅有2种分级结果,还有1个病例有5种分级之多 。总体而言,评定者间的一致性最多只能算中等水平(κ=0.5)。
3 ASA‑PS分级系统在儿科应用中信度不高的原因
描述过于简单、分类主观性强且缺乏特异性是造成ASA‑PS分级在儿科应用中信度不高的原因之一。此外,儿科患者的疾病谱有别于成年人,儿科种类繁多的慢性疾病、先天性畸形或综合征,甚至罕见病,都是成年人患者中不具有的,其复杂性和严重性等方面也与成年人存在巨大差异 。虽然2014年ASA‑PS分级系统进行了修订,增加了具体病例以贴近临床实践,提高了客观性,Hurwitz等 研究也证实了这一改动有助于临床医师ASA‑PS分级评估的正确性,但示例中的某些描述(如吸烟喝酒、冠状动脉粥样硬化性心脏病等)情况显然十分不适合儿科。
波士顿儿童医院研究团队在ASA‑PS分级系统基础上增添了儿科相关疾病的示例(表1) ,用该系统对120份病例进行重新分级,发现新系统具有较高的评定者间信度。重新分级的ASA‑PS分级Ⅰ、Ⅳ级组的可靠性高于Ⅱ、Ⅲ级组。这表明新系统ASA‑PS 分级Ⅱ、Ⅲ级间的界定较为模糊,需要进一步明确。此外,这套评估系统中缺乏儿科急性自限性疾病病程和严重程度的评估,缺乏先天性畸形和综合征的评估,还缺乏包括早产儿和新生儿在内的儿科人群功能受限的定义,这些局限都会造成评估者的主观臆断。
4 除了ASA‑PS分级系统之外,适用于儿科的术前风险评估系统
4.1 儿科风险评估(Pediatric Risk Assessment, PRAm)评分系统
波士顿儿童医院研究团队以美国外科医师学院国家外科手术质量改进计划(the American College of Surgeons National Surgical Quality Improvement Program, ACS NSQIP)数据库中的数据为基础,开发了简化的PRAm评分系统(表2),旨在预测非心脏手术患儿围手术期病死率 。该数据库收录了18岁以下接受非心脏手术儿童的信息,共129个变量,包括术前危险因素、术中情况、术后30 d预后以及住院或门诊患者的病死率。研究以住院病死率为因变量,所有潜在预测因素为自变量,将2012、2013年ACS NSQIP数据库中患儿的数据做多元Logistic回归分析,结果显示13项因素被保留在Logistic回归模型中,包括血液病、术前输血、先天性心脏病、神经系统疾病、急诊手术、呼吸系统疾病、术前心肺复苏、急性肾损伤、化疗、术前正性肌力药物支持、年龄<12个月、术前机械通气和肿瘤。最终为了精简,研究团队在13项预测因素基础上设计了PRAm评分系统,并用2014年ACS NSQIP数据库中的数据进行验证,证明它在预测非心脏手术患儿围手术期病死率方面具有良好的准确性。
Valencia等 利用该系统对非心脏手术患儿围手术期病死率的预测进行了前瞻性外部验证。共纳入13 530例≤18岁非心脏手术患儿,结果显示术后30 d病死率为0.21%(29/13 530),受试者工作特征(receiver operating characteristic, ROC)曲线下面积为0.956,说明该评分系统能有效预测外部验证队列中高死亡风险的病例。另外,研究者通过约登指数及灰色地带方法计算出PRAm评分系统≥6分或≤3分为患儿病死率显著增加或降低的临界分值。此外,Nasr等 在PRAm评分系统研究的基础上引入了外科手术这一风险因素,发现虽然外科手术风险不是儿科患者围手术期死亡的独立危险因素,但是在多元预测算法中,合并症与手术风险的交互作用对预测患儿术后30 d病死率具强烈的提示作用。
4.2 先天性心脏病(先心病)患儿行非心脏手术的风险分层系统
Faraoni等 基于患儿先心病病变严重程度及心功能状态对ACS NSQIP数据库中行非心脏手术的先心病患儿进行风险分层,然后将其与数据库中相应非先心病患儿进行匹配后比较,发现中危组和高危组先心病患儿的总体病死率(分别为3.9%和8.2%)明显高于相匹配的非先心病患儿组(分别为1.7%和1.2%),但低危先心病患儿组与其相匹配的对照组间总体病死率并无区别,说明术前甄别中、高危先心病患儿对改善他们行非先心病手术的预后具有重要意义。
波士顿儿童医院研究团队除了利用ACS NSQIP数据库中18岁以下非心脏手术患儿的数据开发了PRAm评分系统,还对先心病患儿行非心脏手术的数据进行了分析,通过Logistic回归模型得到8个术前风险预测因素,最终设计出先心病患儿行非心脏手术的风险分层评分系统(表3),该模型对于预测住院病死率具有良好的鉴别能力,ROC曲线下面积为0.837 。系统中≤3分为低死亡风险,4~6分为中度死亡风险,≥7分表明死亡风险很高。该评分系统提示除了通常意义上重症的一些术前标志(如正性肌力药物支持、机械通气、术前心肺复苏以及急/慢性肾损伤)外,先心病病变的类型(如单心室生理)以及心功能严重受损的先心病是预测先心病患儿行非心脏手术住院病死率的有力指标。
4.3 先心病手术风险评估系统
目前,先心病手术风险评估模型主要包括先天性心脏病手术风险分级评分(the Risk Adjustment in Congenital Heart Surgery‑1 Method, RACHS‑1)和亚里士多德评分两个系统。RACHS‑1评分于1998年由Jenkins和Gauvreau 提出,按手术难易程度将不同先心病手术分为6个等级,评估方法简便易行,适合外科医师和麻醉医师常规术前评估。其预测院内死亡的能力很好,ROC曲线下面积为0.740~0.784,适合群体患者的预测,而不能用于预测个体病死率 。亚里士多德评分,即亚里士多德基本评分(Aristotle Basic Complexity Score, ABC)和亚里士多德复杂评分(Aristotle Comprehensive Complexity Score, ACC),于1999年由美国胸外科医师协会、欧洲心胸外科协会的先心病外科专家组共同提出。ABC评分根据145种先心病手术的潜在手术病死率、并发症和手术难易度对手术进行赋分,分为4个风险等级,而ACC是在ABC的基础上纳入更多的个体化信息 。RACHS‑1评分预测病死率的能力优于ABC评分,ACC评分预测手术病死率和ICU时间的能力优于RACHS‑1,更适合对小儿先心病手术预后进行预测;但将年龄、早产和主要心外畸形纳入风险评估模型后,RACHS‑1的预测能力就与ACC十分相似了 。
4.4 NARCO‑SS评分系统
NARCO‑SS评分系统是基于对神经系统、气道、呼吸系统、心血管系统以及其他(Neurological, Airway, Respiratory, Cardiovascular, Other, NARCO)5个方面,加上手术复杂程度(Surgical Severity, SS)综合评估的评分系统。Malviya等 研究认为与ASA‑PS分级系统相比,NARCO评分系统信度更高。两者对围手术期风险的预测均十分有效,NARCO评分以及ASA‑PS分级越高的患儿需要监护、住院的概率就越高,住院时间更久,不良事件的发生率、病死率也更高。而将SS纳入这两项系统后,能进一步提升预测的有效性,说明除身体状况外,手术类型及严重程度也是决定围手术期风险的重要因素。Udupa等 也对该系统进行了研究,认为它识别高危患儿的能力比ASA‑PS分级系统强,但两者都不适合预测个体患儿的预后。此外,对NARCO‑SS评分系统中神经系统和气道两项类别进行修订有助于提高预测风险的精确性。
5 小结与展望
虽然ASA‑PS分级系统是一种简单易行的术前评估方法,但它缺乏足够的广度和精度,无法适用于所有患者,尤其是儿科患者。通过增加儿科相关疾病的示例对现有ASA‑PS分级系统进行修订或者建立全新的儿科术前风险评估系统都是极有价值的尝试。但如何对儿科急诊、相关慢性疾病、先天性畸形和综合征造成的器官系统损害进行评估,如何对包括早产儿、新生儿在内的儿科人群功能受限进行定义仍然是需要解决的问题。

精彩评论
相关阅读