首页
快讯
关注
资讯
- 健康
- 科技
- 热点
- 视频
- 产业
- 政策
- 护理
- 投资
- 医改
- 养老
- 疫情
- 人物
- 医保
- 疾病
- 管理
- English
- 临床
- 心血管
- 肿瘤
- 内分泌
- 妇儿
- 感染
专题
专区
知识

欢迎登录体验更多功能

搜索

【神麻人智】评估婴儿操作性疼痛：即时移动设备自动面部分析的可行性研究

2022

08/26

古麻今醉

A-

A+

疼痛，虽然被提升第五大生命体征的高度，但是疼痛作为一种情绪体现，一直缺乏像血压、心跳、呼吸、体温等客观量化指标评估。

67991661475741298

介绍

操作性疼痛指在提供医疗过程中进行的检查、治疗或手术操作相关的急性疼痛。任何可能造成实际或潜在的组织损伤的操作都可能引起疼痛，如静脉置管、静脉穿刺、免疫接种、换药、腰椎穿刺或骨髓穿刺等。操作性疼痛发生环境包括医院或日间手术中心、门诊护理诊所、全科诊所、牙科诊所和家庭护理等。

在急诊科，操作性疼痛是儿童急性疼痛刺激最常见的来源之一，研究显示高达80%的儿童痛苦地接受诊疗。尽管优化儿科疼痛管理是世界卫生组织和儿科疼痛协会的关键保健优先事项，不幸的是，婴幼儿的疼痛管理仍不尽人意。

操作性疼痛控制不佳，可造成短期和长期的后果。反复操作引起的疼痛若镇痛不全可对后续治疗产生焦虑忧伤情绪。对于婴幼儿来说，管理疼痛的主要挑战是准确可靠的评估疼痛。目前普遍接受的疼痛评估标准是自我评估，然而对不能传达疼痛的儿童来说，推荐使用年龄相关的行为性或观察性疼痛评估工具。

观察性疼痛评估工具的共同点是根据儿童的面部表情进行评估。由于人工解读面部表情存有主观差异，使得自动面部表情分析成为一个广泛研究的课题。现已有许多识别儿童疼痛面部表情的自动算法。然而，我们不知道是否有针对婴儿自动疼痛评估工具与基于纸张验证工具进行的对比测试，并且可以在移动应用程序（application,app）的护理点使用。

本研究目的是评估PainChek Infant的心理测量特性，是一个基于护理点的应用程序，利用自动面部表情分析检测1-12个月婴儿的疼痛，区别于设计用于评估操作疼痛的新生儿面部编码系统（NFCS）；以及用于量化操作性疼痛强度的观察者管理的视觉模拟（ObsVAS）疼痛量表。在此过程中，我们质疑使用自动面部表情分析来检测和量化疼痛是否可行。

方法

研究设计与人群

在这项可行性研究中，我们评估了PainChek Infant与新生儿面部编码系统修订版（NFCS-R）和ObsVAS，以评估PainChek对接受免疫接种的婴儿视频进行自动面部表情分析，是否能够准确地检测和量化疼痛。这项研究中使用的婴儿视频来自于在科索沃普里什蒂纳的一家免疫接种诊所的数字数据库。这个数字数据库包含0-12岁儿童410例，其中婴儿329例，我们随机选择了40个婴儿，每个婴儿记录了接种疫苗前60秒和接种疫苗后90秒的视频。

程序

PainChek Infant使用人工智能（Al）自动识别和分析婴儿的面部表情，以下六个面部动作单元（AUs）提示存在疼痛：AU4（皱眉）、AU9（皱鼻）、AU15（唇角下垂）、AU20（水平口伸展）、AU25（张口）、AU43（闭眼）。根据婴儿面部动作编码系统对这些面部动作进行分类。这6个AU中的每一个都使用二进制尺度进行评分（0=缺失，1=存在），总分为6分。该工具是专门设计分析面部表情评估婴儿（1-12个月大）疼痛的。这个app的算法来自西班牙卡斯蒂利亚-拉曼查大学婴儿免疫接种视频的数据库。采用五倍交叉验证法进行独立培训和验证数据集。自动面部分析使用一个固定的视频持续时间（标准的3s视频模式）或使用一个固定数量的最小有效图像（视频自适应模式）来完成。

NFCS-R，与PainChek相同，对婴儿面部表情进行疼痛评估，但它是人工评估而非自动评估。NFCS最初包含了10个面部动作，1996年改为5个，提高了疼痛评估的特异性，同时保持其敏感度和有效性。NFCS-R 包含以下五个面部动作：眉毛凸起，紧闭双眼，鼻唇沟，水平口伸展和紧绷舌头。NFCS-R的评分系统也是二进制的，最终的疼痛评分在0到5之间。NFCS被用于评估婴儿操作性和术后疼痛，也评估治疗效果，以及区分组织损伤和非组织损伤性疼痛。NFCS已被证明有良好的可靠性、结构效度和聚合效度。

ObsVAS，是一种常用的测量和量化疼痛的工具。该比例尺由一条100mm的线组成，其中0mm表示没有疼痛或痛苦，100mm代表了最严重的疼痛或痛苦。疼痛的程度取决于与0 mm的距离。2009年的一项研究显示ObsVAS具有良好—优秀的可靠性（组内相关系数ICC为0.69至0.91）和评估者之间的可靠性（ICC 0.55至0.97）。

40名婴儿的录像被分成不同的片段来显示接种过程的不同阶段：基线（准备接种前，即在父母怀抱中），准备期（暴露接种手臂），接种疫苗期（痛苦部分，即进针10秒内），恢复期（痛苦部分后，进针后10-40秒）。据推测基线和准备期的痛苦表现可能与疼痛无关，因为这些婴儿在此期间尚未注射。共准备了160个评估视频片段。NFCS-R分析的视频片段的长度均为10秒。

四名评估人员使用了三种方法评估婴儿疼痛。评估者们对彼此的研究结果一无所知，他们通过电子数据管理系统（EDMS）进行远程评估和数据输入。评估人员通过其各自的研究识别号访问EDMS，确保他们只评估分配给他们的婴儿视频。每个视频测试集包括30名婴儿，每个评估员被分配了两个测试集之一的120个视频片段进行疼痛评估。每个视频片段至少由两名评估人员独立完成配对的疼痛评估。每个测试会话数据集都被分配给一名有临床经验的评估员（即儿科护士）和一名无临床经验的评估员（即尚未开始儿科实习的护理学生）。为了尽量减少回忆偏差，每个评估者完成两个独立的测试集之间间隔4周。PainChek Infant面部评估使用安装在iPadMini-4上的1.3版本（美国加州库比蒂诺 IOS版本13.6.1）完成。NFCS-R被纳入EDMS，以便在评估者观看视频片段时输入观察到的面部行为，并将滑块纳入EDMS，以便评估者可以直接输入 ObsVAS分数。从三种疼痛评估量表中获得的结果被输入到EDMS中。在评估者记录完PainChek Infant数据后，应用程序会被删除，使之不保留在设备上。

在第一次测试阶段，供评估者查看和记录的是被加载到EDMS中没有音频的视频片段。评估人员被要求使用以下工具完成疼痛评估：NFCS-R单视频观看（NFCS-R单视频）、NFCS-R多视频观看（NFCS-R多重）、ObsVAS、PainChek Infant视频自适应模式（PainChek Infant自适应）和PainChek Infant标准3s视频模式（PainChek Infant标准）。选择这个顺序是为了尽量减少在使用其他工具之前自动使用PainChek Infant工具可能发生的偏差。30名婴儿出现在两个测试会话集中的顺序是由研究团队随机分配的。每名婴儿的4个视频片段会使用相同的工具进行评估，一旦完成对单个婴儿的4个视频片段的评估并提交到EDMS中，评估者就不能再查看这些视频片段。采用该方法是为了减少回忆偏差。在使用一个工具完成对测试会话集中所有视频的评估后，评估人员使用下一个分配的工具进行再次评估。为了进一步避免回忆偏差，EDMS为每种疼痛评估方法自动随机分配视频片段的评估顺序。在4周后的第二次测试阶段，每个评估者在不知道第一次评估结果的情况下，完成了与第一次测试会话集中相同的视频片段的评估，在第二次测试阶段，评估人员没有使用PainChek Infant评估，而是通过PainChek Infant模拟器独立完成的。

为了确保在疼痛评估工具方面的使用能力，评估人员培训了PainChek Infant、NFCS-R和ObsVAS的使用，也熟悉了EDMS的使用。

统计分析

婴儿面部区域有6个项目，最小样本量为30个。出于实际原因，我们选择了40个样本，允许有无法完成疼痛评估的实例（例如，两次自动面部分析失败）。IBM SPSS统计学26版本用于数据分析。使用二项式对数函数广义线性混合模型（GLMM）评估视频片段的面部动作，评估者作为固定因素，婴儿作为随机因素。通过柯尔莫戈罗夫-斯米尔诺夫正态性检验评估，疼痛评分不是呈正态分布的。所有视频片段均使用平均值、SD、中位数和IQR来描述疼痛评分。采用带有对数函数广义估计方程（GEE）模型的伽马分布来检查评分有差异的视频。计算变化分数来评估量表对变化的反应性。通过计算疫苗接种期的疼痛评分减去基线评分，计算每种方法的疼痛改变分数。通过计算准备时的疼痛评分减去基线评分来计算每种方法的非疼痛改变分数。使用平均数、标准差、95%偏差校正和加速（BCa）置信区间（CI）来描述疼痛和非疼痛的变化分数。BCa Cl的计算使用了1000个样本，并对评估者进行了分层抽样。如果PainChek Infant方法的分数变化超过2分，或替代方法超过33%，我们认为是有反应的。对于非痛苦的流程，不应该看到分数的变化。对于每一种方法，都使用线性混合模型（LMM）来检查疼痛和非疼痛程序中疼痛评分变化的关系。LMMs将疼痛评分作为一个连续的结果，将程序（疼痛/非疼痛）和评估者作为固定因素，将婴儿作为一个随机因素。通过使用PainChek Infant方法按基线或准备期的婴儿评分将婴儿分为低疼痛评分婴儿（<3）和高疼痛评分婴儿（≥3）来评估疼痛量表的反应性。使用ObsVAS、NFCS-R和NFCS百分比将婴儿分为低疼痛评分和高疼痛评分，高疼痛评分为50%或以上，低疼痛评分为低于50%。LMM使用疼痛评分作为连续结果，疼痛、程序（疼痛或非疼痛）、时间段（第一或第二）、评估方法、评估者作为固定因素，婴儿作为随机因素来观察反应性。

结果

2020年8月31日和10月19日分阶段完成了40名接受免疫接种的白种婴儿的4303次疼痛评估。婴儿年龄为2.2至6.9个月龄，平均年龄为3.6个月龄（SD1.3），中位年龄为3.4个月龄（IQR2.3-4.5）。40名婴儿中有24名（60%）为女性。在第一次测试中，使用5种疼痛评估方法进行了2384次评估，在第二次测试阶段，使用三种方法进行了1439项评估（表1），另外160项评估是通过使用PainChek Infant标准模拟器进行的模拟（即没有评估者）完成的。

15911661475741389

表1：第一次和第二次测试阶段各种评估方法对视频片段的疼痛评估。

根据PainChek Infant自适应和PainChek Infant标准（第一次测试）和模拟PainChek Infant标准（第二次测试，图1），发现面部活动在接种疫苗期间达到峰值，且在恢复时略高于基线水平。

42031661475741761

图1：第一次测试阶段（A）、第二次测试阶段（B）、联合测试阶段（C）各种评估方法评分变化。

GLMM显示，每个面部动作的视频片段之间存在显著差异（p<0.001）。在第一次测试阶段中，在所有使用PainChek Infant自适应和PainChek Infant标准的评估中，共有956项评估记录，其中有41项（4%）失败。失败通常与视频质量差、婴儿的姿势或护士及父母妨碍孩子有关。PainChek Infant标准模拟记录了160项评估，其中有17个项（11%）失败。这些失败是由于系统无法有效地判断出最合适的自动评估开始时间。

GEE模型以评估者和视频片段作为固定因素，并没有在两个测试阶段中检测到 NFCS-R单视频、NFCS-R 多重和ObsVAS疼痛评分的显著差异。当将PainChek Infant标准模拟数据疼痛评分与PainChek自适应和PainChek标准评分进行比较时，也没有显著差异。我们使用LMM模型描述疼痛和非疼痛事件评分检测量表的反应性，见表2。

68681661475742022

表2：各种评估方法在疼痛和非疼痛事件评分的变化。

三种PainChek Infant工具对疼痛评估都有显著差异，LMM证实对疼痛程序的反应性：PainChek Infant自适应和PainChek Infant标准方法为4.4，PainChek Infant标准模拟为4.6。NFCS-R和ObsVAS方法也报告了有临床意义（>33%的变化）和具有统计学意义的反应性（表2，图1）。两次测试阶段的Bland-Altman图比较发现测量之间没有系统差异（图2）。

51101661475742240

图2：两次测试阶段的Bland-Altman图。

ICC结果表明，两次测试片段的每种评估方法的所有评估者之间具有中等到极好的一致性（表3）。

21141661475742457

表3：两次测试阶段每种评估方法的评估者之间具的可靠性和内部一致性结果。

ObsVAS、NFCS-R多重、NFCS-R单视频、PainChek Infant（表4）在第一次和第二次测试会话集整体和每个视频片段的评估者内部可靠性为极好。

15081661475742734

表4：每种评估方法的评估者内部可靠性和内部一致性结果。

讨论

本研究评估了PainChek Infant与NFCS-R和ObsVAS心理测量特性，以确定其在婴儿操作性疼痛评估中的适用性。NFCS-R和ObsVAS依赖于用户观察和判断疼痛程度，这可能会对疼痛的治疗产生影响。这种用户依赖属性在其他现有的观察性疼痛评估工具中很常见。相比之下，由于人工智能的进步，PainChek Infant使用自动面部表情分析来自动解码面部动作，并确定是否存在六种与疼痛相关的面部表情。PainChek Infant分析没有用户主观性，并可在3秒内实时完成。此外，PainChek Infant是通过移动设备操作，因此在工作流程、存档和通信方面具有潜在的好处。结合这些特性，PainChek Infant提供了一个改善婴儿疼痛评估的机会，并可能导致临床实践的变化，有助于解决当前婴儿疼痛相关的挑战。

但是，这些评估方法仍然有一些限制。首先，评估心理测量特性不存在黄金标准。评估取决于一系列间接的效度度量的结果，所有这些结果都有局限性，如：不可能使评估者忽视婴儿周围的环境，因此可能会使评估者的量表应用产生偏差。为了帮助克服这种潜在的偏差，我们使用了四名评估者（临床和非临床背景）。此外，研究中使用的EDMS会自动静音所有视频，以确保声音不会影响评估者评分。

这项研究也受到事实的限制，即评估者并没有直接面对婴儿，而是通过观看录像来进行评估。虽然这种评估疼痛的方法不同于临床实践，但之前已有关于使用视频记录来验证疼痛评估的情况。此外，视频录制可以供评估者多次观看这些片段（如在NFCS-R和ObsVAS的情况下），这一直被认为是一个优势。研究表明，使用PainChek Infant模拟器所获得的结果与评估者评估的结果相当。但是我们承认，失败仍然可能发生，临床实践中进行的试验结果表明，可能需要添加一个手动评估选项。这些算法在实验中应用于1-12个月大的婴儿。在年龄较小或年龄较大的儿童上使用该工具还有待测试。此外，纳入评估的婴儿都是白人，其他种族的婴儿使用时必须考虑到这一点。我们相信，PainChek Infant代表了一个有进步意义的婴儿操作性疼痛评估和监测。不过，还需要进一步的研究来评估其临床实践中的效用。

述评：

疼痛，虽然被提升第五大生命体征的高度，但是疼痛作为一种情绪体现，一直缺乏像血压、心跳、呼吸、体温等客观量化指标评估。具备正常沟通能力的成年人尚且对疼痛的描述存有主观差异，对于尚无表达能力的婴幼儿来说，操作性疼痛的管理具有更大的挑战。随着AI技术的发展，对婴幼儿面部表情分析用于疼痛评估被广泛关注。本文中，对PainChek Infant 作为APP 评估婴儿疼痛在移动设备中使用的可靠性，与以往被广泛认可的NFCS-R和ObsVAS 评估方法进行测试对比，报道了其特定的亮点，如3秒内自动解码面部表情，不仅耗时较短还极大规避了评估者的主观偏差，并且在移动设备上操作，对护理存档工作提供了极大的便捷等。但作者也承认，用该APP 评估婴儿疼痛在临床实践中存在失败风险，其主要原因还是评估心理测量特性不存在黄金标准。我们认为只对40名接受免疫接种的婴儿视频进行评估，样本量还是过少，即使一共对4303次疼痛进行了评估。因为一个婴儿的哭闹动作代表疼痛可能一致，也可能是其特有的表达方式。AI技术对临床疼痛管理的应用还有多长的路要走，我们拭目以待。

编译：谢莉

述评：李丽

原文链接：Hoti K, Chivers PT, Hughes JD. Assessing procedural pain in infants: a feasibility study evaluating a point-of-care mobile solution based on automated facial analysis. Lancet Digit Health. 2021 Oct;3(10):e623-e634.

声明：古麻今醉公众号为舒医汇旗下，古麻今醉公众号所发表内容之知识产权为舒医汇及主办方、原作者等相关权利人所有。未经许可，禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用，亦须注明来源。欢迎转发、分享。