定量诊断测试的制造商应在其产品标签中提供详细的参考区间信息。对于经过充分研究并被广泛认可的将参考样本划分为子类的测试,制造商应为这类子类提供参考区间。
1. 引言
相信大家对于血常规检查报告单应该都不陌生,报告单上的参考区间/范围就是我们通常判断检查结果异常与否的依据,那么,这个参考区间是怎么来的呢?
定量的产品都需要有这样的参考区间,企业建立参考区间都是根据公认的标准EP28-临床实验室中的参考区间的定义、建立、和验证。接下来VDEAR团队就给您重点解读下这份对于定量产品企业如何建立自己产品的参考区间的指南。
2. EP28范围
EP28为诊断实验室和诊断试剂制造商提供了如何为定量实验室检测试剂建立及确认参考区间的最新指南。主要讨论了如下几个方面:
1)EP28主要大纲框架-建立参考区间方案大纲
2)建立参考区间主要步骤
2.1)选择参考主体
2.2)分析前和分析过程考虑因素
2.3)分析参考值
2.4)参考区间展示
3)参考区间转移
4)参考区间验证
5)其他问题(不能纳入EP28的重要但附带参考值主体的情况)
下面,IVDEAR团队将从这几个方面为大家重点解读(重点解读红色标识部分内容)。
3. EP28主要大纲框架
1)定义及其关联
1.1)定义
· 参考个体(Reference individual) - 根据明确的标准选择进行测试的人(定义这个人的健康状态很重要);
· 参考群(Reference population) - 由所有参考个体组成的组;
注1:参考群通常有一个未知数量的成员,因此,是一个假设的实体;参考群可能只包含一个成员(例如,一个人可以作为他自己或另一个人的参考);
注2:在这个指南中没有涉及“特定个体”的参考区。
· 参考样本组(Reference sample group) – 选择能代表参考群的足够数量的人。
· 参考值(Reference value) – 通过观察或测量参考样本组而获得的值(测试结果);
· 参考分布(Reference distribution) – 参考值的分布;
· 参考限(Reference limit) – 从参考分布中得到的用于描述研究目标的值;
注:定义参考限通常的做法是定义参考值特定分段值,一个小于或等于或大于或等于的上限或下限;参考限是对参考值的描述,可以与其他各种类型的决策限区分。
· 参考区间(Reference interval)– 两个参考限(参考上限与参考上限)= 的区间;
· 参观察值/病人实验室测试结果)Observed value/ patient laboratory test result) - 通过对测试对象(即患者)的观察或测量而获得的特定类型及数量的值,将与参考值、参考分布、参考极限或参考区间进行比较。
1.2)参考区间及其涉及的参考个体、参考群、参考样本组、参考值、参考分布、参考限、参考区间及观察值间有何关联?
关联如下图:
2)建立参考区间方案大纲
参考区间的建立主要包含三种情况:
· 针对新分析物或分析方法的参考区间研究
· 多中心参考区间研究
· 针对先前测量过的分析物的参考区间研究
这三种参考区间研究大纲如下图所示:
4. 建立参考区间
建立参考区间主要步骤:
· 选择参考个体
· 分析前考虑事项
· 分析参考值(有效参考区间的计算方法和要求)
· 参考区间展示
1) 参考个体的选择
参考个体的选择可通过文献检索获得信息以确定排除、划分标准后制定样本问卷,根据问卷内容及每个参考个人的健康状况,以及结合抽样技术,从而促进参考个体的选择和划分。
1.1)排除和划分
排除标准:基于参考个人的信息,根据潜在影响测试结果的因素设置排除标准,防止该参考个人被奶如参考样本组。并非所有的参考区间研究都有相同的排除标准,下表列出部分可能的排除标准的例子。
划分标准:划分标准是所选参考个体的特征,它将参考样本划分为重要的子类。两个最常见的划分标准是年龄和性别,常见的划分因素如下表:
上述两个表可以看出: 一项研究中的排除标准可以用于另一项研究中的划分。例如怀孕,为一般人群服务的实验室可选择将孕妇排除在参考样本之外;然而,支持产科团体实践的实验室可以选择将其样本按妊娠划分。
1.2)样本问卷
问卷设计需要保护参考个人的隐私,但是为了分析发现的一些潜在异常情况,需要联系参考个人或者通知其医生时,在设计上就会包含个人信息如姓名、地址和电话号码,那么这时就需要实验室设置关于一个医疗审核和保密通知的机制。
当然也可以采用匿名方式的编码系统,但是参考个人联系实验室确认检测结果情况时,这种匿名问卷的方式问题就更大。
另一种是通过排除和划分来对问题进行分组,特别是在先验研究的情况下。这种方式应包括旨在揭示已知的影响正在调查的测试疾病状态信息的问题。
注:尽管进行参考区间研究不是严格意义上的研究,但实验室也应适当获得每个参考个体的书面知情同意,参考个体签署书面同意后完成问卷。
问卷为实施排除和划分标准提供了一种极好的方法。形式应该简单,问题通常需要是或否的答案和简单的、解释性的回答。问卷可以与一些简单的测量一起使用,如血压、身高和体重,也可以通过询问受访者是否认为自己健康情况的相关访谈。
1.3)参考个体选择的方法
a. 直接采样技术(推荐)
使用具体的、定义明确的标准从参考人群中选择参考个人(这些标准在采样之前应用,称为先验条件;在采样之后应用,则称为后验条件)。
b. 间接采样技术
在某些情况下(如儿科),使用直接抽样技术可能特别困难时,提倡使用间接技术,但不赞成作为建立参考区间的主要方法。
间接采样技术可能更合适以下五个方面:
Ø 献血者
Ø 接受常规体检以进行定期健康检查的个人;
Ø 正在接受铅筛查的个人;
Ø 接受小手术的病人;
Ø 接受基因筛查的个体。
间接采样技术虽然方法相对简单和相对便宜,但必须采取额外的预防措施,不包括数据库中可能存在的不健康个人的结果,所以采用间接技术产生的参考区间都应该被认为是粗略的估计,因为大多数数据来自参考个体的基本假设可能是不正确的。
综上,只要有可能,直接采样技术是最推荐的方法。
2)分析前考虑事项
参考人群的分析结果必须反映所有可能影响测试结果的分析前变量和分析过程变量,所有的分析前因素,包括受试者准备、样本收集和处理、分析方法和仪器安装,都必须仔细定义并用于检测参考个体和患者群体。
一般来说,分析前的考虑涉及两个领域,即生物学因素和方法因素。
生物学因素包括那些具有代谢和血流动力学来源的因素(如,可能导致细胞损伤的程序因素,使用药物发生酶诱导反应的受试者应该排除;
方法因素包括标本的收集和处理, 包括考虑收集方法、添加剂和填充管的顺序(对于血液样本);用多种方法、仪器或系统测量同一分析物,需要进行适当的检查,以验证各种方法、仪器或系统是否产生具有可比性的结果。
2.1)受试者准备:
受试者准备不足或偏离所定义的标准可能导致结果不准确或数据有偏差。下表总结了在受试者准备方面需要考虑的一些因素:
2.2)样品类型、收集、搬运和储存:
实验室应有概述样品收集、处理和储存的手册,以便医生在解释患者结果时可以适当地给出参考区间。需要注意血清、血浆或全血样本应指定适当的采血管,其他液体样本特殊要求以及温度因素的影响。
血液:如果选择血液标本,需要确定样本是动脉、静脉还是毛细血管;标本是否应抗凝;如果抗凝,哪种抗凝。
其他液体:其他体液的标本获取,虽然通常不受实验室的控制,但仍需要定义收集、处理和处理的具体手册。这些液体包括尿液、脑脊液、胸膜、心包、羊水和唾液等
温度:一些标本 (分析物)的保存需要在特定温度或冷冻下保存,必须建立特殊条件满足储存要求,并严格遵守它们。一般情况下,标本采集后应及时处理。
2.3)分析方法特点:
除了个体内和个体间的差异外,参考区间研究还需要考虑测量方法的分析差异性。所以实验室提供信息的有效性是至关重要的,所使用的方法必须详细描述,需报告运行间分析的不精确度、检测限、线性、回收率和干扰特性,特别是其真实性。
另外,还需要考虑影响分析性能的其他因素,包括设备/仪器、试剂(包括水)、校准标准和计算方法。 参考区间的建立还必须包括批次和技术人员的可变性,以及如果使用相同的多台分析仪,还应考虑仪器间的可变性。
生成的数据的可靠性是至关重要的,因为该方法的精密度和真实性决定了其诊断功能。因此,在确定参考区间期间,还包括常规使用与患者检测相同类型的QC材料,这不仅监测了研究过程中使用的分析方案,而且确保了结果的长期等效性。
3)分析参考值
本节主要介绍最少数量的参考值确认方法、离群值的处理、参考值的划分这三个方面。
3.1)最少数量参考值确认方法
非参数方法:使用非参数方法,除非获得至少n个=(100/P)−1观测值,否则不可能区分一个有P%间隔的分布的两个百分位数。
如要估计第5百分位数的2.5百分位数,或第97.5百分位数的第95百分位数(即P = 2.5), 至少需要39次测量[39 =(100/2.5)−1]。虽然理论上可以用39个样本确定95%的参考区间,但至少需要120个样本才能在这些区间上达到90%的置信限。
3.2)鲁棒法
没有特定的所需最小观察数,当然,最好在研究参考区间时使用尽可能多的有效的观察结果。使用较少的观察值的缺点是,对于较小的样本量的统计不确定性,就导致参考区间限值的置信区间宽度就比较大,而这种类型的不确定性会随着受试者数量的增加而减少。
综上所述:确定样本量的一般标准是,参考限的90%置信区间(CI)的宽度相对于95%参考区间本身的宽度是可以接受的,也建议90% 置信区间的宽度小于参考区间宽度的0.2倍。如果置信区间宽度不可接受,则需要更多的参考值。
3.3)离群值的处理:
在参考限估计中一个重要的隐含假设是测量的参考值代表了一个“同类”的观察集合。这就意味着大多数参考值都满足这个条件,但也有一些不符合的测试结果,这些往往超出了大部分参考值的范围,而且它们很容易被识别为需要特别注意的“离群值”。
注:除非已知离群值是异常的观察结果(如,由于分析中的错误或适用于其余受试者的分析前控制的失误),否则应该是保留而不是删除它们。
3.4)离群值确认的方法步骤:
1. 频率分布的目视检查
2. 利用统计技术进行离群值检查,这些技术中的大多数都是基 于观察到的参考值是高斯分布的假设。
1)Dixon提出了一个在参考值估计的方法:比值D/R,D是极端观察值(大或小)和
下一个最大(或最小)观察值之间的绝对差,R是所有观察值,包括极端值。Reed等人建议D/R的值为三分之一作为截断值;即如果差值D等于或大于R的三分之一,则删除极端观察值。
2)Tukey提出的离群值检查方法:只使用了中间的50%的样本,从而减少,甚至消除了在分布一侧的多个异常值可能产生的掩蔽效应。
注:当参考值不是Gaussian分布时,需要对其进行变换。一个合理的转换是Box和Cox。
3.5)参考值的划分
在收集汇总和分析受试者样本的实际过程之前,应该考虑受试者子类需要单独划分的可能性。对男性和女性或不同年龄组进行单独的参考区间可能是不合理的,除非它们在临床上有用和/或在生理上有良好的依据。如果满足单独划分的情况,那么至少应该抽取每个性别或年龄或其他子类的120名受试者。
1)一般而言,只要两个子类的观察平均值之间的差值在统计上显著性, 那么每个子类都需要有自己的参考区间。Sinton等人建议,除非参考对象的子类平均值之间的差异至少是合并(总体)样本中估计的95%参考区间的25%,否则不能估计单独的参考区间。
2)Harris and Boyd 建议采用标准正态偏差检验计算子类均值间差异的统计学意义:
x1 和x2 是这两个子类的观察平均值,s12和s22是两个子类的方差,n1和n2 是两个子类的观察值的数量。如果原始数据是高度倾斜的,并且一个简单的变换,如对数变换,例如,产生的值更接近Gaussian分布,那么最好对变换后的值计算统计值z。
Harris and Boyd将计算出的统计值z与一个关键值z*进行了比较,看是否两个子类需要单独划分。
z*=3(naverage/120)½ = 3[(n1 + n2)/240]½ .
如果计算出的z超过z*,建议进行划分。此外,如果标准偏差较大,例如S2超过1.5倍S1或者S2/(S2− S1)小于3,这样也可以进行划分。
方法局限性:
1)该方法是建立在观察值都满足高斯分布的假设情况下,并且它不能解释子类的不平等流行率;
2)由平均值和标准差计算出的z值并不一定反映底层分布情况。
3.6)参考限置信区间(CI):
从选定受试者样本计算的参考限是对研究人群中相应百分位的估计,来自同一人群的另一个样本可能产生一些不同的参考限制。识别和评估样本估计中的这种可变性的有用方法是,使用样本提供的信息,计算所估计的总体百分位数的CI。
CI是包含特定概率的真实百分位(如人口的2.5百分位)的值范围,通常为90%或95%。这个概率被称为置信区间的“置信水平”。
注:CI有效性的基本假设是观测值是相互独立获得的,即使不是严格随机抽取的,参考样本也能代表总体。
a. 以下两个原因证明CI有效性:
· 提醒研究者样本估计的可变性,提供了这种可变性的定量度量方法;
· CI随着样本量的增加而缩小。因此,研究者可以通过选择更多参考个体样本提高参考区间的精度。
b. 参考限的CI可以通过非参数方法和鲁棒法获得(非参数法和鲁棒法见本文3.3部分)。
4)参考值展示
本节从两部分介绍参考值展示的两种方式。第1部分介绍实验室和最终用户的参考值。第2部分介绍适用于定量临床实验室诊断测试制造商和最终用户的参考值。
Part 1: 实验室展示
每一个定量的临床结果都应伴有一个适当的参考区间。所应用的参考区间应反映适用于该实验室的特定参考人群重要的子类分区情况。许多测试结果的冗长报告应包括以某种方式突出显示不在参考区间内的结果(例如,在结果附近印“高”或“低”)。应使用术语“参考区间”;应避免使用术语“正常”、“通常”或“预期”。
注:任何使用子类参考区间的报告都应该在报告的主体或人口统计学部分中包含患者的分区因素。
应记录所使用的参考区间的来源。
不管是内部验证获得或者通过其他方法验证了参考区间,都需要保存支持的数据(如,人口统计数据、健康标准评估资料、排除和划分标准等),并可根据要求提供。
医疗决策限制:参考区间由统计方法定义的,并描述了一个特定的人群。相比之下,决策限制是由共识和不同人群之间的区分来定义的。当存在由国家或世界共识决定的决策限制时,应报告这些限制,而不是参考区间。
以高密度脂蛋白(HDL)胆固醇和NTproBNP/BNP为例:在高密度脂蛋白胆固醇的情况下,可以根据大人群研究的数据来分类冠状动脉疾病风险增加(<40 mg/dL)或风险降低(>60 mg/dL)。在BNP/NTproBNP的情况,基于临床敏感性和临床特异性的决定限制可用于确定患者发生充血性心力衰竭的可能性。为了避免混淆,工作组鼓励实验室报告决定限制或参考区间,但不报告两者,并明确使用了哪些指标。
Fig.1上图1中样本报告中的总胆固醇和高密度脂蛋白胆固醇。当报告了针对不同临床情况(如低密度脂蛋白[LDL]胆固醇)的几种决策限制时,应在报告中添加对这些建议的简要总结。
Part 2:制造商展示
定量诊断测试的制造商应在其产品标签中提供详细的参考区间信息。对于经过充分研究并被广泛认可的将参考样本划分为子类的测试,制造商应为这类子类提供参考区间。
1)至少需要包含以下信息:
u 数量
u 性别
u 年龄(如适用);
u 种族和/或人种(如相关);
u 用于cut-off值的百分位数(如中央95%,第99百分位数)
2)提供根据ISO17511可追踪结果以达到国际公认的标准的的方法,以便比较不同方法之间的患者值。
3)建立参考区间时,制造商必须对其进行足够详细的描述(如所使用的分析方法、所研究的参考个体,以及选择参考限的技术方法)。
注:当制造商对分析系统(试剂、校准器和/或仪器)进行实质性修改时,应该提供关于对参考区间的影响的明确文件。
以上是对参考区间建立及参考区间展示内容的描述。当参考区间建立后,有可能需要进行参考区间转移及其验证(主要针对多中心参考区间的研究和先前测量过的分析物参考区间的研究),如何进行参考区间转移及验证,后续IVDEAR团队将会一一再为您详细解读,敬请关注,谢谢。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您