内分泌检查结果的解释原则
目录
作者:Peter A. Graham
译者:吹过的晚风
一般原则内分泌测试结果的解释通常是令人生畏的。在很大程度上,这是因为内分泌系统对外部和内部反应是非常动态的。因此,实验室测试结果可能在生理上是合适的,但很难与真正病理状态下的结果区分开来。
“正常的”生理和“异常的”病理之间有一条很细的分界线,可能并不总是能够简单地将所有内分泌测试结果归为这两类。然而,在某些情况下,内分泌检测结果可以清楚地分为阳性或阴性两类,两者之间很少有重叠。对于执业的兽医来说,重要的是知道哪些结果值得信赖,哪些结果值得谨慎。这种信心来自于:
了解内分泌系统的生理学认识到其他内分泌器官和非内分泌疾病的影响了解所使用测试的诊断性能属性。在某些情况下,检测结果只是加强了对内分泌疾病的诊断。在其他情况下,测试结果有助于提供明确的诊断。解释的技巧是知道哪些判断可以提供满意的诊断,哪些判断可能需要随着事件的发生而在单个患者中进行复查。
通常,器官系统中是否存在疾病是根据个体测量值是落在给定参考区间之内还是之外来确定的。然而,在许多内分泌疾病中,特定的测试结果可能保持在其参考区间内,但仍为疾病的存在或分类提供强有力的证据。在这些情况下解释结果的关键是回忆和依赖负反馈的概念,这是内分泌学的主要规则。记住这条规则有助于临床医生了解特定情况下的内分泌测试结果,简化解释,并允许区分生理上适当的反应和病理。掌握了负反馈原理的知识,除了其他例子外,还有可能解释参考区间甲状旁腺激素 (PTH) 结果导致犬高钙血症,对垂体依赖性高肾上腺皮质激素 (HAC) 进行分类,并理解为什么低剂量地塞米松抑制 (LDDS) 试验之后可以立即进行促肾上腺皮质激素 (ACTH) 反应试验,但反之则不然。
诊断测试性能如上所述,由生理和病理反应引起的内分泌检查结果可能有相当多的重叠。因此,在调查内分泌疾病时测量的许多激素浓度并不能提供完美的诊断效果。例如,下丘脑垂体肾上腺对压力和其他疾病的反应经常与犬HAC的检测结果相关,导致诊断特异性差(许多假阳性)。同样,非甲状腺疾病的总甲状腺素(T4)反应使这种单独测量对犬甲状腺功能减退的特异性很差。
诊断灵敏度和特异性
一旦建立了实验室检测的分析性能,或确定了对动态内分泌检测的适当反应,下一步就是确定检测的诊断性能。这提供了关于检测如何区分某一特定疾病的存在和不存在的信息。
为了评估诊断效果,通常使用二分结果,即检测结果是阳性或阴性,病理状况或疾病是存在的或不存在的。然而,虽然这是最容易理解和最常用的方法,但它是一个具有两个极端的系统(未患病或患病)。它没有考虑到“灰色地带”的结果,也没有考虑到不同程度的病理,这通常是内分泌失调的特征,特别是那些需要时间发展的。
诊断灵敏度
诊断敏感度(不要与分析敏感度混淆)是通过测试正确识别出患有疾病的患者的比例。 这个比例的推导需要一个合理规模的患病人群,通常通过独立的金标准诊断方法或技术已经很好地表征为患有这种疾病。
Dixon 和 Mooney (1999) 通过在 30 只使用促甲状腺激素 (TSH) 反应测试结果确认为甲状腺功能减退的狗中测量游离 T4,推导出平衡透析 (fT4d) 的诊断敏感性。 在这 30 只狗中,有 24 只的 fT4d 结果低于 5.42 pmol/l 的诊断临界值。
诊断灵敏度= 24/30 = 0.80 (80%)
由于该属性是基于样本的比例,因此总体比例的置信区间可估计为±1.96 x估计比例的标准误差。
灵敏度的95%置信限=灵敏度 ±1.96 x√[灵敏度x(1 -灵敏度)/ n]
因此,患病研究组的规模越大,置信区间越窄,因此估计的敏感性越可靠。 基于少量动物的诊断敏感性研究将产生非常宽的置信区间,这意味着与基于大量动物的研究相比,它们是不太可靠的敏感性来源。 在上面的示例中,95% 置信区间的范围从 0.61 (61%) 到 0.92 (92%)。
诊断敏感性与真阳性率同义。 由于敏感性来自患病人群,因此敏感性越高,假阴性率越低。 由于假阴性很少见,因此可以对阴性结果为真更有信心。 因此,高诊断灵敏度的测试对于排除疾病特别有用(图 1)。
图1 诊断灵敏度的推导。例a,诊断灵敏度为80%,假阴性率为20%。在例b中,诊断敏感性为99%,假阴性率为1%。FN =假阴性;TP =真阳性。常用的记忆辅助工具是 SnOut(灵敏度有助于排除疾病)。
推导出的诊断敏感性在某种程度上会受到患病组的选择的影响。 通常,患病组包含易于分类的病例,因此可能患有严重或明显的疾病。 较难分类的轻度或早期病例可能会被忽略。 因此,在不包括具有代表性的表现程度范围的研究中,敏感性可能被高估。 如果对新测试引用了高诊断敏感性,则谨慎地检查患病组是否恰当地代表了完整的范围或连续的表现。
诊断特异性
诊断特异性(不要与分析特异性混淆)是通过测试正确识别的无疾病患者的比例。 这个比例的推导需要一个明确表征的人群,该人群已知没有所讨论的病理。 理想情况下,这不应该只是一个健康的群体,而应该包括具有类似信号的动物,这些动物具有某种暗示所讨论疾病的属性或临床症状。 除非患病组外,特异性的计算方式与灵敏度相同。
Dixon和Mooney通过使用TSH反应测试结果对77只被证实为甲状腺正常(即非甲状腺减退)的狗进行测量,得出fT4的诊断特异性。在这77只狗中,72只的结果大于或等于5.42 pmol/L。
诊断特异性= 72/77 = 0.935 (93.5%)
诊断特异性的置信区间与敏感性的置信区间的推导方法相同。在上面的例子中,95%置信区间在0.85(85%)到0.98(98%)之间。
诊断的特异性等同于真实的阴性率。由于特异性来自于非患病人群,特异性越高,假阳性率越低。更大的信心可以放在积极的结果是真实的,因为假阳性是罕见的。因此,诊断特异性高的检测对诊断疾病特别有用(图2)。
图2 诊断特异性的推导。在样本c中,诊断特异性为93%,假阳性率为7%。样本d中,诊断特异性为99%,假阳性率为1%。FP =假阳性;TN =真阴性。一种常用的记忆辅助工具是“SpIn”(特异性有利于统治疾病)。
对非患病人群中受试者的选择可能会影响诊断特异性的估计。 正如已经提到的,重要的是所选对象正在接受有关疾病的适当调查。 例如,一项关于犬 HAC 测试特异性的研究,使用没有兼容的临床或表现体征的非常年幼的动物,可能会显着高估诊断特异性。 如果对新测试引用了高诊断特异性,则谨慎地检查非患病组是否代表了适合于所讨论疾病的信号和各种表现。
理想情况下,当主要目的是排除或排除疾病时,诊断测试的选择应提供最佳的可用诊断灵敏度,而当目的是排除或确认疾病时,应提供最佳的特异性(图 3 和图 4)。
图3 犬甲状腺疾病检测按敏感性和特异性排序。TgAA是对犬甲状腺病理而不是甲状腺功能障碍的检测。TT4 =总甲状腺素;TgAA =甲状腺球蛋白自身抗体;Ft4d =透析游离甲状腺素;TT4/TSH =总甲状腺素/促甲状腺激素;促甲状腺激素;fT4d/TSH =透析游离甲状腺素/促甲状腺激素。图4 犬肾上腺皮质亢进试验按敏感性和特异性排名。ACTH=促肾上腺皮质激素;LDDS =低剂量地塞米松抑制试验;UCCR =尿皮质醇:肌酐比值。阳性和阴性预测值和患病率的影响
诊断敏感性和诊断特异性提供了有关测试如何在明确定义的疾病状态的人群中执行的有用信息。 然而,在临床实践中,明确定义的疾病状态是一种罕见的奢侈。 实际上,进行测试的目的通常是试图更清楚地定义患者的疾病状态。 执行测试后,会生成结果,了解测试结果指示正确诊断的可能性(概率)很重要。
为了确定正确诊断的概率,使用阳性预测值 (PPV) 和阴性预测值 (NPV)。 PPV 和 NPV 由敏感性 (Se) 和特异性 (Sp) 与流行率相结合得出(图 5)。
在大多数情况下,受试动物群体中该病症的真实流行率是未知的。然而,了解测试在不同流行情况下的行为可以改变结果的权重,并可以影响进行测试的动物类型。
另一种考虑患病率的方法是在执行测试之前疾病存在的概率(测试前概率)。通过仅对已经很可能患有该疾病的动物(适当的年龄、品种或性别、相容的临床症状和常规临床病理学异常、排除其他鉴别诊断等)进行测试,可以显着提高测试前的概率。
如图 6 所示,流行率(测试前概率)对预测值有显着影响,尤其是在诊断敏感性或特异性相对较差时;内分泌疾病的检测通常就是这种情况。
在高患病率(高预测试概率)情况下,例如在有相关疾病的适当支持数据的情况下,诊断敏感性低的测试具有较差的阴性预测值。当用于诊断的支持临床数据有限时,低诊断特异性的测试在低流行(低预测试概率)情况下的阳性预测值很差。 在针对相对罕见的疾病筛查大量人群时,如此低的患病率并不少见。PPV流行的影响可能是有意思的。当患病率(检测前的概率)低至5%时,阳性LDDS检测用于诊断犬HAC的PPV是不可接受的15%。面对一个阳性的LDDS测试结果,尽管结果是“阳性”,这是非常有可能的(85%)的人认为动物实际上没有HAC。正是由于这个原因,LDDS检测不适合“筛查”狗的HAC,除非有强有力的支持证据(高流行率或检测前的概率)。
图5 正负预测值的推导。FN =假阴性;FP =假阳性;Prev =流行;Se =诊断灵敏度;Sp =诊断特异性;TN =真阴性;TP =真阳性。低诊断特异性的测试在兽医内分泌学中很常见; 因此建议在对犬甲状腺功能减退症使用总 T4 或对犬 HAC 进行 LDDS 测试之前增加预测试概率(患病率)。 对于犬甲状腺功能减退症的总 T4,避免在已知会增加假阳性结果风险的情况下(例如非甲状腺疾病、某些药物疗法)对狗进行测试也很重要。 或者,即使在假阳性组中,通过结合使用具有更好特异性的甲状腺功能测试,而不是仅依赖总 T4,也可以提高对甲状腺功能减退症诊断的信心。
对于诊断猫甲状腺功能亢进症,总 T4 具有较高的特异性,但敏感性较低。 因此,这是一个很好的筛查老年猫的测试,因为有信心通过阳性测试结果诊断甲状腺功能亢进症。 然而,当患病率(测试前概率)很高时,NPV 会降低,并且不能使用参考区间 TT4 值明确排除甲状腺功能亢进。 适当的行动方案是重新测试或与更高灵敏度的测试相结合,例如 fT4d。
已发布的预测值并不普遍适用。 如图 6 所示,它们完全取决于测试群体中的流行度(测试前概率),因此,除非还说明了流行度,否则不应信任预测值。 为了应用于临床环境,引用的流行率必须与临床医生的预期相似。
一些研究引用测试准确性(所有正确的结果占所有测试的比例)。这种绩效衡量与预测值一样受到流行程度的影响,因此应该以类似的方式进行严格评估。
非内分泌因素的影响在某些情况下,非内分泌因素会显着影响内分泌测试结果的解释,并可能影响所选测试。他们甚至可以决定是否进行测试。非内分泌因素对个体内分泌系统检测结果的具体影响在相关章节中讨论。
在许多情况下,非内分泌因素的影响是微妙的。由于生理因素导致的测试结果变化可能会出现在单个动物或动物组的结果之间。然而,这种变化通常不足以引起诊断类别的重大变化。在这些情况下,即使生理因素使结果超过诊断阈值,结果也很可能处于临界状态,并以适当低的诊断置信度来看待,而不是被自信地错误分类为患病或健康。然而,在某些特殊情况下,非内分泌因素会导致健康与疾病的严重且频繁的错误分类。
品种
狗的身体特征差异很大,因此使用一般的全品种参考区间时诊断错误分类的风险并不奇怪; 可以认为特定品种的参考区间更合适。 由于广泛的品种变异在猫身上不是什么问题,这个问题在狗身上更受关注。
品种特定参考区间的必要性取决于对每个感兴趣品种内大量健康个体的研究。 到目前为止,只完成了有限数量的研究,并且从中,仅在少数特定情况下提出了品种特定范围的有力案例。
现在人们普遍认为,长头型猎犬品种的总 T4 参考区间要低得多,在某些情况下,还有游离 T4。 在这些狗中,它们的参考区间的下限可能低于大多数市售检测的检测限。 在这个群体之外,尽管一些品种协会坚持认为,几乎没有证据表明一般的全品种参考区间是不合适的。
测量肝脏在生长激素 (GH) 影响下产生的胰岛素样生长因子 (IGF-1) 的循环浓度,用于疑似肢端肥大症和侏儒症,并确定营养状况。 这受到狗的大小(和年龄,见下文)的强烈影响。 较小的狗的 IGF-1 浓度自然低于较大的狗,在解释结果时需要考虑到这一点。
如果特定品种的参考区间不可用,提交年龄和品种匹配的狗的对照样本可能会有所帮助。
年龄
幼年期和青春期的动物的循环激素浓度可能与成年动物明显不同。 例如,在生命的最初几周,甲状腺激素浓度可能很高; 并且在生长动物中 IGF-1 的浓度远高于成年动物。
随着成年动物年龄的增长,激素浓度可能会发生更微妙的变化; 例如,总 T4 似乎随着年龄的增长而缓慢下降。 然而,一般而言,当使用全年龄参考区间时,这些变化不足以导致严重的诊断错误分类。
一天中的时间段
尽管在人类和其他哺乳动物中,通常测量的激素循环浓度可能存在很强的昼夜模式,但这在狗和猫中可能有限或没有相关性,尽管在教科书中经常被引用。 已经表明狗的皮质醇具有周期性和脉动的分泌模式,但尚未证明昼夜模式。 因此,建议在一天中的特定时间进行肾上腺功能检查是没有根据和不必要的。
当使用测试进行治疗监测时,一天中的时间(或更准确地说,自上次用药以来的时间)更为重要,例如治疗犬甲状腺功能减退症时的甲状腺激素或治疗犬 HAC 的三氯司坦。
药物
有一长串常用的兽药已经被研究过,它们可能会改变内分泌测试结果。到目前为止,大多数此类调查只发现细微或最小的影响,因此诊断错误分类是不太可能的。然而,有一些药物可以发挥重要的诊断效果。常见的例子包括:
磺胺类药物,可导致原发性但可逆的甲状腺功能减退巴比妥酸盐抑制总T4,通过代谢酶的诱导,可导致假阳性ACTH反应和ldd测试结果糖皮质激素,它抑制甲状腺激素浓度,并对垂体-肾上腺轴产生负反馈,影响肾上腺功能测试。理想情况下,当使用这些药物治疗时,不应进行内分泌检查。如果不能避免使用巴比妥类药物或糖皮质激素,则应考虑采用专业实验室方法(如fT4d)或其他诊断技术。
非内分泌疾病
非内分泌疾病是最大的挑战和错误分类的风险。非内分泌疾病显著影响伴侣动物两个最常被调查的内分泌系统的结果:甲状腺和肾上腺。
如上所述,检查的诊断特异性(如甲状腺功能减退和HAC的LDDS测试),全T4对猫甲状腺功能亢进的诊断敏感性尚不完善。最重要的原因是非甲状腺或非肾上腺疾病的影响。
任何严重的非甲状腺疾病,无论是急性的还是慢性的,都有可能将 T4 的总浓度抑制在参考区间以下。因此,对于已知的非甲状腺疾病的狗,应该推迟甲状腺检测,直到它通过治疗减轻或稳定。或者,由于非甲状腺疾病对 fT4d 结果的影响较小,因此测量此参数可提高正确诊断甲状腺功能减退症的机会。非甲状腺疾病的影响在猫甲状腺功能亢进症的调查中也存在类似的困难,因此需要在从非甲状腺疾病中恢复后重新测试猫,或额外测量 fT4d 以进行正确诊断。任何可能被描述为代谢压力的疾病都有可能导致 HAC 测试的假阳性结果。简单的解释是压力疾病对糖皮质激素的生理需求增加了生产能力,这可能会被动态内分泌测试(例如 ACTH 反应和 LDDS 测试)误解为病理性过剩(HAC)的证据。内分泌疾病的影响虽然内分泌系统(如甲状腺、肾上腺)被称为独立的实体,但值得强调的是,在许多情况下,它们是紧密相连的。此外,与内分泌病相关的病理过程有时会干扰检测结果的分析有效性或正确解释结果的能力。
并发内分泌病
一种内分泌病的预先存在可能会影响可靠地确认或排除其他内分泌病的能力。例如,控制不良的糖尿病犬的常规临床病理异常与HAC犬的相似。在这种情况下,肝酶和胆固醇升高在支持HAC诊断中的重要性必须打折扣。同样,患有HAC的狗可能有一个低的循环总T4浓度,即使是真正的正常甲状腺。
高脂血症
多种内分泌疾病可导致高脂血症。 使用某些分析方法,脂血症能够干扰某些分析物的测试结果。 对于使用他们的技术测量的每种特定分析物,商业实验室通常知道这种影响的程度。 当存在干扰时,通常是因为存在的脂质改变了设备检测样品中光或颜色变化的能力。 抗体与分析物的相互作用以及抗体结合激素与游离激素的分离较少受到影响。 一般来说,放射免疫测定不受干扰影响,因为光或颜色变化不是不可或缺的。 然而,对于 fT4d,样品中游离脂肪酸浓度的增加将通过结合蛋白的置换,导致游离激素分数增加。
内源性抗体
正如之前所讨论的,免疫分析几乎只用于测量激素。 免疫测定的原理依赖于针对被测激素的抗体。 通过在样品和测定标准品中使用均匀量的抗激素抗体,可以控制相互作用,并可以可靠地估计样品中的激素浓度。 然而,如果患者样本中已经存在可与受测激素发生交叉反应的抗体,则失去对激素抗体相互作用的控制。 因此,不能再对激素浓度进行可靠的估计,并产生错误的结果。
抗甲状腺球蛋白
产生错误结果的常见情况与存在与三碘甲状腺原氨酸 (T3) 和 T4(T3AA 和 T4AA)交叉反应的抗甲状腺球蛋白抗体有关。这些分别发生在大约 30% 和 10% 的甲状腺功能减退犬中。这些抗体的结果是假高还是假低结果取决于免疫分析设计的复杂性。然而,假高(不一定高于但通常在参考区间内)是最常见的后果。这些抗体在甲状腺激素的可用性方面对动物没有生理影响,但它们对正确测量激素的影响很大。
在总 T4 的情况下,可以通过在样品预处理后通过透析 (fT4d) 或免疫分离测量游离 T4 来避免 T4AA 的影响。不包括此类预处理的免费 T4 测量技术(例如直接 RIA、模拟)与总 T4 测量一样受到 T4AA 的干扰。
抗胰岛素
在治疗前或更常见的情况下,在用抗原性与内源性胰岛素不同的胰岛素治疗后测量胰岛素时,也可能会看到由于抗胰岛素抗体干扰而导致的假高结果。
抗鼠抗体
依赖于源自鼠杂交瘤的单克隆抗体 (MAB) 的检测(例如常用的犬 TSH 检测)存在来自患者体内循环的抗小鼠抗体的风险。 这在职业暴露于小鼠或小鼠血清产品或接受 MAB 治疗产品的患者中可见。 这种现象尚未在狗身上得到令人信服的认可。
内分泌治疗
尽管用于测量激素的免疫分析的设计应尽可能针对所讨论的激素进行特定设计,但在某些分析中,所使用的抗体会与相关化合物发生交叉反应。 例如,泼尼松龙会导致皮质醇结果虚假增加,而地塞米松不会,并且在曲洛司坦治疗期间积累的类固醇前体将导致 17-羟基孕酮浓度比预期更显着升高。
如果在未确认潜在疾病的情况下进行对症或姑息治疗,则可能会妨碍准确解释。 在没有确定潜在病症的情况下治疗钙疾病可能会出现问题。 如果治疗使循环钙浓度正常化,PTH 结果的解释就会受到影响。 类似地,如果在糖皮质激素给药后进行,在确认性内分泌测试之前对可疑的肾上腺皮质功能减退症进行治疗可能会影响调查。 在这种情况下,醛固酮测量可能更有帮助。
外源性糖皮质激素,包括局部眼、耳和皮肤药物治疗,通常会导致ACTH反应试验结果被抑制,不应被解释为肾上腺素缺乏的证据。