基于数据挖掘建立成人甲状腺相关激素参考区间的流程和方法研究

来源 :北京协和医学院 | 被引量 : 0次 | 上传用户:zglcharmer134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:参考区间(Reference Interval,RI)对于诠释临床检验项目的结果有着重要的价值,目前建立RI的方法主要分为“直接法”和“间接法”。近年来,随着信息技术的发展,基于真实世界数据的“间接法”由于其成本低、便捷、可行性高而受到越来越多的关注。然而,目前缺少基于临床实验室大数据建立RI的指南,这无疑阻碍了临床实验室工作者使用该方法。本研究团队在之前的研究中验证了基于体检人群仅使用临床实验室数据建立甲状腺相关激素RI的可行性。在此研究的基础上,本研究将从样本量估计、分区分析、间接法建立RI以及拟合年龄相关连续RI模型四个层面,探索估计RI样本量的方法,评价经典RI分区方法,并比较不同的“间接法”对甲状腺相关激素建立RI的适用性,基于真实世界数据探索并比较建立甲状腺相关激素的连续性年龄相关RI模型的方法,为各个临床实验室基于真实世界数据建立甲状腺相关激素或者相似分布的检验项目的RI提供流程和方法层面的理论依据。方法:基于北京协和医院2014年至2018年体检数握库,按照严格入排标准纳入参考个体,建立参考数据集。基于同质化的体检数据池,在剔除甲状腺过氧化物酶抗体(thyroid peroxidase antibody,TPO-Ab)和甲状腺球蛋白抗体(thyroglobulin antibody,TG-Ab)阳性的个体以及采用Tukey法剔除异常值后随机抽取同参考数据集等量的数据,建立体检数据集1。在上步剔除异常值后校正数据集性别、年龄组间比例后随机抽取同参考数据集等量的数据,建立体检数据集2。2014年至2018年体检数据库中进行甲状腺相关检测的全部个体构成体检数据集3。基于2016年门诊数据库,纳入进行甲状腺相关激素检查的所有个体,采用Tukey法剔除极端异常值后建立门诊数据集。外部验证数据集由120名甲状腺功能正常的健康人组成。基于上述数据集进行以下四部分研究。第一部分研究:分别基于参考数据集和体验数据集1和2,采用自建的样本量估计方法计算建立甲状腺相关激素RI所需的样本量。并采用Bland-Altman分析比较转换参数法和非参数法在不同样本量下建立的RI上限和下限的差异。第二部分研究:分别基于参考数据集和体检数据集1和2,采用多因素线性回归确定年龄、性别、季节因素对于甲状腺相关激素的层级,并以此进行嵌套设计计算对应因素的方差成分。采用标准差比率法(standard deviation ratio,SDR)计算年龄、性别、季节因素的SDR,SDR>0.3提示按照该因素分区。对于SDR>0.3的因素,比较分区后RI的差异,若上限或下限的差异比值大于0.375,则明确需要按照该因素分区。比较三个数据集分区的最终结果。第三部分研究:基于参考数据集、体检数据集1和2,使用标准转换参数法建立甲状腺相关激素的RI。基于门诊数据集和体检数据集3,采用Hoffmann、Bhattacharya法、期望最大化算法以及截断最大似然估计参数法计算甲状腺相关激素的RI。比较不同算法建立的RI。此外,使用不同算法建立的RI判断验证集中个体的甲状腺相关激素的结果,计算落在RI外的比例(falling out reference interval,FOR),若FOR值小于10%,则RI通过验证。第四部分研究:将体检数据集2按照7:3的比例拆分为训练集和测试集。基于训练集,使用分数多项式回归、分段多项式回归、LMS法以及基于位置、尺度和形状的广义可加模型(Generalized Additive Models for Location,Scale and Shape,GAMLSS)建立甲状腺相关激素年龄特异性的RI模型。采用施瓦兹的贝叶斯判别准则(Schwarz Bayesian criterion,SBC)评价模型的拟合优度,采用多重蠕虫图确定模型拟合欠佳的解释变量区间,并根据蠕虫图的形状对相应的模型进行调整。在建立模型后,使用建立的模型,判断测试集中对应年龄的个体的检测结果,计算FOR值。若FOR值小于10%,则认为该年龄特异性的参考区间模型通过验证,反之则不通过。结果:第一部分研究:非参数法建立RIs的样本量普遍比转换参数法大。使用三个数据集,计算建立甲状腺相关激素RIs的样本量略有差异。在小于估计值前的样本量集中转换参数法和非参数法的一致性要劣于估计值后样本量集。第二部分研究:多因素线性回归提示性别因素对甲状腺相关激素影响最大。基于嵌套设计,三个数据集游离三碘甲状腺原氨酸(free triiodothyronine,FT3)和血清游离甲状腺素(freethyroxine,FT4)分区分析中,性别因素的SDR均大于0.3,且按性别分区后,RIs上限或下限的差异比大于0.375,明确FT3和FT3的RIs应该按照性别分区。而其他甲状腺相关激素的RIs不需要分区。三个数据集分区分析结果一致。第三部分研究:使用参考数据集,体检数据集1和2的转换参数法、Hoffmann法、Bhattacharya法、期望最大化算法以及截断最大似然估计参数法建立的甲状腺相关激素的RIs均比厂商说明中的RIs以及协和医院检验科(Peking Union Medical College Hospital laboratory,PUMCHlab)正在使用的RIs窄。在外部验证中,厂商说明中的RIs以及PUMCHlab的RIs的FOR值绝大部分为0.0%。基于参考数据集,体检数据集1和2的转换参数法以及基于门诊数据集的Hoffmann法、Bhattacharya法、期望最大化算法以及截断最大似然估计参数法对应的FOR值小于10%。基于体检数据集Hoffmann、Bhattacharya法、期望最大化算法以及截断最大似然估计参数法因混合数据分布特点不明显而分离效果较差。Bhattacharya法和截断最大似然估计参数法男性FT3 RIs的FOR值大于10%。Hoffmann和Bhattacharya法估计的TSH的RIs下限为负值。相较于其他间接法,基于体检数据集1和2的转换参数法建立的RIs和基于参考数据集建立的RIs的一致性较好。第四部分研究:分数多项式回归、分段多项式回归、LMS法以及GAMLSS模型拟合的甲状腺相关激素随年龄变化的规律大致相同,即TSH RIs上限呈现随年龄增长而呈现升高趋势。男性FT3和FT4呈现随年龄增长而单调下降的趋势。女性FT3水平随年龄增长波动式下降。女性FT4呈现先下降后轻微升高的趋势。TT3和TT4变化不明显。在内部测试中,所有模型FOR值均小于10%,且测试数据落在参考区间上限外(falling out upper limits of reference interval,FORU)和下限外(falling out lower limits of reference interval,FORL)的比例接近2.5%。除小部分模型的老年段的残差散点均值较高或出现S型外,大部分模型拟合较好。且对于同一激素不同模型的SBC值差异较小。结论:1.本研究建立了用于估计建立RIs样本量的方法,可用于估计建立包括甲状腺相关激素在内的检验项目的RIs的样本量。2.基于大数据使用嵌套方差设计进行分区分析是可行的,且两种计算SDR的算法分析结果一致;3.若仅使用体检数据,建议采用剔除TPO-Ab和TG-Ab抗体阳性个体和异常值的方法建立甲状腺相关激素的RIs;若使用门诊数据,建议使用期望最大化算法估计参数法;4.推荐使用GAMLSS模型建立甲状腺相关激素年龄特异性参考区间模型;5.本研究建立基于临床实验室大数据建立甲状腺相关激素或类似分布的检验项目的参考区间的流程,为其他临床实验室提供理论依据和方法学参考。
其他文献
近年来与供应链管理相关的研究不断增加,供应链管理从全局出发作出有利于整体的决策,能够提高供应链的整体竞争力。生产和运输协调调度问题是供应链管理的重要研究方向之一,将企业的生产制造活动和运输活动纳入统一的调度决策体系中,同时进行生产调度和运输调度的安排。分布式多工厂和多车辆运输调度问题在现实生活中普遍存在,但为了降低复杂性很多研究都对该问题进行了简化。本文将研究分布式多工厂生产和多车辆运输调度问题,
双端面磨削加工是一种高效率的平面磨削加工方式,常见于有较高平面度,平行度要求的精密零件的制造中。针对双端面磨削粉末冶金不锈钢等强塑性的材料时,加工后平面几何精度不稳定这一现象,本文重点对双端面磨削粉末冶金不锈钢工件这一加工形式热特性开展研究。磨削所产生的热量大部分会被磨屑带走,而在双端面磨削粉末冶金不锈钢的加工过程中,由于粉末冶金不锈钢塑性较强,平面磨削的接触方式使磨屑不能及时排出,这将导致磨削区
背景:根据统计,全球每年约有150万先天性心脏病儿童出生。外科手术治疗是先天性心脏病主要治疗手段。据调查显示,手术前有半数以上的儿童经历了焦虑,其中有40至60%接受麻醉和手术的幼儿受到术前严重焦虑的影响。1至5岁手术儿童最容易产生术前焦虑。治疗性游戏是儿童医疗游戏辅导服务的内容之一,可以提高患儿对压力环境的适应能力,缓解焦虑状态。此外,在发达国家中儿童医疗游戏辅导服务水平还是评价医院服务质量的重
目的:绝大部分中耳疾病与颞骨通气障碍相关,若颞骨的通气障碍得不到纠正,治疗效果往往无法令人满意。影响颞骨通气的因素众多,除咽鼓管的功能外,乳突的缓冲作用、中耳黏膜的气体交换作用等均能影响颞骨的通气。但基于人体的颞骨通气实验难以直接进行,目前缺乏将颞骨作为整体进行的通气系统研究。本研究旨在将颞骨作为一个整体,建立包括岩骨的颞骨通气引流系统的数值仿真模型,增加对颞骨通气障碍相关疾病致病机制的理解,以期
目的:系统性红斑狼疮(Systemic Lupus Erythematosus,SLE)是一类临床表现多样且症状严重的自身免疫性疾病,可引起器官炎症浸润并导致永久性损害。骨坏死是SLE常见的并发症,其特征是骨细胞凋亡和坏死增加,引发患者肢体疼痛、活动障碍,最终导致残疾。目前,关于系统性红斑狼疮合并骨坏死的发病机制尚不清楚。本研究基于中国人群队列,旨在探究系统性红斑狼疮合并骨坏死的发病率以及相关危险
背景:静脉血栓栓塞症(VTE),是住院患者的常见并发症和重要死亡原因之一,内科住院患者VTE发生风险尚未引起医学界足够重视,其中自身免疫病患者发生VTE风险显著增加,但缺乏适用于该人群的VTE风险评估工具。研究目的:本研究拟明确自身免疫病患者并发VTE的风险因素,编制自身免疫病患者并发VTE的风险评估工具,并确定风险评估工具的敏感性、特异性及风险评分界值。研究方法:采用文献回顾法总结自身免疫病患者
背景:随迁老人是指跟随子女来到异地生活的老年人。由于居住地的改变,随迁老人面临着包括家庭关系重构、流动地的文化冲击、新环境的融入等挑战,并可能由此产生心理健康问题。随迁老人具有“流动”和“老龄”双重属性。关注随迁老人的心理健康状况既是积极应对健康老龄化的要求,也是促进流动人口基本公共卫生服务均等化的体现。护士作为提供医疗卫生服务的主体成员之一,有必要关注随迁老人心理健康状况。目的:描述随迁老人的社
第一部分超声及超声造影在导管良恶性病变中的诊断价值研究目的研究乳腺导管病变的的超声及超声造影特点,探索超声及超声造影在乳腺导管良恶性病变中的诊断价值。材料和方法收集2019年4月至2020年1月在中国医学科学院肿瘤医院就诊的可疑乳腺导管病变患者82例(82个病灶),所有患者均具有穿刺活检或术后病理结果,所有患者均于手术或穿刺前行超声及超声造影检查,记录常规超声中的大小、形态、边界、内部及后方回声、
背景:Ⅰ型糖原累积症(glycogen storage disease type Ⅰ,GSD Ⅰ)是遗传缺陷致葡萄糖-6-磷酸酶(glucose-6-phosphatase)系统异常,而出现的糖代谢障碍疾病,是糖原累积症最常见的一种分型。由于葡萄糖-6-磷酸酶系统的缺陷,糖原分解和糖异生途径均受阻,使得食物的消化和吸收成为Ⅰ型糖原累积症患儿血糖的唯一来源,饮食治疗作为基本治疗措施之一,就显得尤为重
背景:背部深层脂肪顽固,难以通过减重消除,影响轮廓美观,目前传统治疗方法是基于西方人群特点设计的,不适用于亚洲人,而抽吸阻力大、出血多等问题阻碍了经典的脂肪抽吸术在背部的应用。本文以解剖为基础,探索背部轮廓畸形产生的解剖基础,以提出更优化的手术方式。方法:通过大体解剖和精细解剖研究背部皮下脂肪的构成,浅筋膜系统的微观结构特点及宏观分布模式,结合解剖证据指导临床应用,提出皮肤皮下组织复合体塑形的理念