论文部分内容阅读
近些年来,临床数据交换标准协会(Clinical Data Interchange Standards Consortium,CDISC)标准已经获得越来越多的关注,并且成功实施CDISC的公司在逐渐增加。据调查显示,近一半的北美制药公司在使用CDISC标准,并且这个比率随着时间的推移,还在不断升高。在国内,部分企业及组织已经率先将CDSIC应用于临床试验中,并积累了相当的经验。研究数据制表模型(Study Data Tabulation Model,SDTM)是收集试验数据的标准模型,而分析数据模型(CDISC Analysis Data Model,ADaM)则侧重于提供标准的分析数据模型,在熟悉及应用SDTM之后,如何实施ADaM变得不可避免。ADaM标准可有助于监管部门,更好的理解统计分析数据及结果,并提高审阅效率。本文通过对比B公司数据集(Operational Acquisition Datasets,OAD)与SDTM数据集,总结其优缺点,并通过比较实施ADaM的几种方法,验证基于OAD产生ADaM数据集的可行性。通过ADaM元数据定义和映射,呈现从OAD获得ADaM数据集的过程。同时对ADaM域中各变量进行归类总结,分析实施ADaM过程中可能存在的优化空间,通过具体实施这些优化流程,结合一套成熟的宏系统,快速高效地产生ADaM数据集。研究目的通过对比OAD和ADaM数据集,分析验证混合法产生ADaM数据集的可行性,并探讨其在临床数据管理的应用前景。通过分析并优化创建ADaM数据集的过程,结合SAS宏系统来实现这种优化,并对优化结果进行验证。旨为ADaM使用者提供基本思路和基础保障,并提供一些更快更具效率的方法。研究方法通过学习和研究B公司在应用CDISC标准方面的经验,在引入ADaM相关概念的同时,结合自身实际工作经验,对比应用ADaM的四种方法,即平行法,回顾法,线性法和混合法,探讨其优缺点,并分析混合法应用于ADaM的可行性。这四种方法的分类,是根据产生ADaM和SDTM数据集的先后顺序决定的,线性法是CDSIC最标准的方法,即先产生SDTM数据集,再产生ADaM数据集。而由于企业数据标准的存在,一般公司会采用混合法作为折中的办法。本文将基于混合法,通过研究ADaM中可自动提取变量的数目,观察三个不同阶段临床试验,其中三个试验分别是Ⅰ期肿瘤、Ⅱ期肿瘤、Ⅲ期抗菌,以五个ADaM数据集(ADSL、ADAE、ADLB、ADEX、ADVS)中可自动提取变量占比率为参考指标,并归纳验证优化的必要性和推广的可行性。最后结合一套成熟的宏程序,以创建ADaM数据集所需时间作为主要参考因子,检验本文提供优化方案是否更加有效,并对其进行优劣分析。研究结果及结论可根据使用者的不同情况,制定不同的应用方案,混合法更能发挥企业自身和CDISC标准两者的优势,是一种目前较为理想且合理的方法。OAD与SDTM数据集在结构和内容上非常相似,也从另一个侧面验证基于OAD产生ADaM数据集的可行性。OAD是SDTM+数据集中的一种,使用者可根据自身情况,在形成独特的SDTM+数据集的同时运用混合法。三个阶段不同临床试验中,可自动提取变量的占比率都非常高,在一定程度上支持了优化的必要性,同时通过简化流程,理论上可以更快地创建ADaM数据集。最后,本文提供的优化方案在时间上具有一定的优势,理论上支持了这种推广的可行性,但是对于一般的CRO公司,出于多方面的考虑,可能这种优化方案并不是最好的选择,不过这种优化思路具有相当的借鉴和参考价值。