论文部分内容阅读
医学论文,尤其是临床研究性论文的质量和水平取决于该研究的科学性,而科学性的准确体现与医学统计学在研究设计和成果表达上的正确应用密切相关。在阅读文献时,经常发现医学论文中存在着各种各样的统计学问题,包括研究设计方面的缺陷、统计方法使用错误、统计图表错误或不规范、统计学术语和统计报告不规范等。近年来,医学论文的质量问题引起了医学研究人员的广泛关注,目前已成为国内外医学领域研究的一个重要问题。由于国内外对于医学论文质量评价方法不同且各种评价方法的侧重点也不一样,探讨如何科学评价医学论文的统计质量,将有利于提高国内医学论文的科学性。目的编制随机对照临床试验论文统计质量评价量表,制定量表评分说明。选取随机对照临床试验论文进行统计质量调查,应用调查结果对量表进行信度、效度和可接受性评价。应用所形成的量表评价郑州大学学报(医学版)2009-2010年投稿的随机对照临床试验论文的质量,评估郑州大学学报(医学版)投稿的随机对照临床试验论文拟录用分数临界值。研究方法通过文献资料分析法和小组讨论形成量表条目池,通过专家咨询形成随机对照临床试验论文统计质量评价量表初表。采用分层随机抽样的方法选取2008年已发表的随机对照临床试验论文90篇进行预调查,根据预调查结果和专家咨询情况,采用专家咨询法、变异系数法和相关系数法筛选量表条目,最终确定随机对照临床试验论文统计质量评价量表包含的维度和条目数。采用分层随机抽样的原则,分别从2008年已发表的随机对照临床试验论文中,随机选取非核心期刊论文50篇,核心期刊论文50篇,SCI论文34篇,对拟定的随机对照临床试验论文统计质量评价量表进行信度、效度和可接受性评价。应用形成的随机对照临床试验论文统计质量评价量表对郑州大学学报(医学版)2009-2010年投稿的随机对照临床试验论文共60篇进行统计质量评价,了解该学报投稿的随机对照临床试验论文的质量状况,评估投稿的随机对照临床试验论文的拟录用分值。研究中所有数据录入Epidata 3.0,采用SPSS16.0进行数据统计分析,检验水准α=0.05。采用专家咨询法、变异系数法和各条目与总分的相关系数法进行量表条目的筛选;采用克朗巴赫系数α测量量表的内部一致性信度、各条目的kappa一致性检验和配对t检验测量量表的重测信度和评价者间一致性信度;采用方差分析和Bonferroni法评价量表的区分效度,Spearman秩相关分析评价量表的效标效度;应用统计描述郑州大学学报(医学版)2009-2010年投稿的随机对照临床试验论文质量、采用ROC曲线评估拟录用随机对照临床试验论文的统计质量得分。结果1.按照量表制作程序,经过小组讨论和专家咨询对量表条目池进行筛选,确立了由3个维度22个条目组成的随机对照临床试验论文统计质量评价量表初表;对量表预调查结果通过变异系数和相关系数分析,结合专家咨询情况对量表条目再筛选,最终形成以统计设计维度8个条目、统计过程维度5个条目、统计报告维度7个条目的随机对照临床试验论文统计质量评价量表。2.量表的信度评价:内部一致性信度系数为0.801;重测信度和测评者间信度测定采用逐条目kappa一致性检验,重测信度测量中3个维度的kappa一致性系数分别为0.802到1.000之间,0.818到1.000之间,0.823到1.000之间,量表具有较好的重测信度;测评者间信度测量中3个维度的kappa一致性系数分别在0.772到0.881之间,0.835到1.000之间,0.806到1.000之间,配对t检验差异无统计学意义,量表的测评者间信度较好。3.量表的效度评价:量表区分效度较好,能够将三种类型的期刊论文区分开来(F=173.81,P<0.001),非核心期刊论文(60.20±4.68)分,核心期刊论文(65.68±8.44)分,SCI期刊论文(86.91±6.06)分。该研究形成的量表评分与CONSORT声明2010版评分结果相关性较好(rs=0.948,P<0.001)。4.量表的可接受性评价:量表调查回收率为100%,研究者独立完成量表的时间在9-15分钟之间,平均完成时间为12.03±1.26分钟,可接受性较好。5.郑州大学学报(医学版)2009-2010年投稿的60篇随机对照临床试验论文统计质量总分在40分—78分之间,平均分为57.28分,标准差为7.689,建议录用分数值为60分及以上,此时灵敏度为0.714,特异度为0.872,正确指数为0.586。结论1.该研究形成了包含统计设计、统计过程和统计报告3个维度,20个条目的随机对照临床试验论文统计质量评价量表。通过调查结果分析,该量表信度、效度和可接受性均较好。2.对郑州大学学报(医学版)2009-2010年投稿的随机对照临床试验论文统计质量分析显示统计得分服从正态分布,ROC曲线分析结果显示60分及以上为可以考虑录用的论文。