Bayes两类线性判别函数判别效果影响因素分析——基于Monte Carlo法的模拟研究

来源 :重庆医科大学 重庆医科大学 | 被引量 : 0次 | 上传用户:accphailan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Bayes线性判别法是判别分析中的经典模型,适用于多元正态分布数据,其判别效果诸多因素的影响。如何针对不同的研究目的与研究内容,结合具体的数据分布情况,选择最佳的函数以获得最低误判率,是本研究关注的重点。  以某医院体检健康中青年人体检数据为蓝本,本研究采用MonteCarlo方法,系统的模拟出两种先验概率的确定方式(等概率与构成比)、6个水平的总体阳性比(0.04,0.1,0.2,0.3,0.4,0.5)、5个训练样本容量水平(50,100,200,500,1000)以及变量间不同相关程度(独立、中度相关、高度相关与全模型),各种组合设定条件下线性Bayes判别函数的刀切法误判率。并对判别效果进行单因素组间比较、析因设计方差分析和线性回归分析。模拟比较结果显示,先验概率的选取和总体阳性比水平对误判率有较大影响作用,以构成比作为先验概率误判率显著低于等概率法且误判率随着总体阳性比的升高而增大;训练样本容量与模型中变量相关程度对判别效果影响不明显。  在进行Monte Carlo模拟并得出结论的基础上,应用该医院体检数据,进行真实数据的实例验证,实例验证分为两部分。首先完全延续Monte Carlo模拟的路线,对真实数据进行抽样,选择相应的变量比较四种模型不同样本量、先验概率确定方法设定条件下,模型误判率的情况。第二部分选取三个有实际意义的待判疾病,纳入与疾病有一定关联的人体指标作为自变量建立函数。每种模型的自变量个数为4。样本量水平同样固定为50、100、200、500、1000五个档次,每种设定均采用等概率与构成比两种方法来确定先验概率。  实例验证结果为:第一部分结果与预期完全一致,在样本量为200,使用构成比建立全模型时最低;第二部分与预期基本一致,首先以构成比为先验概率的误判率符合前文总结的走势规律,而以等概率为先验概率的误判率与预期出现了偏差,其次样本量对结果的影响基本与预期保持一致,模型一、二均在200左右的水平达到较好的判别效果,模型三则略有扩大,但200以后误判率的降低很少。
其他文献
目的研究铬的营养状况对处于生长发育阶段Wistar大鼠的leptin、胰岛素、生长激素及肿瘤坏死因子分泌的影响和对血糖、高密度脂蛋白、甘油三酯和总胆固醇代谢的影响.结论①铬
目的:利用B淋巴细胞杂交瘤技术建立分泌抗软海绵酸(Okadaic Acid,OA)单克隆抗体(Monoclonal Antibodies,McAb)的杂交瘤细胞株,为下一步大量制备抗OA的McAb和建立测定OA的酶联
教师如何在教学中创设意境呢? 导入——妙趣横生。俗话说:“良好的开端是成功的一半。”精彩有趣活泼的导入不仅能使学生很快进入角色,积极投入到学习中来,使学生明白本课的
利用玛曲黄河源区气候与环境综合观测研究站的湍流资料,分析了青藏高原东部玛曲地区土壤冻融过程中近地层湍流统计特征的差异.结果表明,冻融过程中不同阶段近地层湍流输送特
硬笔的历史悠长,早在古埃及文明时,人们用芦苇笔在纸莎草上写字作画,后来鹅毛笔取而代之,不少艺术家用一些自然或人工的材料将端部削成扁尖状,蘸上墨水创作作品。随着钢笔等
研究目的:1、评估结核病(TB)患者抗痨期间的QOL;2、评估TB患者抗痨期间的营养状况;3、评估患者在抗痨治疗前后对结核病的认识情况;4、回顾性分析1998年TB登记情况.研究方法:
糖尿病(Diabetes Mellitus,DM)是由多种病因引起的代谢紊乱.人工神经网络(Artificial Neural Network,ANN)是由大量与自然神经系统细胞相类似的人工神经元联结而成的网络.ANN具有
该课题分为两部分:第一部分,通过悬液定量杀真菌试验比较了三株真菌对二氯异氰尿酸钠(NaDCC)溶液中有效氯的抗力,结果发现:所测三株真菌中,泡盛曲霉(Aspergillus Awamori AS3.446
马鞍山矿山研究院、本钢歪头山铁矿和本钢公司矿山处合作,为提高尾矿输送浓度,在4号浓缩池上进行计算机恒量控制系统的单机试验研究获得成功的基础上,于1988年10月将该项目
1.您如何看待人和世界的关系?rn答:这个世界创造了一个你,你也应该去创造一个世界.rn
期刊