化学计量学方法用于蛋白质组学质谱数据的特征筛选

来源 :分析试验室 | 被引量 : 0次 | 上传用户:sniper0928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于偏最小二乘判别分析和F-score的特征筛选方法,并将其用于蛋白质组学质谱数据分析。方法主要包含3个步骤:(1)用LIMPIC算法对原始数据进行预处理;(2)计算每个变量的F-score值并将所有变量按F-score值降底的顺序排列;(3)采用偏最小二乘判别分析交互检验按前向选择法选择最佳变量子集。用本方法对一组卵巢癌数据进行分析,最终从原始的15154个质荷比变量中选择了12个特征变量作为潜在生物标记物,它们在训练集上交叉检验的特异性和灵敏度分别为98.36%和98.15%,在独立测试集上的特异性和灵敏度分别为96.67%和100%。用筛选出的变量作PCA所得的结果显示这些变量能够较好地将样本分类,说明能够反映出样本的类别信息。所提出的方法可用于蛋白质组学质谱数据的特征筛选及样本分类。 A method of feature selection based on partial least-squares discriminant analysis and F-score is proposed and applied to proteomics mass spectrometry data analysis. The method mainly includes three steps: (1) Preprocess the original data by LIMPIC algorithm; (2) Calculate the F-score value of each variable and arrange all the variables according to the F-score value; (3) Partial Least Squares Discriminant Analysis Interactive Test Select the best subset of variables by forward selection. Using this method to analyze a group of ovarian cancer data, 12 characteristic variables were finally selected as potential biomarkers from the original 15154 mass-to-charge ratio variables. The specificity and sensitivity of cross-validation in the training set were 98.36 % And 98.15%, respectively. The specificity and sensitivity on the independent test set were 96.67% and 100% respectively. The results obtained using the selected variables as PCA show that these variables can better classify the samples and show that they can reflect the sample type information. The proposed method can be used for characterization and sample classification of proteomics mass spectrometry data.
其他文献
本文论述了现代化图书馆“以人为本”的管理思想,对如何培育现代化图书馆人以及造就现代化图书馆人的最终目的也进行了阐述。 This article discusses the management idea
缠缠绵绵,淅淅沥沥,下个没完,这梅子黄时雨。果香满园,枝叶牵衣,梅子熟了,却不见赏花的你。原来誓言坚如铁,也薄如纸,经不起一季,便零落满地,梅子黄时雨,飘落满地,梅子黄时雨,打湿记忆。落
有机磷农药皮肤中毒的治疗体会河南省社旗县大冯营乡李庄村卫生所(473302)李丰波收治有机磷农药皮肤中毒66例,其中男50例,女16例。年龄23~52岁,疗程1~3天,全部治愈。体会:①彻底清洗皮肤、更换衣服尤为重
在抢救急性有机磷中毒的病人时,部分病人在症状缓解的恢复期或基本控制后,出现病情突然变化,再次发生中毒症状,严重者可导致死亡,这种现象称为有机磷中毒的反跳。多年来,我
药物或毒物中毒是常见的临床急症,传统使用催吐、洗胃、导泻、利尿、解毒、维持呼吸和循环功能等综合治疗方法是行之有效的,但对部分严重中毒或治疗时机过晚或有严重并发症者,病
目的 探讨产褥期结核病患者的特点及早期诊断。方法 回顾性分析了 1990年至 1999年间确诊的 2 0例产褥期结核病患者。结果  2 0例确诊患者经正确抗痨治疗后均痊愈。结论 
办 法 沿虚线剪下答案,用钢笔正楷填写姓名、科别、工作单位、详细地址及发奖用标签的各项内容[当地邮政编码、包括路(街)门牌号码的详细地址、姓名]。将正确答案填入答卷
目的:探讨前列腺素E1(PGE1)+充氧(O2)疗法对糖尿病肾病(DN)的治疗作用。方法:146例DN患者分为4组:PGE1+O2组56例,对照组[PGE1、SVATE(蝮蛇抗栓酶)+O2、SVATE组]各30例,分别予不同方案治疗并比较其疗效;同时检测患者治疗前后尿素氮(BUN)、血肌酐(Scr)、
1 病例介绍患者,男,62岁,慢性咳嗽、咯痰史25年,因两周前不慎受凉,咳嗽咯痰、气喘就医。体检:T37.4℃,P118次/min,R28次/min,BP16/10kPa,神志清,纳差,唇轻度发绀,发育营养中
本文旨在评价妊娠期间日常饮食锌摄入和锌补充对血浆和红细胞锌浓度的影响。结果表明,在对照组和补锌组中,高饮食锌摄入的妊娠妇女在随机分组时和以后的测量中红细胞锌水平均比