多标签分类算法的研究及其在中医诊断帕金森领域的应用

被引量 : 0次 | 上传用户:shall202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
帕金森病(Parkinson’s Disease, PD)是一种在中老年人中常见的慢性中枢神经系统变性疾病。中医采用辨证论治来诊疗帕金森病,确定了该病可由5种证型描述。为了方便对帕金森数据的收集和分析,中医学家提出了帕金森中医量表来规范诊断过程。中医量表涵括了与帕金森病相关的临床症状,医生在诊断患者时只需在量表中标记相应的症状,一张量表对应一个病例。然而,对于如何从量表推断出具体的证型,中医界依然无法达成共识,各家仍以经验为主。本文将多标签分类技术应用于中医治疗帕金森,试图将医生的诊断经验构建成模型,希望能够发现一些尚未被注意到的规律,促进中医在治疗帕金森领域的发展。本文的研究思路是将中医量表作为特征属性,把每个量表对应的证型作为标签,而症状到证型的推断依据将由多标签算法自动学习得到。早期,中医认为帕金森患者同时最多伴有两个证型。而随着该领域的发展,中医又将患者的证型分为主证和次证。本文分别对修正前和修正后的帕金森数据展开工作,分为两部分:1)对于修正前的帕金森数据,我们提出了一种基于Classifier Clains思想的算法ETCC(EnTropy Classifier Clains),该算法能够从全局角度优化预测顺序链,探讨了帕金森证型间的全关联性。算法的思想如下:依据特征选择的原则,ETCC认为标签的贡献度越高,则在顺序链中的排名就越高。通过引入信息熵理论,ETCC能够计算得到一个贡献度矩阵,矩阵中的元素表示两两标签间的局部贡献值。同时,利用PageRank算法将标签间的局部贡献度转化为全局贡献度。最后依据每个标签的贡献度决定预测顺序链,并构建相应的模型。2)帕金森数据集经修正后区分了主证和次证,为了保留数据的原始信息,我们将数据集中5种证型进行主次分离,即得到10个标签。分离后,由于次证标签过于稀疏,基本上无法被模型学习,导致预测效果非常不理想,因此我们提出了基于标签组合处理多标签不均衡的算法DEML(Dealing with labels imbalance by Entropy for Multi-Label classification)。DEML首先定义了多标签数据集不均衡的标准和计算类别不均衡的方法,同时采用一种随机的策略构建均衡的标签子集。然后对标签子集逐个进行二进制编码,将多标签问题转化为多元分类问题,最终集成所有多元分类器得到预测结果。实验表明,以上两种算法不仅能够挖掘一些帕金森数据集的有用信息,对于其它数据集同样拥有优秀的性能表现。
其他文献
颜之推可谓南北朝最通博最有思想的学者,在中国古代文学史上具有重要的地位和深远的影响。他一生经历南北两朝,对南北两朝的政治、社会俗尚以及文化生活几乎都有钻研,并能结合现
贺铸是我国北宋时期的著名文人,他文武兼备,“老于文学,泛观古今,词章议论,迥出流辈”。然而由于文集多已散佚,因此可供后人研究的主要是其诗词作品。目前,关于贺铸的研究主
作为当代台湾文坛的重量级作家,骆以军是一个极为擅长讲故事的人,并用多部作品构筑了一个故事迷宫。本文以“讲故事的人”为切入点,深入探索骆以军的文学世界,并梳理出一条关
目的分析注射用奥硝唑致严重过敏反应的临床特点,为安全用药提供理论依据。方法回顾性调查收治的20例注射用奥硝唑导致严重过敏反应患者的病例报告,对过敏反应类型、性别、年
目的:研究肺血栓栓塞症(PTE)患者炎性标志物及纤溶活性改变及探讨其临床意义。方法:通过ELESA方法测定386例PTE患者及250例健康对照人群血浆超敏C-反应蛋白(Hs-CRP)、白介素-6(
<正>50年来,武警长沙支队望城中队始终坚持弘扬雷锋精神,以雷锋传人的责任担当向社会播撒雷锋精神的正能量。湖南望城是雷锋的故乡,也是雷锋精神的发源地。在毛泽东提出"向雷
背景与目的:由于利妥昔单抗(rituximab)在B细胞非霍奇金淋巴瘤(non-Hodgkin’s lymphoma,NHL)中的广泛应用,与其相关的间质性肺炎(interstitial pneumonia,IP)陆续报道,后者
通信产业在21世纪初的这10多年中,达到了空前未有的发展水平。整个通信行业对我国GDP的贡献率日益增长,尤其是随着4G网络的广泛商用,标志着新的业务增长点和庞大用户市场的出
<正>军民融合发展战略已成为世界各国的共同选择。目前,走在世界新军事革命前列的国家,普遍重视军民兼容、军民结合,以军事领域的先进技术转为民用,促进民用经济的发展,以民
毕业论文题目:“单独二孩”生育意愿及其影响因素研究自1982年计划生育确立为基本国策以来,城市严格的“一孩”生育控制政策在过去的30多年间未曾发生过根本性改变。自1992年