基于可控的置信机器学习方法研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:singdj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习算法的研究已经取得了很大的进展,并且得到了广泛的应用,但多数机器学习算法只能给出“是”或“不是”、“属于”或“不属于”这类简单的判断,缺少一种置信度机制来说明这种判断的可信度或可靠性有多大。置信机器就是这种带有置信度机制的机器学习方法。置信机器是许多机器学习方法的进一步延伸,它不仅可以像许多机器学习方法做出性能的预测,还可以对预测结果中的定量的质量度量,给出可信性(Credibility)和置信度(Confidence)。目前的置信机器学习算法的研究,往往理论基础深奥,算法复杂,可替代计算的函数很少,且不容易理解与使用。本论文主要对基于可控的置信机器学习方法进行研究,以便找出更简单、更高效、更可靠、更实用的可控置信机器学习方法,主要的研究内容如下:首先对置信机器问题的提出、置信度等问题进行了论述。将置信度机制分为采用整体平均置信度学习方法的置信度机制、贝叶斯学习方法的置信度机制、直推式学习方法的置信度机制、带有拒绝选项学习方法的置信度机制。本学位论文的所有研究就是基于第四种置信度机制,即带有拒绝选项学习方法的置信度机制来实现的。针对二元置信分类问题,提出了一种基于一类分类器的二元置信分类(Tow Class Confidence Classification Based on One Class Classifier,TCCC-OCC)算法。该算法通过对识别样本进行两次学习的结果进行计算与分析,实现了接受域和拒绝域的划分,从而省略了在传统的置信机器学习中必须为每个未知样例进行具体置信度的计算,也省略了设置拒绝域阈值,减少了计算量。同时运用集成学习的方法,对学习结果进行多层学习,进一步提升了识别率。对可控率的置信问题进行了研究,提出了一种基于二元分类器的可控置信分类(Controllable Confidence Classification Based on Tow Class Classification,CCC-TCC)算法。该算法利用支持向量机(SVM)对样本进行学习,然后将学习结果从空间值转化为一维空间的Output Score值。由于SVM输出值Output Score的大小顺序保持了 SVM分类时距离超平面的远近距离顺序,所以可以通过设置阈值来控制置信度和错误率。CCC-TCC算法包括设置总的错分率进行可控置信分类算法、分别设置正负例错分率进行可控置信分类算法、从Score设置输出转换值的百分比进行可控置信分类算法、从错分的Score设置输出转换值的百分比进行可控置信分类算法共4个子算法,并在心脏病和糖尿病等5个数据集上对它们进行了实验验证。对置信回归问题的可控性进行了研究,提出了基于KNN的置信回归(Confidence Regressin Based on k-Nearest Neighbor,CR-KNN)算法。该算法以 KNN算法为工具,将回归学习的结果进行误差判断,实现接受域与拒绝域的划分,从而实现置信回归,并通过设置具体的误差数值的改变,实现了置信回归的可控。最后运用UCI等数据集中的数据进行了验证研究,选取了 Heart、Australian、Colon-Cancer、Pima Indians Diabetes、Liver-Disorders、Bodyfat、Housing、Pyrim、Triazines、Cpusmall等十余个数据集进行了实验研究,与其它相关的算法在相关方面的研究进行了比较。本学位论文提出的TCCC-OCC算法和CCC-TCC算法,以及CR-KNN算法对问题的研究,取得了满意的效果,达到了预期的目的。
其他文献
The Gurbantunggut Desert is the largest stable and semi-stable sand desert in China,yet few data exist on vegetation pattern and species-environment relationshi
<正>要看到稳中有变、变中有忧,也要看到危中有机,要看到中国发展仍处在重要战略机遇期,特别是要发挥好战略机遇期一些新内涵的作用。要针对存在的困难和问题,采取有针对性的
<正>从1981年到2015年,中国电视剧"飞天奖"走过了30多个春秋。它既是一部中国电视剧逐步成长、拾级而上的发展史,也是时代变迁、艺术繁荣的共同文化记忆。今年是第30届"飞天
信用风险膨胀要求结构信用衍生品定价研究发展,文章不仅介绍了主流结构信用衍生品,对建模定价的原理和方法进行了研究,也探讨了定价过程的问题和趋势。
<正>从2010年开始,一种新的家庭伦理剧类型在荧屏上持续热播并受到不同年龄层次受众的欢迎,如:《婚姻保卫战》、《裸婚时代》等。这些作品突破了传统家庭伦理剧的框架,将青春
<正>目前,X线钼靶摄像、超声影像学检查已经能够基本明确乳腺癌诊断。超声引导下空心针穿刺活检临床应用简便、安全,能通过超声介入技术为乳腺肿瘤患者获取术前组织病理学诊
当下,中国动画正面临"走出去"这样一个千载难逢的机遇。本期"动漫艺苑"栏目刊登了华中师范大学李三强博士的文章《中国动画如何才能"走出去"》。文章以《三国演义》动画版"走
社区结构是许多真实复杂网络所普遍具有的一个结构特征,它的存在有着广泛而重要的实际意义。近年来,社区结构研究在生物学、社会学和计算机科学等多个领域取得了丰硕成果,已
城市化是世界各国发展的共同趋势,是人类文明和进步的标志。论文简述了国内外城市环境地质工作的历史发展,着重论述了城市地质工作的内容,指出我国城市环境地质中存在的问题