基于三元概念分析的机器学习算法研究及应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:11-Jun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三元概念分析(TCA)是一种新颖的数据分析方法,是在形式概念分析(FCA)理论基础上对三维数据或者多维数据处理的有效扩展,也是顺应大数据时代多样性信息数据的应用产物。目前关于三元概念分析的研究相对较少,对于运用三元概念构建学习模型框架从而进行具体应用的分析也相对匮乏。因此,如何根据三元背景有效提取出三元概念,如何利用三元概念构建模型将其应用于具体实例中等,都成为三元概念分析理论得以成功应用要解决的问题。本文基于三元概念分析,提出MLTCA(Machine Learning Triadic Concept Analysis)学习模型并对其进行验证。具体研究工作如下:首先借助三元概念分析的基本理论和性质,提出构建三元概念的Tri-concepts算法。该算法立足于三元背景,从对象、属性、条件三个集合中提取三元生成算子,经过h诱导算子的闭包运算,将三元生成算子逐渐生成三元-集,再对所有条件的三元-集合并、删除冗余集合,最终得到三元概念。然后在Tri-concepts算法基础上综合考虑三元概念分析对于实际应用的要求,为了更好的运用三元概念表示现实应用中的数据,提出将三元概念与模糊集结合,定义了附有隶属度的三元概念,即将三元背景中的二值关系扩展为[0,1]区间的模糊关系,表示特定条件下属性对于对象的隶属度。基于此可对原信息数据构建带有隶属度的三元概念,根据模糊理论中贴近度的表示,类比得出三元概念之间的相似性度量,从而可计算出训练数据的三元概念和测试数据的三元概念的相似值,达到对待测数据分类的目的。因此,基于三元概念分析的机器学习MLTCA分类模型是一个从数据表示到推理分类的完整的学习模型。最后将模型具体应用于文本分类中,分别在理论与实验中说明其正确性和有效性。经过在不同数据集上测试的结果表明,MLTCA模型具有较好的性能和实用性,可以得到比较好的分类效果。
其他文献
随着我国经济社会的发展,深基坑工程施工越来越多,然而这些工程本身均存在安全风险而且会对其周边环境产生很大的影响。传统的手工基坑监测数据管理办法仍然停留在数据的存储和
随着计算机科学技术的快速发展,特别是数据库技术的广泛应用,数据挖掘领域成为热门的研究之一。浩瀚的数据海洋隐藏着大量对人们有重要价值的信息,如果能够通过有效的数据分析,提
随着社会的发展和科技的进步,社会计算、基因工程等领域的信息和数据呈指数级增长。为了从海量数据中获取有效的知识或规律,数据挖掘应运而生。作为-种重要的数据挖掘技术,关
随着移动设备的使用日益普遍和因特网的应用已经逐渐覆盖了人们生活的各个方面,人们就产生了依靠简单的移动设备向网络用户提供服务的需求。而在嵌入式技术的发展中,出现了一
在数字信息化浪潮的推动下,非线性编辑方式已经取代了传统技术,成为在电视台节目制作的首选方式。在此方式下,节目制作的素材、产品等大都以计算机文件的形式保存,大量的文件必然
由于计算机的快速发展,新一代计算机资源充足,主流CPU的速度越来越快,性能开始出现严重的过剩状态,应用软件可以在极短的时间内处理完毕,然后大量的系统资源将处于闲置浪费状
我国是农业大国,提高农产品产后处理水平是增加农业产值的主要方法之一目前市场上脱水蒜片的分选主要靠人工感官进行,其分选精度不易保证,分选结果一致性差。进行农产品自动
Java Card是一种可运行Java小应用程序的智能卡,随着全球EMV迁移及国内金卡工程的大力推动,Java Card在金融领域的应用越来越广泛,下一代银行卡全面迁移到Java Card已是箭在
随着我国电力工程的快速发展,电力工程中的招投标活动影响电力行业的发展,电力物资的评标是招投标环节的核心内容。现有的评标方案中,对于小宗物资的评标比较完善,但涉及到大
随着互联网、云计算以及物联网的快速发展,电子商务、电子政务、社交网络等新应用为人们的日常生活和工作带来极大方便,同时也使数据产生的方式越来越多样化,数据量呈爆炸式