数据挖掘技术研究与应用

来源 :北京航空航天大学 | 被引量 : 0次 | 上传用户:canble_dut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘从产生时起,就是面向应用的.但是在实际生活中,存在许多模糊现象不能简单地用传统理论精确地刻画,如何表示和处理这些现象是数据挖掘研究中的重要问题.本文从实际应用中存在缺值、不完全和噪音数据等问题为出发点,结合人机交互技术中数据挖掘的应用,研究分析了数据挖掘中的一些理论与方法,取得了以下主要研究成果:1.建立了一种基于聚类的粗糙集模型.粗糙集理论是处理模糊和不确定知识的一种重要的工具,但经典粗糙集理论对原始数据本身的模糊性缺乏相应的处理能力,特别是数据中存在缺值时,经典粗糙集理论中的等价类无法刻画.本文基于聚类方法,对聚类中距离的概念加以扩展,使得能处理数据中存在缺值和非数值性数据,基于这种聚类方法得到的粗糙集模型,能处理不完全数据和模糊性数据.2.提出了可变精度聚类算法.聚类算法是数据挖掘中的常用方法,本文针对实际应用中聚类算法对初值依赖性较大,容易收敛于局部最优点、不能很好地处理缺值等问题,提出了可变精度聚类算法,降低了对初值的依赖性,有效地避免了算法收敛于某些局部极值点.3.提出了基于区分能力大小的启发式约简算法.约简的应用主要存在两方面的问题:约简的有效计算问题和处理数据中噪音和缺省值问题.近年来,对于这两个方面的问题有很多研究,但尚无二者兼顾的好方案.本文提出了一种能处理噪音的有效约简算法,该算法基于粗糙集理论认为知识是区分事物的能力的观点,对知识进行量化,证明了量化的合理性,并以量化后的区分能力作为启发式信息,指导约简,提高了约简效率.4.挖掘出了一组手势类.手势在人机交互中起着重要的作用,手关节自由度多给手势的识别与合成带来了困难,基于可变精度聚类算法得到了238个手势类,任何一个手势相似于其中一个类.在中国手语合成系统中,这些手势类不仅满足了手语词库的建立、中国聋人手语合成的要求,而且为进一步探索手的运动控制方法,寻求新的手语运动编码打下了基础.5.发现了手关节之间的约束.手运动是灵活与复杂的,但手运动也存在一定约束,使用基于区分能力大小的启发式约简算法,发现了手关节之间的约束,可将手的关节自由度降到15个,可在一定的误差范围内,将手的自由度降为7个,即手势的特征主要集中在手的7个关节自由度上,这将大大简化手势识别与合成中的工作,为寻找手势最小识别基元提出了一种新的思路.
其他文献
“智能化农业信息系统集成开发平台”课题属于国家高技术研究发展计划(863计划),课题开展以来一直面向农业信息化领域,该领域的研究一直是农业科技革命的先导。另外,在基于组件的
无线感知反应网络作为物联网的基础网络,是由大量具有数据采集、处理、无线通信能力的微型低功耗传感器节点及反应节点通过多跳通信方式组成的网络系统。随着无线感知反应网
随着各大企业数据集中及网络技术的不断发展,信息量越来越庞大,而从数据库管理系统本身的应用来讲,随着数据量日益增大,即使运行在性能极高的大型主机上,在处理大量并发用户
多Agent系统(Multi-Agent System,MAS)是分布式人工智能重要的研究领域,多Agent系统协商是多Agent系统的核心研究内容之一.该文结合我们承担的国防预研项目"分布式专家系统环
近年来,随着计算机技术、信息技术和系统技术的飞速发展,计算机仿真的应用领域不断拓宽,国民经济发展特别是军事需求的强大推动,促使计算机仿真在理论和实践两方面都走上了快速发
随着生物科学技术和计算机科学技术的迅猛发展,生物信息学已经成为一门崭新的学科而悄然兴起并日益发展.在生物信息学中,序列分析,即从核酸和蛋白质序列出发,分析序列中表达
虚拟空间会议系统是多媒体会议系统的终极形式,在虚拟空间会议系统中,所有的与会者将其虚拟替身合成到具有空间感、真实感的虚拟会议空间中,实现与会者之间自然的交互与协作。现
乳腺癌是危害人类健康的恶性疾病之一.目前,早期检查和早期治疗仍是提高乳腺癌治愈率的关键.其中乳腺X光检查是最常用和最可靠的检查方法.然而由于乳腺X光片图像中癌症的特征
该文针对视频水印的特点(对视频质量影响小、对编码效率改变少、实时性、抗帧操作的鲁棒性等)展开研究,实现了一个实时可行的视频水印系统.论文的具体研究内容包括:1.该文阐
在信息时代的今天,随着数据量的快速增长,如何从海量数据中高效地挖掘出有用的信息变得越来越重要。空间co-location模式表示在空间中存在若干空间特征,不同特征间的实例在空间