不确定情形下多目标规划的分类模型和算法研究

来源 :中国科学院研究生院(本部) 中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:jievons
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,数据挖掘是一个从海量数据中发现并提取隐藏的、前所未知的、有价值的信息或知识,然后利用这些信息或知识做出重要的商业决策的过程。因此,分析数据库、数据集市和数据仓库中收集的历史数据能够帮助决策者更好地了解他们的客户、评价企业在市场中的地位、提高和改进决策的质量和增加其竞争力。随着理论研究的不断深入和大量的实际应用,数据挖掘的方法逐渐发展成为一门新的学科和技术,它主要包括决策树、神经网络、线性规划、模糊集、粗糙集和支持向量机等方法。   然而,某些现有的确定性数据挖掘方法和模型在解决实际问题时又存在各种各样的局限性,特别是当数据中存在不确定、不精确、不一致、不完整等数据或信息时,这些方法和模型的性能表现较差,有时甚至无法有效地得到问题的解。因此,本文在深入研究模糊集和粗糙集等不确定理论、多目标规划和决策以及分类问题等的基础上,尤其是在客观地分析了这些方法之间存在的互补性的前提下,提出了建立一系列不确定情形下的多目标规划的模型和算法,并将它们用于解决数据挖掘中的分类问题,以提高分类的准确性、分类模型的求解效率和它们在新数据上的泛化能力。   因此,该论文主要研究了不确定情形下的多目标规划分类的各种模型和算法,包括了模糊多目标规划分类、基于粗糙集预处理的多目标规划分类和粗近似多目标规划分类的各种新的模型和算法流程。此外,在全面分析了传统的特征选择方法存在的不足的情形下,提出了基于统计属性贡献度的特征选择模型和算法;同时,尽管粗糙集在属性和信息约简方面具有优势,但是由于一般的粗糙集方法本身所包含的缺点,所以本文描述并给出了一种扩展的、基于粗糙集理论的属性约简模型和算法,它综合考虑了粗糙集的代数和逻辑方法。   最后,通过信用评分和Web客户忠诚度分析的实际应用,其分类结果和与传统方法对比分析的结论表明,不确定的多目标规划分类方法能够显著地提高分类准确率、模型运行的效率以及它们在新数据集上的推广能力。对于上述各种模型和算法的商业应用来说,它们能够较好地改进和提高商业决策的质量和效益。
其他文献
近几年,随着网络、通信以及传感技术的发展,数据流受到普遍关注;常见的数据流包括Web访问日志数据流、股票价格信息数据流以及网络信息数据流。随着数据流越来越受关注,研究人员
在计算机体系结构研究中,对内存系统的研究是非常重要的一部分,而访存trace的采集分析一直是必不可少的一环。HMTT就是一套基于硬件监听方式对访存行为进行监控分析的工具,相比
多核处理器的发展使得并行编程越来越流行。但是并行程序执行行为的不确定性,使得它们中存在错误难以测试和调试,这给程序员的工作带来巨大的困难和挑战。而且,隐藏在并行程序中
随着网络环境的日益完善和人们对分布式系统要求的逐步提高,作为分布式人工智能重要的研究领域,多Agent系统(Multi-Agent System)逐渐成为当前的研究热点。而多Agent系统协商
动物性食品中药物残留是近年来食品安全问题中最突出的问题之一,是困扰世界范围的难题。尽管国家加大了监管力度,但禽兽水产品致使中毒现象屡次发生,缺乏灵敏、准确、稳定、经济
二氧化碳浓度升高已导致全球气温明显上升,并带来其它一系列的环境变化,已引起了人类的高度重视。以区域甚至全球为中心的碳循环观测网络迅速发展起来,积累了大量的观测数据。采
近年来,海量小文件读访问时延大成为并行网络文件系统(pNFS)的主要问题。其原因有两点:一是元数据访问频率高、耗时开销大;二是IO粒度小、磁盘吞吐量低。针对上述问题,本文以pNFS
近年来,多核体系结构已成为处理器前沿研究的热点。比起单核处理器体系结构,多核处理器体系结构的仿真和验证技术将面临更大的问题和挑战。随着设计规模的不断扩大,两种传统的功
基于Gibbs抽样的贝叶斯模型选择结合先验信息,可以得到良好的估计与预测效果,从而受到各领域研究的重视。本文通过分析Gibbs抽样和Metropolis—Hastings算法构造转移核的本质,探
随着互联网的飞速发展,数据呈爆发式增长,企业为了节约成本、提高资源利用率,纷纷在数据中心部署云计算平台。相比于传统的部署方式,云计算对计算、存储以及网络资源进行统一分配