棉纺质量数据挖掘技术的研究

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:guoguo1guoguo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的迅速发展,以及数据库管理系统的广泛应用,各个应用领域积累的数据越来越多,激增的数据背后隐藏着许多重要的信息,用户希望能够对其进行更高层次的分析,以便更好的利用这些数据。虽然目前的数据库系统可以高效实现数据的录入、查询、统计等功能,但无法发现数据之间的关联以及蕴含的信息,无法根据现有的数据预测未来的发展趋势,缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。中国棉纺织业是纺织工业中基础最好的传统产业,在国民经济中占有重要地位。信息技术的发展,使得棉纺业在生产管理和生产过程中积累了大量的业务数据。如何充分利用这些数据为企业创造效益,是纺织企业目前期待解决的重要问题,数据挖掘技术的诞生,为解决这类问题提供了一条有效的途径。本文以浙江春江棉纺企业的质量数据为基础,对棉纺企业成纱等级分类问题的技术难点进行分析,介绍了常用的分类方法如决策树分类、神经网络分类、支持向量机分类、遗传算法分类和朴素贝叶斯分类,给出了决策树分类算法和朴素贝叶斯分类算法在成纱等级分类问题上的具体实现。在决策树分类算法中通过计算训练集中各个属性的信息增益判断决策树中各个属性节点的顺序,以哈夫曼编码建立决策树,提出了决策树裁剪算法,提炼出成纱等级分类中用到的规则。朴素贝叶斯算法是在假设训练集各个属性之间相互独立的前提下进行的,首先计算各个训练属性与成纱等级之间的条件概率,通过贝叶斯理论计算出测试数据在每个成纱等级下的条件概率,将测试数据归入某个成纱等级。在本论文中,通过决策树和贝叶斯分类算法的实验数据的对比,分析了两种分类算法的优异。并在实验数据的基础上提出了改进的贝叶斯分类算法。
其他文献
在高性能计算领域,应用的性能可以伴随着处理器的“摩尔定律”而提升,编程者不需要改写代码便能获得处理器性能提升所带来的“免费午餐”。现如今这一趋势已经由于主频的功耗瓶
计算机网络自上个世纪50年代产生至今,已经历了半个多世纪的发展。如今网络已经成为我们生活中不可或缺的一部分了,Internet、局域网,甚至手机通信的GPRS,都处处反映着网络的
说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文通过分析说话人识别基本原理与系统结构,考察现有的说话人识别技术,研究采用
中文作为人类传播信息的重要语言工具之一,中文信息处理已经成为信息处理领域的热点研究问题。中文自动分词是中文信息处理的重要组成部分,而词典处理效率是影响中文自动分词
无线传感器网络(WSN,Wireless Sensor Network)综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,是计算机科学技术一个新的研究领域,具有十分广阔的应
45°旋转扫描反射镜是目前最成熟、最常用的光机扫描模式,在卫星遥感器上有着广泛的应用前景。但是由于45°旋转扫描反射镜在扫描过程中会产生像旋,直接采用该扫描方式在应用
情感计算是国际上近几年刚刚兴起的、试图使计算机能够像人类那样具有理解和表达情感能力的一个多学科交叉的新研究领域,在智能人机交互中起着重要作用。由于人的面部表情是情
基础云服务(IaaS)以其减少性能开销,提高资源利用率的优点已经成为云平台服务以及云软件服务的重要支撑。虚拟化是实现IaaS的核心技术,然而由于云服务应用需求,托管的虚拟机
随着工业生产的发展,工业生产过程日趋复杂化,工业控制系统的开发成为工业生产中一个非常重要的部分。但传统的工业控制系统存在着软件水平不高、质量不好的问题,因此优秀的
事件发掘就是从海量的、实时的、嘈杂的文本中发掘出有意义的事件,并将其中的事件要素概括抽取出来。事件发掘与其他自然语言处理领域的研究,如信息挖掘、主题检测、事件抽取