基于遗传算法的数据挖掘技术研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:mzt1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术的应用已经相当广泛,但关于数据挖掘方法的研究仍然方兴未艾。在众多的数据挖掘方法中,关于预测的方法和关于聚类的方法是相当常用的,目前也有很多学者在进行与这些算法相关的研究。但很多研究都是在某一方面对现有算法进行了改进,在关于预测和聚类算法及其它算法的研究中,没有一种方法是十全十美、可以解决现有算法存在的所有问题的。就预测和聚类算法而言,本文给出了作者对目前已有算法的一些改进方案。在数据挖掘技术的预测方法中,回归分析是最常用也是最简单易行的预测分析技术,但这种分析存在很多不足,通常得到的结果不够精确,有时候误差会比较大。鉴于遗传算法的全局寻优特性,为了解决传统回归方程的参数精度问题,本文引入遗传算法来对回归方程中的参数进行寻优,以便优化回归方程。在数据挖掘中,聚类分析也是一种很长用的技术。而聚类技术中K-means聚类分析技术又是最常用的方法。但K-means算法在实际应用中需要用户给出要聚类的数目即k的值,另外,K-means算法在运行时要首先随机产生一个初始聚类中心,然后再对使用这个初始聚类中心得到的聚类结果进行不断调整,而这个聚类结果在很大程度上受初始聚类中心选取的影响。为了消除K-means聚类算法对于用户输入k值的依赖,也为了减小K-means聚类算法受初始聚类中心的影响,本文引入了遗传算法。在具体实现中,首先在原始样本集的一个子集上运行遗传算法进行参数k的寻优以及在该最优值k的基础上对初始聚类中心的寻优,然后再在原始样本集上运行K-means聚类算法,最终得到聚类结果。在最后,本文分别给出了对应于预测算法和聚类算法的应用实例,经过在实例数据集上的运行结果和先前方法的比较中得出,在这两种方法中引入遗传算法提高了预测和聚类的精度和准确性,试验证明,本文提出的方法具有良好的使用价值。
其他文献
本文针对大采高厚硬顶板赋存条件(大采高,厚、硬),综合运用理论分析,数值模拟和现场实测相结合的方法对大采高厚硬顶板控制及支架工作阻力进行了研究。研究结果表明:运用FLAC3
本文取材于实际课题,对电动管柱助力式齿轮齿条转向器的异响问题进行仿真研究。首先分析了该转向器产生异响的机理,并据此制定了研究方案。然后建立了检测台架条件下齿轮齿条
下沟煤矿自2001年技改以来,积极推行煤巷锚杆支护技术,100%实现了锚网支护,经过十几年的技术积累,已经能熟练掌握一般条件下的巷道锚杆支护技术。但是随着开采深度和开采强度
煤炭自燃是威胁煤矿安全生产的重大灾害,煤炭自燃造成的间接损失难以估计。煤炭行业每年都要投入巨额资金用于火灾治理。本论文就是进行煤自燃低温氧化阶段吸附氧气机理研究
白云苍狗,斗转星移。俯仰之间,距你我初识已过去多年,如今我已过及笄之年,生活恬淡幸福。可梅里,如今,你过得真的好吗?  记得,通过一组网上图片,初识了你,彼时的你那么美丽。白雪裹挟着原野,云雾辉映着彩虹。你,银装素裹,洁白无暇。你让山民对你敬仰,让万山向你臣服。  他们说,那西南边陲之地,住着位“雪山太子”,名为梅里。美丽别致,绰约多姿。在那里,溯流而上的暖湿气流与你相遇,你便像孩子般会恶作剧,一
油管是石油开采过程中使用量最大的耗材,油管质量对石油工业安全生产具有十分重大的意义。复用油管即一根油管反复使用,但多次使用后油管的质量参差不齐,很多油田都频繁发生
论文对滑行式刨煤机的运动学及刨头受力进行了分析。确定了影响滑行式刨煤机动态特性的主要因素。建立了滑行式刨煤机纵向、横向的动力学模型,并且利用离散体动力学模型法给
粉尘爆炸是粉体工业灾害事故最主要的形式,由首次爆炸引起的粉尘二次及多次爆炸加剧了粉尘爆炸的严重后果。粉体工业中,可能引起粉尘爆炸的着火源较多,粉体生产单元操作多样
钻井泵是钻井工程中的重要设备,实时掌握其工作状况并预测其剩余使用寿命对钻井工程的正常运行有着十分重要的意义。论文通过对中国石化集团某钻井工程公司的五台在役3NB-130