论文部分内容阅读
三支决策是不确定性问题求解的重要理论。将三支决策应用于机器学习领域中不确定问题求解,是三支决策的重要研究方向之一。时间序列聚类是当前机器学习领域的热点问题,其主要的研究方向分为时间序列相似性距离计算和基于时序距离的聚类结果优化,本文结合三支决策思想对时间序列聚类中的不确定性问题进行了不同层次的算法优化,以达到提高时间序列聚类效果的目的。本文具体研究内容包括以下工作。第一,由于经典DTW(Dynamic Time Warping)算法存在高能低效的问题,影响了时间序列聚类的时间效率。本文引入三支决策,提出了一种基于分层递进三支决策的时序相似性算法。其主要思路是基于三支决策理论,建立DTW三支决策理论模型,基于误识别率最优化方法对模型中的决策阈值给出求解思路,并运用一种启发式的模拟退火算法对阈值进行求解。最后经过对比实验分析,验证了本节提出的算法相比于采用两支决策的FTW(Fast Similarity Search under the Time Warping)算法更加有效,愈加证明了三支决策应用于二支决策的拓展研究是普适有效的。第二,集成聚类是为解决单一型聚类的不足,而提出的一种新型聚类技术。能够有效提高聚类结果质量,然而集成过程中基础聚类优劣的不确定性,影响了最后结果的准确性。本研究在经典集成聚类方法的基础上,引入三支决策技术提出了一种基于三支决策理论的集成聚类新方法。其主要思路是基于三支决策建立基础聚类可靠度的三支决策模型,进而构建三支决策局部加权共联矩阵。然后通过凝聚层次聚类的思想解得最终的集成聚类结果。最后通过公开数据集进行实验,验证了本节提出的算法在聚类问题中的优势。第三,基于上述研究成果,本文提出了一种基于三支决策时间序列度量方式和三支决策集成聚类方法的新型时间序列集成聚类方法。最后采用公开数据集设计实验,从三个角度,与其它算法比较,实验结果证明本文提出的算法能够有效的减少低质量聚类对最终集成聚类结果的影响,在多个数据集合上都表现出较大的优势。