大数据的序贯预测和聚类研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hesur
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的进步导致各行各业产生的数据越来越大,这使得大数据的研究迫在眉睫。本文分别研究了序贯数据的预测方法和高维无标签数据的聚类问题。(1)针对序贯得到样本量庞大的数据,我们提出了序贯线性回归方法。此方法不仅可以节约存储空间和提高计算速度,而且预测正确率比传统的均值预测高。根据数据获取的时间效应以及数据预测效果,我们又提出了加权重的序贯线性回归方法。(2)针对高维无标签数据,稀疏自表示神经网络方法进行降维,用数值优化方法求解神经网络并在隐层用k-means方法聚类。与其它聚类方法相比,我们从模拟数据和真实数据验证了稀疏自表示神经网络方法聚类的优越性。
其他文献
预测是决策的前提,任何成功的决策都离不开科学的预测。预测因涉及的不确定因素众多而显得格外复杂。预测方法虽然很多,但是没有一个是完美的和普遍适用的。探索新的预测方法
学习控制是智能控制理论的一个重要分支,它在非线性不确定系统控制方面有着独到优势。相对于线性参数化,非线性参数化适用于更为广泛的非线性不确定系统,然而非线性参数化不
鲁棒性是目前数字水印研究中需要解决的难题。设计鲁棒性水印的关键在于水印嵌入位置的选取。离散小波变换不仅具有较好的匹配HVS(HumanVisual System)特性,而且与JPEG2000、
学位
本论文主要建立对称锥的变分分析并给出对称锥优化问题扰动分析的理论结果,主要内容可概括如下: 1.第2章基于欧氏Jordan代数的性质,研究了对称锥的变分性质。首先推导了对称
本博士论文研究带自由边界KPP型扩散方程在时间几乎周期介质中解的传播现象。具体来说,我们回顾并探讨了KPP型扩散方程在时间几乎周期介质中解的渐近动力学行为,研究了带自由边
研究10个小麦品种(系)随机区组试验的LOX活性、蛋白质、湿面筋、沉降值、籽粒硬度、直链淀粉和RVA参数等13个品质性状及其相关性。结果表明,除糊化温度之外,其余12个品质性状
获取真实物体的三维模型,一直都是计算机图形学、计算机视觉等领域的研究热点,尤其在动画、游戏、虚拟现实等领域,有着广泛的应用,特别对于人体的三维数据,有着不可评估的价值。传
由于在实际系统中普遍存在退化、时滞现象,诸如工业工程系统、电力系统、生态系统、金融系统等,从而引起了国内外学者的广泛关注并取得了全面的进展。人们为了更准确的描述、模
近年来,偏微分方程和小波方法进行图像处理不仅对理论研究提出了新的课题,也对图像处理的发展起到了重要的促进作用,它既有重要的理论价值,又有广阔的发展前景。图像去噪是其