一种基于数据不确定性的概念漂移数据流分类算法

来源 :应用科学学报 | 被引量 : 0次 | 上传用户:wuyan425
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐私保护、数据丢失、网络错误等原因导致网络中大量数据存在不确定性.数据流系统中数据连续不断到达系统,故不能一次性获得全部数据,此外数据的概念特征经常发生变化.针对这种情况,构建了一个增量式分类模型来处理数据具有不确定性的隐含概念漂移的数据流分类问题.该模型采用非常快速决策树算法,在学习阶段使用霍夫丁边界理论迅速构建能处理数据不确定性的决策树模型;在分类阶段将加权贝叶斯分类器应用于决策树的叶子节点,以提高不确定数据分类的准确率;采用滑动窗口技术和替换树来处理数据流中的概念漂移现象.实验表明,无论对人工数据还
其他文献
期刊
当前,我国肉羊产业存在养殖规模较小、生产设施设备与技术落后、生产效率和经营效益相对低下等问题,加速我国肉羊产业标准化规模发展,提高生产效率和经营效益已经成为必然的趋势
粉渣 粉渣是豌豆、红小豆或土豆等原料粉或粉条的副产品.含粗蛋白质和淀粉很少,质量差。用粉渣大量饲喂,常引起母猪消瘦、下奶量少,还容易引起母猪拉稀。长期饲喂会使母猪产死胎
中小型企业是我国国民经济的重要组成部分,也是国有经济最活跃的经济组织之一。
近年来,美国教育界就“如何判断一个师范毕业生是否具有成为一名教师所必需的知识和技能”的问题进行了研究和探讨,大多数人认为,方法之一仍然是考试.目前,据说有40多个州已
期刊
提出基于分类器可信度的权重计算策略,解决动态数据流集成分类中子分类器权重分配难题.该方法充分考虑了所处不同位置样本对权重计算的影响,利用信息熵描述分类器对预测结果
提出一种基于欧氏距离的双比特嵌入哈希算法,以欧氏距离来度量二进制哈希编码之间的相似性.该方法可更好地保持原始特征空间的相似性关系,提高检索精度.另外,为了提高欧氏距离的计算速度,利用位操作实现二进制哈希编码欧氏距离的计算.对于64位的双比特嵌入哈希码,所提算法比传统欧氏距离的计算速度快400倍左右.在3个主流图像库上进行图像检索实验,与当前主流量化算法相比,该算法取得了更好的检索结果.