模糊等值理论在数据清理中的应用

来源 :东南大学学报:英文版 | 被引量 : 0次 | 上传用户:gliu0307
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了规则合并的优化方法和重复记录聚类清除的方法.应用模糊等值理论,避免了传统等值理论非此即彼的僵硬方式,但清理过程中部分规则可能存在包含与被包含的关系,被包含的规则其等值度显然会相对较小,根据用户阀值提出了规则合并的优化方法,可减少重复记录的计算时间.基于同样的原因,规则间的包含与被包含关系将影响模糊等值度的误差分析,因此提出了利用忽略被包含的规则等值度提高误差分析精度的改进模糊等值理论误差分析方法.重复记录的核实通常需要人工逐条检测,易于出错,本文提出的聚类算法,可节省大量的用户劳动.最后给出一个实验
其他文献
针对文档分类过程中不同大小文档表示、文档特征选择和文档特征编码问题,提出了一种基于粗糙集的角分类神经网络Rough—CC4.利用近义词构成等价类,以此表示文档,可以缩小文档表示
提出了一种基于三维有限元的电磁无损检测缺损响应快速模拟的组合方法, 该方法由三项技术构成, 分别是局部计算技术、差场技术和迭代解技术. 采用局部计算技术, 可以将三维计
基于小波包分析推导了结构动力系统在不同分析尺度上的状态方程和观测方程,在此基础上研究了结构动力响应在不同分析尺度上的时-频特性.理论分析证明,采用小波包分解结构的动