消除数据仓库中相似重复记录的方法

来源 :第二十届全国数据库学术会议 | 被引量 : 0次 | 上传用户:rainbow0938
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要探讨了在星型模式中如何利用维表的相似重复消除的结果来探测和消除事实表中的相似重复记录问题.在数据仓库中还存在雪花模式这类比星型模式更复杂的数据模型,未来的工作将主要研究如何扩展本文提出的方法,将它用于雪花模式的清洗.
其他文献
作业练习是教学流程中重要的一个环节,是课堂教学的延伸和继续.合理的练习是学生学习数学、发展思维的一项经常性实践活动,也是师生信息互动交流的一个关键窗口.数学教材中的
期刊
职高英语口语教学对于学生的职业发展有重要影响,教师必须高度重视.本文探讨了职高英语口语教学的难点和教学原则,提出了几点高效的教学策略和有利于学生发展的评价建议.
国际股权融资方式一、境外上市。国际资本市场对进行股权融资主体的资信方面要求较高,一般来讲,企业必须同时满足以下几点:1.企业规模经营程度高;2.企业在国际市场上有一定的声誉,竞争
那天下午,李四开着他的面包车进了城.车上坐着的,还有邻居老张.这两年,老张出门打工挣了点钱,想把家里的房子装修一下,于是让李四开着车,陪他进城买装修材料.rn其实李四并不
本文从使用的主要技术入手,提出了基于本体的语义化数据库模型OSDBM(Ontology-based Semantic Database Model).在该模型中,数据库中的元数据映射到本体中,以实现不同系统中
汤老师被评为十佳教师的消息刚刚公示,就接到群众举报,说他接受过房地产商赠送的一处楼房.rn调查组到他家调查,汤老师尴尬地交出一串钥匙说,有这事.不过,房子我没住.为了退房
本文对初中数学分层作业应用的意义作出概述,分析了初中数学分层作业的优化策略.其中首先要对作业的目标、作业量和题目难度采取分层设计方式,同时要丰富作业的形式,合理开展
本文提出并研究在微机环境下ACMS科学可视化分布处理模型和体系结构(Advanced Client Marshal Server),同时用多线程均衡任务的分配,使得任务分配和结果收集分开,进一步提高
目前已经使用振动测量和神经网络方法开发出了齿轮传动的故障诊断技术。实施振动测量采用背对背结构的齿轮试验装置 ,在施加负荷和按齿轮节圆线速度条件下运转 ,这些都是工业
2009年11月,西子湖畔,“三潭印月”集合信托债启动发行,融资规模达到1.44亿元,—为了帮助中小企业融资,这已是杭州市西湖区政府债权型引导基金的第二期。此外,西湖区还实践了