面向相似重复记录检测的特征优选方法

来源 :传感器与微系统 | 被引量 : 0次 | 上传用户：lianzi0118

【摘要】

：

大数据集相似重复记录检测和识别中，数据源组成复杂、表征数据记录的特征属性过多，因而检测精度不高、执行检测的代价过大。针对这些问题，提出了一种分组模糊聚类的特征优选方法

【作者】

：

李鑫李军丰继林高方平李忠

【机构】

：

防灾科技学院灾害信息工程系

【出处】

：

传感器与微系统

【发表日期】

：

2011年2期

【关键词】

：

特征优选相似重复记录模糊聚类相似度 optimal feature selection approximately duplicate records

【基金项目】

：

基金项目：国家科技支撑计划资助项目（2008BAC35805）,中国地震局教师科研基金资助项目（20090105,20090301,20090101）,河北省教育厅自然科学研究计划资助项目（Z2009407）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据集相似重复记录检测和识别中，数据源组成复杂、表征数据记录的特征属性过多，因而检测精度不高、执行检测的代价过大。针对这些问题，提出了一种分组模糊聚类的特征优选方法。首先进行分组记录的属性处理，以有效降低记录属性的维数，并获得分组中的代表性记录，然后采用一种相似度比较计算方法进行组内相似重复记录的检测。理论分析和实验表明：该方法有较高的识别精度和检测效率，能较好地解决大数据集中相似重复记录的识别问题。

其他文献

台湾人民抗击日寇割占台湾史略

台湾人民抗击日寇割占台湾史略张凤翔台湾自古以来就是中国的领土，居住在台湾及其附近岛屿的中华儿女长期以来就在那里生息、繁衍，戍守、维护着祖国的统一。甲午中日战争后，台湾

期刊

台湾人民台湾史刘永福台湾保卫战日本侵略军日本侵略者清政府抗日保台黑旗军《马关条约》

高灵敏度谐振式红外光声气体传感器研究

研究了高灵敏度谐振式红外光声气体传感系统,对系统的谐振频谱进行了测试分析,观察到了新的谐振模式。经过对比,发现选用新的谐振模式具有更高的测试灵敏度和信噪比,新的谐振

期刊

光声传感器谐振式频率灵敏度信噪比photo-acoustic（PA）sensor resonant frequency sensitivity

不同INS器件对GNSS/INS深耦合接收机跟踪环路的影响

针对在GNSS/INS深耦合接收机产品设计中INS器件的选用问题,仿真研究了不同动态条件下,导航级、战术级和商业级这3种不同性能级别的INS器件对GNSS/INS深耦合组合接收机跟踪环

期刊

INS器件性能GNSS/INS深耦合跟踪环路仿真研究performance of INS device GNSS/INS deep-coupled

基于电磁力的FBG电流传感器研究

利用通电螺线管与永磁铁之间的作用力,提出了一种测量电流的方法。光纤Bragg光栅(FBG)在永磁铁的牵引下发生轴向应变,引起Bragg中心波长的漂移,通过解调中心波长漂移量对电流进行测量。实验中采取多匝数螺线管和小电流来模拟大电流,对0~3 A的直流电流进行了测量。实验结果表明:中心波长漂移量与电流有很好的线性关系,线性度为0.9998,电流灵敏度约为0.97 nm/A。

期刊

光纤光学光纤BRAGG光栅波长解调电磁力fiber optics fiber Bragg grating（FBG） wavelength demo

莫力达瓦达斡尔族自治旗工商联在发展中前进

莫旗工商联1991年8月正式恢复,几年来,他们就如何做好新时期工商联工作从当地实际出发,进行了有益的探索。一、抓宣传,扩大工商联知名度。1991年莫旗工商联初建之始,多数人

期刊

工商联工作请示汇报开拓工作专职干部经济协作闲散资金非公有制经济引进项目贷款担保政协委员

共轴双驱型导轨精密定位与同步性的研究

为了满足高精度测量系统对高精密运动导轨的需求,通过结合通用运动自动控制器(UMAC)和直线电机的驱动方式,实现了"PID+速度/加速度前馈+陷波滤波器"控制算法对共轴双驱型导轨

期刊

导轨精密测量通用运动自动控制器比例—积分—微分精密定位同步性

漫话两岸　关系沧桑

漫话两岸关系沧桑今天的两岸关系是历史上两岸关系的继续，今天和历史有割不断的千丝万缕的联系．以史为鉴，启迪现在，对我们继往开来，全面贯彻我党对台方针政策，推动两岸关系向更深层

期刊

海峡两岸关系台湾海峡国民党蒋介石毛泽东解放台湾台湾局势沿海岛屿解放军福建沿海城市

一种通过算法移植降低无线传感器网络能耗的方法

在研究了多种降低系统功耗方法的基础上，针对无线传感网络的低功耗要求，对无线传感器网络各模块进行了分析和研究，设计并实现了一种基于算法移植的软件开发低功耗的方法，有效降低

期刊

无线传感器网络低功耗方法传感器节点wireless sensor networks （WSNs） low power consumption meth

“中国”与“新中国”

《没有共产党就没有新中国》这首歌对中国人民来说是妇孺皆知的。从解放区传唱到现在,四十年来,无论是“红海洋”的岁月,还是改革开放的今天,人们仍然由衷地、满腔热情地唱着

期刊

日本法西斯敌后根据地周天度蒋家王朝中国各族人民翦伯赞孙起孟救中国红海洋立凡

有机改性溶胶-凝胶传感膜检测亚硝酸根

以二甲基二乙氧基硅烷与四乙氧基硅烷为有机-无机复合前驱体，番红花红为敏感指示剂，利用溶胶-凝胶法研制出有机改性传感膜。实验结果表明：在酸性条件下传感膜与亚硝酸根作用，导致

期刊

溶胶-凝胶法传感膜亚硝酸根番红花红sol-gel method sensing film nitrite crocus red

面向相似重复记录检测的特征优选方法

与本文相关的学术论文