利用属性集相关性与源误差的多真值发现方法研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:studentOfJXUFE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前真值发现的研究主要利用数据源质量和数据之间的关系,然而实际数据的分布呈现长尾现象,传统算法在处理尾部数据时,准确率大大下降.本文对数据源进行分类,对头部数据源利用属性集相关性,给予正确集更多的置信度补偿,易于剔除错误数据;对尾部数据源,根据误差小的数据源应获得更高的权值分配的理论,将真值发现转化成全局优化问题,通过寻求数据源权值的最佳分配,获得最可能接近真值列表的属性集合.实验表明,本文提出的方法在真实的长尾数据集上,准确率和召回率方面均优于传统算法.
其他文献
由于养殖面积大,分布广而分散,涉及千家万户,管理难度大,汕头市南澳县的养殖用海海域使用权多年来始终坚持着“属地管理”原则。即由所属镇村参与养殖用海管理,由镇政府或村集体向
对寒地水稻不同品种、不同粒位子粒灌浆过程进行了 Logistic方程的拟合 ;比较了最大灌浆速率、最大灌浆速率期、平均灌浆速率等与子粒灌浆有关参数的品种间、粒位间的差异 ;
Hill方程和Clohessy-Wiltshire方程广泛用于解决编队飞行卫星的相对运动,这些方程的线性化基于三点假设:理想球体、圆参考轨道和相对距离足够近。这些假设带来较大的模型误差
动态分析是通过动态执行来测试评估程序的分析方法.现有的许多工作依靠动态分析来检测软件缺陷或安全漏洞.动态执行应用程序时,应用程序会根据用户的文本输入决定执行路径,缺
5月31日,“丝路国家海水养殖国际论坛”在福建福州隆重举行,论坛由中国水产科学研究院黄海水产研究所(农业农村部“一带一路”海水养殖技术培训基地)主办,并得到了中国水产流
期刊
针对视频完整性和版权保护的安全需求,为了保障视频的真实性和合法性,提出了一种基于空时特征的指纹算法。算法借鉴了视觉哈希的思想,利用视频内运动和变化的信息来生成内容特征,并通过MD5哈希算法将特征和用户私钥生成指纹信息。算法利用改进的H.264扩频水印方案,将指纹信息嵌入视频帧中,实现了H.264视频内容完整性的认证,并能在存在篡改的情况下有效识别视频中被篡改帧在序列中的位置。
早几天回乡下,见一台收割机锈迹斑驳、线路脱落、电瓶失踪,目测已停置有2年以上.问起旁人,说是前年“双抢”时在作业过程中出了故障没人维修,丢在这里了.rn优质的农机具,既需
期刊
将电子政务与公安消防监督管理工作相结合 ,阐述了消防电子政务建设的内容 ,并以北京市公安局消防局电子政务建设为例 ,分析了消防电子政务应用现状和存在的问题 ,并就北京市
2004年10月中旬赴日本参加“中日大城市危机管理研讨会”,笔者的体会是日本不仅有内阁府防灾局的中央级防灾决策系统,还有东京都及其新宿区的防灾中心,作为多灾日本其最成功
“养殖户祖祖辈辈都靠这片海域养殖获取收入来过日子,但他们不配合,工作就不好推进。”在粤东某地,一位基层工作者感慨说,一些地方“门前海”观念根深蒂固,导致当地部分村民并不接