海量数据的一种集合模糊匹配关联算法

来源 :河南城建学院学报 | 被引量 : 0次 | 上传用户:hanyan0503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在海量数据背景下,在实际数据匹配关联时,集合数据往往因失真而不能做到精确匹配,再者由于数据量的急剧增加导致匹配之后的一般关联操作效率较低。因此,本文借助优化后的分布式处理策略提出了一种在Hadoop平台下进行集合模糊匹配度的关联算法(A Fuzzy Matching Linking Algorithm about Set under Hadoop,FMLASH)。在相同实验环境下,FMLASH算法与MRSimJoin算法相比,在处理时间上缩小20%,并且FMLASH算法在增加节点数和数据量时表现出更好的可
其他文献
改革开放以来,国有企业体制随时代发展不断演进,民营企业也继之兴起。随着社会主义市场经济体制日趋完善,国企改革不断深入,民营企业发展日益显著。随后,国企与民企似乎陷入
采用日立835-50型自动氨基酸分析仪和四极串联质谱仪,对脑活素-D注射液和3种样品对照液中氨基酸和肽的含量及分子量进行了测定。结果表明,本品中含有大量的氨基酸和肽,这对进
目的:探讨血小板聚集功能和尿11-脱氢血栓素B2(11-DTB2)检测对评价一次及反复脑梗死患者服用阿司匹林治疗作用的价值。方法:42例反复脑梗死(≥2次)患者和50例发生一次脑梗死患者服
资本主义历史上发生过多次危机,不同时期危机的表现也不尽相同。2008年起源于美国的金融危机,不仅影响范围广,持续时间长,危机造成的后果严重,而且后危机时代它带给我们的启
对平顶山七矿矿区的景观现状进行研究,分析了矿区原有的6个功能分区(包括工业广场、加工区、居住区、采煤区、洗煤区、矸石山区),以及周边交通、人群、水资源、植被及土壤等
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
食管恶性肿瘤术后,食管吻合口狭窄是常见的并发症,其严重影响患者生活质量,主要表现为吞咽困难,严重者无法进食,食管吻合口狭窄可分为良性狭窄和恶性狭窄。良性狭窄治疗方法
<正>(2009年4月25日-广州番禺)在全国范围内开展"胆囊切除术后不良反应大规模人群调查",治疗疾病应重视保留器官和功能,是现代人文医学发展方向的新观念。①成立内镜行业微创
那节《面对……》的作文讲评课上,我读了姚双双同学的《面对失意》。读后,同学们都向她投以羡慕的目光。不经意间,我发现邢伟和房慧静同桌俩满脸的不屑,并在小声嘀咕着什么。为了
为了进一步分析研究装配式建筑结构中钢筋套筒灌浆连接件锚固的可靠性,试验分析研究了9种不同类型共计27个钢筋套筒连接试件在单向拉伸荷载作用下的力学性能和锚固机理。研究