数据仓库下基于学习的并行实体解析算法研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:jia343212539
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了改善传统实体解析算法在单机环境下采用人为方式设定属性权值及阈值难以对海量数据进行快速有效处理的缺点,基于Hadoop框架使用MapReduce计算模型,在多节点分布式环境下,通过不断调整网络学习属性之间的内在关系以及属性权值、阈值等参数后,再将模型放在Hive数据仓库中的真实数据集上进行有效性验证。分别使用5 000及9 000条数据进行实验,实验结果表明,基于学习的并行实体解析算法准确率、召回率和F1值较高。因此,基于学习的并行实体解析算法对于海量数据不仅能进行快速有效的处理,而且能有效降低人工经验
其他文献
音乐基础教育对于整个音乐教育有着非常关键的作用。其中俄罗斯在全球范围内的音乐基础教育较为独特,因此,对俄罗斯音乐基础教育的特点进行分析对于增强国内音乐基础教育有着较
为了模拟低空突防中飞行器面临的武器威胁、地形环境和大气环境等情况,需要建立一套完整的战场模拟仿真平台。在仿真平台结构分析的基础上,研究了低空条件下的威胁模型和环境模型,其中,着重描述了武器威胁各因素的自身特性,讨论了几种威胁形式的计算方法,提出利用地形组合、地形拼接的方法来处理地形数据以形成需要的战场地形,还考虑了大气环境对低空飞行的影响,最后结合实例说明生成的虚拟战场数据可以作为背景数据提供给低
12月4日是我国第一个国家宪法日。12月4日上午,湖南省株洲县招投标管理局组织全体机关干部学习宪法知识。株洲县招投标管理局局长王洪兵同志就宪法制定的背景、历史意义及宪法
原始萤火虫(GSO)算法存在收敛速度慢、搜索精度不高等缺点,故设计一种改进型蛙跳萤火虫(FGSO)算法。该算法采用自适应可变步长替换固定步长,并且结合蛙跳算法的族群划分策略,
地方音乐具有鲜明的文化色彩,是我国音乐体系的重要组成部分。本文将重点就高校音乐教学中纳入地方音乐的策略进行探讨,以期能够为音乐传承以及高校音乐教育质量的提高提供一
为实现福州市城市快速轨道交通第二轮建设规划项目(即6号线、5号线一期、4号线一期)早日启动建设的目标,福州市相关部门正加大力度牵头开展《福州市城市快速轨道交通第二轮建设
中西乐器结合的手风琴新音乐是围绕手风琴乐器为基础,融入中国乐器和民族音乐元素,以新的室内乐组合形式,新的音乐作品来呈现。2003年张晓波和梁云江教授共同创建蓝梦手风琴
在人工鱼群算法智能仿生应用于机器人路径规划中,为提高规划的求解速度、降低规划路径长度,存在算法后期收敛速度降低和易陷入局部最优解的缺点。为此在上述算法的基础上,引入方
2012年12月10日,在福建省海峡西岸经济区福清市,徐工1200吨全地面起重机征战在鲤鱼山风电现场。据悉,这是徐工成功安装的第三台1200吨全地面起重机风机,在以后一段时间内,将陆续完
复合材料在噪声干扰下的振动优化控制过程中,针对复合材料噪声干扰下的无规则振动进行控制时,传统的方法通过在复合材料结构中,安置隔振和隔声材料来达到抑制噪声与振动的目的。但是,传统方法没有区分材料中的不同点振动源强度不同带来的问题,无法解决不同点振动强度不同带来的控制误差。为了解决上述问题,提出了采用结构声强算法的复合材料噪声干扰下的振动控制方法,计算复合材料层板结构表面在动荷载作用下各单元的力和速度