基于大数据下MapReduce模型的汉英机构命名实体对识别探究

来源 :第二十七届全国计算机信息管理学术研讨会 | 被引量 : 0次 | 上传用户:liang__fei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于MapReduce框架,本文提出从海量汉英平行语料库中抽取汉英对应的命名实体对的方法.首先基于斯坦福大学的分词、词性标注和句法分析等工具完成汉语和英语的句法分析,然后根据人工内省制定汉英双语命名实体抽取的规则集,提取出中英文候选命名实体,基于MapReduce框架计算出它们互为对应中英文命名实体的概率,最后通过设定的阙值筛选出中英文命名实体对.
其他文献
本文开发了激光传感控制技术,通过光影像学原理,实现2D检测,将图像处理后转换为胶量数据,来动态监测含胶量的分布,再通过信号反馈自动调节滚筒的压力来保证预浸料厚度一致性和胶量的均匀性,此技术保证了纤维克重与胶含量的在幅宽方向和长度方向的一致性,在提高品质的同时也提高了生产效率,保证了预浸料品质的稳定,实现技术革新.
SiCp/2024 composite was produced by powder metallurgy process.The microstructure and mechanical properties of the composite were investigated by means of SEM,EDS,tensile testing and hardness testing r
Graphene/polyaniline(GPA) nanocomposites in a novel structure have been fabricated through in situpolymerization of aniline on the surfaces of graphene sheets.It was found that graphene and polyanilin
利用光催化材料自身半导体能带结构驱动氧化一还原反应分解N0x是改善空气质量的关键路线之一,将TiO2光催化剂与路面材料复合,通过路面材料媒介,将移动源排出的氮氧化物催化净化,减少尾气对大气和环境的污染.本文中主要介绍国内外路面负载TiO1光催化降解NOx这一绿色技术所涉及的基本原理、分析方法、实验结果、应用效果,讨论了TiO2光催化净化NOx未来发展的方向.
Fe-Al金属间化合物以其好的抗氧化、抗硫化特性,优良的抗腐蚀性和高温强度等突出性能,成为一种廉价的抗腐蚀材料.Fe-Al与A12O3之间相容性好,可作为过度底层制备Fe-AVAl2O3梯度涂层以提高Al2O3陶瓷涂层的性能.采用化学镀法制备Fe包覆Al核(Al)-壳(Fe)结构复合粉体,以Fe-Al复合粉体为喷涂材料,利用等离子喷涂法在Q235钢基体上制备涂层,在喷涂过程中Fe、Al反应生成Fe
作者采用将半固态模锻成形工艺和材料连接成形工艺相结合的复合工艺成功制备出2024-SiCP/2024复合材料齿轮件.力学性能测试表明在630℃成形温度,400MPa成形压力的工艺参数下制备的齿轮件其界面拉伸强度可以达到240MPa.通过微观观察表明成形温度、成形压力等对界面形貌、成分均有较大的影响.同时,结合微观组织观察,得出了2024-SiCP/2024复合材料半固态模锻连接成形微观形成机制.
本文从大数据的基本内涵入手,分析研究了大数据环境下美军军网应对策略以及大数据对我军军网建设发展的影响,并提出了加强大数据环境下我军军网建设的五点措施建议.
在分析图书情报领域中网络舆情信息服务研究现状的基础上,结合图书馆在网络舆情信息服务方面的优势,针对存在的“资源分散、重复建设”等问题,提出基于云计算的网络舆情信息服务平台框架,力图整合并发挥图书情报系统资源优势,提高网络舆情信息服务的质量和效率.
在军事领域,云计算的出现也必将对军事技术及军事应用产生重要的影响。本文从应用的角度分析了云计算的定义和特点,介绍了基于云计算的作战数据服务的整体框架和系统设计.
本文考察了宾州中文树库中动词短语成分分布,探讨了短语树库中动词次范畴框架自动抽取实现.动词次范畴框架在语义标注、信息抽取等应用中具有十分重要的意义.文章在定性与定量分析的基础上,对动词支配论元进行了进一步分析,并构建动词次范畴框架知识库,提供相关动词次范畴框架知识服务.这些知识将作为今后信息抽取研究的基础,用于科技文献主题词、时间等实体的自动识别.