基于Hash结构的逆向最大匹配分词算法的改进

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：sgrwflh

【摘要】

：

分析中文的语义,首先要对句子进行分词。中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。对传统的分词词典和算法进行了改进,提出了基于H

【作者】

：

丁振国张卓黎靖

【机构】

：

西安电子科技大学计算机学院

【出处】

：

计算机工程与设计

【发表日期】

：

2008年12期

【关键词】

：

中文分词哈希结构逆向最大匹配算法分词词典消除歧义

【基金项目】

：

国家863高技术研究发展计划基金项目(2004AA1Z2520);军队网络互联与信息安全策略研究基金项目(2006QB1069)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

分析中文的语义,首先要对句子进行分词。中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。对传统的分词词典和算法进行了改进,提出了基于Hash结构的分词词典机制,并给出了一种改进的逆向最大匹配分词算法（RMM）。该算法在重点考虑切分速度的同时兼顾了切分精度,在很大程度上消除了传统的最大匹配算法可能产生的歧义。实验结果表明,该分词算法在运行效率和结果的准确性方法有了很大的提高。

其他文献

2014-2018年单中心金黄色葡萄球菌的临床分布及耐药情况研究

目的分析2014-2018年金黄色葡萄球菌(Staphylococcus aureus, S.A)的临床分布特征和耐药情况,为临床干预与研究提供依据。方法收集2014年1月1日至2018年12月31日首都医科大学

期刊

金黄色葡萄球菌临床分布耐药性

新媒体时代背景下新闻传播理论的创新分析

随着互联网技术的不断发展,新媒体时代的到来已经在很大程度上改变了传统的新闻传播方式和渠道,使新闻工作出现了很多新特点、新挑战,在此背景下,传统的新闻传播理论就显现出

期刊

新媒体时代新闻传播理论创新

广西贵港港平南港区发展的机遇、挑战和对策

本文论述广西贵港港平南港区发展要立足于本地资源的开发和利用，要充分利用经济腹地的货源，完善港口设施，提高港口的吞吐能力，同时通过体制的改革、资产重组和吸引外来投资做大做

期刊

港口机遇对策

急性胰腺炎并发高血糖的护理干预

应激性高血糖是急性胰腺炎的伴随症状之一，文献报道急性胰腺炎约50％的患者可出现暂时性高血糖，30％的患者有尿糖。血糖持续升高，是影响胰腺炎患者预后的重要危险因素。我科对56例急

期刊

急性胰腺炎高血糖护理

老年2型糖尿病患者血糖稳定性影响因素分析

目的动态监测老年人2型糖尿病患者血糖变化,分析血糖稳定性的影响因素,为糖尿病患者血糖控制及制定指导方案等方面提供数据支持.方法通过问卷调查、体格测量和实验室检查收

期刊

糖尿病血糖控制稳定性

用于南极低温低压环境下的恒温恒压装置设计

中国南极天文台所在的南极DomeA地区属于低温低气压环境，用于存储天文观测数据的海量存储系统在此环境下很难正常工作。为给海量存储系统提供稳定的工作环境，设计了一套适应低

期刊

控制理论与控制工程恒温恒压低温低压温度气压控制系统

不断总结民族工作“中国特色·云南经验”

<正>建设民族团结进步示范区,既是新时期新阶段我国民族团结进步事业发展的重要战略举措,更是云南省全面建成小康社会的重要内容和措施。云南省建设民族团结进步示范区,不断

期刊

民族团结进步创建活动实体化中华民族共同体意识示范区建设全面建成小康社会

非洲图书馆文化扶贫策略研究

非洲是发展中国家最集中的大陆,上世纪80年代有国家就开展了图书馆文化扶贫的实践和研究。文章利用文献研究法和内容分析法,从现有文献中选取了五个具有代表性的非洲国家,对

期刊

非洲图书馆文化扶贫图书馆文化扶贫

发展公共租赁住房的难点与对策

本文对公共租赁住房的组织框架、运营主体、面向对象等具体的制度设计问题进行分析，并提出了解决思路，如“先租后买”模式。

期刊

公共租赁住房住房保障“三位一体”“先租后买”

从苏俄时期电影看俄罗斯人的价值观转变

俄罗斯一位当代哲学家说:“从表面上看,俄罗斯是欧洲的,但从骨子里他是亚洲的。将欧洲和亚洲结合在一起的便是俄罗斯的灵魂”。在俄罗斯人身上,各种矛盾的特点奇妙地结合在一

期刊

俄罗斯苏联电影社会民族性格心理价值取向

基于Hash结构的逆向最大匹配分词算法的改进

其他学术论文