基于Hash结构的逆向最大匹配分词算法的改进

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:sgrwflh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析中文的语义,首先要对句子进行分词。中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。对传统的分词词典和算法进行了改进,提出了基于Hash结构的分词词典机制,并给出了一种改进的逆向最大匹配分词算法(RMM)。该算法在重点考虑切分速度的同时兼顾了切分精度,在很大程度上消除了传统的最大匹配算法可能产生的歧义。实验结果表明,该分词算法在运行效率和结果的准确性方法有了很大的提高。
其他文献
目的分析2014-2018年金黄色葡萄球菌(Staphylococcus aureus, S.A)的临床分布特征和耐药情况,为临床干预与研究提供依据。方法收集2014年1月1日至2018年12月31日首都医科大学
随着互联网技术的不断发展,新媒体时代的到来已经在很大程度上改变了传统的新闻传播方式和渠道,使新闻工作出现了很多新特点、新挑战,在此背景下,传统的新闻传播理论就显现出
本文论述广西贵港港平南港区发展要立足于本地资源的开发和利用,要充分利用经济腹地的货源,完善港口设施,提高港口的吞吐能力,同时通过体制的改革、资产重组和吸引外来投资做大做
应激性高血糖是急性胰腺炎的伴随症状之一,文献报道急性胰腺炎约50%的患者可出现暂时性高血糖,30%的患者有尿糖。血糖持续升高,是影响胰腺炎患者预后的重要危险因素。我科对56例急
目的 动态监测老年人2型糖尿病患者血糖变化,分析血糖稳定性的影响因素,为糖尿病患者血糖控制及制定指导方案等方面提供数据支持.方法 通过问卷调查、体格测量和实验室检查收
中国南极天文台所在的南极DomeA地区属于低温低气压环境,用于存储天文观测数据的海量存储系统在此环境下很难正常工作。为给海量存储系统提供稳定的工作环境,设计了一套适应低
<正>建设民族团结进步示范区,既是新时期新阶段我国民族团结进步事业发展的重要战略举措,更是云南省全面建成小康社会的重要内容和措施。云南省建设民族团结进步示范区,不断
非洲是发展中国家最集中的大陆,上世纪80年代有国家就开展了图书馆文化扶贫的实践和研究。文章利用文献研究法和内容分析法,从现有文献中选取了五个具有代表性的非洲国家,对
本文对公共租赁住房的组织框架、运营主体、面向对象等具体的制度设计问题进行分析,并提出了解决思路,如“先租后买”模式。
俄罗斯一位当代哲学家说:“从表面上看,俄罗斯是欧洲的,但从骨子里他是亚洲的。将欧洲和亚洲结合在一起的便是俄罗斯的灵魂”。在俄罗斯人身上,各种矛盾的特点奇妙地结合在一