基于扩展规则与统计特征的未登录词识别

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户:hanben1104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高各行业领域未登录词识别效果,提出一种基于扩展规则与统计特征的未登录词识别方法。分析行业领域未登录词构词特点,制定扩展规则,根据扩展规则对分词项进行扩展得到复合词,通过词频、互信息、邻接熵等统计特征判别复合词是否为未登录词。若为未登录词,则对其继续扩展和识别。六个行业领域和通用领域未登录词识别实验结果表明,提出的方法取得了较好的未登录词识别效果,具有较好的移植性。
其他文献
<正> 家用电器已经成为我们日常生活中必不可少的东西,而健康又是人们努力追求、希望拥有的至宝。随着科技的发展,家用电器与健康正在进行着完美的结合,这些健康型的家用电器
随着我国社会经济的快速发展,畜禽养殖业得到了空前的发展,是农业经济中的重要组成部分。在禽畜疾病防治过程中,兽医是保障畜禽养殖工作顺利进行的基础,对畜牧业的发展有着重
<正> 随着市场竞争的加剧和消费者消费需求的变化,我国手机消费市场日益呈现出四大特征:外观时尚,功能适用,成为手机产品发展的基本趋势;注重体验,张扬个性,成为手机
根据当前鸭大肠杆菌病的进化变异情况,合理调整最佳防治方案、优化药物对症控制处方,总体效果得以明显提升。
<正> 知识产权作为一种无形的财产权,由智力劳动者对其成果依法享有的一种权利。在当今的国际经济贸易中,知识产权保护涉及的领域在逐渐加宽,份量在逐渐加大。在未来的国际贸
<正> 在消费者的申诉中经常遇到一些难以解决的纠纷,这些纠纷的共同特点就是消费者无法提供确凿有力的证据,甚至根本就没有证据。这对执法部门顺利解决争议,依法维权十分不利
<正> 进入2003年,中国冰箱行业又开始了新一轮的市场争夺,观察今年上半年国内冰箱行业动态,我们不难发现,看似平静的市场实际已是暗涛汹涌。我国政府对中国冰箱生产全面推行
过去的许多研究表明在实际张量数据中密集的部分存在着异常或者欺诈行为,如微博僵尸粉行为、网络攻击等。因此,研究人员提出了各种各样的方法来针对密集块的提取,但是这些方法存在低准确率和低召回率的缺点。针对这些缺点,提出了一种基于二叉树搜索的多密集块检测方法(DDB-BST),通过对张量数据进行基于评价指标的局部搜索,找到评价指标最高的子张量数据,将数据分成左右子节点,通过不断比较父节点和左右子节点评价指
养猪与猪病防治是职业技术学校畜牧兽医专业的专业课,具有很强实践性.为了适应我国畜牧业经济发展的要求,实现十三五规划提出的“现代农业”的发展战略,养猪与猪病防治课程的
文章以“新城疫高免蛋黄液与新城疫的治疗”为主要研究对象,在对鸡新城疫进行简要概述的基础上,从高免蛋黄液的制备以及应用等方面展开深入、细致的研究与分析,希望能为进一步认