融合分词隐层特征的汉语基本块识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:haicang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以字为基本标注单位,构建了一种汉语基本块识别的神经网络学习模型。模型联合分词任务的神经网络学习模型与基本块识别任务模型,将分词任务模型中学习得到的隐层特征融入基本块识别的模型中,两模型相互交替优化学习模型参数,并实现了以整句似然函数(而非单字似然函数)作为优化目标的算法。实验结果表明:1)以整句似然函数为优化目标的基本块识别的F值比单字似然情形要高出1.33%,特别是在多字块识别中,其召回率比单字似然情形要高出4.68%;2)融合分词任务模型中的隐层特征的汉语基本块识别模型的结果比不做融合的模型要高出
其他文献
事件抽取旨在从非结构化的文本中抽取出事件的信息,并以结构化的形式予以呈现。监督学习作为基础的事件抽取方法往往受制于训练语料规模小、类别分布不平衡和质量参差不齐的问
在素质教育背景之下,大学在注重对学生专业教育的同时,还需要借助音乐加强对学生审美情操的强化,启迪学生灵魂,引导学生树立正确的三观。基于此,本文从明确教学目标,正确处理
针对无监督属性选择算法无类别信息和未考虑属性低秩等问题,该文提出了一种融合K均值聚类和低秩约束的属性选择算法。算法在线性回归的模型框架中有效地嵌入自表达方法,同时
<正>~~
期刊
目的评价彩色多普勒超声对下肢动脉硬化的诊断价值.方法收集经彩色多普勒超声诊断并与临床相符的60例下肢动脉粥样硬化患者的完整超声诊断资料,分析内膜-中层厚度及动脉斑块
该文将行业政策形式化为一个由微观、中观和宏观政策血缘网络构成的复杂网络体系。分别通过改进的基于语义的政策词语相似度计算方法、依存句分析和基于向量空间模型的方法构
2016年12月23-24日,中国中文信息学会第八次全国会员代表大会暨学会成立35周年学术会议在北京中国科技会堂隆重举行,大会通过无记名等额投票方式选举产生了中国中文信息学会
音乐,绵延着几千年中华人民的对于音乐的独特理解。它不仅仅代表一个时代的音乐品位,它更代表了这个时代的人对音乐的独特思维。而且音乐是最能表达一个时代的人民的情感。无
位于长白山下、松花江两岸的吉林省,以其半是高山大川、半是旷野平原的独特自然景观著称于世,传唱在这块黑土地上的民间歌谣——吉林民间歌谣,作为祖国歌谣大家庭中的一颗熠
文献的语言风格是作者在语言运用方面的思维定势的体现,对于文献之间语言风格的差异,以前的研究大多采用定性分析的方式加以比较和概括,而在文献检索和文本分类领域需要得到