基于Bi-LSTM的维吾尔语人称代词指代消解

来源 :电子学报 | 被引量 : 0次 | 上传用户:auzjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LSTM的输入,挖掘维吾尔语隐含的上下文语义层面特征;其次对维吾尔语人称代词指代现象进行探索,提取针对人称代词指代研究的24个hand-crafted特征;然后利用多层感知器(multilayer perception,MLP)融合Bi-LSTM学习到的上下文语义层面特征与hand-crafted特征;最后使用融合的两类特征训练softmax分类器完成维吾尔语人称代词指代消解任务.实验结果表明,充分利用两类特征的优势,维吾尔语人称代词指代消解的F1值达到76.86%.实验验证了Bi-LSTM与单向LSTM、浅层机器学习算法的SVM和ANN相比更具备挖掘隐含上下文深层语义信息的能力,而hand-crafted层面特征的引入,则有效提高指代消解性能.
其他文献
<正>一、案例基本情况介绍项目地块位于深圳市宝安区大浪街道南侧和平路与布龙公路交汇处,东近龙华街道,南接民治街道,西邻羊台山。项目总用地面积为89401平方米,分车辆段平
会议
<正>中国免疫学会血液免疫专业分会经批准于2001年10月成立。北京大学血液病研究所著名专家王德炳教授任主任委员,郭峰、邵宗鸿教授任副主任委员。学会定于2011年10月底在广
摘要:钢铁行业是我国经济的支柱产业,钢铁工业产值占GDP比重超过10%。同时,钢铁行业作为一个原材料生产和加工部门,处于产业链中间位置,行业的波动对其上下游以及经济波动产生重要
非遗是劳动人民生活、生产实践的积累和结晶,反映了特定时期和区域内人类生产生活的方式和精神状态,具有重要的历史认识价值、文化精神价值、社会经济价值和艺术审美价值。因
目的:从人参根中分离纯化人参糖肽组分P-Ⅱ并研究其理化性质。方法:首先采用50%乙醇提取,高浓度乙醇沉淀,活性炭脱色得到人参糖肽,经DEAE-Sepharose CL-6B柱分离,依次用0.2,0
目的对比分析腹腔镜手术与传统手术在消化道肿瘤切除中的临床效果。方法选取80例消化道肿瘤患者为研究对象,利用随机数字表法将患者随机分为观察组和对照组,每组40例。对照组
《骑桶者》是人教版高中语文选修课教材《外国小说欣赏》的一篇课文,本课属于“虚构”话题单元课文,教材打破传统小说“三要素”的解读方式,将“叙述”“虚构”等新鲜概念引
卡塞格伦(Cassegrain)及类卡塞格伦式光学镜头在光电装备中应用广泛.为了研究具备卡塞格伦式光学镜头的光电装备所特有的猫眼效应特性,采用ZEMAX光学设计分析软件建立了卡塞
本文系统分析和总结了国际研发税收优惠政策在激励对象、研发活动界定、研发支出范围和管理制度等方面的特点和变化,在此基础上,提出了我国研发费用加计扣除政策的完善方向。
近日,国务院总理李克强主持国务院常务会议,决定完善农村及偏远地区宽带电信普遍服务补偿机制,缩小城乡数字鸿沟;加快发展农村电商,通过壮大新业态促消费惠民生,力争到2020年使宽带
报纸