【摘 要】
:
针对现有双语词向量研究方法获取双语词向量需要用到大量双语平行文本,对于柬汉双语而言存在着平行文本不足的关键问题,而英语作为通用语言,英语-汉语以及英语-柬埔寨语双语
【机 构】
:
昆明理工大学信息工程与自动化学院,云南南天电子信息产业股份有限公司
【基金项目】
:
国家自然科学基金(No.61462055,No.61562049)
论文部分内容阅读
针对现有双语词向量研究方法获取双语词向量需要用到大量双语平行文本,对于柬汉双语而言存在着平行文本不足的关键问题,而英语作为通用语言,英语-汉语以及英语-柬埔寨语双语平行文本较多且容易获得,因此在典型相关分析跨语言词向量模型上作出进一步改进,提出以英语为中间语言的基于多重CCA算法的汉柬双语词向量构建方法。通过将英语、汉语词向量投影至汉-英向量空间,将英语、柬语词向量投影至柬-英向量空间,根据CCA算法分别得到英-汉、英-柬双语词向量;以英语作为中间词并结合部分实验室构建的柬汉双语电子词典将上一步得到的英-
其他文献
V2 Conference网络视频会议系统已经被政府、企业、军队、金融保险、教育科研、医疗医药、物流、零售等多个行业所应用。并且应用范围广泛,包括内部会议、对外沟通以及远程教
为了解决光缆网络快速发展而维护力量薄弱这一矛盾,有必要建立光缆监测系统,以便通过对光缆线路的实时监测,及时发现和处理线路故障.文章在简要介绍光缆监测系统的基本原理及
现有的视频烟雾检测方法大多通过运动检测提取疑似烟区,并依据经验手工设计提取烟雾特征,在复杂场景中检测准确率不高。针对以上问题,提出了一种基于时空双路3D残差卷积网络的视频烟雾检测方法,基于混合高斯背景模型与原始视频帧的小波低频分量差进行疑似烟区提取,其次构造时空双路3D残差卷积神经网络,并引入注意力机制加权融合烟雾时空域特征,实现端对端的烟雾识别。实验结果表明,该方法可以得到更为完整的疑似烟区,尤
基于身份的可搜索加密方案(IBEKS)使用身份等信息作为公钥,绑定了公钥和用户(私钥),省去了CA认证的环节,但是也带来了一些问题,比如密钥托管、密钥撤销等。基于此,首次提出无
建立算法优化后的中国国家能源年度消费总量Logistic模型,并以2003年至2010年中国国家能源消费年度统计数据为基础,对中国未来20年的能源消费情况进行研究和预测,2015年、2020年