融合主题模型的在线可比度计算研究

来源 :现代信息科技 | 被引量 : 0次 | 上传用户:eric7272
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线挖掘可比语料是构建大规模可比语料库的可行途径之一,在线可比度计算是语料挖掘过程中的关键环节。本文提出一种融合词汇重合度和主题模型的在线可比度计算方式,主题模型选择能够进行在线学习的Online LDA,利用词对齐工具GIZA++进行主题映射,融合方式为加权求和。在下载的中英新闻语料上的测试结果表明,两种计算方式融合后的准确性比两种都要高。
其他文献
随着经济的发展和进步,信息技术的使用给现代教育带来了前所未有的变化.在我国中等职业教育中,开展英语教学的主要方式是课堂上课和课外资料学习.在目前的一些创新教育模式中
张江高科技园区已经走过了19年的开发历程,从一片阡陌农田发展成为拥有6000余家注册企业、20余万从业人员、经营总收入超1556亿元、税收近110亿的国内外知名高科技园区,正逐步
随着社会物质文明的提高,人们不断追求生活质量的提高,健康保健意识越来越强。创建和谐社会,珍爱生命,关爱生命,生命离不开水。可地表水污染严重,威胁饮水安全,绿色天然矿泉水就越显
在视频监控场景中,由于车辆自身外观的多样性和相似性以及无约束的监控环境,以致很难通过全局外观特征区分不同的车辆目标。与全局外观特征相比较,局部区域特征更具区分能力。同时,为了兼顾算法的速度,本文提出一种基于区域与全局融合特征的以图搜车算法。该算法分为三个阶段:首先,以车辆IDs作为标签信息,训练一个车辆的全局特征网络;其次,加入局部区域特征网络,进而联合训练局部区域特征与全局特征网络;在推理阶段,