基于双向长短时记忆单元和卷积神经网络的多语种文本分类方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:maygrass
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对日渐丰富的多语种文本数据,为了实现对同一类别体系下不同语种的文本分类,充分发挥多语种文本信息的价值,提出一种结合双向长短时记忆单元和卷积神经网络的多语种文本分类模型BiLSTM-CNN模型。针对每个语种,利用双向长短时记忆神经网络提取文本特征,并引入卷积神经网络进行特征优化,获得各语种更深层次的文本表示,最后将各语种的文本表示级联输入到softmax函数预测类别。在中英朝科技文献平行数据集上进行了实验验证,结果表明,该方法相比于基准方法分类正确率提高了4%,且对任一语种文本均能正确分类,具有良好的扩展
其他文献
超分子化学(主客体化学)是当今化学领域研究新的发展方向之一,其中主体对客体的分子识别与包络和分子间的弱相互作用是主客体化学研究的核心内容。近年来,葫芦脲逐渐成为主客
析泰国金融开放与泰铢危机的关系许少强一、前言毫无疑问,导致1997年7月泰铢危机最重要的原因之一在于该国的金融开放。尽管如此,我们也应该看到:第一,泰国90年代前期的金融开放有着较坚
2002年底中国开始对电力产业进行拆分重组,在发电领域引入竞争,"厂网分开,竞价上网",改变了原来的电力产业市场结构。在竞争与规制并存的历史背景下,以"R-SCP"理论分析框架为
【正】 学生解决问题,并不一帆风顺。有时,在无效尝试之后,会突然出现“灵感”,一个仿佛偶然的思想在心里瞬时冒了出来,问题便不知起因地得到了解决。苏联心理学家克鲁捷茨基
在复杂海洋环境航行中,对航迹的准确预测是保障舰船安全、有效航行的重要基础。提出一种基于长短记忆网络模型的舰船航迹预测方法,该方法利用历史时刻舰船运动状态序列预测未
我国养老保险基金入市投资运营的迫切性已毋庸置疑。从养老保险基金运营的诸多制度因素及其缺陷的角度,结合国情,分析制约我国养老保险基金入市投资运营的障碍,其中包括筹资
建立了测定沉积物中全硫的艾士卡熔融-离子色谱法。以艾士卡试剂为熔融剂,将沉积物样品在马弗炉中于850℃灼烧2h,使各种形态的硫全部转化为硫酸根离子,用离子色谱法测定提取
<正> 国内文学评论家在对莎士比亚评论时,都承认“他既反对封建,又超出资产阶级思想范畴,反对资产阶级。”但在具体论述中对他在这方面的功绩却不够重视。事实上,在早期莎剧
目的探讨中医盒灸联合熏蒸对脑卒中后肢体障碍患者运动功能及日常生活活动能力的影响。方法 106例脑卒中后肢体障碍患者,随机分为观察组和对照组,各53例。对照组在常规护理基
对庆阳市鲜食玉米生产现状、加工、存在问题等方面进行简述,结合本地鲜食玉米生产实际,提出了加大政府支持、选择优良品种、标准化栽培、应用高效种植模式、适时收获、保鲜贮