基于语义理解注意力神经网络的多元特征融合中文文本分类

来源 :电子与信息学报 | 被引量 : 49次 | 上传用户:shengyu0128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文本分类模型(3CLA)。模型首先通过文本预处理将中文文本分词、向量化。然后,通过嵌入层分别经过CNN通路、LSTM通路和注意力算法模型通路以提取不同层次、具有不同特点的文本特征。最终,文本特征经融合层融合后,由softmax分类器进行分类。基于中文语料进行了文本分类实验。实
其他文献
目的了解末梢血作血小板计数时新旧抗凝管对其结果的影响.方法应用全自动血细胞分析仪对同一组血样的新、旧抗凝管血小板计数分析,经统计处理.结果两者比较新、旧抗凝管血小
患儿,女,10个月.营养欠佳,体重仅8.5Kg,右腰部包块8个月.家长诉该患儿出生后2个月时,右腰部在哭闹、排便时出现一个无痛性鸡蛋大小包块,休息时便如常人.父母外出打工,未行治
在建设市场中,其核心竞争力是价格,所以说每一个建筑单位的商业投标书占据了投标文件的关键位置。可以说,建设单位投标报价的合理性和科学性是标得项目的首要条件,也是确保施
为研究高速公路高填方路基施工技术,针对高填方路基填筑质量控制指标进行分析,提出质量控制措施,结合实际工程介绍强夯法与冲击法施工工艺,并对采用该两种方法填筑的高填方路
分析了组建局域网系统和日常运行中常见问题,并给出解决问题的方法.
眼下新《红楼梦》正在播出,褒贬不一,现选刊本社社长兼总编、红楼管理研究专家刘丽君的畅销书《刘丽君点评红楼职场“八金钗”》,以飨读者。 Now the new “Dream of Red Ma
本文从选线的原则、选线需搜集的基础资料等角度,论述了长距离输煤管道线路的选线方法.