基于标签语义相似的动态多标签文本分类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:elsie0709
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对标签随着时间变化的动态多标签文本分类问题,提出了一种基于标签语义相似的动态多标签文本分类算法。该算法在训练阶段,首先按照标签固定训练得到一个基于卷积神经网络的多标签文本分类器,然后以该分类器的倒数第二层的输出为文本的特征向量。由于该特征向量是在有标签训练得到的,因而相对于基于字符串即文本内容而言,该特征向量含有标签语义信息。在测试阶段,将测试文档输入训练阶段的多标签文本分类器获取相应的特征向量,然后计算相似性,同时乘以时间衰减因子修正,使得时间越近的文本具有较高的相似性。最后,采用最近邻算法分类。实验
其他文献
为满足电压源换流器高压直流输电(voltage source converter high voltage direct current,VSC-HVDC)装置可靠性及其试验方法和试验等效机制研究的需要,重点研究了该装置中绝
当前城市用地土地利用存在诸多问题.城市新区土地综合分析是保证城市新区土地开发走集约利用的一种关键手段.它的内容主要包括:城市新区选址研究、确定城市规划要点、投资经
科技的进步促使拥有众多优势的自动导引车(Automated Guided Vehicle,AGV)逐步替代人工搬运,随之产生的多AGV路径规划、协调问题也应运而生。针对上述问题,依据AGV行驶特征,
随着中国“新常态”模式的开启,以住依靠大规模投资拉动GDP快速增长的“老常态”发展模式的时代将一去不复返,取而代之的是更加注重整体平衡发展、从更深更广的程度提高生产效
介绍了自动浇注机的电气控制系统,尤其是关于SINAMIC S120在浇注机上的调试及应用。电控系统采用运动型PLC(CPU317T-2DP)控制SINAMICS S120,具有处理速度高、抗干扰能力强、性
艺术铸造是技术与艺术完美结合的产业,技术为保证艺术服务,核心是艺术。所以在生产过程中对型壳焙烧和浇铸必须严格控制就非常必要,本文重点谈谈自己工作实践中的一些观点和
人到老年,经常会有腰部、背部、关节疼痛的感觉。以下介绍十种自我按摩法,有利于防治老年人的腰痛。
多数基于FP-growth思想的频繁模式挖掘算法存在建树过程复杂、支持度计算繁琐的问题。针对这些问题,提出一种基于位编码链表(Bitmap-Code List,BC-List)的频繁项集挖掘算法(B
第二届广州国际铸造、压铸及锻压工业展览会已于2013年9月26日在广州保利世贸博览馆圆满落下帷幕。展会再次携手享负盛名的广州国际模具展览会(Asiamold2013),合共展出面积达20,0
目的调查1999年~2002年国家细菌耐药性监测网不同地区大肠埃希氏菌和肺炎克雷伯氏菌临床分离株的耐药性,比较不同来源菌株耐药率间的差别.方法药物敏感性试验采用纸片扩散法,W