基于属性网络语义表示的文本表示算法

来源 :新一代信息技术 | 被引量 : 0次 | 上传用户:hhlovels
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络表示学习、主题模型以及词向量将文本或文本中的词表示成低维的向量,三者之间相互促进缺一不可.CLM(Collaboratively Improving Topic Discovery and Word Embeddings by Coordinating Global and Local Contexts)算法基于主题表示和词嵌入表示文本,忽略了文本之间的链接关系.为了提高文本表示的效果,提出了融合语义和网络结构的文本表示算法,利用非负矩阵分解方法将网络表示、主题表示和词嵌入三者进行融合,形成统一的框架,共同地进行文本表示.将表示好的文本分别在聚类和分类算法上进行比较,实验结果表明改进后的算法在准确率和NMI值都优于原算法,文本表示的效果有了一定的提升.
其他文献
为了高效求解KPC问题,通过结合具有不同编码结构的S-HBDE和ETDE两种进化算子,提出了一个具有编码复用的离散混合差分进化算法DHDE.首先,在单种群中利用具有(n+1)维空间的ETDE
对于医疗诊断领域传统机器学习分类算法效果不理想的情况,引入深度森林算法,应用于乳腺癌肿瘤的分类问题.该算法使用随机抽样方式对乳腺癌原始特征进行变换增强其特征表征能
电能是当今人类社会各项活动的重要能源基础,而电能在传输的过程中不可避免的会产生一定损耗,称之为线损。线损以损失电量的多少来表示,以损失电量占供电量的百分比来衡量即为线
随着国有企业改革的不断深入,国企也将会面对更多的挑战,特别是规模不大的中小型国有企业,生存和发展成为了这类企业当前面临的重要问题。在人力资源管理体系本来就不够完善的中