短文本相关论文
互联网的蓬勃发展带来了海量的文本内容,分析和归纳这些文本内容是常见的任务。其中,主题模型是一种分析文本内容的常用方法。这类......
无监督机器学习方法中的神经主题模型已被广泛用于自动挖掘文本潜在语义。然而,短文本篇幅有限,文中可用于推断的信息匮乏,模型难以在......
随着互联网技术的普及,各种网络社交平台、电子商务平台快速兴起,越来越多的人在网络上发表自己的意见和看法。这些内容包括对社会......
从CNN、RNN、CNN-RNN、GCN及其他深度学习方法五个方面,全面分析了其在短文本分类应用中的研究现状,比较了各自的优缺点,总结了常用的......
随着社交媒体的发展,用户产生内容(UGC)成爆发式增长,这些带有特定情感信息的内容大部分都以短文本的形式出现,主要是用户对于事物或......
随着大数据时代的来临,互联网进入人们的生活。信息与数据也是以各种各样的形式出现:语音、视频、图像和文本等。在这些数据形式中......
随着互联网的快速发展,各类社交平台为互联网人群提供对某领域或者主题发表个人倾向观点的渠道,而这些社交平台对文本长度有一定限......
随着互联网的发展以及移动设备的普及,用户对社交网络的依赖与日俱增。微博作为国内最大社交平台之一,大量基于微博的研究应运而生......
近年来,伴随着人们在互联网平台上越来越多的中文信息日常交流、获取和存储,互联网上同时出现了大量的不规范的短文本信息,这些短......
技术是指通过模型与算法将一段原始文本提炼为简短的概要。短文本摘要生成技术在网络评论的观点提炼、短文本信息压缩等方面有着广......
随着网络的不断发展,互联网应用层出不穷,日益增加的用户让互联网逐渐成为了资源丰富的数据库。本文针对大量的互联网数据,提出了......
中文短文本分类中存在大量低频词,利用好低频词中的信息能有效提高文本分类效果,针对基于词向量的文本分类研究中低频词不能被有效......
随着如今海量的直播视频数据产生,从长视频提取出精彩短片段的需求也愈发迫切。但目前,提取精彩片段的多数解决方案仍是通过人工筛......
短文本语义相似度计算为自然语言处理领域的一项关键技术,并且已在智能客服问答、自然语言推理、文本信息检索及自动阅卷等领域有......
中文短文本分类最重要的是提取和表示短文本特征,传统的表示方法静态训练词向量,存在特征稀疏、语义不足等问题,对此提出一种基于......
听力教学是初中英语教学中的重要一环,短听力文本的教学更是不容忽视.本文阐明了短听力文本活动的设置目的 ,并以外研版初中《英语......
随着移动网络和APPs的发展,包含用户评价、标记、打分、图像和视频等多源异构数据的用户生成内容(User Generated Contents,UGC)成......
为了有效提高客服效率与主动服务意识,从电力短文本中挖掘客户的情感状态,提出了一种基于迁移学习的情感分析方法,将具有丰富标注......
随着信息技术迅速发展和通讯手段的多样化,人们之间相互交流所产生的邮件、BBS论坛、即时消息等短文本在网络信息流中的地位日益突......
[背景]短文本自动生成技术的研究对阅读与写作效率的提升、传播与引导影响力提升、智能人机交互满意度和机器语义理解能力的提升等......
微博已经成为当今社会新一代的重要媒体,几乎现实社会中的事件都会在微博中形成讨论,并进一步酝酿发酵,进而影响到现实中的社会事......
近年来,Twitter、新浪微博等社交媒体产生的海量短文本形成了巨大的信息资源,同时也造成了严重的信息过载问题。自动摘要技术能从海......
随着互联网技术的蓬勃发展和相关应用的迅速普及,尤其随着Web2.0技术的发展,每个人不再仅仅是信息的消费者,更是信息的生产者,网民可以......
命名实体识别技术对机器自动翻译、问答系统、搜索引擎、信息抽取和文本分类等有重要作用。由于中文内在的特殊性质,识别难度大于英......
随着信息技术的不断发展,人们每天都会面对超过自身接受范围的信息量。因此对文本进行主题分类,并为人们推送特定的信息就成了一个......
处于信息大爆炸时代的现代信息社会,大量的短文本正以迅猛的势头闯进了人们的生活中。短文本的形式有很多,比如,email,微博,手机短......
微博作为现如今传播最广、渗透最深的富信息类社会化媒体与社交工具,让个人和企业都能够即时提出观点、发表意见。相比传统的信息获......
随着互联网对生活的影响不断增加,人们面临着越来越汹涌的网络数据洪流的冲击,这股数据洪流中占比最大的就是文本数据。如何处理海量......
随着互联网技术的飞速发展,如今的网络在线数据以短文本的形式呈爆炸性趋势增长。话题检测与跟踪技术就是为了应对日益严重的互联......
自从互联网开始普及,人们就身处在一个信息爆炸的时代,人们对待生活、工作的思维方式开始逐渐在改变。在Web2.0的UGC(User Generated......
互联网和手机的广泛普及使人们越来越依赖于这些媒介提供的信息,而这类信息大部分是以短文本形式存放的,因此人们对短文本过滤技术要......
随着互联网的高速发展,快餐文化越来越普及。互联网上大量的信息越来越多的以短文本的形式出现,搜索引擎的返回结果和微博等都是这......
随着互联网的不断发展,在网络上产生了大量的短文本数据,这些数据涉及了人们生活的方方面面,并且这些数据包含着大量有价值的知识......
随着信息技术的飞速发展,越来越丰富的信息传播方式出现并影响着人们的生活。短文本是指长度较短(通常少于160个字)的文本,它通常以......
短文本通常指文本长度小于160个字符,一般以手机短信、网页评论、网络聊天信息等形式存在的文本。短文本的热点话题识别问题是短文......
随着通信网络的发展,手机短信、网络聊天以及新兴的信息形式微博等短文本发生了爆炸式的增长,使得它们在网络信息流中占有越来越重要......
随着互联网和通讯产业的快速发展,各种形式的信息扑面而来。而短文本(通常文本长度小于160字符)作为手机短信息、在线即时聊天记录、......
近年来,越来越多的以短文本(通常文本长度小于160字符)形式存在的信息逐渐成为了人们获取消息的主要途径之一,如:微信,微博,网络评论,网络......
随着网络的普及和日趋丰富的社交软件的出现,网络作为一个新起的舆论方式已深入人们的日常生活。舆情分析任务涉及分词、聚类、情感......
传统的主题模型更适用于内容丰富的文本,而短文本上下文信息不足,因此从短文本中提取主题成为理解流媒体信息的一项重要且具挑战性......