短文本相似度相关论文
针对短文本相似度计算中无法充分利用文本中不同部分的不同重要性且较少考虑句法信息而导致准确率较低的问题,提出一种融合注意力......
钢铁冶金工业中,运维检修工作是保障各类设备正常运行的基础,知识库是提高设备运维管理效率的有效途径。钢铁企业通过构建运维知识......
近年来,在智能教育相关政策的强力驱动下,主观题自动评分算法的研究在“人工智能+教育”的背景下具有实用价值和重要意义。算法能......
人类已经进入信息时代,随着互联网的快速发展,网络上的信息呈几何指数增长。然而,面对不断膨胀的海量资源,人们却很难找到需要的信息。......
在网络信息时代,随着通信技术的不断发展,即时通信得到了广泛应用,产生了巨大的短消息数据,短消息数据中蕴藏了大量有用信息资源,如何对......
随着互联网技术的发展,特别是移动互联网的兴起,信息爆炸进一步加剧,同时,信息传播出现了由系统化向碎片化过渡的倾向。短文本泛指......
短文本相似度研究是文本分类下的一个分支,它在智能问答、信息检索等任务中起着基础性作用,具有一定的研究价值。传统的文本相似度......
社交媒体是拥有众多用户参与的新型在线媒体,近年来以推特为代表的社交媒体网站吸引了数以亿计的用户,现实社会中所发生的重大突发......
短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值。本文提出了BERT_BLSTM_TCNN模型,该......
传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低。结合短文本特征稀疏的特性,提出一种多重检验加权融合的短......
在基于知识的问答系统中,问句中的知识谓词信息分析结果将会对知识元组的整体匹配效果产生影响。中文短问句中的知识谓词的信息表......
传统文本表示方法通常基于词袋模型,而词袋模型是基于文本中词项之间是相互独立的假设.最近也提出一些通过词共现来获取词项之间关......
伴随着移动互联的快速发展,越来越多的像微博,微信,短信等短文本信息开始充斥着人们的日常生活。在推荐,舆情等方面,短文本信息的......
全面丰富的兴趣点(Point of Interest,POI)数据直接影响着地图App厂商的地理位置服务。针对传统的POI数据采集与上线方式周期长、......
现有近似邻居集选取方法存在分类较粗、标签缺失等问题,在移动服务方面无法取得较好的效果。为此,提出一种有效的近似邻居集选取方......
随着互联网和人工智能技术的发展,产生了越来越多的短文本数据,人们对文本处理技术有着迫切需求,如在智能问答、信息检索等领域。......
针对基于语义的短文本相似度计算方法在短文本分类中准确率较低这一问题,提出了结合词性的短文本相似度算法(GCSSA)。该方法在基于......
短文本是互联网中常见的内容形式,如社交媒体文本、广告关键字、观点评论、网页标题、搜索查询等。社交媒体的短文本在线聚类是指......
随着时间的推进和网络技术的发展,一方面,人们的认知行为习惯在悄然发生变化,由早期的看书、读报纸演变成现在广泛利用社会媒体进......
随着互联网的迅速发展和Web 2.0概念的提出,问答(Question Answering)系统逐渐成为一种新的信息检索技术。和传统的搜索引擎返回大......
随着因特网和各种移动终端的发展,计算机对各种文本类信息处理的重要性日益凸显。短信、微博、电子商务的普及更使得用简短的文字......
为提高中文短文本相似度计算的准确率,提出一种新的基于混合策略的中文短文本相似度计算方法。首先,根据词语的语义距离,利用层次......
近年来,LDA(Latent Dirichlet Allocation)主题模型通过挖掘文本的潜在语义主题进行文本表示,为短文本的相似度计算提供了新思路。......
社交媒体平台,如微博、推特等,以其操作便利性、信息共享性、用户互动性、话题丰富性以及更新即时性等特征,吸引着大量的用户在平......