分布式表示相关论文
随着互联网的快速发展,数据量爆炸性的增加,人们对搜索的精准性和智能化的需求日益增长,知识图谱的兴起拉开了智能信息检索从字符......
近年来词的分布式表示与组合模型在自然语言处理领域中取得了诸多突破性的成果。词的分布式表示使用实值向量对词进行建模,可以从......
文本表示研究是自然语言处理领域基础的研究课题之一。词是文本中基本的语义单元,传统的词表示方法无法全面反映其所蕴含的语义信......
在自然语言处理领域中,词和句子是最基本的表示单位。词是一种抽象的表示方法,往往包含多种含义,不同词间的关系也各不相同。句子......
随着互联网的发展,世界各地人们之间的距离正在被逐渐拉近,但语言不通的问题却作为一个主要因素阻碍了不同地区人们之间的沟通交流......
据统计,每天都有数以万计新的学术文章出版,如此庞大的文献数量导致信息过载问题日益突出。引文推荐,作为克服这一困难的重要解决......
随着金融市场参与者的大幅增加和金融衍生品的不断演化,金融市场结构愈发复杂多变,对市场稳定和发展提出了新的挑战和机遇。特别是......
互联网已经成为人们获取各类信息的重要来源。然而,急剧增长的互联网信息也给人们带来了信息过载问题的困扰。作为一种能够解决信......
自然语言处理是人工智能研究的核心领域之一。在自然语言处理中,阅读理解技术的发展进步对于处于信息时代的人们准确获取所需信息......
随着人工智能逐渐迈向认知智能,知识图谱已经成为当今大数据时代一种重要的知识表示和组织形式,被广泛应用在智能搜索、问答系统以......
为了学习非结构化文本与对应的结构化语义知识之间的嵌入语义对应关系,本文提出了一种用于自然语言理解(Natural Language Underst......
范畴标注是组合范畴语法解析中的子任务之一,可用于提高解析器的效率和性能.传统的最大熵模型需要手工定义特征模板,神经网络则通过隐......
提出基于双语合成语义的翻译相似度模型,通过在翻译过程中引入双语语义相似度特征提高翻译性能。首先利用分布式方法分别在源端和......
在互联网中存储了大量的网络表格数据,这些网络表格蕴含丰富的语义信息,但表中数据通常存在不一致性,这种由数据不一致性导致的错......
知识图谱(Knowledge Graphs)描述现实世界中实体(entity)及其间的关系(relation),成为了很多智能应用的基础。自2012年谷歌公司提......
知识图谱补全算法能让知识图谱变得更加完整,目前是人工智能领域的一个研究热点。为了更好地给出补全算法综述,文章按照能否处理新......
针对新闻文本领域,该文提出一种基于查询的自动文本摘要技术,更加有针对性地满足用户信息需求。根据句子的TF-IDF、与查询句的相似......
词汇语义表示是自然语言理解的基础。传统的基于语义词典的编码表示构建成本高昂,而独热表示又存在高维稀疏等缺点。词汇的分布式......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
随着社会的发展和科技的进步,人们交流的内容与方式发生着翻天覆地的变化,交流所使用的词汇和语义也发生了显著变化。在过去的研究......
该文收集了自晚清到21世纪间长达144年的连续历时报刊语料,通过统计分析和词语分布式表示两类方法展开研究,计算并辅助识别汉语词......
近年来,随着互联网技术和应用模式的迅猛发展,引发了互联网数据规模的爆炸式增长,其中包含大量有价值的知识.如何组织和表达这些知......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
【目的/意义】词是语言的最小单元,词的向量表示决定了机器学习模型的构建方法。深度学习的神经网络训练得到的词向量,通过无监督......
随着图书馆日常工作的数字化和自动化推进,图书馆书目数量以指数级水平增加,利用人工手段解决书目的分类工作已经变得力不从心,将......
篇章连贯性建模是自然语言处理研究领域的一个基础问题。主流的篇章连贯性模型分为两大类,分别是基于实体网格的连贯性模型和基于......
随着互联网的飞速发展,社交网络平台成为了人们表达观点、发表评论的重要场所,而以微博为代表的社交网络平台每天都能够产生海量数......
人们构建的知识库通常被表示为网络形式,节点代表实体,连边代表实体间的关系.在网络表示形式下,人们需要设计专门的图算法存储和利......
短文本的分布式表示已经成为文本数据挖掘的一项重要任务.然而,直接应用分布式表示模型Paragraph Vector尚有不足,其根本原因是其......
随着Web2.0时代的到来,飞速发展的互联网极大地改变了人们表达意见、抒发情感的方式和途径,微博、论坛等社交平台不断涌现,人们逐......
针对自驾车游客加油轨迹稀疏,还原真实旅游路线困难的问题,提出一种基于语义表示的稀疏轨迹聚类算法,用以挖掘流行的自驾车旅游路......
本文的研究课题为跨语言文本分类,第一章首先介绍了该任务的来源、背景与意义,并总结了目前学术界对于该任务的研究现状,尤其是基......
深度学习是一类新兴的多层神经网络学习算法。介绍自然语言处理中采用深度学习的动机及主要的神经网络语言模型。在此基础上,学习......
知识图谱以形如(实体1,关系,实体2)这样的三元组的形式存储结构化数据,成为了很多智能应用的基础。众多的知识图谱,如Freebase、DB......
知识图谱是由节点和边组成的巨型语义网,以大规模图的形式表示不同节点之间的语义关联。知识图谱作为现实世界中多领域数据的结构......
引文推荐方法的主要任务是帮助研究者自动并有效地发现与研究者查询信息相关的文献列表。随着大量研究论文的发表,为研究者快速而......
针对信息网络(text-based information network)现有研究多基于网络自身信息建模,受限于任务语料规模,只使用任务相关文本进行建模......
RBC(Raidio Block Center,无线闭塞中心)是CTCS-3级列控系统的地面设备,是保证列车高速安全运行的核心设备之一。其发生故障可能影......