词共现相关论文
在互联网飞速发展的当今社会,社交媒体平台已经成为了人们日常生活中的“聚集地”。人们可以时时地在平台上抒发自己对某人、某物......
本文提出了基于词共现和语义分析的网络百科开放分类聚类算法、开放分类层次结构树生成方法以及层次结构树聚类算法。实验结果表明......
基于共词分析技术,结合《中文医学主题词表》(CMeSH)和中国生物医学文献数据库(CBM)自身特点,提出基于主题词共现构建全新中文医学......
随着互联网技术的迅速发展,网上信息飞速增长。如何从这些海量信息中检索出所需要的相关信息已成为一个非常重要的研究课题。而由......
针对文本分类任务中标注数量少的问题,提出了一种基于词共现与图卷积相结合的半监督文本分类方法。模型使用词共现方法统计语料库......
社会网络分析方法为学科、领域综述性研究提供了一个新的研究方法,通过构建媒介素养研究的关键词共现网络,并运用社会网络分析方法......
[目的/意义]从海量微博信息中提取准确的主题词,以期为政府和企业进行舆情分析提供有价值的参考.[方法/过程]通过分析传统微博主题......
以CNKI数据库为数据来源,检索题名中既含有"云计算"又含有的"图书馆"的文献,并把这些文献视为研究对象.通过两种方法实施可视化分......
本文利用文献计量方法对近30年来汉语主题词表研究论文进行统计,通过关键词共现研究汉语主题词表的研究热点,利用社会网络分析方......
针对某政府网站某一时间段的服务器日志中抽取出的搜索引擎查询信息,提出若干标准来遴选出有代表性的核心查询词,并分别针对每个......
为了有效挖掘大量教育信息化网络文档中的热点信息,提出了应用关键词共现技术来揭示该关键词之间的关联与结合,进一步分析比较不同时......
随着数字资源的急剧增加,数字信息量越来越大,同时在激增数据背后,还隐藏着许多重要信息。这种情况下,如何保证用户能够有效的利用这些......
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务.在开放和虚拟网络环境下海......
本文搜集中国学术期刊网络出版总库中大量有关三山五园主题的数据,人工整理后,利用社会网络分析方法Ucinet,从关键词共现和著......
运用文献计量的方法对我国共词分析领域的相关文献进行多角度的定量和定性分析,分析了国内共词分析文献的作者合作情况、期刊分布等......
词汇是语言的重要组成部分,通常词与词联合起来才能发挥出它们的作用。词与词的经常性联合,就形成了词语的搭配。菲斯(Firth)认为“理......
针对文本挖掘中存在的特征空间高维性问题,提出了一种基于词聚类的文本特征描述方法,旨在通过机器学习的方法挖掘词汇之间的语义关......
为了实现从海量的船舶事故调查报告中自动提取出水上交通安全知识,提出了从词语和主题2个层面对船舶事故调查报告进行语义挖掘的方......
答案选择任务的精度对问答系统、文本处理等应用的效果具有重要的影响。针对答案选择模型问句与候选答案句语义信息和句子浅层特征......
针对文本挖掘中存在的特征空间高维性问题,提出了一种基于词聚类的文本特征描述方法,旨在通过机器学习的方法挖掘词汇之间的语义关联......
传统的话题发现研究主要针对于长文本及新闻数据集,大规模短文本具有稀疏、无结构、多噪等特点,传统方法很难有效发现话题。提出了......
文档表示模型是文本自动处理的基础,是将非结构化的文本数据转化为结构化数据的有效手段。然而,目前通用的空间向量模型(Vector Spa......
通过词频统计及词共现等方法,对2000—2011年中国重要报纸上有关民办高等教育的新闻报道在新闻数量、刊登载体、分类统计、主题分布......
利用CiteSpace对学科服务进行作者合作、机构合作和关键词共现等可视化分析并绘制科学知识图谱,理清我国学科服务的发展脉络和现状......
针对现有关键词提取算法存在计算复杂、语义信息挖掘较浅等问题,提出一种基于频繁模式挖掘的中文关键词提取算法.该算法采用改进的......
摘要:使用STU-DOM这种网页提取技术,在实际操作过程中,在对不含超级链接的网页噪音进行判断时,准确性较低,同时,这种技术也不能有效处理D......
在软件开发全生命周期中,需求跟踪在管理需求及其相关制品方面扮演着重要的角色.由于手工跟踪费时且易出错,一些基于信息检索(info......
论文以CNKI数据库近十年来收录的国内信息自由研究论文为研究对象,采用文献计量法、关键词共现等方法,分析了近十年来信息自由研究领......
查询词扩展要解决两个方面的问题:一是扩展词的来源,二是如何在来源集合里挑选扩展词项.对此,首先利用检索结果聚类和排序模型获取......
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出......
目前大多数文本自动分类系统都采用向量空间模型(VSM)来表示文档.针对常规的VSM文档表示方法不能反映概念的问题,文章对VSM进行了......
语义检索的关键技术就是语义扩展。文中利用基于带衰减因子的词共现模型计算公式来获得词与词之间相关性信息资源.从而给出了用于信......
为了克服传统主题词抽取算法中的主题漂移与主题误判等问题,提出了利用词的共现信息来提高主题词抽取的准确率。根据词汇与文本中......
通过技术预测的量化趋势演化模型,预测挥发性有机物(VOCs)的新技术和技术发展态势,从而为该领域提供技术路径方案。基于专业术语、......
提出了一种利用词共现技术自动构建概念图的方法,首先进行词条选择,并计算词条之间的关联强度生成关系矩阵;接着,从关系矩阵中挖掘......
文本主题是文本聚类的关键,而文档中共现词对对文档主题的表现力非常强。因此,在对现有文本主题挖掘和共现词对抽取算法深入研究的基......
关键词作为定义一篇文章主旨的重要元素,在文本处理、文档聚类、数据挖掘、新闻阅读、机器翻译、自动问答系统等多个方面都扮演着重......
研究了现有的关联分类算法在文本分类中的应用,发现对于有结构的文本数据,关联分类算法未考虑文本的语义信息导致分类精度不够理想,为......
针对查询扩展中局部分析方法查准率不高的缺点,提出一种新算法。该算法通过分析与用户查询密切相关的文档,从而得到与其相关的文档......
概念空间在信息组织和帮助用户表达信息需求方面起到了重要作用,但目前研究构建的概念空间主要是一般意义上的概念空间,即具有严格体......
基于关键词集的中文文本特征表示方法难以准确表示文本语义信息,从而导致聚类质量较差.为了解决这个问题,本文将本体论和词共现模......
为提高领域观点词的抽取效果,主要研究了词共现和词上下文对领域观点词抽取的影响。引入词上下文生成同义词词表的方法,使用词上下文......
针对文本检索中所使用的查询词可能与文本词语不匹配而影响检索效果这一问题,提出了一种基于上下文的查询词扩展的方法,该方法根据......
针对传统的信息检索方法采用基于关键词匹配的模式,导致查询效率低下的问题,利用同义词对查询术语进行扩展,提出了一种用于信息检索的......
提出并实现了一种带衰减因子的词共现模型,可以自动生成包含词与词相关性信息的资源.由于该模型考虑了词与词之间距离的概念,同普......
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结......