空间向量模型相关论文
针对数据驱动网络加密性能较差,攻击检测率较低的问题,设计基于云计算的数据驱动网络安全防御技术。基于数据驱动网络的数据捕捉模型......
阐述了基于空间向量模型的分类方法,包括VSM的产生和发展及其内在原理,利用VSM进行分类的基本过程以及影响分类准确率的一些因素......
本文首先基于类别概念,讨论了文本自动分类中文档类别间的关系,在此基础上对文本自动分类的定义进行补充说明,并讨论了文本自动分类中......
近些年来,许多研究机构都在加大信息过滤、信息分类等方面的研究力度。尤其在信息安全问题日益凸显的今天,我国的信息安全战略也在......
在互联网信息急剧增长的今天,搜索引擎已经成为人们从互联网上检索信息的重要工具。但是,随着行业细化不断深入,不同专业领域的搜索需......
随着互联网信息,尤其是文本信息的爆炸式增长,如何让用户高效地获取最重要或者说最需要的信息已经成为学术界备受重视的问题。以Web ......
近年来,随着互联网技术的不断快速发展,网络中的数据量日益庞大,大多数是以文本的形式存在的。如何有效处理这些海量数据,从中发现......
该文通过在对多种常用的文本特征项的权重计算方法的分析后,归纳分析得出决定权重的若干因子,并据此假设出一种方法,并应用了文本......
本文的工作主要集中在基于语义的文本相似度计算技术研究上。本文根据自然语言的特点,提出了通过比较两个文本关键语义对来......
Internet的迅速发展给人们带来诸多方便的同时,也带来了诸如信息过载、信息迷向、不良信息充斥网上等等很多问题,信息过滤应运而生。......
随着互联网络的发展,Web页面的数量激增,人们需要对大量的文本资源进行有效的组织,以有利于信息检索、模式发现、为用户提供推荐服务,......
本文主要从文本预处理和文本聚类两方面较为系统的研究了中文文本聚类的全过程。首先介绍了文本聚类关键技术的基本现状,让读者对......
随着网络信息的海量增长,从海量文本中提取摘要成为自然语言处理研究的热点课题。半个多世纪以来,学者从不同角度出发,提出不同的解决......
命名实体关系是构建语义网络、本体和语义Web的基础,并且广泛应用于信息检索、机器翻译以及自动问答等系统中。在命名实体关系抽取......
随着Web搜索日益被人们接受和使用,关键字查询成为了查询文档和网页的最简单、最流行的信息检索技术。由于应用需求的推动,关系数......
随着互联网信息的日益增长,通用搜索引擎已经无法满足用户对于特定领域信息的查询需求。搜索引擎正在向个性化、主题化、智能化发......
药物重定位旨在为已有药物寻找其新的适应症。药物重定位比起传统药物开发流程,能够显著减少时间与经费投入。随着生物信息学的迅......
网络购物凭借物品丰富多样、方便快捷、价格低廉的特点几乎融入在每个人生活的方方面面。网络购物平台的订单量日益激增,这背后需......
通过现有的地表覆盖数据及信息服务平台,用户能够获取直观的空间分布与时空变化等信息,但对于其分布特征、地域规律、变化成因、发......
如今大数据时代的每一天都会产生大量的数据,当今人们感觉最为强烈的就是社会媒体数据的爆炸增长,比如我们日常涉及的Web新闻、微......
随着嵌入式应用以及微电子技术的快速发展,无线传感器网络技术应用越来越广泛(Wireless Sensor Network,以下统称WSN),由于WSN一般......
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇.本文通过采用跨语言词相似度计算将单语广义向量空间模型(Ge......
本文从根据内容检索应解决的两个基本问题(如何表示内容和如何定义相似尺度)入手,着重讨论了信息检索中解决这两个基本问题的方法,......
数字图书馆的出现,对传统图书馆带来很大的影响,如在信息的存储、信息的组织和管理上。而更应该引起重视的是数字图书馆对信息服务......
看电影是人们日常休闲必备的重要活动,如今电影行业发展地如火如荼,电影数量也急剧增加。互联网的迅猛发展虽然给人们获取信息带来......
专家信息的挖掘对建立全国性的专家信息服务平台尤为重要。论文通过对专家所发表的论文,承担的课题等非结构化数据进行挖掘,来自动......
科学有效的网络舆情管理是政府执政能力的体现,面对网络舆情知识需求的多样性,对知识源进行有效的整合能为政府组织应对知识提供技......
带拥挤距离排挤机制的非支配排序遗传算法(NSGA-Ⅱ)在多目标优化领域具有广泛的应用,NSGA-Ⅱ箕法具有个体分布不均匀以及重复个体......
针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。在基......
向量空间模型是一种以查询Q和文档集合{D1,D2…,Dn}为处理对象的算法,通过这种算法计算出这个查询的相似度SC(Q,Di)以及每篇文档Di(1≤i≤......
在受限领域自动应答系统(RDAQAS)中,以"知网"和领域本体库为基础,计算目标问句和问句语料库中问句的相似度,从中寻找最相近问句,最......
针对主题搜索引擎反馈信息主题相关度低的问题,提出了将遗传算法与基于内容的空间向量模型相结合的搜索策略。利用空间向量模型确定......
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。本文提出了一种基于本体的信息检索查询扩展方法......
为了消除自然语言对构件文本信息描述的二义性以及增强术语间的语义关系,文中采用领域本体的思想,给出了一个基于人工智能领域本体的......
针对目前蛋白质提取方法仅以单句信息为依据的不足,文中提出了以相似性为框架基于大规模文本的蛋白质交互关系识别方法。首先通过......
在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺......
较高的参保率是养老保险制度充分发挥作用的重要基础。与以往文献研究视角不同的是,本文对我国城镇职工基本养老保险参保率的影响因......
针对目前蛋白质交互关系识别主要以单句为依据、因标注数据缺乏而导致训练集规模小等不足,提出一种以关系相似性分析为框架、基于......
研究信息自动获取系统中语义集成的实现方法. 此基础上, 提出了基于词典的语义扩充和基于空间向量模型语义的算法实现.......
利用交叉分类机制共享因特网上各种语言的信息资源是知识挖掘的重要方法,本文给出了双语交叉分类的模型以及实现方法.其主要思想是......
关联性视频点播系统中的视频存在一定的关联性,用户会以极大的概率去观看与其当前观看视频相关联且相似度较大的视频。考虑到这一......
目的构造一种新的文本查重算法,改变传统的Shingling网页去重算法,提高文本的相似度计算率,提高查准率和查全率.方法改变传统的Shi......
为了能够实现对信息检索中的文本分类策略,采用了空间模型算法,做了实验文档测试,获得了各自的权重文档搜索结果,得到在检索过程中,向量......
摘 要:通过计算机实现对文本主题合理提取、组合的过程,很多学者对此有着不同的研究。通过空间向量模型、文本聚类、遗传算去等成熟......
首先,给出了主题爬虫的概念;然后介绍了主题相关度计算的两种模型:布尔模型和空间向量模型;通过对两种模型进行分析,提出了一种基于网页......