基于分类的term重要性识别方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zeroii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的搜索引擎和信息检索中,用户Query中的term-weight通常是以一种上下文无关的方式得到的.现有的大多数信息检索技术都使用词袋方法,例如布尔模型、向量空间模型和概率模型等,这些方法均没有考虑Query中term之间的相关性.为了能够充分利用Query中的信息来提高term-weight的准确度,提出了一种有监督的机器学习方法来学习用户Query中的term-weight.该方法基于分类的方法,并引入了句法分析作为分类的一项重要的特征来训练模型.考虑用户Query中term之间的关系后,既避免
其他文献
一般来说,农机具的冬季停放时间较长,如不精心保管,忽视存放期的维护,机具停放期间的损坏,将会大大超过工作期间的损坏。为了延长机具使用寿命,存放期应注意以下七防。
图像低层视觉特征和高层语义间的“语义鸿沟”是图像检索的关键问题。为了进一步提高基于语义的图像检索系统工作效率,以分块权值和视觉词库为基础,结合图像低层特征和高层语义
为应对网络流量快速增长问题,提出一种基于通用多核平台的入侵检测系统结构。在系统设计基础上,分析、验证了硬件平台、资源分配模式和流量特征等关键因素对系统处理性能的影响
目的:分析内蒙古包头地区2016至2017年某医院病原菌分布特点,了解临床来源病原菌株的流行病学特征及耐药情况。方法:采用Phoenix TM-100全自动微生物鉴定及药敏系统、纸片扩散
采用连续时间马尔科夫链对有缓冲机制的认知系统进行建模和分析,针对过多的认知用户接入会导致业务中断的特点,设计算法控制认知用户的接入概率,在满足用户中断概率限制的前提下
互联网的高速发展使得通过网络传输的文件监控和过滤成为一个热门课题。使用传统的基于字符串匹配的算法显然无法满足呈几何爆炸级别的信息增长的监管需求。而使用SVM确实可
模式匹配算法是入侵检测系统的重要组成部分。为进一步提高入侵检测系统的性能和效率,提出一种新的多模式匹配算法——完全自动机匹配算法(CA-AC算法),并将其应用于入侵检测系
目的:探讨大肠癌组织中星形胶质细胞上调基因-1(astrocyte elevated gene-1,AEG-1)以及上皮间质转化(epithelial-mesenchymal transition,EMT)与多药耐药相关蛋白家族(MRPS)相关蛋白的
红外气动光学效应、大气扰动、湍流等会造成图像的畸变,为了对图像进行准确分析、识别,需要获取畸变校正后的图像。研究了在时变的畸变环境中,通过对拍摄到的序列图像进行处理,消除畸变影响来获取高质量图像。结合图像配准技术,充分考虑到配准后的各图像的质量指数,提出了一套新的畸变环境下的序列图像融合算法。通过在真实数据集上的系列实验,证实了算法的有效性。
目的:观察应用血栓抽吸联合血小板糖蛋白Ⅱb/Ⅲa受体拮抗剂、血管扩张剂在急性ST段抬高性心肌梗死冠状动脉介入治疗中的疗效。方法:收集120例急性前壁ST段抬高性心肌梗死患者为