基于位置语言模型的中文信息检索系统的研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:owen_climb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索
其他文献
针对移动云服务中用户的行为记录影响隐私安全的问题,提出一种基于第三方接入控制的环身份框架.在用户身份注册部分,身份接入控制端为用户提供环身份证书,来确保云服务不能跟
鉴于数字重建影像生成过程具有良好的并行性,实现了一种基于CUDA并行计算的数字重建影像生成算法。该算法首先在CPU端使用八叉树结构来剔除体数据中的空体素并将其载入GPU;然后在GPU中根据光线和线程的对应关系,设计光线内核函数来模拟一束X线穿透人体组织的衰减过程;最后在GPU中由多线程并行执行内核函数来完成DRR图像生成过程。实验结果表明,该方法在保证DRR生成质量的前提下能有效利用GPU的并行计
将烟火切割技术应用于油田井下金属管柱的切割中可以满足特殊环境及特殊要求的切割。针对油田井下的特点,设计了一种井下金属管柱切割装置,主要从切割的烟火药配方、装药方式
传统的图像检索方法均是基于图像的局部特征的,忽略了图像整体特征。针对此问题,深入分析图像的整体特征,提出了一种基于局部特征和整体特征的混合方法来提取图像的内容。首先,采用平稳小波变换方法提取图像的水平、垂直和对角线的图像整体信息;其次,应用每个子矩阵的灰度共生矩阵提取图像的局部特征。根据局部特征和整体特征的联合特征描述,应用多模关联规则的数据挖掘方法对图像进行检索,并且其关联规则的主要决定参数为欧
探测网络社团结构对于分析、设计复杂的自然或工程网络至关重要,然而现有的探测技术主要依托于最优化和启发式算法,不能兼顾计算效率和准确性。因此提出了一种基于演化迭代技术的动态社团探测算法,它能准确高效地发现网络中的社团结构。首先引入了一个离散时间的动态系统,通过描述社团划分收敛到特定指标最优的演化轨迹来确定社团划分。接着提出了一个一般化的指标函数,以确定网络中最优的社团数量及最稳定的社团结构。该指标函
在分析邻域粗糙集模型弊端的基础上,提出了非对称变邻域粗糙集模型,并以全局属性重要度为启发条件,构造了基于非对称变邻域粗糙集模型的属性约简的启发式算法。利用6个UCI标
蛋白质的进化配对是指在进化过程中残基对之间形成的相对稳定的相互作用。基于已被发现的进化配对,采用机器学习的分类技术,将其转换成残基对之间的距离约束,从而将一种定性
图像检索系统是用户导向的。根据用户意图的不同,检索结果的离散度对用户的体验有着不同的影响。一些情况下,用户希望得到的是"类而不同"的结果。当前以关键字为基础的检索系统并不能很好地捕捉到用户的意图。因此,新的交互内容——缩放比例被引入检索系统,以消除用户的意图与检索结果离散度之间的隔阂,使用户根据自己的意图直接调整检索的结果。首先得到检索系统返回的图像,之后计算图像间的视觉与语义的相似度,再利用层次
随着眼动跟踪技术的日益成熟,面向终端用户的视线输入产品问世,视线交互(Gaze-based Interaction)的实用性越来越高。然而,由于眼睛并不是与生俱来的控制器官,用户界面中无论动态或静态的各种视觉反馈,在视线交互过程中都可能干扰用户的眼动,从而影响视线输入(视点坐标)。因此,通过两个视线点击(Eye Pointing)实验,从视点的空间分布特征和视线交互的人机工效两个方面,系统地评估了
条码技术是如今应用最广泛的识别和输入技术之一,尤其是新兴的二维条码技术,由于其包含的信息量大而巨识别错误率低而在各个方面得到很大的重视。该文结合如今应用最广的几种一维和二维条码编码方式,介绍了通过计算机实现条形码编码和译码的软件编程思想及方法。与用条码识读器硬件进行译码相比,软件译码具有更大的灵活性和较低的成本,因此具有很大的发展潜力。