一种面向领域文档的结构化检索模型及其在农技处方检索中的应用

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hmxj1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
各种专业领域中的文档往往具有显著的结构化特征,即一篇文档往往是由具有不同表达功能的相对固定的多个文本字段构成,同时这些字段蕴含了相关的领域知识.针对专业文档的结构化和领域化特征,设计了一种面向结构化领域文档的信息检索模型.在该模型中,首先对领域文档集进行挖掘以构建能够反映领域知识的结构化模型,之后以此为基础设计了结构化文档检索算法来为用户查询返回相关的领域文档.选择一类典型的领域文档——农技处方开展了应用研究,利用一份现实的农技处方文档数据集将提出的方法与传统的信息检索方法进行了实验对比分析,并开发了农技
其他文献
外轮廓信息是评价蝴蝶兰生长态势的重要特征参数,主要通过轮廓提取和链码编码两个步骤获得。蝴蝶兰图像的边缘轮廓最适合利用数学形态学算法提取,但所得轮廓并非单像素宽度,而利用传统8链码算法编码会错误地表达其外轮廓信息,因此结合轮廓特点重新定义了起始链码方向,提出了对称8链码编码算法。在编码过程中,该算法能够通过变换点判断出当前轮廓走向,从而自适应地选择起始链码方向。验证性实验证明,该算法能够准确描述蝴蝶
提出一种既能保持图像重要内容又能较好地保持重要物体形状的图像缩放算法。该方法结合传统的缝裁剪技术和变形技术来对图像进行缩放。首先利用当前公认效果良好的基于图模型的流形排序显著性检测算法得到图像的显著度图,结合图像梯度能量等信息来构造结构更为清晰的图像重要度图;其次利用之前构造的图像重要度图并按缩放尺度的大小来确定适当的缩放方法;最后根据度量比较结果来选择经典缝裁剪方法或基于能量优化的变形方法进行图
针对WSANs中的服务发现问题,提出了一种基于六边形分区的多中心编址服务发现算法MASD.算法综合考虑了节点的通信开销和存储负担,设计了一种多中心的编址方案,此方案采用局部
参数选择本身是一个组合优化问题,尽管过去提出了很多方法,但是参数选择依然令人困惑,为此提出适用于差分进化算法的参数自适应选择策略.该策略在进化的过程中动态评估参数的
服务承载网络是基于服务构建的以满足服务端到端QoS保障为出发点的覆盖网络,是满足可重构柔性网络对业务需求支撑的有效的网络架构。基于可重构柔性网络体系框架,分析服务承载
利用马尔可夫链对图像DCT变换系数的相关性进行建模,提取模型的状态转移概率矩阵作为特征向量,然后采用支持向量机分类器对自然图像和篡改图像进行分类。实验结果表明,该算法