基于多粒度索引的互联网信息检索系统

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:liucm001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
总结了互联网信息检索的相关技术,提出了多粒度索引的技术。多粒度索引技术采用了统计学方法,综合了短语索引和词语索引的优秀思想。该方法先识别文档中包含的未登录词语,然后把识别出来的未登录词语依次放在一个扩展的词典里面。在创建索引的时候,对文本进行两趟词语切分。第一趟是采用基本的分词词典。第二趟词语切分是对上面的结果采用基于扩展分词词典的方法。基于多粒度索引技术设计了互联网信息检索系统,实验数据显示系统在准确率、召回率以及综合评分F-measure上均取得了较好的效果。
其他文献
农一师地处塔克拉玛干沙漠边缘。各团都存在相当一部分中低产田。尤其是低产田。所占份额大。严重影响了农业总产量和团场效益的提高。也是团与团、连与连之间生产水平参差不
揭示了我国证券市场存在的突出问题是:上市公司整体素质低和股市运行中被投机操纵,损害了广大投资者的权益。提出了今后5~10年证券市场发展的目标和力争要实现四个重大转变,并围
文章从Web服务的编排、验证、部署角度提出了基于Pi演算的Web服务组合过程框架,说明了这个框架中每一步骤涉及的理论和工具应用。并在现有研究的基础上,针对框架中人工参与较多
在无线传感器网络中,DV-Hop定位算法无需测距,但定位精度不高。文章分析发现在未知节点至信标节点距离与跳数不一定成正比关系,提出通过仿真事先求得在各跳数情况下未知节点
文章首先讨论以生产函数法为基础的新增长理论,然后从收入与成本的关系出发,建立经济增长模型,并利用新模型对美国1991~2000年的经济增长因素进行分析,以检验新模型的科学性和
人力资本定价理论是目前经济学前沿尖端课题之一,但在传统的企业人力资本定价方法中,人力资本投资风险很少被论及.在考虑人力资本投资风险的基础上,运用时间序列的条件资本资
本文分析了高品质棉市场需求,回顾了高品质棉的研究与应用现状,剖析了市场体系与产业效益。以高品质棉科棉1号为材料,从营养生长、生殖生长、物质积累、棉铃形成、氮素代谢等方
<正>昨天,刚收到科研上“赣棉11号”获大奖的捷报;今天,又传来政治上“保先教育”获先进的喜讯。
期刊
论述了科技保密及其对象,科技保密内容与性质,提出了科技成果在各阶段的保密工作思路.
烂铃是棉花生产上的一大病害。一般年份因烂铃造成减产10%~20%,品质下降20%~30%,收入减少25%左右。大发生年份,烂铃高达30%~40%,减产30%以上,品质下降40%-50%,收入减少45%左右。一般8月下旬到9月