基于URL主题的查询分类方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:tank2203555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为2种策略的结合.策略1通过计算搜索结果中URL的主题分布预测查询主题,策略2基于查询日志点击关系,利用具有主题标注的URL,对查询进行标注获取数据并训练统计分类器预测查询主题.实验表明,方法可获得比当前最好算法更好的准确率,更好的在线处理效率并且可基于查询日志自动获取训练数据,具有良好的可扩展性.
其他文献
  为提高农业自动化、信息化水平,从整体实现农业智能化、自动化,通过对国内外农业物联网研究状况的分析,应用无线传感网络、RFID等相关技术,研发了一套基于物联网关键技术的农
毒品犯罪案件证据具有单一性、隐蔽性、易灭失性和易变性。而公安机关过于粗糙随意的证据收集,会造成检察机关公诉部门的诸多被动。从检察机关公诉角度对毒品犯罪案件证据收
广播电视卫星传输工作,在进行过程中,经常会出现各种干扰问题。所以,研究工作人员需要对这些干扰进行因素分析,之后提出相应的解决方案。希望能够对卫星通信系统的研究人员,
研究了各种结构形式的特点,并分别对三导管架、四导管架和八导管架结构进行了介绍,根据对导管架节点的连接形式的研究,总结出各种节点的结构优缺点,对导管架节点进行了分类,
采用多级安全策略的信息系统中,事务的并发冲突会导致数据冲突隐蔽信道.现有的隐蔽信道检测方法存在以下问题:1)分析角度单一,入侵者可以通过分散记录的方式逃避检测;2)使用
专家证人模式与司法鉴定模式是英美法系和大陆法系在解决专门性事实问题上两种不同的模式。两者在法律文化基础、有关专家的诉讼地位和资格、程序启动、质证、证据能力和证明
宋元时期,泉州的明教(摩尼教)活动甚盛。从考古和历史资料证明,宋代有大批明教徒聚会于晋江华表山麓的草庵,元代在泉州城里专门设有管理江南诸路明教和秦教(基督教)的机构。
自改革开放以来,广西经济发展经历了较短期集中性波动之后,逐步过渡到现在稳定快速发展阶段,特别是西部大开发战略实施和构建北部湾经济合作区后,广西经济在这样的背景下得到
<正>课堂注意力分散是普通高中同学普遍存在的问题。学生觉得自己在英语课堂上很难集中注意力,脑子里总是冒出不受控制的内容,行为上表现为上课睡觉,看课外书,和别人聊天,或
目的:观察头脊电针方法治疗脑卒中痉挛性瘫痪的疗效。方法:60例中风痉挛性瘫痪的患者随机分成电针组(头脊电针组)30例,对照组(常规针刺组)30例,观察两组治疗前后的结果。结果