切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
会议论文
基于站点的Web信息采集器研究
基于站点的Web信息采集器研究
来源 :第二届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户:haizhiren
【摘 要】
:
基于站点的采集器是一类有针对性的采集器,它以站点作为采集的单位.本文在总结以往工作的基础上,首先说明站点采集自身的特点,然后讨论如何提高其性能,最后是实际的系统介绍
【作 者】
:
张凯
李魁
张刚
王斌
【机 构】
:
中国科学院计算技术研究所软件研究室,北京,100080
【出 处】
:
第二届全国信息检索与内容安全学术会议
【发表日期】
:
2005年期
【关键词】
:
信息
采集器
性能
系统
基础
单位
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于站点的采集器是一类有针对性的采集器,它以站点作为采集的单位.本文在总结以往工作的基础上,首先说明站点采集自身的特点,然后讨论如何提高其性能,最后是实际的系统介绍和展望.
其他文献
词典匹配和串频统计相结合在自动主题分析中的应用
当前主题分析主要采用基于词表的自动抽词技术,这种方法的局限性在于无法处理知识库中未登录的关键词.因此本文提出了在专家知识库的词典匹配基础上,结合词的串频统计技术,进
会议
词典匹配
串频统计
主题分析
专家知识库
关键词
自动抽词
自动标引
统计技术
获取
方法
处理
召回率
局限性
证明
文档
实验
基础
词表
多文档文摘中基于语义相似度的最大边缘相关技术研究
多文档自动文摘致力于从多篇文档中将全面、简洁的摘要性文档呈现给用户,提高用户获取信息的效率.本文提出了基于语句级语义相似度的最大边缘相关方法来选取文摘句,为生成高
会议
特定领域专家主页信息的自动抽取
本文介绍了领域专家主页信息自动抽取研究的背景和具体实现的方法.由于网上信息的动态性,中文计算语言学虚拟信息中心需要不断的更新,自动维护可以节省大量的人力和物力.基于
会议
汉英EBMT系统的领域自适应研究
EBMT系统在受限领域下可以高效地生成准确的译文,是目前应用较为成功的一种机器翻译技术.为了进一步解决此类系统面向不同应用领域时的自适应问题,本文提出应用文本分类技术,
会议
汉英
系统
机器翻译技术
应用
文本的类型
领域自适应
译文
受限领域
适应问题
分类技术
实例库
选择
性能
实验
判别
奥运
EBMT中翻译模板的抽取与匹配
在EBMT(Example-BasedMachineTranslation)系统中将翻译实例泛化为翻译模板,可以有效的减少实例的存储空间,提高实例的检索效率,而实例匹配更是直接关系到了EBMT系统的翻译质
会议
一种基于网络的英文缩略语信息的自动抽取方法
面对Internet中丰富的信息资源,本文提出了一种基于互联网,实现缩略语源词组及中文翻译的自动获取方法.本文利用缩略语构词规则来提取候选词组,利用句法规则进行筛选,实现了
会议
一种基于潜在语义的Markov网络信息检索模型
在信息检索中,查询与文档集的词不匹配使得查询的查全率(recall)和查准率(precision)均较低.为了提高检索效果,查询扩展是一种较好的方法.Markov网络是一种图形表示方法,它具
会议
潜在语义
查询扩展
Markov网络
信息检索
查全率
查准率
关于广义向量空间模型中布尔运算的修正
本文对广义向量模型进行了全面系统的介绍,对其存在的问题和不足进行了认真的讨论和分析,通过对该模型中交运算的重新定义建立了修正的广义向量空间模型,并从理论上证明了新
会议
广义向量
空间模型
重新定义
向量模型
交运算
证明
系统
理论
基于P2P的搜索技术和方法研究
在基于Peer-to-Peer(P2P)的搜索技术和方法可以达到传统搜索模式所无法达到的深度和广度,具有更强的有效性和准确性,为搜索模式的进一步发展提供了新的理念和研究思路.本文首
会议
搜索技术
搜索模式
研究与发展
搜索方法
技术特点
准确性
资源
思路
描述
理念
基础
天罗Web信息采集系统中的性能优化
随着Web信息的爆炸性增长,对Web信息采集的性能提出了巨大的挑战.本文介绍了天罗Web信息采集的总体结构和性能优化策略.在性能优化策略中详细分析了优雅采集、页面采集、页面
会议
信息采集系统
优化策略
页面采集
性能
重复网页
页面刷新
集中分析
分布式
多线程
采集器
爆炸性
增长
陷阱
实验
结构
存储
与本文相关的学术论文