【摘 要】
:
随着网络技术的迅速发展和互联网络规模的不断扩大,人们能够获得的新闻信息资源也日益丰富。应用搜索引擎进行检索,经常会得到内容相同或相近的新闻网页,它们不但浪费了存储
论文部分内容阅读
随着网络技术的迅速发展和互联网络规模的不断扩大,人们能够获得的新闻信息资源也日益丰富。应用搜索引擎进行检索,经常会得到内容相同或相近的新闻网页,它们不但浪费了存储资源,而且加重了用户检索和阅读的负担。网页去重处理是提高搜索引擎的关键技术之一,因此,发现并去除重复网页信息的研究工作具有重要意义。文中提出了一种基于版权信息的新闻网页去重算法,其主要思想是:应用转载的新闻网页大多会标出其来源这一特征,并结合网页文本内容进行新闻网页去重。实验结果表明:该方法有效,对新闻网页实现较好的去重,能够得到较高的正确率及召
其他文献
摘要:在一些信息系统中,由于环境、数据需求和场地的限制,无法使用有线和无线网络,所以短信被经常用于这样的系统中。基于以上目的,笔者在教学的过程中,设计了一套基于短信的离散数据收发实验。 关键词:短信;离散数据;信息系统;实验 中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)35-8343-02
循环经济是运用生态学规律重构经济系统,把清洁生产、资源及其废物综合利用、生态设计和可持续消费融为一体,以"减量化、再利用、资源化"为原则,以低排放、低消耗、高效率为基
办公室老钟经常因工作需要将网上的某些文章保存下来,操作方法基本上就是选中、复制、运行WORD、粘贴再整理文章格式,实在是太哕嗦。老钟终于无法忍受了。于是向我求助。其实只
在以家庭承包经营为基础的农业生产经营活动中,农村妇女已成为农业生产经营的主体,当前农村工作的一个重要方面,就是要大力开发女性人力资源。文章通过分析农村女性人力资源
国库集中支付制度改革是我国财政支出管理制度改革的重要内容,是我国公共财政框架的重要组成部分。青岛市国库集中支付改革工作已于2005年11月1日正式启动。改革实践表明,国
网络在后续的运行过程中,总会不可避免地发生各类故障,每一类故障产生的原因也可能各不相同,所以故障排查起来往往会显得无迹可循。为了高效排查各类网络故障.我们需要在平时做个
研究了高半胱氨酸在金电极上形成单分子自组装膜的条件,并利用循环伏安法,交流阻抗谱研究了[Fe(CN)6]3-/4-在高半胱氨酸SAM膜电极上于不同pH值溶液中的电化学行为.循环伏安结
"新生代"农民工是2010年中央一号文件首次提出的称谓,主要指80后、90后农民工。维护"新生代"农民工权益是关系到我国能否实现全面建设小康社会的关键,保护农民工的权益对我国
社会需要隐性采访,是因为新闻媒体的舆论监督是社会实现自我净化的一种必要机制。受众喜欢用隐性采访手段采制的新闻,是因为他们通过记者的采访,看到了阳光不能照到的黑暗角