网络信息过滤的研究与应用

来源 :清华大学 | 被引量 : 0次 | 上传用户:gouridzmhuiyouren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,信息过载问题日趋严重.网络用户需要从数以亿计的HTML网页中迅速而准确地获取满足自己需求的信息,仅靠用户自己的能力是无法做到这一点的.信息查询和信息过滤技术的出现,在一定程度上满足用用户在这方面的要求.根据信息过滤的特殊性,参考概率模型中对于相关信息的运用,该文结合信息论中熵的思想提出了一种向量空间模型中赋权算法tf-pde.这种方法利用关键词在具有类别信息的文章集中的分布估计其价值,并用此价值作为文本集因子取代传统的idf因子.该文还介绍了一个个人化、开放式的信息过滤系统——OpenBookmark.此系统帮助用户保存自己的网页书签.同时通过对于它们的分析得到用户的信息需求,向用户提供个性化的信息推荐服务.系统以开放目录的形式管理用户的共享资源,通过Agent之间的信息交换完成协同过滤.为了鼓励用户提供有用信息,系统建立了一种虚拟货币的发行和管理机制VIPU,采用有偿信息服务的运行方式.
其他文献
高超声速飞行器具有广阔的军事和民用前景,已成为当今航空航天领域研究的焦点之一。飞行控制系统作为高超声速飞行器的关键分系统之一,是实现其安全飞行和完成复杂任务的重要保
该文首先介绍了协作计算模型的发展和三层结构Web数据库技术的相关理论,以及三层结构Web数据库应用系统的方案设计与实现技术.该文的第二部分,是三层结构Web数据库应用实践—
嵌入式智能住宅系统将计算机技术、通信技术和控制技术相结合,将它们运用到传统的住宅系统中以使住宅内的设备和应用系统结合成为一体,更好地实现安全、经济、舒适和方便等各
该文全面回顾了多媒体数据压缩算法的发展历程,扼要介绍了常用的多媒体数据压缩算法,特别是在MPEG-4中用到的哈夫曼编码、算术编码、行程编码、DPCM预测编码、DCT变换编码、
该文研究了现有的连续系统和离散系统的鲁棒分析和设计的方法,分析了这些方法各自的优点和缺点,在此基础上提出了一种新的采样控制系统的鲁棒控制器的设计方法.该方法以连续
本文首先介绍了机器人及并联机器人研究的发展状况,其次介绍了微分几何解耦控制的基本理论,包括微分几何控制理论中的基本概念、基本定理、推论以及一些命题和结论。然后介绍了
智能建筑(包括智能大厦、智能小区和智能家居等)综合信息服务与管理是系统集成发展的必然趋势。基于局域网的智能管理系统(LIMS)正是为了达到这一目的而设计和构造的,它运用了最新
配电自动化是配电网发展的必然趋势.由于配电系统本身固有的地理分布特性,地理信息系统是配电自动化系统中不可缺少的部分.地理信息系统在配电自动化系统中的应用,使得配电自
该文介绍了遗传算法的基本原理和一般过程,并详细讨论了算法中的一些关键问题.介绍了如何建立纵断面优化问题的数学模型,并对它的具体方法步骤进行了详细的讨论.纵断面优化设
本文研究的重点是深度学习技术在大词汇量连续汉语语音识别系统中的应用。深度学习技术在许多任务中凭借其层级特征学习能力和数据建模能力,取得了超过以往浅层学习技术的性能