RSS新闻的更新特征分析及RSS Reader的订阅模型

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:puhongjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RSS技术是一种基于XML格式的网络内容包装和投递的协议,可以用于生成RSS新闻并以RSS频道的形式发布在网站上。通过RSS Reader订阅相关的频道,用户可以选择自己感兴趣的频道,并且方便地获取实时更新的内容,因此越来越多的主流网站提供RSS新闻订阅服务。但之前的研究多集中于多RSS新闻的提取技术和其他RSS应用领域的研究,对于RSS新闻的发布和订阅特征的研究较少。由于RSS网站的更新与RSS Reader的更新不同步,用户通过RSS Reader订阅新闻的过程中可能出现诸如更新信息的丢失、冗余信息的大量产生等现象。因此在本文中,我们力求通过对RSS Reader客户端抓取的RSS数据分析RSS网站的行为特征和RSS Reader的设置对用户获取的频道更新内容的影响。本文主要的工作是建立了数学模型来描述RSS Reader的更新间隔设置与订阅得到的RSS更新内容之间的关系,给出了针对多个和单个频道的设定合理RSSReader更新间隔时间的方法,并且通过实际测量RSS频道的更新数据,分析RSS网站的更新特征和RSS Reader的订阅特征。在实验过程中,通过对RSS新闻发布和更新流程分析,设计相应的RSS数据的测量和分析方案,利用改进的RSS Reader实现了连续24小时对187个RSS新闻频道的更新数据实时地抓取。提出了基于频道列表大小的归一化RSS频道更新量的方法,得到新闻更新比例可以更好地衡量RSS频道和RSS Reader获取的频道文件的更新程度。通过对RSS新闻更新的测量和分析,总结RSS Reader订阅频道的更新内容特征,包括更新时间、更新量和更新比例分布。特别是RSS频道的更新比例间接反映了订阅的RSS新闻的实时性,由此推测RSS网站的更新特征。网站对RSS频道类型的设定和新闻发布时间控制,决定了RSS频道的更新量和更新时间分布。RSSReader更新间隔设置直接影响用户获取到的频道更新质量,包括更新信息的完整性和冗余信息的比例。RSS Reader的更新间隔需要按照RSS频道的更新强度做出适当的调整,以保证用户实时地、完整地获取频道的更新内容。通过对RSS频道的更新强度和更新时间分布的估计,利用数学模型可以很好的模拟出用户获取的频道更新内容随RSS Reader更新间隔设置的变化,则可以针对不同频道内容的实时性和完整性的不同要求设定合理的订阅更新间隔时间。本论文中共有图20幅,表7个,参考文献20篇。
其他文献
期刊
期刊
期刊
期刊
期刊
期刊
军事民用技术的发展,迫切要求精确高效地分析电大尺寸复杂目标的散射特性。而且这些电磁特性也一直是计算电磁学研究领域持久不衰的热点和难点。电磁问题的高效求解包含精度、效率和低内存需求方面的含义。随着所需解决问题的电尺寸的增大,单个个人计算机甚至服务器的速度和内存往往不能满足科学技术和工程问题的需求,一个好的解决方案是使用并行计算技术。近年来,并行计算技术已经越来越深入地应用到科学研究、工程技术以及电磁
随着微电子系统、通信技术和传感器技术的发展,无线传感器网络已成为信息领域的研究热点,广泛应用于环境监测、医疗护理、交通控制、军事侦查等领域。传统的无线传感器网络中
期刊
海洋盐度是研究全球气候变化和大洋环流的重要参数,海洋盐度的探测是确定海洋在气候系统中所起作用的关键。L波段(1401MHz-1426MHz)的微波辐射计遥感海洋盐度是测量盐度的最佳方