论文部分内容阅读
研究网络一种常用的方法是通过抓取网络“快照”来实现,对每一个“快照”的分析可以反映网络的各方面特性,这些特性对于刻画网络特征具有重要的作用。对一些连续的”快照”分析则可以反映各特性的动态变化情况;而抓取这些“快照”一般需要用到专门的抓取平台。在本文中,我们介绍了针对Gnutella网络的研究,设计实现的相关平台。采用的基本原理是利用Gnutella协议中ping/pong消息获取节点和文件相关信息,使用的硬件是普通的PC,软件是Gtk-Gnutella修改而来,运行在linux环境下,采用控制端与工作端相结合的方式;优化方面,我们在软件、硬件和数据库三个部分,通过比较实验,分别探讨了影响平台性能的因素;优化后的平台每台机器每分钟获得的pong数量可以达到15000,可以访问300个peer,同时还可以得到节点的连接关系、文件的详细信息以及文件节点的相关信息等等;通过与其他相关平台的比较,得知平台抓取速率的瓶颈在于建立TCP连接对时间的消耗,对以后的设计提出了相应建议。我们利用在15个小时抓取的数据对网络特性进行了分析,得到了包括文件类型、流行度及其动态分析,网络拓扑分布等几个方面的信息。最后对P2P网络污染问题进行了简要介绍,对之前的污染检测标准提出了基于应用方面的改进,并通过实验,得到了Gnutella网络中不存在大规模污染的结论。