论文部分内容阅读
在这互联网技术高速发展的21世纪,网络中产生的流量明显剧增,随着用户交互信息越来越多、共享文件越来越大,P2P这种参与节点既是服务器又是客户端的应用模式因其快捷可靠的网络性能得到了广泛的使用,其中最具代表性的就是BitTorrent文件共享软件。在现有研究中,我们可看到BT类P2P网络所产生的流量占据了互联网总体流量的很大部分,吸引了大量专家学者对BT网络流量的宏观特性进行全面研究,然而因为现有网络流量测量工具无法获得随着时间演化BT网络中节点间流量的交互情况,我们对BT网络下载过程中节点间流量的特征规律及其与内部运行机制间的关联性等微观流量行为的研究很少。
为了完善BT网络流量行为的分析研究,本文在对现有包括BT应用的P2P网络流量行为研究的系统调研和梳理的基础上,开展了BT网络节点间流量行为和总流量行为的研究工作,得到了一些研究成果,主要包括:
(1)构建了一个BT网络节点间流量的数据采集系统并将其部署在Planetlab实验平台上。在此系统中,我们改造了遵循BT协议的开源软件Ctorrent作为我们的实验客户端,使其可记录节点间流量的交互情况,并将记录的文本信息返回到数据收集服务器。为了方便后续数据的分析,我们对获取的数据进行了统一的预处理,并从下载完成节点的总下载量、BT网络流量自相似性和Tit-for-Tat机制三个方面对获取的数据进行了正确性验证。
(2)发现每批节点入网后,先较多地与近似同批入网的节点进行交互,经过一段时间后才分散地与网络中现有阶段的所有节点进行交互,但总体看来,各节点会分散地与网络中的大部分节点进行数据交互;BT网络在很短的时间内就会完成绝大部分的文件共享,原因在于网络中的大部分节点在很短的时间内就能完成各自全部数据的下载;中间批次入网的节点对整个网络文件共享的贡献更大;大部分下载节点对种子节点的依赖性很小,大部分数据都来自于网络中其他节点的交互,体现出P2P应用模式的优越性;BT网络中80%以上的节点的上传/下载流量具有自相似特性。
(3)揭示了每批节点刚入网时,其邻居节点的选择会受到节点入网时间的影响,入网一段时间后,其邻居节点的选择才会比较随机;得益于BT网络的“最稀少片优先”原则,文件片的分发比较均匀分散;文件片分片大小的不同几乎不影响节点对间总流量的分散程度和各节点上传总流量的分布情况,文件片分片小有利于大部分节点的快速下载,文件片扩散的均匀程度也会有小幅度的提升,但延长了小部分节点的下载时长;文件大小与各节点上传总流量的分布情况间存在近似等比的关系,共享文件小的网络中,上传/下载流量具有自相似特性的节点数更多,自相似性更强。