论文部分内容阅读
如今互联网己经成为人们日常生活中不可分割的一部分,但个人信息泄露等安全问题日益严重,个人的隐私被越发关注,不断有用户尝试以匿名的身份访问互联网。Tor作为隐藏流量源的匿名通讯机制,通过重路由技术能够有效地隐藏用户的身份,目前它的用户数目己经超过了 450万人。但是Tor不仅能为普通用户提供着服务,由于其双向匿名机制,同时也为非法交易及其他犯罪行为的平台——暗网,提供了良好的生存环境。由于暗网的负面影响,以及Tor入口流量特征明显易被识别的缺陷,它的使用受到很大限制。Tor网桥为解决此问题应运而生,它可搭载多种混淆协议将Tor的流量伪装得不引人注目。obfs4作为目前使用人数最多的混淆协议,能够干扰针对其原生流量的特殊对待,由此带来的新挑战尚未攻克。本文研究的主要内容是针对搭载obfs4协议网桥的Tor流量进行追踪,围绕这一课题,做了如下几个方面的工作:首先,本文介绍了 Tor的机制,包括其组成、连接过程和网桥等,并详细阐述了 obfs4的工作原理,对Tor的现状进行了分析。此外,对常见的流量分析方法加以总结,包括对流量识别及追踪技术的分类综述。其次,提出了基于样本维度权重的SVM算法,以识别obfs4的Tor流量。针对obfs4现有的16种特征值,进行多种方式的权重组合,以较优的比重,使用改进后的高斯核函数SVM算法进行实验。结果表明,本方法较己有方法在性能上有显著提高,能够较为准确的识别出obfs4的流量。再次,提出一种IPD质心方法,利用K均值聚类算法的聚类特性将已有方法进行改进,使得加入的水印在obfs4网桥三种模式上均能被高效地检测出。实验结果表明,改进后的算法有着更高的检测率和识别率,且应对不同的网络环境有着较强的适应能力。最后,提出了三种使用场景,针对使用Tor双向匿名机制的暗网环境进行流水印方案的合理运用。场景包括用于确认用户与特定服务通讯关系、用于发现特定服务的访问用户以及用于追踪暗网服务的真实身份。并对三种使用场景的优势劣势以及实施难度进行了评估。