社会网络不良URL的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:storm369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,问答类社会网络迅速发展,用户量快速增长。经过数年的积累,以人为核心的问答类社会网络正成为互联网的主体应用之一。然而,随着社会网络的蓬勃发展,互联网安全受到了新的挑战。首先是用户信息的安全。在社会网络中,为了更好的交流,用户一般都会公布自己的个人信息。然而由于缺乏安全防护意识和未采取隐私措施,用户信息资料经常被非法公开或被一些不法分子非法利用。使得用户的隐私和安全问题频频发生。其次是不良URL的传播。由于社会网络中信息的快速传播性,很多黑客可以用社会网络传播不良信息。其中危害性比较大的是不良URL,主要有恶意URL、钓鱼URL。垃圾广告URL、色情URL等。这些给用户使用社会网络及社会网络的健康发展造成了严重的危害。  本文是当前研究问答类社会网络中的不良URL的少数文章之一。有效的弥补了该类研究的不足。针对当前问答类社会网络中出现的不良URL现象进行了深入的研究。本文首先对社会网络中的不良URL的问题进行了分析。说出了其中的危害:传播恶意URL(包括钓鱼URL)、给用户造成威胁、安装恶意软件、窃听用户信息、盗取用户密码等威胁;或者传播色情URL,影响网络生态环境;或者散步大量广告,使用户难以找到自己需要的答案,或者用户收到许多不良信息的误导和骚扰。  本文针对问答类社会网络中的问题,提出了解决方案。即首先爬取问答类社会网站,提取其中用户回答问题所发布的URL,然后通过urlvoid网站进行判断,可以迅速的找出该URL的性质,进而判定是否是恶意的URL。对于广告类的URL,也就是与用户问题不想对应的URL。通过文本相似度来计算URL与问题的匹配值。其中用到了网页关键字提取,文本相似度计算等。如果匹配值较低,则认为他们是不相关的,进而判断为不相关URL。  最后实现实验并对实验结果进行评估。通过大量的实验及评估,实验取得了较好的实验结果。  本文主要通过对问答类社会网络中不良URL的研究,通过对雅虎问答的爬取,分析,得到了以下结论,取得了一下成果:  1,本文是当前对社会网络中的不良URL研究的少数文章之一,针对问答类社会网络中出现的安全问题,提出了解决框架,并设计了我们的系统,通过了实验验证;  2,用雅虎S4平台提高了鉴定不良URL的速率,获得了较为理想的速率;  3,利用文本相似度处理,鉴定垃圾URL,广告URL,扩展了文本相似度原理的应用;  4,能够快速的判别出恶意URL,这大大减少了恶意URL的危害。
其他文献
话题演化是指根据不同时间段文本内部的话题相似度获得的话题产生、兴起、消亡的变化历程。本文实现了基于种子文档和OLDA话题模型的发现文本话题信息的改进方法,该方法使用
社交网络已经变成了许多人的每日生活的必不可少的一部分。许多社交网络已经部署了基于位置的服务。使用这种服务和愈加普遍的能够精确获取地理位置的设备朋友们能够分享最喜
随着智能手机用户数量不断地增加,手机病毒也大量地出现。手机病毒不仅会导致系统瘫痪、泄漏用户的重要信息、远程监控用户,而且也会给人类带来巨大的经济损失。因此智能手机的
随着互联网的发展和智能手机的普及,各种智慧旅游应用在市场上层出不穷,旅游导航系统也成为了智慧旅游建设的主要产品之一。但由于智能手机GPS定位技术在景区导航系统中无法保
随着计算机网络应用的日益深入,计算机终端已成为网络中大部分事件的起点和源头。只有通过完善的终端安全防护才能够真正从源头上控制各种安全事件的发生,遏制网络内部发起的
随着科技的发展,人们的生活越来越趋向于自动化、智能化,信息与物质间的联系日益增强。WSN(Wireless Sensor Network)正是在这发展大潮中诞生的一员,无线传感器网络具有感知
随着高性能计算技术的不断发展,各种高性能计算方法被广泛地应用于实际工程领域,在国民经济、国防建设和科技发展中占有非常重要的战略地位。相场法是目前用于模拟枝晶微观组
伴随多租赁理念在业界的推广应用,基于SaaS模式的应用已经成为一种高效、先进的业务应用解决方案。单实例多租赁(Single Instance Multi-tenancy)的应用模式体现出其低费用,
作为一种新兴的计算平台,图形处理器(GPU)在科学计算和工程领域展现出巨大的计算能力。GPU也很快由单纯的图形处理加速单元,演变成适合通用计算的处理器(GPGPU)。然而随着计
伴随着计算机的发展过程,各种处理操作现均慢慢要求在处理速度上让用户满意,以增加体验。图像分割作为计算机视觉中一个基础而重要的学科,到现在为至已经被广泛研究。从原有