基于半监督学习的恶意URL检测方法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:wdw_king
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型,减少了为数据打标签带来的成本开销.在传统半监督学习协同训练(co-training)的基础上进行了算法改进,利用专家知识与Doc2Vec两种方法预处理的数据训练两个分类器,筛选两个分类器预测结果相同且置信度高的数据打上伪标签(pseudo-labeled)后用于分类器继续学习.实验结果表明,本文方法只用0.67%的有标签数据即可训练出检测精确度(precision)分别达到99
其他文献
在计算机网络日益发展的今天,网络上的信息传播正在逐步取代传统媒体,因而计算机网络上的安全问题也越来越受到人们的重视。针对当前大流量网络的普及和多核处理器的广泛应用,提出并实现一种高效的网络数据包重组还原平台。该平台完全工作在用户空间,主要对以旁路监听方式下在网络链路捕获到的网络数据包进行重组及协议还原。扼要地介绍协议还原所涉及到的数据包捕获、数据包重组以及应用层协议还原等关键技术。实验证明,该平台
在水利工程质量监督检查和稽查实践中,发现部分水利工程的设计与工程实际脱节、设计与施工方案矛盾、设计忽视工程运行反馈、水利工程专业间图纸互相冲突、泄洪洞通气孔设置
补燃室头部距离是影响固体火箭冲压发动机二次燃烧效率的关键参数,采用数值模拟的方法研究分析了该参数对固体火箭冲压发动机二次燃烧效率的影响,数值结果与同等条件下实验结果
介绍湖南省锅炉压力容器无损检测人员资格考委会在编制考核质量管理手册和操作考试评分细则及准备考核试件和考核设备等方面所做的工作。湖南省考委会是全国省级锅炉压力容器
古今中外,如何管理官员都是社会生活中最考验人类智慧和技巧的难题.不同的制度,管理官员的方法完全不同.在还不能做到官民一体、官员与公众之间多少还有着那么一些界限的条件
利用2005年至2011年中国内地法定报告的乙肝发病数资料分别建立广义回归神经网络模型以及传统的BP神经网络模型,探讨广义回归神经网络在乙肝发病预测中的实用价值。结果显示,广义回归神经网络拟合及预测结果的平均绝对误差,平均相对误差以及均方误差均小于BP神经网络。该结果提示,广义回归神经网络在乙肝发病数预测中具有较好的应用价值。
在配电网的建设与管理方面,现有的技术路径和管理模式还无法将业务链、数据链和图块链融合贯通,导致各业务环节难以贯通融合、海量数据组织难度大和拓扑电系图精准度不够。针
对Buades等人提出的非局部均值图像去噪算法进行改进。传统的方法在滤波参数定义上存在缺陷,为了解决这个问题,通过建立噪声方差与滤波系数的关系,提出解决噪声估计的方法。另外,根据小波系数的分布特点,利用GGD模型参数(尺度和形状参数)对系数进行拟合,并用GGD模型参数提出一种有效的噪声方差估计算法。实验结果表明,该噪声方差估计算法不仅能有效地估计噪声方差大小,而且使原有的非局部均值算法具有自适应性