恶意PDF文档检测技术的研究和实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:xpz_peng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断普及和办公自动化需求的日益升级,电子文档的应用范围在不断的扩大,PDF (Portable Document Format)作为一种文件格式与操作系统平台无关的电子文档,已经成为数字化信息传播和存储的重要格式。伴随着PDF的广泛使用,针对PDF的攻击事件也层出不穷。其中,带有恶意代码的PDF文档带来的危害最为严重,给广大企业和用户带来了极大的损失。因此,针对恶意PDF文档的检测技术越来越凸显在当前时代背景下的意义。本文对PDF文档结构和针对PDF文档攻击技术进行,对现有的恶意PDF文档检测方法进行比较,结合目前的PDF文档分类方法,提出了基于逻辑回归的恶意PDF文档静态检测方法。具体工作如下:1.对PDF文档格式和目前针对PDF文档的攻击手段进行归纳,分析目前PDF文档检测技术的优势与不足,结合逻辑回归算法,提出了一个基于逻辑回归的恶意PDF文档检测模型。2.设计并实现了基于逻辑回归的恶意PDF文档检测系统。详述了系统需求、系统设计、关键模块的功能与实现。3.在PDF文档特征提取模块,结合PDF文档格式,选择PDF文档的结构路径作为特征,对PDF文档进行特征提取。提取过程使用广度优先算法,保证提取过程中的有效性。4.对PDF文档进行特征选择时,研究了目前常用的特征选择算法,选择卡方检验算法作为特征选择算法,选择出可供系统分析的有效特征。5.在PDF分类检测模块,采用当前机器学习领域使用广泛的逻辑回归算法,学习训练生成分类器。并通过仿真实验,从检验正确率和时间效率上对系统有效性进行了验证。
其他文献
目的:探究产科护理质量持续性改进中"以人为本"理念的应用效果.方法:选取了2018年2月1日至12月31日期间在我院产科收治的92例产妇作为主要研究对象,按照数字随机法将患者分为
集合论是现代数学的基石,是数学大厦的基础.集合论为数学的严密性提供了有利的工具,它也是数学哲学的重要据点,是数学和哲学衔接的主要环节之一.在大多数场合,我们是把它当作一种语
目的观察分析依美斯汀联合色甘酸钠治疗过敏性结膜炎的疗效。方法 150例(300眼)确诊为过敏性结膜炎的患者,随机分为依美斯汀组、色甘酸钠组、联合组,各50例(100眼)。依美斯汀
采用溶液共混法制备卡拉胶/淀粉共混膜,并对共混膜的耐水性、抗拉强度、透光率、热稳定性等进行考察。分析结果表明,随着淀粉含量的增加,共混膜的耐水性提高,膜的抗拉强度呈
继推出TSC Carat55E系列可网管工业百兆冗余环网交换机后,卓越信通电子(北京)有限公司又于近日推出了TSC Carat55EG系列可网管工业千兆冗余环网交换机,用于构筑高可靠性的1000M工
为解决部署在梨树断陷的首口页岩气水平井梨页1HF井存在的井壁失稳风险高、机械钻速低、固井施工难度大、井眼轨迹控制难度大等技术难题。在梨页1HF井施工过程中,通过综合应
很多医生在诊治慢性前列腺炎以及其他盆腔感染充血疾病时,常常会让患者在进行常规治疗的前提下,进行适当的热水坐浴,甚至不进行任何特殊治疗而把热水坐浴作为治疗的惟一方法。殊
报纸
简单地说,供应链转型就是系统提高供应链的能力,以便做以前做不到的、价值更高的事。供应链分三段:供应商与供应商管理、生产与运营管理、客户和客户管理/服务。这里讲的是客户端
购销比价法是一套科学的加强企业内部管理的有效方法,是施工企业降低工程成本管理的最直接、最有效的手段之一。本文介绍几种方法,供参考。
目的分析探讨肿瘤标志物检验在胃癌诊断中的临床价值。方法选择在本院进行治疗的胃癌患者40例,将其列为观察组,选取体检健康者40例,将其列为普通组,具体的选择时间为2018年2