混合布尔算术表达式化简与混淆研究

来源 :刘彬彬 | 被引量 : 0次 | 上传用户:liongliong556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合布尔算术(Mixed Boolean-Arithmetic,MBA)混淆技术是一种语义保留的变换方法,它将一个简单的表达式转变为一个难于理解和分析的形式。更具体一点,这种混淆技术产生的表达式包含混合使用的算术运算操作符(如,加法和乘法操作)和布尔运算操作符(如,与、或、非等操作)的表达式。MBA混淆技术即使在面对静态或动态反混淆方法时,包括先进的SMT求解器分析技术,依然能够有效隐藏程序中的数据和算法流程。然而,专用的MBA反混淆技术依然处于不断发展中。目前先进的MBA化简方案,如模式匹配,bit-blasting,程序综合,和深度学习等方法,依然存在着各种不足,如面临着严重的性能问题,为特定MBA模式所设计,或产生过多的错误化简结果。与现有的线性MBA化简方法相比,本文深入线性MBA混淆机制的设计中,抽象出其核心机制为:基于真值表的线性方程组求解系统。之后,本文提出signature-vector的概念,signature-vector能够表示线性MBA表达式的完整语义。基于signature-vector,本文发展出一种高效的线性MBA表达式化简办法。首先,基于线性MBA表达式的真值表来计算signature-vector。对于任意给定的signature-vector,通过计算位运算表达式的线性组合来重新构建一个简单的表达式。通过这种方式,针对任意的线性MBA表达式,该方法可以将其化简为一个等价的简单形式。我们已经实现该化简方法为一个开源工具MBA-Blast,并且在一个具有10,000条线性MBA表达式的数据集上进行测试。本研究也在真实的二进制反混淆场景下测试MBA-Blast,实验结果表明MBA-Blast能够帮助软件分析人员理解被混淆后的恶意软件的行为。与已有的工作相比,MBA-Blast是最高效和通用的线性MBA表达式反混淆技术;MBA-Blast具有坚实的理论基础,化简线性MBA表达式成功率高且代价可以忽略。MBA表达式的反混淆研究对MBA混淆技术提出潜在的挑战,因此现有的MBA混淆技术必须被加强以克服这些出现的挑战。本文首先回顾已有的MBA混淆技术,并且阐明现有的MBA混淆技术主要基于线性MBA表达式—MBA表达式的一个简单子集。这种现况留下一个未被探索的研究方向,也就是更复杂的非线性MBA表达式。因此,本文提出一种新的混淆方法来展示非线性MBA混淆技术的潜力。非线性MBA表达式是通过组合或变换具有坚实理论基础的线性MBA表达式而得到。与现有的MBA混淆技术相比,本研究能够产生更复杂的非线性MBA表达式。我们已经实现该方法为一个开源工具,命名为MBA-Obfuscator,并利用该工具产生一个大规模的数据集。相关实验结果表明,MBA-Obfuscator是一个具有坚实理论基础的实用混淆技术。非线性MBA表达式的出现,提出一个全新的挑战:如何化简MBA表达式。本文首先探索SMT求解器处理不同种类MBA表达式的能力:线性,多项式,和非多项式MBA表达式。我们观察到SMT求解器只能处理简单的线性MBA表达式,在面对复杂线性MBA表达式和非线性MBA表达式时面临严重的性能瓶颈问题。为了提高SMT求解器的处理能力,本文提出一种语义保留的方法来化简MBA表达式。首先,我们将任意一个位运算表达式转换为一种统一的形式—一个简单的MBA表达式。之后,我们应用基本的数学规则来合并同类项,并产生一个具体的化简结果。实验结果表明,本研究提出的化简方法能够极大提高SMT求解器处理MBA表达式的效率。本文提出的方法已经能够成功化简多项式MBA表达式,最后一个挑战便是如何化简非多项式MBA表达式。本文提出一种基于神经网络的化简方法,神经网络模型的输入为非多项式MBA表达式,输出为一个简单的表达式。首先,本文构建相应的神经网络模型,并用它们来学习非多项式MBA表达式的语法和语义。之后,本文生成一个大型数据集,它包含一百万个非多项式MBA恒等式,并用该数据集训练神经网络模型。最后,利用训练好的神经网络模型来化简非多项式MBA表达式。实验结果表明,同已有的化简方法相比,本研究提出的方法在大幅提高化简正确率的同时也能大幅降低化简时间。本文以MBA表达式为研究对象,提出不同的方法来产生非线性MBA表达式,并且提出一系列方法来化简不同种类的MBA表达式。希望本文工作能够对MBA表达式的混淆和化简提供新的思路和见解。
其他文献
学位
水的性质在许多物理、生物和化学过程中发挥着重要作用。作为双电层的主要组成部分之一,界面水的结构和取向对许多界面过程均具有重要影响。目前,双电层的研究重点通常集中在溶剂化离子在带电界面的排列上,而溶剂分子的结构、取向和氢键网络却少有报道。在分子水平上探究界面水的结构和功能为电催化、膜科学及蛋白质工程等诸多领域提供理论指导,但由于现有技术手段的限制,原位揭示水的结构与功能仍存在巨大挑战。在本论文中,主
量子计算中数据存储和数据处理都是在量子比特中完成。对于超导量子计算,执行量子门操作时,需要产生一系列控制脉冲依次应用于量子比特上。正是由于这样的特性,超导量子计算依赖经典电子学来完成量子比特的操控和测量。目前商用测量仪器广泛应用于学术界的超导量子实验室中,但随着超导量子计算领域飞速发展,基于量子纠错的容错量子计算和嘈杂中等规模量子计算两条路线的发展对用于量子比特操控和测量的电子学系统提出了新的挑战
磁双稳态分子基磁性材料在高密度信息存储、自旋电子学、量子计算和分子制动器等方面具有潜在的应用价值,是分子材料的热门研究领域之一。为了探究影响环形磁矩和自旋转换现象的内在要素,揭示其磁学现象的内在本质,本论文设计、合成了一系列具有磁双稳态的单核铁和多核稀土配合物,考察了抗衡阴离子对自旋交叉配合物磁性的影响;以双配位基团配体构筑了可结合自旋交叉单元的单分子磁环;利用原位反应成功构筑了首例四面体Dy4单
研究目的:本文以无锡市立人小学为例,研究12周的民间体育游戏对小学生身体形态、身体机能和身体素质的影响,探讨体育游戏对小学生身体健康产生的促进作用,从而为能够更好地发展民间体育游戏、丰富小学体育教学内容、提高学生体育运动的参与度、促进学生健康成长提供参考建议。研究方法:将身体健康的90名小学五年级学生分为实验组(45人)和对照组(45人),实验组以民间体育游戏为活动主要内容,对照组以常规体育课教学
希格斯机制是标准模型中电弱对称性自发破缺的根源,解释了基本粒子的质量。所预言的希格斯粒子是标准模型中唯一的标量粒子。2012年,ATLAS和CMS实验分别在大型强子对撞机上发现了希格斯粒子。在过去的十年中,ATLAS和CMS实验对希格斯粒子的性质的测量精度不断提高,检验了标准模型,同时探测超出标准模型的新物理。希格斯玻色子衰变为一对底夸克在所有希格斯衰变模式中具有最大的分支比,这使得它成为研究希格
原子力显微镜因具有高分辨、高灵敏以及能在近生理条件下成像的优点在生物学领域的研究中得到了广泛的应用。原子力显微镜不仅能够用于表征样品表面的形貌特征,还能用于定量测定生物分子间的相互作用、识别和定位细胞表面特定分子以及测量细胞力学性能等。本论文基于原子力显微镜开展了以下几个方面的研究:1.基于原子力显微镜单分子力谱技术研究了甲基化CpG结合蛋白2(MeCP2)的甲基结合域MBD与甲基化DNA之间的相
贫困问题一直是困扰全世界各国的难题,中国也无法规避贫困对国家、社会所带来的消极影响。2020年脱贫攻坚战取得了全面胜利,消除了绝对贫困,但这并不意味着中国将不再有贫困人口这一概念,贫困治理仍然任重道远。在减贫的各项政策当中,发挥兜底保障作用的社会救助政策始终占据着举足轻重的地位。社会救助是由国家和社会牵头,依法对难以维持最低生活保障的个人和家庭给予物质、实物和服务等多方面的帮扶,以保证其基本生活的
随着量子霍尔效应的发现,与拓扑相相关的研究逐渐成为凝聚态物理中最有活力的领域。作为一种具有代表性的拓扑相,在零磁场下即拥有量子化霍尔电导的量子反常霍尔效应于1988年首次在理论上由物理学家邓肯·霍尔丹(Duncan Haldane)提出。但较为苛刻的实现条件使其一直停留在理论研究层面。随着新型拓扑材料的发现,量子反常霍尔效应最终在实验中被观测到。至今,量子反常霍尔效应已经在:(ⅰ)磁性掺杂拓扑绝缘
本研究融合记忆理论与构式语法理论,构建出“记忆—构式”教学模式。该模式基于构式语法理论将句式分解为结构语块、语义语块和语用语块,减轻学生的理解负担;同时遵循记忆规律和周期,合理设置复现节点对语法结构进行节律性复现,以提高汉语句式学习效率与言语交际效能。“记忆—构式”教学模式的有效性在教学实践中得到较好证实,针对印尼八华学校小学汉语初级课堂的连动句教学效果如下:一轮教学周期后,实验班的连动句使用正确