基于互信息图神经网络的加密数字货币违法交易检测方法研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:xjwyx770729
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着加密数字货币的迅速发展,其种类愈加丰富。加密数字货币带来诸多方便和财富的同时也滋生了洗钱、敲诈勒索、黑市交易、赌博等违法犯罪行为。与传统的货币不同,加密数字货币为犯罪分子提供隐蔽交易形式的同时会暴露出他们独有的行为方式,研究人员通过加密数字货币的交易时间,交易地点,交易数目等一系列特征行为来分析当前这笔加密数字货币的交易是否合法。加密数字货币交易合法性的检测面临两方面问题:一方面,只有少数加密数字货币的交易属于违法交易,而大多数交易都不存在异常,两类样本极度不平衡。另一方面,由于数据量庞大,人工难以进行全部标记,且受限于领域专业知识,标注人员无法高准确度地标注数据,因此数据中存在大量数据未被标记的情况。因此,在复杂的加密数字货币交易中准确分辨出合法交易和违法交易颇有挑战。为解决这两方面问题,本文提出基于互信息图神经网络的加密数字货币违法交易检测算法,主要研究内容分为以下两点:(1)将互信息和传统的交叉熵损失函数相结合,得到基于互信息先验的损失函数,并将其用于缓解加密数字货币违法交易检测数据集中正负样本不平衡问题。首先,利用互信息的思想,从已知标签信息中得到与标签先验有关的偏移量。然后,将与标签先验有关的偏移量应用到每一个图神经网络的输出中,以此缓解类别不平衡问题。实验结果表明,在加密数字货币违法行为检测中,使用互信息先验损失函数的方法比传统用于处理数据不平衡的方法可以取得更好的效果。(2)将互信息和自监督学习相结合,得到基于互信息自监督图卷积神经网络模型,用于处理数据集中存在大量未标记数据的问题。其核心是使用互信息来最大化图的全局特征和局部特征,并通过图的全局特征和局部特征来构建正负样本对。正样本对的局部特征是将当前节点通过图卷积神经网络之后的特征,全局特征是整个图中节点通过图卷积神经网络之后节点特征的均值;负样本对的局部特征是将图中节点的顺序打乱,再通过图卷积神经网络输出节点的特征,全局特征也是整个图中节点通过图卷积神经网络后节点特征的均值。通过判别器对正负样本对打分并训练网络模型。最后将原始数据输入到自监督学习训练好的图卷积神经网络模型中,获取新的节点特征,再将其输入到一个二分类器进行分类。实验结果表明加入基于互信息自监督图卷积神经网络的加密数字货币违法行为检测模型比不加入自监督的模型有提升,并且在此基础上加入基于互信息先验的损失函数之后模型效果得到更大的提升。
其他文献
科技的进步和生活水平的提高促进了人类的平均寿命的提高,但与此同时,人口的老龄化问题也逐渐突出。据研究显示,我国的老年人口将在2035年达到4亿的规模,比例接近三成。而伴随发生的老年人的慢性疾病发病率也随之水涨船高,如不进行早期检测和干预,甚至会威胁生命。如果能对人体进行实时的健康监测,并在早期及时进行诊断和治疗,则会降低这些疾病朝着恶化的方向发展的概率。无线体域网技术的出现和发展则正好可以应用于此
学位
图像融合是指将图像中有意义的信息从源图像中提取出来并加以组合,使其生成的融合图像具有更大的信息量并利于后续应用。红外与可见光图像融合是图像融合中一个重要且经常发生的问题,红外图像具有明显的对比度,能够在恶劣天气下有效地将目标信息从背景中突出出来。可见光图像包含丰富的纹理细节,更加符合人类视觉的感知系统。红外和可见光图像融合将这两种特征结合起来,产生具有高对比度和丰富纹理的结果。本文提出一种新的基于
学位
互联网中,论坛贴子、观影评价、商品购买评价及回复、咨询、建议、即时聊天记录(MSN/QQ/We Chat)等内容通常是短文本。针对此类文本内容实现文本自动分类具有广泛用途,如根据影评内容判断观众对电影喜爱是正向、负向还是中立等。因此,基于自然语言处理技术的短文本分类问题成为研究热点。文本分类方法主要分为两大类,分别是基于传统机器学习的方法和基于深度学习的方法。在传统的机器学习方法中,文本分类精度的
学位
目前较为普遍接受的星系形成与演化理论认为星系停止恒星形成活动的过程伴随着形态的改变。大质量红色盘星系的存在对这一理论提出了挑战。已有研究表明,这类星系具有显著的核球成分,由此得出形态熄灭机制可能是红盘星系熄灭的机制之一。然而,其中的成分分解采用的是简单的核球加盘成分的模型。本文通过对近邻红色和蓝色大质量盘星系的多波段多成分二维图像测光分解获取其核球等子成分的物理参数,并进一步对比分析红色大质量盘星
学位
目前,单模态情感识别技术在很多领域都得到了广泛应用,比如表情识别、语音情感识别等。但由于单模态状态下的特征信息有时会出现数据量不足或受到外界影响严重等情况,所以多模态方法以其模态的多样性和模态之间的互补性正逐渐受到重视。虽然多模态融合的策略在一定程度上弥补了单模态的不足,但由于不同模态之间有一定的异质性也有一定的相似性,那么选取适合不同特征互相连接又不增加特征冗余的融合结构是很重要的研究方面;并且
学位
无线传感器网络(wireless sensor networks,简称WSN)中,能源问题是无线传感器网络在应用中面临的最重要挑战之一。无线充电技术无疑是解决能量问题的可行方案。在WSN中部署一个或多个带有大容量电池的无线移动充电器(mobile charger,简称MC),这被称为无线可充电传感器网络(wireless rechargeable sensor networks,简称WRSN)。在
学位
称呼语是言者用于指代听者所使用的名称,是言语交际中不可或缺的组成部分。它的语用功能丰富,可用于引起或维持听者的注意力,体现听者的年龄、性别、职业或种族等社会属性,或展现言者的意图和态度。各个民族都有自己的称呼语系统,它们之间既有差异,也有共性,这些差异和共性在翻译中有所体现。因此,研究称呼语的翻译有两方面的意义。一方面,它有助于加深我们对不同的称呼语系统的理解。另一方面,面对文化差异给翻译带来的难
学位
聚焦分类学习是当前多聚焦图像融合最流行的框架方法。这类空间域的方法将多聚焦图像融合视为一个聚焦/离焦分类问题:首先使用一个预训练的神经网络模型判断源图像的聚焦特性,进而通过拼接源图像中的聚焦区域来生成一幅全聚焦图像。虽然这种基于深度学习的融合框架已经显示出突出的性能,然而由于源图像聚焦二分类的基本前提并不完全符合实际,因此会导致融合质量下降。为了充分利用深度学习模型的优点并有效克服上述这些缺点,本
学位
随着计算机的普及和网络技术的发展,数字媒体内容的大范围和快速传播有了深厚的发展土壤,这促进了文化交流,但也由于其零成本的复制、秒速的传播使得盗版产品广为流传,数字版权面临着极大的挑战。为了解决这一问题,本文针对图像的篡改检测识别,提出了一个算法技术框架。用于检测对图像进行的添加、删除和翻拍等操作,以保护原创图像。在对原图上的篡改检测效果良好的基础上,对于翻拍、变形图像的检测问题,也取得了一定的效果
学位
股票是人们日常生活中一种重要的投资方式,合理分析股票价格的走势并作出准确的预测一直是投资者和金融学家们关心的问题。由于股票数据存在非线性、多特征等特点,传统的基于统计学构建的预测模型难以对股票价格作出准确的预测。近年来,人工神经网络依托硬件技术的进步取得了长足的发展,可以高效地处理大量、多维的数据,这为股票预测领域提供了新的研究方向。但股票价格的走势与多种因素有关,如板块效应、宏观经济政策、技术指
学位