基于统计机器学习方法的原子在强激光作用下电离的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:chj0821031
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的日益发展,在很多领域产生了复杂且体量巨大的数据。如何从各种各样的数据中获得有价值的信息是一个值得研究的方向,其中,对数据进行分类则是关键的一步。在传统分类算法中,对于样本中类与类之间的数量以及误分类的代价等方面的研究较少。在处理不平衡数据的问题时,传统分类算法的性能表现有待提高。因此,针对不平衡数据的研究应运而生。不平衡数据在经济、医学等领域十分常见。例如:解决欺诈检测、医疗诊断和垃圾邮件过滤任务。目前很多学者针对不平衡数据的分类进行了大量研究,例如:从数据采样层面、单类学习层面与集成学习层面处理不平衡数据的问题。对于数据采样层面,主要分为欠采样和过采样两种方式,通常用SVM、KNN等传统分类方法作为基分类器。对于单类学习,其训练只包含一类样本的数据,不具有稳定性。单分类器集成是近几年的一种新的方法,是将不同标签数据训练所获得的单分类器集成起来,相比于单分类,效果有了进一步提升。在原子研究领域,强激光场辐照体系下的电离行为是该领域的研究热点。强激光与原子之间的相互作用会产生高次谐波发射以及非次序双电离等非线性的现象。这些现象可以通过“半经典”模型来作出解释:原子在强激光的作用下,可以通过隧穿或者是越垒的方式进行电离。之后,电离的电子在激光场的振荡作用下可能会返回到母体离子发生重碰。现存的原子在强激光作用下电离的研究一般是基于电离之后的轨迹分析,而在电离之后,重碰的行为明显少于非重碰的行为,这使得相关数据集产生了不平衡的现象。由此,基于非平衡分类法的原子在强激光作用下电离的研究是非常重要的。本文的主要目标是增强不平衡的原子电离数据的分类效果,一方面,我们将采样技术与现有的分类方法进行结合,与不平衡数据研究方向中的最新研究成果单分类集成方法进行评比,在评价指标上给出结果。另一方面,将过采样、欠采样与分类方法结合前和结合后的结果进行对比,以求掌握不同采样技术与常用分类方法结合后的整体结果。本文提出一种基于单分类的神经网络的统计机器学习方法来研究强激光作用下原子的电离之后电子的状态分类问题,数据集为电离之后电子的位置数据和动量数据。首先针对数据集进行处理,分别进行了特征生成和主成分分析;然后计算每个样本的集成单分类分数,将其作为每个样本的特征;在得到新特征之后,通过神经网络方法进行分类。本文方法与普通分类方法、过采样与欠采样方法以及集成单分类方法在AUC值、准确率、精确率、召回率和F1分数等几个方面进行了比较,证明了本文所提出的分类模型在原子电离数据上的分类效果更好,能够有效地对电子是否会发生重碰行为做出预测并判定,具有对激光实验中判定电子状态的实际意义,对后续的激光实验中的研究提供了支撑作用。
其他文献
近年来,我国的经济正从粗放型发展向高质量发展转型,国家大力推动质量强国相关建设,经济结构和产业结构的调整与升级不断深入。检验检测行业作为国家质量基础设施的重要组成部分,是国家重点发展的高技术服务业和生产性服务业,对高标准市场体系建设,经济结构的不断优化等方面发挥着重要的作用。本论文研究对象是GD公司的检验检测业务。GD公司创建于1964年,2002年正式注册成立,2019年在深交所上市,是国内领先
学位
网状Meta分析是一种将多个独立研究结果进行定量合并分析的统计学方法,克服了传统Meta分析只能对比两种治疗措施的疗效的不足,具有将多种治疗措施的直接比较与间接比较进行合并的强大功能。通过数据分析和统计推断,网状Meta分析可以使医生或患者在众多的治疗措施中选择出最安全有效的一种,从而为临床决策提供准确的参考。本文对肩袖撕裂的修复疗效进行了网状Meta分析,涉及到的修复技术包括单排修复、双排修复、
学位
中国作为全球最大经济体之一,同时也是全球最大的温室气体排放国家。核电作为一种高效的绿色、清洁能源,对于实现节能减排的目标具有重要意义。G集团是中国最大、世界第三大的核电企业,截至目前,集团旗下在运和在建机组装机容量均位列国内首位。在国家政策支持下,G集团的核电业务发展将迎来更多机遇和空间。与此同时,G集团也面临着诸多挑战。尤其是自2015年实施新一轮电力市场改革以来,中国核电行业逐步引入双边协商定
学位
随着金融市场的不断变化,金融风险管理在资本配置、投资组合等应用领域中发挥着不可忽视的作用。在应用过程中,往往需要计算或估计一个随机变量的期望值去度量风险,通常使用的是分位数欧拉资本配置方法,也称为风险价值法(Value at Risk,VaR),就是用该随机变量在某个预先指定的概率水平下的分位数,作为其风险度量的值,但是这种方法的经典非参数估计的收敛速度低于标准速率且不满足次可加性。由于资本配置者
学位
整数值时间序列数据在经济、医学和环境科学中非常常见.整数值自回归(integer-valued autoregressive,记为INAR)模型和整数值广义自回归条件异方差(integer-valued generalized autoregressive conditional heteroskedasticity,记为INGARCH)模型常被用来拟合这类数据.本文分别基于这两类模型来研究整数值
学位
现今社会,随着科技不断的进步,经济得以繁荣发展,人们对物质及文化的追求不断提升。消费者的购买力随之增强,对纪念品的需求也渐渐凸显,越来越多的消费者开始追求个性化、多元化、具有代表性的奖章和徽章等金属纪念品。在制造业升级和多种新技术发展的背景下,礼饰品行业逐渐发展壮大。为了向市场提供更优质的产品,多品种小批量的生产方式在越来越多的企业当中广泛应用。但随着原材料与人工成本的上涨,客户在准时交货、定制样
学位
2020年始,全球“缺芯”的浪潮愈演愈烈,各行业芯片全面短缺的局面出现,全球深陷芯片短缺的困局。而中美贸易摩擦所带来的科技制裁,也触痛了国人的“缺芯”的神经。2021年,我国“十四五”规划将半导体行业纳入重点发展产业,行业发展进入了快车道。随着国家政策对半导体行业的不断加持,也为了减少芯片的对外依赖,我国半导体公司如“雨后春笋”般涌现,半导体行业人才也因此愈发紧缺。在此背景下,人才的作用在半导体企
学位
随着大数据技术的高速发展,高维数据已普遍存在于医疗、电商、交通、金融等多个领域.然而,数据维数的膨胀给数据的统计分析带来了极大的困难和挑战.充分降维(SDR)方法在实现降维的同时保证了给定预测变量时响应变量的条件分布不会有信息丢失.在本文,我们首先提出了一种新的度量随机向量间相关性的方法:秩散度(RD).进一步介绍了基于RD的SDR(RDSDR)方法来估计中心子空间.该方法具有模型自由的优势,与其
学位
WH网络公司是一家经营超过二十年的企业互联网服务、网站建设服务的老牌公司。然而新生代员工工作价值观个性凸显并呈现出高流动性的职场新态,给正面临移动互联网业务冲击的公司经营带来巨大挑战。本文通过对WH网络公司新生代员工产生离职倾向的影响因素进行研究,并为降低新生代员工的离职提出管理对策。本文先介绍WH网络公司经营背景、新生代员工离职情况和人力资源管理现状,得出新生代员工离职管理研究的必要性。通过管理
学位
在本文中,我们研究如下一类六阶双曲方程的初边值问题(?)这里Ω ? Rn是具有光滑边界?Ω的有界区域,ε>2,β>1,p满足(?)本文研究上述六阶方程在三种不同的初始能量下解的性质.首先利用Galerkin方法和压缩映射原理得到了弱解的局部存在唯一性,进一步结合位势阱方法不仅得到了方程解整体存在的一个临界值,还得到了在初始能量小于临界值时解的不变集和真空隔离区域.其次研究了亚临界能量E(0)<d和
学位