非线性级联结构数据的因果推断方法研究

来源 :南华大学 | 被引量 : 0次 | 上传用户:cannyjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,大数据技术的快速发展,给各个领域带来了海量的数据,而研究这些数据之间的因果关系,进而带来相应的商业、科学研究价值则显得至关重要。当前的人工智能在一定程度上忽略了因果关系而导致动力不足,因果关系的研究可能是实现强AI人工智能的唯一途径。因果关系方向推断则是因果关系研究的热点之一。目前的因果关系方向推断方法通过观测数据来识别变量之间直接的因果影响,但是由于观测到的数据之间可能存在级联结构,变量之间存在间接的非线性的因果影响,使得传统因果推断算法准确率低稳定性较差。基于上述问题,本文论述了因果推断的理论知识和经典的因果推断算法,然后在此基础上,本文做了以下工作:在级联非线性加性噪声模型的基础上,提出了一种基于对抗变分法的因果推断方法(AVCANM)来进行因果方向识别,该方法相较于传统的因果推断方法,能够更好地处理具有级联结构的非线性观测数据的因果方向推断问题。AVCANM算法通过对抗训练,在两个方向上分别优化数据的边缘对数似然的变分下界ELBO(Evidence Lower Bound),进而确定因果方向。该算法对ELBO的优化是利用对抗策略而非近似公式,对抗策略能允许潜在噪声有更广泛的分布,进一步提升了模型的推断能力。在理论上证明了该算法的可行性,并且通过在模拟数据集和公开数据集上的实验表明,相较于传统的因果发现算法,该方法在识别间接的、非线性的因果关系上具有较好的稳定性。在具有级联结构的高维数据中,本文结合AVCANM算法提出了一种适用于高维级联数据的因果推断算法。首先,通过最大相关性-最小冗余度m RMR方法(minimum-Redundancy-Maximum-Relevance)来判断各个节点之间的依赖关系,确定与目标节点存在依赖关系的节点集,通过判断节点之间的条件独立性,进一步优化节点集数量,得到节点之间的因果骨架无向图结构。最后,利用本文提出的AVCANM算法,判断并识别变量之间是否存在隐变量,并根据隐变量数量,对变量进行的因果方向识别,最终得到完整的因果结构。通过在模拟数据集上的实验表明,在具有级联结构的高维数据中该算法相较于传统算法有较好的表现。
其他文献
EAST(Experimental Advanced Superconducting Tokamak)装置是我国自制的全超导托卡马克装置,近期成功实现可重复的1.2亿摄氏度101秒和1.6亿摄氏度20秒等离子体运行。更高的温度和更长的运行时间对辅助加热系统提出了更高的功率和长脉冲稳态运行要求。离子回旋共振加热作为EAST装置中最有效的加热手段之一,而高压直流电源系统的性能直接决定高功率射频发射机系
学位
含铀废水是核工业产生的主要放射性污染物。含铀废水一旦排放到环境中不仅污染自然环境,还会威胁着人类的健康。因此,有效处理含铀废水具有重要意义。金属有机骨架(MOFs)是一种先进的多孔材料,在吸附方面表现出巨大的潜力。UiO-66是水稳定性MOFs材料中最具有代表性的材料之一。具有较大的比表面积和化学稳定性,具有较好的发展前景。但是,UiO-66是一种超细粉末材料,不利于固液分离。而且在酸性条件下Ui
学位
近年来,伴随着网络上的信息数量呈爆炸性增加,信息抽取的研究受到了普遍的重视,而事件检测又是信息提取中的子任务,成为了自然语言处理研究的重点,并出涌现了许多成果。作为自然语言处理中的一种有效手段,依存句法分析能够解析出文本中词与词之间的依赖关系,而图神经网络(GNN,Graph Neural Network)是近年来在自然语言处理领域中的成熟的深度学习技术之一,所以不少学者尝试将二者方法结合以提高事
学位
随着我国互联网和移动通信技术的发展,使得基于互联网的医疗平台,如在线医生系统和医患社区网络,越来越多地被患者和医疗专业人员使用,希望它们能缓解日益增长的医疗服务需求,并减少因地理和社会经济障碍造成的医疗服务获取困难。在这类的平台中,患者可以通过键入他们的医疗问题,说明他们的具体症状和已经采取的治疗手段等信息,建立与医生的对话。完成这个过程后,所有关于医疗问题的关键信息,以及诊断和医疗建议,都会被记
学位
随着互联网技术和信息技术的广泛应用,在线教育平台蓬勃发展,智能导学系统作为一种使用前沿的智能技术,通过计算机向学习者传授知识、提供学习路径规划的个性化学习系统,成为在线教育平台当下的发展目标。智能导学系统能够记录学生的习题作答情况,根据历史答题记录来追踪学生对各个知识概念的掌握程度,针对不同学生的知识状态进行个性化习题推荐,重点关注学生在知识掌握能力上的薄弱之处,提高学习效率。在智能导学系统获取学
学位
<正>北京时间2022年10月1日(北美时间9月30日),特斯拉2022 AI Day在加州帕罗奥图举行,人形机器人擎天柱正式亮相。在此之前,波士顿动力旗下的人形机器人Atlas已经可以走路、跑步、攀爬、跳过障碍,甚至可以在跌倒后自行起身。因此,人们很自然地觉得擎天柱理应比Atlas更加敏捷强悍,甚至能如同科幻电影中的机器人一样“强大”。然而,期望越高越容易失望。当看到擎天柱在台上颤颤巍巍地行走,
期刊
显微图像中细胞核的检测和分割对生物医学研究和临床实践具有重要意义,包括细胞核形态分析、癌症诊断和分级。然而,由于显微图像中存在染色不一致、目标和背景存在显著差异以及人为噪声等特点,再加上在显微图像中大多都是小目标且有覆盖和粘连的情况,从而导致鲁棒、精确的细胞核检测和分割非常具有挑战性。在目前的临床实践中,依靠病理学家手动评估疾病进程不仅需要专业知识,而且手动检查过程主观且耗时。近年来,深度学习方法
学位
静态分析发现软件缺陷是提高软件质量,确保软件可靠性的有效手段之一。近年来,研究使用自动确认技术来降低对疑似缺陷进行人工审查的成本是研究的热点问题。主流技术路线是通过设计一些缺陷特征,并使用机器学习中有监督的分类算法来自动实现对疑似缺陷的确认。其中难点和重点是设计准确性高的缺陷自动确认模型,本文针对如何提高静态分析缺陷自动确认的准确性以及如何将缺陷自动确认方法应用于核电领域做了如下研究:(1)提出一
学位
在深度学习中,大部分数据集存在数据冗余和样本分布不均衡问题,导致异常检测准确性下降,降低了异常检测效果。此外,大多数传统的异常检测模型忽略了数据点之间的关系结构信息,不能有效应用到图结构数据中。针对上述问题,研究一种不受不平衡样本数据影响以及将数据间的结构信息高效应用到图结构中的异常检测模型具有重要意义。而自编码器能够重构原始数据,可以自动从原始数据学习所需参数特征,能够有效地解决上述问题。因此,
学位
自20世纪末以来,作为一股新兴经济力量,基于互联网普及而出现的电子商务实现了从零到百万亿的爆炸式增长,为许多国家的市场注入了巨大的活力,在经济发展中逐渐占据一定的地位。这其中,电商平台依靠互联网技术的迅猛发展,凭借其商品的齐全性、交易的快捷性及低价优势快速壮大起来。电子商务全球网络零售额短时间内从零不断实现突破式增长,根据联合国贸发会议数据,2020年全球网络零售额占零售总额的19%,较2019年
学位