高维数据的正态性假设检验

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:asdfghjkb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正态分布凭借其优良的性质被广泛应用到多种统计理论和方法中,因此检验数据的正态性是非常有必要的。近年来,越来越多的实际问题涉及到高维数据,这也让正态性假设检验问题一直充满活力。本文从单变量正态性检验着手,总结了四大类检验方法的基本原理、优缺点和适用的数据类型等。本文将高维数据的正态性检验方法划分为基于统计图的检验、多个单变量的检验、合适的降维方法以及直接对高维数据进行检验。本文还归纳了单变量的正态性检验方法推广到高维情况下的常用手段。然后通过计算机模拟比较多种高维正态性检验方法的性能,得到的结论包括:高维正态性检验容易出现第一类错误不可控的情况,提高样本量和维数的比值是解决该问题的有效方法之一;HZ检验和独立化变换后的JB检验效果最好等。最后对两个实际数据集检验其正态性,结果均为拒绝原假设,进一步表明在实际研究中对正态性假设条件进行验证的必要性。
其他文献
近年来,跨境电信诈骗在我国频发,但因其诸多特点导致管辖权冲突不断,影响我国司法机关及时惩治犯罪。本文先后从现行法及普遍管辖原则入手,尝试解决管辖权冲突,继而通过对跨境电信诈骗管辖权冲突进行分类,认为一类是基于同一管辖原则产生的特有冲突,这一类冲突因跨境电信诈骗的虚拟性、团伙性特征产生,对于这一类冲突,本文认为可将属地原则中的信号传输地进行排除;另一类是基于不同管辖权原则产生的固有冲突,这一类冲突不
牛乳中富含多种营养物质和生物活性成分,为人类提供重要的营养,但容易受腐败菌和致病菌的影响而造成腐败变质。牛乳同时也是可产生强烈的过敏反应的主要食品过敏源之一。因此,研究能有效杀菌、保持营养并降低其致敏性的牛乳加工方式具有重要意义。本研究选取单循环和多循环高静压、短波紫外和远红外加工方式,分析了不同加工处理方式对α-酪蛋白微观结构、过敏性、消化性和抗氧化性的影响,并研究了这些处理对牛乳理化品质、微生
对小程序平台和云服务器租赁等新型网络服务提供者而言,应当灵活理解与适用《侵权责任法》第36条规定的“通知删除”规则。《侵权责任法》第36条第2款将适用主体扩展为“网络服务提供者”的同时,又相应地将必要措施进行了弹性扩展,增加了法律适用的灵活性,由此新型网络服务提供者应落入“通知删除”规则的适用主体范围之内。司法实践过程中,应明确“通知删除”规则的本质属性,将其作为免责条款适用,避免利益天平过分倾斜
灯盏乙素(Scutellarin)是从菊科植物短葶飞蓬中提取分离的黄酮类成分,长期用于脑栓塞、中风后遗症、冠心病及其他缺血及微循环障碍疾病的临床治疗,具有较好的疗效和安全性。灯盏乙素苷元(Scutellarein)是灯盏乙素脱去葡萄糖醛酸基团的苷元部分,是灯盏乙素口服吸收的主要形式。与灯盏乙素相比,苷元的脂溶性增加,脑缺血损伤保护作用也更强。因此,灯盏乙素苷元有望成为一种新的、较为安全有效的脑缺血
我国将主要目的测试视作主要的反滥用措施来防止税收协定滥用,并且在该方面有着较长时间的适用历史,但未曾出台过进一步的实施细则,加上主要目的测试赋予了执法机关很大的自主裁量权,因此,主要目的测试在我国适用时可能发生某些问题。若想要较好地发挥主要目的测试条款的应有作用,这些问题亟需解决。BEPS多边公约的签署,不是国际反避税的终点。作为签订有大量双边税收协定国家,我国仍需要在立法、执法等方面不断完善主要
Thailand and China have a historical relationship that dated from the ancient time.The relationship of two countries began more than 2,000 years agoduring the Han Dynasty era.The different political i
学位
目的:本研究通过对上海市三所高校大学生体力活动、屏幕时间以及焦虑、睡眠质量的调查:1)了解目前上海市大学生体力活动水平、屏幕时间现状以及焦虑水平和睡眠质量状况;2)研究体力活动与大学生焦虑及睡眠质量之间的关系;3)研究屏幕时间与大学生焦虑及睡眠质量之间的关系;4)研究体力活动和屏幕时间共同作用与大学生焦虑及睡眠质量之间的关系,以此为我国健康教育和健康促进项目在大学生人群中进行顺利推广提供科学的依据
近年来,由于经济和互联网的高速发展,出现了“数据爆炸”现象,造成了信息过载,由此引出了推荐系统。本文主要针对推荐系统中基于用户的协同过滤(user-CF)算法进行改进。首先,学习了一些较成熟的推荐算法,对各个算法的研究思路及优缺点分别进行概述。其次,针对user-CF算法中用户冷启动的问题,建立基于用户画像的相似度计算模型。最后,针对用户-评分矩阵高维稀疏的问题,建立基于内容的推荐与user-CF
随着时代的进步,大量的自然语言文本出现在了电子商务、论坛、博客等网站上。它们数据量太大,所以无法用人力来一一分析,使用电脑来对这些数据进行语义分析是必然的选择。现在主要的自然语言处理方法有两种,一种是基于统计的方法,它是机器学习领域的成果,主要原理是用词组出现的概率来计算舆情信息;另一种是基于有限状态机的方法,主要原理是由语言专家归纳语法规则,系统读取这些规则并处理文本、生成舆情信息。第二种方法在
基于量热法和MEMS技术所制备的芯片量热计是用于描述化学反应或生物过程的有效工具,具有尺寸小、制造成本低、样品用量小、便携性高等多种优点。它在酶催化反应、活性蛋白肽变性过程、碱基DNA链中核苷酸渗入等生物检测领域有广泛的应用前景。首先介绍了量热计的工作原理和传统量热计的缺陷,并引出了MEMS技术对于芯片量热计发展的推动作用;然后基于器件性能和设计要素包括量热法、传感方式、腔室结构和材料对国内外研究