多重检验中原假设比例的估计与应用

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:isaxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的不断发展,海量数据的作用日益明显。多重检验作为分析高维数据的重要理论,已经引起了许多统计学者的注意。多重检验有着广泛的应用,比如生物信息学、医药行业以及基因组学等。本文着重探讨多重检验中原假设比例的估计与应用问题:  本文首先介绍了多重检验的背景、意义以及研究现状,通过对正确原假设比例估计问题进行分析研究,确定了本文的研究重点。接下来介绍了多重检验的一些基本理论,指出了多重检验中最重要的是控制第一类错误,然后给出了几种错误度量标准,指出了FWER和FDR的重要性。根据P值的定义与性质,提出用P值来进行假设检验。在假设检验相互独立和相依的情况下针对FDR介绍了各种检验方法,并引入了两阶段FDR控制方法。在研究错误发现率时,发现了估计正确原假设比例的重要性,并用数据说明了估计真正原假设比例的意义。  其次介绍了几种已有的估计方法,通过对已有方法进行分析研究,我们提出了新的估计方法。新方法主要是将三次样条方法应用在Jiang和Doerge(2008)提出的均值法上,并将几种方法分别在均匀数据集、非均匀数据集和隐藏相依结构的基因表达数据上进行模拟研究,给出了几种方法的估计值,我们发现新的估计法有较好的效果。  此外,我们又提出用参数混合模型来估计真正原假设的比例,主要针对正态分布混合模型给出了四种算法:矩估计方法(MM)、EM算法、k-means和EM算法(KMEM)以及改进k-means和EM算法(MKMEM),并对四种算法在不同情形下进行模拟,并给出了四种算法的估计偏差。  论文最后以微阵列数据为例,给出了三种数据集:乳腺癌基因表达数据、肿瘤细胞数据以及GSE1743肾移植数据,进行仿真研究,给出各种方法在不同数据集下的估计值,确定我们方法的可行性。
其他文献
在金融数据分析、股票交易、网络安全等领域,产生了以“海量”,“高速”为特征的流式数据,这些数据流持续不断地到达且速度无法估计,数据的价值随着时间的流逝而减少并具有实
通过视频序列检测交通事件是目前国内外在智能交通领域中检测交通事件较为前沿的一种方法,而提高事件检测的准确性,降低其误报率是当今研究的热点。本文从基于视频的交通事件检
云存储服务利用云计算技术将基础设施层大量不同类型的存储设备通过合理组织构建存储系统平台,向用户提供数据存储、共享、访问和管理等功能。为了保证用户访问请求能够得到快
视觉跟踪在智能监控,人机交互,车辆导航的方面有着广泛的应用,是计算机视觉领域研究热点。稀疏表示因其符合人类视觉特性,而且能降低图像处理对视觉特征的依赖,引起了研究人员的广
在实时监测卫星系统运行状态的过程中,数据量非常之大,人工监测反应过慢。面对已经出现异常数据的卫星,或者即将进入异常运行状态的卫星,难以提前采取措施。采用自适应指数平滑法
随着存储技术的不断发展,各种新型存储器件不断涌现。固态盘作为新型存储器件,随机读写能力远胜于硬盘,但其价格太高。而硬盘作为传统存储器,单盘容量越来越大,但是其数据存取速度
计算机技术在飞速地发展,而磁盘的存取速度却提升缓慢,成为了影响计算机系统性能的主要因素。新型的存储介质固态盘(Solid State Driver, SSD)的迅猛发展给存储系统注入了新的
随着单处理机计算速度和网络技术的不断提高与发展,计算机应用范围逐渐扩大,异构计算系统在现实生活和工作中得到了广泛运用。实时硬件任务调度与资源管理是异构计算系统的关键
钢铁工业的发达与否代表了一个国家的工业化水平,而且其在国家的经济组成成分中占了不可忽视的比例。带钢是钢铁工业的主要产品之一,用途非常广泛,可以用来制造自行车车架、轮圈
智能视频监控是机器视觉领域中的一个重要分支,是未来安全监控技术的发展趋势,在机场、银行、商场等场所中有着广泛的应用。其中运动目标检测技术是实现智能视频监控的关键技术