大数据背景下多重抽样框方法探讨

来源 :统计与决策 | 被引量 : 0次 | 上传用户:weichungchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前所获取的大数据并非都是总体数据,通常未能完全覆盖总体,因其多源异构的特性,致使传统的数据分析方法受阻。文章将抽样调查方法引入到大数据中,对大数据背景下应用多重抽样框的必要性进行剖析,并主要针对大数据中数据多源异构的难点,将每个来源数据作为一个抽样框进行处理,提出了大数据中多重抽样框的构建。进而根据大数据的数据特征进行分类,针对不同情况确定是否需要进行分阶段抽样设计,并提出运用SF估计量对基于多重抽样框的总体进行估计,此估计量较为符合大数据中多重抽样估计的需求,并能对总体有较好的估计。
其他文献
本文介绍了利用故障阅读仪V.A.G1551对奥迪A6轿车097型电控自动变速器进行故障诊断时,故障阅读仪的连接、功能选择、故障码的读取和故障码的清除等操作的具体方法。
中小企业的迅猛发展,使得其对资金的需求日益增加,而中小企业贷款难度也日益加大,其中中小企业融资渠道主要是银行贷款。将具体从银行的角度介绍中小企业融资难的现状,试图分析中
本文研究了以玉米淀粉为原料,用耐高温α-淀粉酶液化,真菌淀粉酶糖化生产麦芽糖浆的工艺。探讨了玉米淀粉乳浓度、液化时间对液化DE值的影响,以及液化DE值、温度、pH值、酶用
在初中教学阶段,学生的层次差异比较大,由于不能分快慢班,导致在课堂教学的组织上比较的困难。在课堂教学中实施分层教学成为了必要的手段,但是在具体的分层教学如何实施,如何让分
【正】 到馆读者的具体情况很多,要全部罗列出来比较困难,也没有必要。我们不妨就几种主要情况来推测一下读者心理,由此也想判断一下专业图书馆工作的哪些方面应该比较侧重。
关于自然资源价值问题的研究,目前尚未形成统一定论。本文在分析当前国内多种自然资源价值理论的基础上,从劳动价值论和效用价值论两个角度对价值的本质进行辨析,并在此基础上进
由中央电视台文艺中心影视部和广西满地乐影视文化有限公司、北京联盟影业投资有限公司和南宁电视台联合出品的20集电视连续剧《没有语言的生活》日前登陆央视八套。这 Tele
作为一名医学工作者,必须每天都要学习很多新的医学知识,记忆很多药学名词。只有这样才不至于被社会所淘汰。可面对自己年龄大、工作忙、记忆力差的问题,怎样提高自己学习和识记
期刊
目的观察回肠造口周围皮肤炎患者行气囊导尿管封堵引流治疗的效果。方法将66例回肠造口周围皮肤炎患者按入院时间的先后顺序分成3组,观察组23例采用气囊导尿管封堵引流治疗,
总结了目前我国杜鹃花繁殖、栽培、育种方面的研究进展,并指出了我国杜鹃花繁育研究存在的问题。