基于少数类过采样的倾向得分匹配插补法

来源 :统计与信息论坛 | 被引量 : 0次 | 上传用户:jeeryf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无回答在大数据应用中频繁发生。通常,实际数据的无回答率较低,在这样的情况下,采用倾向得分模型对无回答单元与回答单元进行匹配,易导致倾向得分匹配插补法的插补效果显著下降。为此,将合成少数类过采样算法的思想融入到倾向得分匹配插补法中,提出基于少数类过采样的倾向得分匹配插补法。利用统计模拟与实证研究,在不同无回答率、插补重数和误差分布情形下,演示新插补法的统计性质和应用效果。统计模拟显示,新插补法具有明显高于倾向得分匹配插补法的精度,统计性质受无回答率、插补重数和误差分布的影响小。实证结果显示,新插补法在
其他文献
提高组版效率,不仅需要编辑和编辑部门不断增强使命感和责任感,对业务精益求精,进一步改进工作方式,而且需要提高采编"一条龙"的质效,不断提高全流程的管理水平,进一步完善流
新的传播技术改变了社会信息的流动结构,舆论极化与新媒体紧密相关,因此对于社交媒体下的舆情应对与信息治理亟待深入研究.利用社会网络分析方法,选取疫情期间具有代表性的"
言论专栏是党报党刊竞争力的综合体现,河南《开封日报》在媒体融合发展时代背景下积极打造时评热议专栏,本文结合创办实践,着力从关注社会热点体现新闻时效性、发挥党报特色
钓鱼邮件作为一种普遍的社会工程学攻击方法,是黑客常用的攻击手段.APT攻击综合运用社会工程学和多个漏洞实施攻击,通常具有较强的隐蔽性,钓鱼邮件是APT成功实施的关键因素之
一直以来,为适应传播技术的发展,作为三大传统媒体中历史最悠久的纸媒也堪称是尝试和变革最多的。融媒体时代,纸媒再一次遭遇前所未有的挑战与空前激烈的竞争。面对人们手机
随全球分工网络的不断深化,发达国家借助其掌握的核心技术和品牌服务持续限制着发展中国家的附加值获取能力。本研究从宏观和微观角度估计了中国制造业价值链曲线,并验证了中
随机前沿模型在小样本情形下容易出现正偏度问题,无法给出厂商技术效率的合理估计值。放松经典模型中关于复合扰动项的相互独立假设后,基于Copula方法刻画白噪声项与技术无效
南阳诸葛庐,西蜀子云亭。刘禹锡一首《陋室铭》,让诸葛庐与子云亭流传千古。子云,何许人也?他是历史上与司马相如并称为“扬马”的扬雄,是继司马相如之后西汉最著名的辞赋家
张栻为南宋“中兴名相”、抗金统帅张浚长子。他曾创建湖南长沙城南书院,主教岳麓书院。岳麓书院在其苦心经营下闻名遐迩、人才辈出,上承濂洛、下启船山,确立了宋代理学中湖
策划组织大型活动是地方媒体增加经济收入的重要举措,创新是做强品牌活动的利器,活动营销是衡量和扩大融媒体影响力的重要手段。