基于OpenCL的Viola-Jones人脸检测算法优化研究

来源 :2014全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:zzw200512168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Viola-Jones人脸检测算法的GPU实现版本,存在线程间负载不均衡的非规则特性.如果仅使用传统优化方法,人脸检测算法难以在GPU计算平台上达到较高性能.本文通过kernel合并、粗粒度并行、Persistent Thread、线程与任务动态映射、本地队列等优化方法的应用,突破了负载不均衡非规则特性导致的性能瓶颈,大幅提高了人脸检测算法在GPU计算平台上的性能.实验结果表明,与OpenCV2.4中高度优化的CPU版本在Intel Xeon X5550 CPU上的性能相比,优化后的算法在AMD HD7970和NVIDIA GTX680两个GPU计算平台上分别达到了11.24~20.27和9.24~17.62倍的加速比,实现了在不同GPU计算平台间的性能移植.
其他文献
如何搞好思想政治课高考复习,提高思想政治高考复习实效,是高三政治教师长期思考的问题。本人认为,一节高效的思想政治高考复习课要做到“四个统一”。即知识、能力与素养的统一
高级程序变换是提高程序性能的重要手段,很多涉及到优化参数的选择问题,如为循环分块选择适当的分块因子,由于优化参数搜索问题本身是NP-难问题,目前尚没有确定性的算法可以
少年时家贫,我只断断续续读了6年书,便跟随父亲种地糊口了。成年劳累,忍饥挨饿,苦难不堪,但却泯灭不了我对读书的向往和憧憬。父亲见我整天念叨着要读书,无奈地半是劝告半是斥
分析型数据库在现代企业中得到广泛应用,在使用过程中对查询处理速度的要求逐渐增强.大数据环境下,分析型数据库面临一系列新的挑战:首先,数据复杂性与日俱增,使得数据库系统
会议
绘本对于开发学生智力,促进儿童思维形成具有重要作用,小学语文在教学中,为了培养学生想象力,即可通过绘本教学方式,活跃学生思维。基于此,本文主要通过思维具象化、鼓励学生细致观
在语音识别领域,基于深度神经网络(Deep Neural Network,DNN)的声学模型与传统的基于高斯混合模型的声学模型相比取得了出色的识别效果.由于DNN的网络模型非常庞大,网络参数
会议
1976年2~11月对西德某大学6个医院和3个临床理论研究所的90%以上的职工(共826人)用放射免疫测定法普查了 HBsAg及抗-HBs。6个医院中,有1个是包括传染科及透析等部门的内科医
非规则应用的任务并行化是高性能计算领域研究的热点.本文面向多核集群架构,对最流行的并行编程模型MPI进行扩展,使其有效支持非规则任务并行.主要研究内容及创新包括:在共享
会议
30年前:多就地生产如今:赴港,甚至出国生子成为风潮尽管现时内地的医院多了,医疗条件也好了,却有更多的人愿意多费周章远涉香港,甚至国外产子。据统计,2001年,港产内地婴儿还
宜山县石别公社大棒生产队几年来,由于采取有效措施,认真抓好玉米防霉工作,玉米霉烂变质和黄曲霉毒素的含量比其他队显著降低,社员健康得到了保证,他们的主要经验是:一、提