Mali T604 GPU 的二维浮点矩阵运算并行优化方法

来源 :单片机与嵌入式系统应用 | 被引量 : 0次 | 上传用户:show800811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于以三星的 Exynos5250处理器为核心的 Arndale Board 嵌入式开发平台,对集成于处理器上的 Mali T604嵌入式 GPU 的 GPGPU(General-Purpose computation on GPU)技术进行研究,并对不同运算规模的浮点矩阵乘法进行并行加速优化,提供实际测试结果。Linux 操作系统上的实验结果显示,基于 Mali GPU 的并行浮点矩阵乘法方案相对原始串行算法而言,效率显著提高,并且运算规模的增大可以显著提高并行性。
其他文献
采用博通BCM20793芯片设计了NFC模块,进行硬件设计,并进行设备驱动分析。多方面对该模块进行验证,结果表明该模块稳定、可靠、识别率高,可集成到支付、票务、门禁、防伪等系统中
【摘 要】预设与生成是课堂教学的重要因素。预设包含了教师的教学设计与课前准备,而生成是学生对文本的理解与疑惑。预设可以精心谋划,而生成则无法完全预料。一课生成有趣简洁高效的数学课一定是预设与生成的统一。预设尊重了文本(教材),生成尊重了学生,他们如何课堂的双翼,缺一不可。  【关键词】小学数学;预设与生成;教学目标  【中图分类号】G427 【文献标识码】A  【文章编号】2095-3089(20
Vishay Intertechnology,Inc.发布新款汽车级的超薄、大电流电感器-IHLE-4040DC-5A,该电感器采用可减少EMI的整体e屏蔽层和紧凑的4040外形尺寸。Vishay Dale IHLE-4040DC-5A能够
当代中国只有科学信念而缺乏科学信仰,主要是古代科举制度造成的。考察科举制度的历史演变,可以看出科举考试使民众形成对人的信仰而失去对物的信仰。科举制度的长期历史积淀使
Maxim Integrated Products,Inc.推出MAXREFDES73#参考设计,帮助可穿戴设备开发人员快速评估皮肤电反射(GSR)测量系统。GSR(皮肤电导率测量)设计面临巨大挑战,设计人员在完成传感器设计之前需要熟悉各种分立器件和校准软件。作为GSR参考设计,MAXREFDES73#集成了数/模转换器(DAC)和模/数转换器(ADC)以及具有高级电源管理
本文介绍了基于MicroTiVo公司的MT3108芯片和Microchip公司PIC18F4520单片机的无钥匙智能门禁系统.MT3108跳码编码芯片采用了椭圆曲线密码(ECC)算法,使门禁系统安全性更强.阐述
“八荣八耻”社会主义荣辱观的提出具有很强的现实意义,具有丰富而深刻的内涵。高校思想教育战线的工作者,要大力弘扬社会主义荣辱观,努力培养高素质人才。
中国烟草百年带动国产卷烟纸于20世纪30年代诞生 ,50年代以后的长期自给 ,改革开放逐步实现“两高”卷烟纸的国产化
抗战时期,中国共产党结合当时的特殊环境,探索出了一套培养大批德才兼备的领导干部的干部继续教育的方法,主要有:干部学校与“无期大学”相结合的方法;自我研习与集体讨论、领导组
Premier Farnell集团子公司英蓓特科技与意法半导体倾力合作,共同实现了免费开源的CooCox工具链与最新STM32系列微处理器产品之间的完美结合,使开发人员可以借助STM32产品系列