基于DPU加速的CNN推理系统设计与实现

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:ZPHZPH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对卷积神经网络推理阶段的高性能需求与边缘设备的性能限制导致的推理实时性问题,利用软硬件协同设计的思想,采用DPU实现了CNN的推理加速,提高计算性能的同时降低了推理时间。首先搭建了基于DPU加速器的硬件与软件平台,其次为了降低CNN模型的存储体积和计算量,对模型的数据进行量化与预编译处理,最后使用DPU对ResNet50进行了加速测试。在单次推理测试中,DPU的运算性能为76.43GOPS,平均负载为73%,耗时100.88ms,与CPU相比推理速度提升了40.48倍。在多次推理过程中,两次推理之间间隔
其他文献
清洁能源接入比例和终端电气化率的快速提升给城市电网带来了新的挑战,亟需研究城市电网形态演化规律,并为城市电网的发展提供针对性建议。首先,从设备网架层面、通信调控层面、市场服务层面分析城市电网受到的挑战;其次,从源-网-荷角度分析,梳理出围绕灵活性展开的城市电网演化主线;再次,从灵活性角度出发,研究新形态城市电网在清洁能源消纳能力、电网经营效益、可靠运行能力、多元服务能力四个方面的特征,并提出以灵活性提升为指引的发展目标和具体任务;最后,建立指标集评价新形态城市电网发展情况。
在软件测试的环节中,需要准备和维护大量的测试数据,随着软件系统所处理的数据量日益增大,测试数据的需求量也越来越大,传统的手动创建测试数据方式已经无法满足当今的软件测