基于FPGA的卷积神经网络加速器动态余数处理映射模型

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:minjiangfashion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将卷积计算转化为矩阵乘法是FPGA上一种高效实现,而现有的转化方法无法根据卷积参数的不同动态调整,限制了卷积计算的并行度。提出一种新的动态余数处理映射模型。该映射模型包含有3个子模型:特征值映射模型,权值映射模型,和输出映射模型。特征值映射模型将特征值转化为特征值矩阵,权值映射模型将权值转化为权值矩阵,特征值矩阵和权值矩阵通过乘累加计算阵列得到卷积计算结果,由输出映射模型将卷积计算结果存储到内存中。在卷积计算过程中,卷积的输出通道数通常不是乘累加计算阵列行数的整数倍,3个子映射模型会根据产生的余数动态调整
其他文献
环境的复杂色彩严重影响了火灾现场救援过程中目标识别的准确性与及时性。为此提出一种面向三种色彩模式的基于欧式距离的火灾图像偏色度量化方法。首先通过三种情景模拟火灾现场,利用相机拍摄不同时空下的火灾现场场景,同时拍摄不同时空常规现场场景,形成火灾现场偏色检测图像库;其次面向RGB、HSV、YCbCr三种色彩模式提出欧式距离法火灾图像偏色度量化方法,同时针对火灾图像基于图像库进行偏色度检测;最后,利用M
在信用卡违约预测中,信用卡数据存在有标签获取难度大和分布不均衡的问题,使得经典的数据挖掘算法分类效果不佳。针对以上问题,将深度学习中的Transformer作为编码器对原始数据进行自编码,挖掘和建模用户数据的深层信息,将编码后的向量送入传统分类模型进行分类预测,从而判断该用户是否存在违约行为。在有标签数据规模较小时,提出算法的召回率相比于传统分类算法有了显著的提升,实验结果验证了算法的有效性。
针对当前异常数据实时检测算法未考虑空间复杂度,导致异常数据检测率低,通信开销大,造成检测误报率高,运行时间长的问题,提出基于HDFS开源架构的异常数据实时检测算法。基于HDFS开源架构搭建数据分布式云存储体系,采用多级哈希表搜索算法,查询异常数据。基于支持向量机设计支持向量数据描述异常检测算法,计算最小超球体边界描述数据分布范围,依据此边界分类未知异常样本数据,利用最小闭包球算法,优化求解支持向量
DNA折纸术是一种全新的DNA自组装方法,具有可编程性、纳米可寻址性等优点,被广泛地应用于DNA计算中。利用DNA折纸术可折叠出特殊结构的特点,在DNA折纸基底上设计了一种求解可满足性问题的计算模型,该模型采用分子信标原理,通过观察荧光的明灭排除非解,从而找出可满足性问题的解。最后通过实例和模拟仿真表明了模型的可行性。
为了提高多目标任务优先级排序效率,降低软件测试的成本,满足软件测试需求,提出基于多线程的多目标任务优先级排序方法,通过多线程并发技术提高多目标演化算法的执行效率,采用融合选择函数的非支配遗传算法,设计编码、算子、个体评价,将平均故障检测率、有效执行时间设为优化目标,实现多目标任务优先级排序。实验结果表明,上述方法的多目标任务优先级排序效果最佳,收敛性好,求解目标函数的速度快,目标函数求解效率高达9
针对LSTM-CNN网络模型接收句子输入训练时间长、处理较长文本时效率低下问题,提出了一种基于跳转的LSTM-CNN模型。新的模型首先在读取文本序列时进行跳转判断,即在每一步中,利用两层感知机从前向序列、后向序列和当前单词中提取信息,确定是否跳过当前单词。然后利用LSTM分析跳转后的序列语义以及提取其特征,在CNN模型进一步提取局部特征。最后合并到较小的维度,并以正或负标签输出。相比基于LSTM-
针对传统方法筛选用户访问记录过程中,抓取页面行为特征不够全面,影响了用户信息采集成功率等问题,提出基于网络爬虫结合关联大数据的用户信息提取方法。利用网页爬虫技术,协助浏览器抓取网络页面,统计访问模式和网页浏览内容,获取历史行为数据,挖掘用户感兴趣的关联大数据,对行为特征进行预测评分,排序其重要程度,得到用户信息提取列表,进一步筛选列表页面信息,得到能够反映用户兴趣的资源信息。选取时间为30天的手机
目前的数据调度方法在对数据负载链路进行均衡调度时,传统网络未进行分流操作,导致了链路利用率不能满足所设定的阈值,调度延时以及调度结果不准确等情况。于是提出基于SDN的云存储数据负载均衡调度方法。方法采用可编程的API调用网络,分离传统网络设备控制面与数据面,结合数据负载均衡调度方法选择需重路由链路的路径组,利用适应度函数选取出需重路由的路径组,通过SDN控制器改写并下发原始数据流表,完成对数据负载
针对暗通道先验算法在图像的明亮区域去雾时存在色偏严重、色彩失真等问题,提出一种改进的暗通道先验图像去雾算法。先将待去雾图像利用三通道明亮区域分割法获得全局大气光强度值;再通过边界约束条件得到透射率图像,并运用高斯型同态滤波对图像进行平滑处理;最后用色阶补偿原理结合小波变换对透射率图像与原图像进行融合,之后将融合后的图像与去雾后的图像进行多次融合补偿,得到最佳色阶图像,达到复原图像的目的。仿真结果表
针对传统能量优化方法没有进行节点分簇处理,导致可配置能量低、能量配置效率低的问题,提出基于粒子群算法的物联网可配置服务能量优化方法。根据物联网一阶无线电模型计算可配置服务所需要消耗的能量,利用惯性权重和学习因子改进传统粒子群算法,解决其容易陷入局部最优的问题。采用改进后的粒子群算法获取合理的适应度函数,通过最小生成树模型获得连通图的权重,得到可配置服务传输数据的最优路径。根据最优路径上节点之间的簇