面向CGRA循环流水映射的数据并行优化

来源 :2012中国计算机大会 | 被引量 : 0次 | 上传用户:skynini83
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据密集型应用中的核心循环消耗了程序的大量执行时间.如何实现核心循环在粗粒度可重构体系结构(CGRA)上的有效映射仍是当前研究领域的难点.为了在CGRA上最大程度开发应用并行性,降低循环访存开销,提高硬件资源利用率,文中提出一种新颖的面向CGRA循环流水映射的数据并行优化方法.通过定义一种新的可重构计算模型TMGC2以实现对循环的多条数据流水线并行加速.为避免并行化执行带来的额外存储体冲突问题影响CGRA执行性能,为后续循环映射创造了良好数据条件,引入存储体消除对数据进行重组,并结合数据重用图实现数据并行优化.实验表明,采用文中方法对已有CGRA循环流水映射方法进行优化,可以提高37.2%的数据吞吐量及41.3%的资源利用率.
其他文献
This paper is devoted to apply adaptive neural network dynamic surface control (DSC) technique to dual motor driving servo systems.High order neural network is utilized to approximate unknown function
图像分割是图像处理的关键问题,因图像类型和应用领域的不同,尚无通用的、公认的分割方法。本文运用形态学连通性理论,依据图像的色调、亮度、纹理等分布特性将彩色图像划分成若干个连通区域(即等价类)。由于连通区域内部像素点具有相同或相近的特征,该方法对平滑区域和纹理部分均有较好的分割效果。实验证明了本文所提方法的有效性。
针对经典的Mean-Shift 算法在目标发生遮挡时容易导致跟踪失败的问题,提出了一种改进的Mean-Shift 跟踪算法。该方法通过计算Bhattacharyya 系数能准确的判断目标是否被遮挡,并引入Kalman滤波估计出运动目标在下一帧中最可能的出现位置,再利用Mean-Shift 跟踪算法在这个缩小的范围进行搜索和目标匹配,从而可用较小的运算量获得较为可靠的跟踪效果,并能有效的适应目标被遮
图像分割是目标提取、模式识别和计算机视觉的关键与核心。在粒计算的框架下,首先采用彩色图像的连通性算子构造图像分割问题的基本粒。然后,在估计基本粒尺度的基础上,利用曲面正交拟合技术进行基本粒正则化。最后,通过谱图聚类算法融合各个基本粒,实现粒视角下彩色图像的分割。模拟实验验证了本文所提方法的有效性。
视觉跟踪是计算机视觉中的研究热点,其应用领域广泛。为了适应视觉场景中目标表观的变化,提出了一种基于核主成分分析的视觉跟踪算法。在初始跟踪阶段,采用简单的粒子滤波相关跟踪算法获取场景中目标的先验表观图像数据,根据目标表观图像颜色直方图与梯度方向直方图定义核函数,计算核矩阵,利用核主成分分析计算图像样本在核空间的降维矩阵,最后通过贝叶斯滤波获得目标状态的最佳估计,并进行仿真。实验结果说明了算法在真实的
视觉物联网是物联网的视觉感知部分。针对目前视觉物联网技术对目标的检测低,精度差,提出了使用Kinect 深度摄像头,将深度信息和彩色信息结合,建立视觉物联网系统。该系统获取场景深度信息,充分利用深度信息不受光照变化和目标阴影干扰,对场景进行建模,获取精确的前景目标区域,同时结合彩色信息对特定目标提取纹理特征并进行训练,在不同场景下检测特定目标,并统计目标个数。实验表明,该系统稳定可靠,检测率高,精
本文研究了原油管输工艺评价自动化监控系统,通过OPC 技术实现了实验运行过程的实时监控,设计了合理的ADO.Net 数据库访问机制实现对实验过程中产生的大量数据进行快捷、有效的查询和管理,实现了原油管输工艺评价模拟实验从方案设计到运行完成整个流程的全自动化.该系统的成功应用,使原油管输评价模拟实验的整个过程达到规范化、工程化和标准化.
紧密子图发现在许多现实世界网络应用中具有重要的研究意义.提出一种新的紧密子图发现问题——Top-κ犽属性差异q-clique查询,找出图中犽个节点间属性具有最大差异的q-clique.属性差异q-clique是一种结合图的结构特征和节点属性的紧密子图,在作者合作关系图数据中,该查询可以发现属性(如研究领域或所属单位)上不同的具有紧密合作关系的团队.给出了q-clique的属性差异度量,证明了该问题
针对目前科学技术文献数量激增、难以从总体上分析把握的现状,本文提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法。该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题。然后,通过话题过滤剔除意义有限的话题,并借助简单启发式规则选择种子话题。最后,再利用语义相关度将相邻时间片内内容相近的种子话题联系起来,以得到
选择性集成学习已经成为分析基因表达数据获取生物学信息的有力工具。为了更好地挖掘基因表达数据,利用极限学习机的集成,克服单个ELM用于数据分类时性能欠稳定的缺点,该文提出了一种基于输出不一致测度的ELM相异性集成算法(D-D-ELM)。算法首先以输出不一致测度为标准对多个ELM模型进行相异性判断,其次根据ELM的平均分类精度剔除掉相应的模型,最后对筛选后的分类模型通过多数投票法进行集成。算法运用到B