基于可重构计算平台的K最近邻分类算法的硬件实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:guohaoyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习已成为信息技术的基石,许多机器学习算法已经进入具有严格要求的移动设备。机器学习算法硬件实现需要提高处理能力,从而来提高加速效果。本文研究对象为K最近邻算法,由于计算处理器的快速发展已使其逐渐接近功耗极限,但是需求却依然快速增长,芯片设计和制造的成本越来越高,在此背景下本文采用可重构架构对K最近邻算法进行硬件加速。本文围绕K最近邻算法的硬件加速,主要完成两方面工作:第一,利用可重构计算技术实现了一款KNN算法硬件加速系统。该加速系统使用同一套存储阵列和计算阵列,利用可重构控制器针对不同的计算和存储方案进行重构。与采用专用集成电路实现相比具有更高的灵活性,比通用处理器实现的能效更高。第二,本文提出的KNN硬件实现方案主要分为距离计算模块、排序模块、寻址模块以及决策模块。它能够支持8路并行计算,其中距离计算模块采用欧式距离计算方式。本文设计一种全流水的乘累加树单元,能支持任意数值的样本计算;排序模块采用插入排序方法,可以实现在四个周期内对20个数据进行排序。本文提出的硬件加速系统在14nm CMOS工艺下进行电路综合,工作主频可以达到1GHz,峰值运算能力为64GFLOPS。利用Xilinx开发板Ultra Scale XCVU440进行硬件实现,其主频可以达到200MHz。相比于传统的硬件实现方式,采用基于可重构技术的KNN硬件实现在计算速度方面提高了2.4倍以上,最高达到17.05倍。
其他文献
开源软件开发是以人为本的知识密集型劳动。对于新手而言,最好的融入一个新项目的方式就是贡献一个自己的修复提交。缺陷报告是开发人员和报告者之间以特定格式详细描述缺陷发生情况的文档。新的开发人员虽已具备一定编程能力,但面对当前项目的缺陷库时却是一无所知的,此时他的身份是一个知识寻求者,因此需要一个可以引导他的知识提供者。使用知识图谱技术能将缺陷库中聚集的大量专业知识、经验、缺陷记录以及用户活动记录有效地
立体视觉是计算机视觉领域被广泛研究的课题之一,其在机器人避障、三维重建以及自动驾驶等领域有十分重要的应用。作为立体视觉的核心问题,立体匹配算法在很大程度上决定了整个系统的精度与耗时,而巨大的计算量、遮挡、弱纹理以及光影问题又对立体匹配提出了巨大的挑战,传统的双目立体匹配算法难以克服以上问题。在本文中,我们基于多基线三目相机模型,对于立体匹配算法进行优化改进以解决如上问题,并着手搭建了三目立体视觉系
变异测试通过执行变异操作以模拟典型软件缺陷,可以有效衡量测试用例集的缺陷检测能力。然而,变异操作通常会生成大量的变异体,编译、执行这些变异体会耗费大量的测试时间,导致变异测试效率低下、可用性不高。为了优化变异测试的效率,提升变异测试在实践中的可用性,测试人员通常采用变异选择方法对变异体集合进行约简。在执行变异选择方法时,需要多次执行变异测试以计算每次选择的变异体集合的质量得分,用以选择质量最优的子
学位
学位
太赫兹技术作为最为瞩目的前沿技术之一,在国防、航天、医学、通信、食品、环境等领域具有广阔的应用前景。作为太赫兹系统的核心器件之一,太赫兹探测器的发展也面临着更多挑战和机遇。室温太赫兹探测器具有体积小,结构紧凑,成本低,可在室温下工作等优势,是目前太赫兹探测器的主要研究方向。微测辐射热计通过热敏材料的热效应将太赫兹辐射转化为热量来探测太赫兹波,是目前主流的室温太赫兹探测器,具有室温工作、宽频探测、实
新生儿黄疸在新生儿中是最常见的一种疾病,病情严重时会导致患儿脑部神经系统受损,受损后死亡率高达65%,即便治愈也会对患儿的神经系统造成永久性损伤。蓝光治疗是目前最常见也是最有效的治疗新生儿黄疸的医疗手段,但是过度照射会给患儿带来一定的副作用。现有蓝光治疗设备无法自动控制光照,增加了患儿受到蓝光损伤的风险。同时,治疗过程缺乏远程操控手段,不但增加了医护人员的工作量,而且使得医护人员更加频繁地暴露于蓝
随着电子商务的迅猛发展,国民对物流运输的需求飞速上升,物流相关企业如雨后春笋般涌现,如何降低物流运输成本成为物流行业发展的关键问题。近年来,一部分学者将前沿技术与物流规划问题相结合,衍生出了智慧物流这一研究领域。装箱和车辆路径规划问题是经典的NP-Hard问题,一直是物流运输领域研究的重点。在很多场景中,物流运输中需同时考虑装箱和车辆路径规划,并且通常有多种备选车型。因此带装箱约束的多车型车辆路径
随着深度神经网络技术的发展,基于领域文本数据集训练得到的深度神经网络模型逐渐应用到社会各个领域,用来解决各个领域中的实际问题。深度学习模型的构建需要大规模、高质量领域文本数据作为训练集。在实践中,领域文本获取成本高等原因会造成缺乏训练数据、样本分布不均衡等问题,并会导致深度学习模型的泛化能力较差。数据扩增是一种可以提高训练集大小的技术。目前,常用文本数据扩增技术处理文本数据时易影响体现文本领域特征
随着智能物联技术的快速发展,如何利用该技术消除人与空间、数据与决策之间的间隔,以及建立智慧、高效、安全、易用的空间预定与提升会议全流程体验成了企业人员的关注目标。本文致力于为全球企业打造会议生态系统,建立基于写字楼的房间设备控制系统,旨在让会议室更加智能,让写字楼办公人员使用更加高效便捷,同时也让系统管理员实时掌控会议室智能设备的运行情况,最终让整个公司团队可以真正专注于公司业务本身,提升办公效率