HT3.0控制器的设计与性能优化

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:QQ343282482
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,处理器结构已经从单一的南北桥结构发展到现在的多核互联结构。处理器已经发展到每秒千亿次的计算量,总线成为了高性能计算机发展的瓶颈,所以出现了高速串行总线来解决这个瓶颈问题。   本文首先结合现在业界的高性能CPU的发展,可以发现流行的总线已经趋向于高速串行总线。然后经过对比分析,找出了比较适合现在龙芯平台的高速总线HT。然后在龙芯平台上设计实现了HT高速接口,在此基础上研究发现现在HT总线上延迟比较高,实际带宽比较小的情况。最后发现是在HT控制器内部的跨时钟域存储和状态机决策比较多的情况造成的。所以提出了两种优化方法分别针对延迟和带宽,并且做了实验证明了此优化方法是有效的。   本文的主要贡献如下:   1.设计实现了HT3高速接口,使其能够在龙芯平台上连接其他的HT3设备。   2.为了更好地支持龙芯平台上的多核互联,所以延迟和带宽都是比较重要的,在此基础上用同源比例时钟FIFO设计优化了HT控制器内部跨时钟域的延迟。   3.为了使得龙芯CPU能更好地利用HT控制器的带宽,所以仿照CPU内部流水线设计了AMBAAXI总线上的读写通道,使得HT接口在接收请求时做得更高效。4.对以上3点都进行了实验验证,得出结论是HT高速接口设计的正确性、延迟和带宽的优化都是行之有效的。   上述工作都是在龙芯3号平台上研发设计,为以后龙芯CPU多核互联设计能获得更小的延迟,为以后龙芯CPU多核互联架构获得更多的带宽提供可行方案。
其他文献
偌大的互联网已经演变成了一个巨大的知识宝库,对这个知识宝库的探索、挖掘和分析是当下的一个热门应用领域。在对这个知识宝库进行探索和知识萃取之前,首要的一步是要收集原
物体跟踪和运动物体分割是计算机视觉中两个本质问题,并广泛应用在视频分析中,如动作识别、身份识别等。本文旨在含动态场景的视频中不限物体类别地跟踪和分割运动物体。在技
近年来,随着人工智能、计算机视觉以及深度学习的发展,汽车辅助驾驶系统已成为十分火热的研究和应用领域。在汽车辅助驾驶系统中,车道保持、偏航预警、自适应巡航、前车距离测量
随看社会生产力的发展和人民生活水平的提高,电气、电子设备的使用大大增加,人类社会对电力资源的使用需求越来越大。同时,电力资源相对短缺的问题也越来越严重。尤其在世界
制造业的服务化已成为制造业的发展趋势,而作为我国经济重要组成部分的中小制造企业的服务化却面临制造能力不足的困境,急需与其他企业进行制造服务的协同与共享。近年来,随着物
根据物理模型构造优化算法是自然计算中重要的算法构造方法,量子波函数的概率解释与优化算法随机求解过程的相似性使得基于量子物理模型的优化算法成为未来构造新的优化算法的
重力正演是已知地下物性求地上观测面的重力异常值,其反演问题是根据地上观测面的重力异常值求地下场源体的物性以及形态。重力异常反演在地球物理勘探中有着十分重要的作用,
随着多线程技术在现代编程中的广泛使用,比如C中的pthread库、Java中的Thread类,人们对多线程程序的安全性越来越重视。原子性错误是并发程序错误的主要类型之一,如何检测和查找
学位
人体行为识别近几年来受到了广泛的关注,成为计算机视觉和模式识别领域的研究热门,并且在人机交互、虚拟现实、智能监控、智能家居等方面得到了广泛的应用。目前该领域的研究已