论文部分内容阅读
数字信号处理器(DSP)广泛应用于处理复杂和实时性要求高的算法。经过几十年快速发展,单核DSP运算性能得到极大提升,然而其性能的继续提升遇到了难以克服的瓶颈,基于单核架构的DSP处理器逐渐不能满足数据处理要求。因此,各半导体公司纷纷开始研发多核架构的DSP芯片,如TI公司发布了TMS320C66x系列多核DSP。该系列芯片拥有卓越的运算性能和丰富的接口资源,已经在消费类电子产品、高性能计算,医疗影像以及自动化等诸多领域得到广泛应用。随着数字图像技术的进步,视频图像不断向多帧频、高分辨率方向发展。为了能够实时有效地对视频图像进行处理,本课题设计并实现了基于TMS320C6657多核DSP的图像处理平台。系统平台最高具有80GMACS或40GFLOPS运算能力并且扩展了多种外设接口,满足低速率与高速率等不同场合数据传输的需求。在该平台上运行一种改进的图像匹配算法,将匹配任务合理划分给每个DSP内核。经验证,实验结果满足要求。本论文具体工作内容有:首先,描述了TMS320C6657芯片内核架构与片上外设资源。介绍了多核DSP软件开发方法。研究了内核之间的通信机制,给出了三种不同的同步通信方法。探讨了主从模型和数据流模型两种常用的多核处理模型,对并行程序的性能进行分析和评判,从负载均衡等角度实现并行程序的优化。然后,以TMS320C6657 DSP和XC6VLX240T FPGA为核心芯片,设计了一套基于图像处理的硬件系统平台。FPGA实现PAL制式或DVI制式的视频图像采集,将采集到的图像数据传给DSP,接收DSP回传的结果并显示输出。本课题完成了系统方案论证、芯片选型、电源模块设计,时钟模块设计以及其他外围芯片的设计。经过PCB板卡制作、芯片焊接、硬件电路调试等步骤,实现系统平台正常工作。其中,DSP与FPGA之间保留两种数据传输机制,分别为uPP通信与SRIO通信,论文详细介绍了两种通信机制的原理以及各自传输过程的实现。最后,在上述图像处理平台上实现了一种图像匹配算法。该算法以归一化互相关(NCC)匹配算法为基础,通过引进小波变换算法与差分进化算法,改变以往图像匹配中对图像所有像素点进行搜索的方式,减少算法匹配时间。在匹配准确率不变的同时,极大减少搜索时间,达到实验预期效果。在算法功能初步实现的基础上,对匹配算法进行任务划分,合理分配到TMS320C6657两个内核中运行,并且从编译器优化选项、软件流水,循环展开等角度对上述程序进行优化,进一步提升程序性能。