论文部分内容阅读
以集成电路为核心的电子信息产业已经成为关系到国计民生和国防建设的支柱产业之一,是世界第一大产业。长期以来,集成电路产业的发展是以工艺制造能力的不断提升和设计方法学的不断进步为前提,而集成电路设计方法学进步的本质是设计抽象层级的提高。当前,应用需求持续膨胀,集成电路设计和验证复杂度越来越高,亟需新的设计方法提升设计能力:(1)采用高层次设计工具,提升设计抽象层级和单元粒度,在行为级和算法级进行系统设计;(2)采用可配置或可重构的设计单元和结构化的设计方法,提高设计的复用性和可扩展性。 集成电路算子设计方法基于可支持特定复合运算、存储访问、路径转发和系统控制的算子或可重构算子,采用数据控制流图分析和资源调度分配技术,进行算法描述到算子结构硬件的映射。本文开展计算访存解耦合的H.264编码算子方法设计研究,设计的H.264编码器中流调度系统和流计算系统高度解耦合,且流计算系统具有很强的结构规整性,便于进行硬件规模扩展且具有灵活的可配置性。本文提出的方法和结构在一定程度上解决了高层次综合研究中任务级并行开发、模块接口综合和外部存储接口设计的问题。论文的主要工作和创新点如下: (1)针对系统级结构规划对设计质量的决定性影响,结合流媒体算法的计算密集、数据局部性强和访存规整的特点,提出了流调度系统和流计算系统高度解耦合的算子设计系统目标结构。 (2)通过对H.264编码算法进行任务分解并分析算法中数据流的依赖关系,基于数据流“生产者-消费者”局部性完成了数据流计算和访存的解耦合。通过数据流重组和任务调度,本文开发了H.264算法的并行计算流水线,并生成了面向算子设计的H.264数据流图。 (3)通过H.264算法中的系统控制和数据流调度任务的分析,定义并设计了一款16位RISC应用处理器和支持分布式帧缓存器的多通道可配置存储访问接口。基于设计的RISC内核开发了一款MCU,采用CSMC0.18um CMOS工艺进行流片验证。芯片面积10.89mm2,其中RISC内核占用20.4K等效逻辑门,在100MHz工作频率下实测功耗为96.9mW。 (4)从算法分析和架构需求出发,提取了流结构媒体应用专用算子库,提高设计质量和效率。采用约束分解和基于约束的资源分配调度技术,将支持并行计算流水线的数据流图映射分离的流调度系统和流计算系统。其中前者由总线连接的应用处理器、共享存储器、分布式帧缓存器和可配置存储访问模块组成,后者由可重构算子构成的专用处理阵列和流间存储器组成。 (5)设计了用于数据流调度和流水线同步控制的软件汇编代码,实现了一款可配置H.264高清视频编码器。硬件加速仿真和FPGA原型验证结果表明,6组不同类型的测试图像序列平均压缩率达到46∶1,平均PSNR达到36db。采用SMIC65nm(1)P8M CMOS工艺进行逻辑综合和物理设计,在200MHz的时钟约束下,编码器硬件占用723.5K等效逻辑门和32.8KB片上SRAM,芯片物理面积为2.79mm2,功耗为214.5mW,可以支持720P@60fps的实时视频编码。