龙芯3B的SIMD编译优化及分析

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:zgs352262
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据龙芯3B处理器特有的SIMD运算部件和指令集,在GCC编译器中实现了SIMD访存和SIMD运算的自动向量化.针对SIMD访存,给出了现有的访存方法,并详细介绍了适合龙芯3B的SIMD访存方法.对于不能自动向量化的其他SIMD运算,在GCC编译器中增加了Builtin函数的支持,用户可以根据标准函数接口调用SIMD运算函数,完成向量操作.通过对SPEC-CPU2000、DSPstone等大量benchmark的测试和分析,给出了龙芯3B SIMD运算的各项性能指数.对于性能表现不同的测试函数,均给出了详细分析数据和结论.测试表明,龙芯3B的SIMD运算在实际应用中有着良好的性能表现.
其他文献
主动队列管理(Active Queue Management,简称AQM)是网络拥塞控制领域的一个热点.针对主动队列管理中PID算法超调量大,抖动大的问题,提出一种GPID(Gearshift PID)的拥塞控制算
随着互联网上Web服务数量的增多,服务的QoS开始成为用户在选择服务时关注的焦点.为了有效获取服务的QoS信息以便向用户推荐高质量的服务,提出一种用户位置感知的Web服务QoS预
基于Agent的建模和仿真技术在复杂系统和复杂性研究中得到广泛的应用,并且由此产生了许多的系统仿真软件,这些软件的维护将会成为问题.为解决这个问题并利用Agent技术在建模
语义标识的过程模型是基于领域本体对过程模型中活动的前置条件&效果进行标识后所产生的模型.语义过程模型的可执行性问题是确保语义过程模型质量的核心问题,同时已被证明是
流管理功能在多种网络设备中具有基础性作用.随着报文流规模的增加,大规模流管理系统中流表添加、查询和删除的效率往往迅速下降,成为影响系统整体性能的瓶颈.针对该问题,提
提出基于概率主成分分析的三维人体运动自动识别与分类算法.它根据不同类别的人体运动应各有自己代表性的特征集,采用概率PCA方法建立各类动作的高斯分布模型;然后构建基于最小错误率贝叶斯决策理论的多分类器,实现对未知的动作序列(或具有代表性的帧)进行多分类决策.该方法具有概率模型的优点,适合高维数据处理;同时,这种方法能够提取运动数据的内在特征,较好地消除了运动数据在时间轴上的差异带来的问题,从而准确地
目前,大多数基于无证书的加密方案和签名方案的构造方法都忽视了恶意私钥中心的攻击,如何设计一个有效的可抵抗恶意私钥中心的无证书密码系统是研究热点.通过对原始的无证书
从分数阶微分和小波分解的特点出发,提出一种用于图像增强的FWE(Fractional Differential and Optimal Wavelet De-composition Used in Image Enhancement)方法,即通过在一定分解层数范围内分别计算图像经小波分解所得各分量信息熵最大值所对应的分解层来确定一个最优分解层N,使用新提出的分数阶微分掩模对原始图像以及图像经小波分
从云环境下跨域资源访问的安全需求出发,结合现有系统采用访问控制模型的现状,在RBAC模型的基础上,引入风险管理机制,将风险游标的概念扩充到访问发起域中,增强了跨域访问的
无线传感器网络的实际应用很大程度上依赖于可靠性,如何对其抗毁性进行评价是目前研究的热点.对此,基于元胞蚁群算法提出一种新的度量方法(Invulnerability based on Cellula