1.DSP芯片发展
随着DSP芯片应用领域的不断扩大,DSP芯片已形成低、中、高三个档次:低端产品执行速度一般为20~50MIPS,能维持适量存储和功耗,提供了较好的性能价格比,适用于仪器仪表和精密控制等;中端产品执行速度一般为100 ~150MIPS,结构较为复杂,具有较高的处理速度和低的功耗,适用于无线电信设备和高速解调器等;高端产品执行速度一般为1O00MIPS 以上,处理速度很高,产品结构多样化,适用于图像技术和智能通信基站等。
对于种类繁多的DSP芯片,一般可按其工作的数据格式将其分为两大类定点DSP芯片和浮点DSP芯片。定点DSP品种最多,处理速度为20 ~240OMIPS;浮点DSP处理速度为40M ~ 1GFLOPS。
图1 DSP芯片
2.DSP芯片结构
DSP芯片是专为高速信号处理而设计的,由于采用了不同于普通单片机的体系结构,因而具有一些显著的特点。
2.1哈佛结构
传统的冯诺伊曼( Von-Neumann)结构由于具有单一公用的数据和指令总线,因此在高速运算时,往往在传输通道上会出现瓶颈效应。DSP芯片内部一般采用哈佛(Harvard)结构,片内至少有四套总线:程序的数据总线与地址总线,数据的数据总线与地址总线。这种分离的程序总线和数据总线,可允许在一个机器周期内同时获取指令字(来自程序存储器)和操作数(来自数据存储器),从而提高了执行速度。
2.2硬件乘法器
数字信号处理中最重要的一个基本运算是乘法累加运算,也是最主要和最耗时的运算,因此单周期的硬件乘法器是 DSP芯片实现快速运算的保证。现代高性能的DSP芯片甚至具有两个以上的硬件乘法器用以提高运算速度。数据宽度也从16位增加到32位。
2.3多个并行处理单元
DSP内部一般都集成了多个处理单元,如硬件乘法器(MUL)、累加器(ACC)、算术逻辑单元(ALU)、辅助算术单元(ARAU)以及 DMA控制器等。它们都可以并行地在同一个周期内执行不同的任务,例如辅助算术单元能为下一次的运算做好准备,适合于完成连续的乘加运算。芯片内部还包括有其他总线,如 DMA总线等,可实现数据的后台传输而几乎不影响主 CPU的性能的有FFT的位反转寻址,语音的A律、p律算法等。
为了提高并行处理能力,现代DSP芯片通常采用单指令多数据流结构(SIMD)、超长指令字结构(VLIW)、超标量体系结构、多DSP核体系结构和DSP/MCU混合结构,这些并行处理机制大大提高了DSP芯片的性能。
2.4流水线技术
DSP芯片的哈佛结构为流水线技术提供了方便。由于采用流水线技术,DSP芯片可以单周期完成乘沃累加运算,大大提高了运算速度。而DSP芯片的指令基本上都是单周期指令,因此单周期指令执行时间可以作为衡量DSP芯片性能的一个主要指标。
2.5片上存储器
外部存储器一般不能适应高性能DSP核的处理速度,因此在片上设置较大的程序/数据存储器以减少对外部存储器中程序/数据的访问次数,充分发挥DSP核的高性能。目前高性能DSP芯片上的可配置程度/数据RAM高达7MB。采用大的片子存储器可以减少外部存储器接口的引脚,甚至省略外部存储器接口,而且也减小了芯片的封装体积。
2.6多种外设和接口
为了加强 DSP芯片的通用性,DSP芯片上增加了许多外设。可能包括的外设有:多路DMA通道、外部主机接口、外部存储器接口、芯片间高速链接口、外部中断、通信串口、定时器、可编程锁相环、A/D转换器、JTAG接口等。
2.7特殊寻址模式
为了满足FFT积等数字信号处理的特殊要求,DSP芯片大多包含专门的硬件地址产生器,用以实现循环寻址和位翻转寻址,并在软件上设置了相应的指令。
2.8零消耗循环控制
数字信号处理的一大特点是大部分处理时间花在了较小循环的少量核心代码上。大部分DSP芯片具有零消耗循环控制的专门硬件,可以省去循环计数器的测试指令,从而提高了代码效率,减少了执行时间。
2.9JTAG接口
由于DSP芯片结构的复杂化、工作速度的提高、外部引脚的增多、封装面积减小而导致的引脚排列密集等原因,传统的并行仿真方式已不适合于DSP芯片的发展和应用开发。1991年公布的JTAG接口标准满足了IC制造商和用户的要求,1993年 JTAG接口标准修订为5线接口。在片JTAG接口为 DSP芯片的测试和仿真提供了很大的便利。
2.10程序的加载引导
加载引导是指器件在上电复位后执行一段引导程序,用于从端口(异步串口、I/O口、主机接口)或外部EPROM/FLASH存储器中加载程序至高速RAM中运行。一般用 EPROM/FLASH存储器存储程序,但是其访问速度较慢,而一些已有的高速EPROM/FLASH存储器价格昂贵且容量有限;同时高速大容量静态RAM价格又在不断下降,因此这种加载方式是一个有效的性价比解决方法。
3.在图像技术中的应用
目前实现图像处理的主要方式有四种:①基于通用PC微机;②基于通用DSP芯片;③基于专用DSP芯片;④基于可编程FPGA。在通用PC微机上主要是软件实现图像处理,能够提供中等的图像处理能力,但是要占用CPU几乎全部的处理能力。在独立机型设计中一般采用其他三种方式:①基于可编程FPGA的设计比较复杂而且难度较大;②基于专用DSP芯片的设计应用范围受限;③基于通用DSP芯片设计的优点是设计简便、灵活,特别适合于新型产品的研究开发。
3.1图像技术对DSP芯片的要求
对于图像技术来说,由于要处理的数据量大,计算复杂,计算中间结果精度要求高,因此需要选择合适的DSP芯片。在选择DSP芯片时首先要考虑对芯片速度的要求。由于现代高性能DSP芯片的结构多样化,单纯依靠指令执行速度MIPS 比较其性能是不全面的,现在一般采用单周期的乘加次数,或采用数字信号处理中的基准程序如FFT和数字滤波等的执行时间来测评DSP芯片的速度性能。其次,还需要考虑如何选择定点或浮点DSP芯片。
一般说来,浮点DSP芯片的运算精度高,动态范围大,寻址空间大,指令运算能力较强,但功耗、成本、体积较大。而定点DSP芯片的运算精度与浮点DSP芯片相同(定点的数据位数和浮点的位数相同的情况下),且功耗、成本、体积较小,但动态范围小,需要防止计算溢出,寻址空间小,指令运算能力较弱。从总体性能上看,浮点DSP芯片优于定点DSP芯片。此外,在硬件方面还应考虑芯片的外部总线结构、片上存储器结构、DMA功能、串行通信口和芯片间通信能力等因素;在软件方面主要是开发软件的功能性、开发时间要求等因素。
综合考虑DSP芯片的性能和开发设计的要求后,在图像技术中应该首选浮点DSP芯片,但是在对价格敏感的产品设计中,目前采用定点DSP芯片的例子也有。
表1比较了代表目前很高DSP芯片技术水平的三种产品,包括TI公司的定点 DSP芯片(TMS320C6203)和浮点DSP芯片(TMS320C6701)与AD公司浮点DSP芯片(ADSP-21160)。由于工作时钟较高的原因,TI公司的DSP芯片在单芯片处理能力上优于AD公司的产品,但是在多芯片集成处理上AD公司的DSP芯片性能更好一些。
3.2基于DSP芯片的图像处理系统
图2所示为一个独立型通用图像处理系统。系统板主要构成为:工作于167MHz的TMS320C6701 ; 32位4M的SDRAM ,32位128K 的SBSRAM,32位4K的双口RAM,16位1M的Flash存储器;两路A/D,每路40M/12Bit,可同时采样,采样频率可变;可编程FPGA作为灵活的接口;通用数字接口也可以直接接收彩色数字图像;外部HPI主机接口可用于系统控制;仿真调试JTAG接口;串行通信接口;电源监测与复位控制电路等。
在该系统开发板上处理应用于会议电视的CIF格式的彩色图像,实验效果较好。TI公司提供了全图形的Code Composer集成开发环境,具有汇编语言和直接的C编译器。汇编语言的程序代码执行效率高,而采用C语言的程序代码效率较差。但是,直接采用汇编语言编程有一定难度。因此,通常先采用c语言设计验证算法,然后经过C编译器产生汇编代码。最后在汇编代码的基础上进行优化。
图2 独立型通用图像处理系统框图
结束语
以上就是DSP芯片在图像技术中的应用介绍了。DSP芯片将应用在更多的领域,如智能通信基站、雷达、声纳、图形图像系统、语音识别、VOIP、飞行仿真、军用设备等等。
〈公海赌赌船官网jc710/XXW〉专业制造二极管,三极管,MOS管,桥堆等,20年,工厂直销省20%,上万家电路电器生产企业选用,专业的工程师帮您稳定好每一批产品,如果您有遇到什么需要帮助解决的,可以直接联系下方的联系号码或加QQ/微信,由我们的销售经理给您精准的报价以及产品介绍
联系号码:18923864027(同微信)
QQ:709211280