您好,欢迎来到五一七教育网。
搜索
您的当前位置:首页基于FPGA的DDC设计

基于FPGA的DDC设计

来源:五一七教育网
电子科技大学硕士学位论文

基于FPGA的DDC在频谱仪中的设计

姓名:张锡权申请学位级别:硕士专业:电子与通信工程指导教师:李玉柏;董万明

20090501

摘要摘要软件无线电思想的出现带来了接收机实现方式的革新。随着近年来软件无线电理论和应用趋于成熟与完善,软件无线电技术已经被越来越广泛地应用于无线通信系统和电子测量测试仪器中。数字下变频技术作为软件无线电的核心技术之一,在频谱分析仪中也得到了越来越普遍的应用。本人参与的手持式频谱分析仪项目采用的是中频数字化实现方式,可满足轻巧,可重配置和低功耗的需求。数字化中频的关键部件数字下变频器DDC采用的是Intersil公司的ISL5216,这个器件和高性能FPGA共同组成手持频谱仪的数字信号处理前端。这个数字前端就手持频谱分析仪来说存在一定的局限性,ISL5216的信号处理带宽单通道为1MHz,4个通道级联为3删z,未能满足谱仪分析带宽日益增加的需求;系统集成度不高,ISL5216的功能要是集成到FPGA,可进一步提高系统集成度,降低物料成本和系统功耗。基于以上两个方面的考虑,现正以手持频谱分析仪项目为依托,基于XilinxSpartan3A—DSP系列FPGA实现高速高处理带宽的DDC。本论文首先描述了数字下变频基本理论和结构,对完成各级数字信号处理所涉及的数字正交变换、CORDIC算法、CIC、HB、多相滤波等关键算法做了适当介绍;然后介绍了当前主流FPGA的数字信号处理特性和其内部的DSP资源。接着详细描述了数控振荡器NCO、复数数字混频器MIXER、5级CIC滤波器、5级HB滤波器和255阶可编程FIR的设计和实现,并对各个模块的不同实现方式作了对比和仿真测试数据作了分析。最后介绍了所设计DDC在手持频谱分析仪中的主要应用。关键词:数字下变频,FPGA,频谱分析仪,积分梳状滤波,半带滤波,多相滤波ABSlRACTABSTRACTThecomingofSoftwareDefinedRadio(SDR)redefinesthewaytoimplementreceivers.Withthetheorygettingmorematuredandcompleted,SDRtechnologyhasasbeenwidelyusedinwirelesscommunicationsystemandtestequipment.Digital—DownwellaselectronicmeasurementtechnologiesusedbyConvert(DDC),oneofthecoreSDRreceivers,isgettingmoreandmoreextensiveapplicationinspectrumanalyzer.Withthedigital—IFrealizationapproach,handheldspectrumanalyzerCanmeetthecorerequirementoffacility,reconfigurationandlowpowercomponentindigital-IFmoduleinthisconsunlption.TheprojectisDigital··DownConverterofISL5216madebyIntersilCorporation.ThisDDCinfrontendofhandheldspectrumAboveall,sign址processingconjunction、丽tllFPGAcomposeaswellthedigitalanalyzer.Butthereissolnelimitationbandwidthof1MHzpersinglechannelnotaboutthisdesign.as3MHzonwith4channelscascadedcansatisfythecustomerincrementalrequirementsanalysisDDCspeedandbandwidth.Inaddition,thedensityofsystemintegrationandcostofBOMandefficiencyofpowerconsumptionCanbeimproved,iftheearlfunctionalityoftheconcernsbeimplementedandembeddedinFPGA.TakingaboveintoOnconsideration,andRelyingontheprojectofhandheldspectrumanalyzer,DDCbasedXilinxSpartan3A,DSPFPGAwithcharacteristicofsignalhighprocessingfrequencyandbandwidthhasalreadyputintodesignan.devaluation.AfterintroducingbasictheoryandarchitectureofDDCkeytheoryandsummarizingvariousandalgorithmssuchasdi西uaquadraturetransformation,CORDIC,CIC,areHB,polyphaseFilteringetc,whichexhibitsthedigitalusedbydifferentfunctionunit,thispapersigr脚processingthetraitandresol/rceincurrentprimaryFPGA.AndthendescriptnotonlydesignandimplementationofNCO,MIXER,CIC,HB,and255ordersFIRindetail,butalsocomparethedifferentrealizationmethodandanalyzethemodule’Sperformancebasedontestdata.Finally,demonstratechiefapplicationofDDCappliedinhandheldspectrumanalyzer.Keywords:DDC,FPGA,Spectrumanalyzer,CIC,HB,PolyphasefilteringII主要符号表主要符号表ADC:AnalogtoDigitalConverter模拟到数字转换器ASIC:ApplicationSpecificIntegratedCircuit专用集成电路CORDIC:COordinateRotationDigitalComputer坐标旋转数字计算机CIC:CascadedIntegratorCombfilter积分梳状滤波器CLB:ConfigurableLogicBlock可配置逻辑块DDC:DigitalDownConverter数字下变频器DDS:DirectDigitalSynthesis直接频率合成DSP:DigitalSignalProcessor数字信号处理器DFE:DigitalFrontEnd数字前端DANL:DisplayAverageNoiseLevel显示平均噪声电平DA:DistributedArithmetic分布算法FPGA:FieldProgrammableGateArray现场可编程门阵列FIR:FiniteImpulseResponsefilter有限冲击响应滤波器FFT:FastFourierTransforln快速傅利叶变换FIFO:FirstInFirstOut先进先出队列HB:HalfBandfilter半带滤波器LO:LocalOscillator本地振荡器LUT:LookUpTable查找表MACC:MultiplyACCumulator乘累加器NCO:NumericControlledOscillator数字控制振荡器PCB:PrintedCircuitBoard印制电路板RBW:ResolutionBandWidth分辨率带宽SFDR:SpuriousFreeDynamicRange无杂散动态范围VI独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:丞够驭日飙吖年,月z泊关于论文使用授权的说明本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或(保密的学位论文在解密后应遵守此规定)签名:摊导师签名:日期:年月日盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文扫描等复制手段保存、汇编学位论文。第一章引言第一章引言1.1数字下变频技术软件无线电的核心思想是对天线感应的射频模拟信号尽可能的数字化,将其变换为适合DSP器件或计算机处理的数据流,然后通过软件来完成各种功能。现阶段,由于受各种关键器件,特别是受模数变换器(ADC)采样速率、工作带宽和通用数字信号处理器(DSP)处理速度的,数字中频软件无线电正成为理想软件无线电的一种经济、适用的折中选择。在目前大多数软件无线电接收机中,一般先经模拟下变频至适当中频,然后在中频用ADC数字化后输出高速数字中频信号,再经数字下变频器(DigitalDownConverter--DDC)变频、抽取和低通滤波之后变为低速的基带信号,最后将基带信号送给通用DSP器件作后续的解调、解码、抗干扰、抗衰落、自适应均衡等处理。这样大大降低了对ADC和DSP器件性能的要求,便于实现和降低成本。数字下变频器在这里起到前端ADC和后端通用DSP器件之间的桥梁作用。因此,数字下变频技术成为软件无线电接收机的核心技术之一,通用数字下变频器也被越来越广泛的应用到各种无线通信设备和测试测量仪器,以及电子对抗、雷达和信息化家电等领域。1.2FPGA在数字下变频领域的应用近年来现场可编程门阵列(FPGA)器件和DSP在芯片逻辑规模和处理速度等方面的迅速提高,用硬件编程或软件编程方式实现软件无线电技术在理论和实用化上都趋于成熟和完善。软件无线电技术只需通过软件上的更新就能够选择不同的业务或调制方式、追加和修改功能,具有传统硬件方式所无法比拟的灵活性、开放性和可扩展性。因此,软件无线电技术已经被越来越广泛地应用于蜂窝通信及各种军用和民用的无线系统中。FPGA器件在工艺方面的进步和设计思想上的创新为之带来了前所未有的逻辑规模和强大的DSP处理性能,如图1.1。FPGA愈来愈多地应用于高性能信号处理主要基于三个因素:1)高度的并行性:FPGA能实现高性能数字信号处理是因为它具有高度并行处理电子科技大学硕士学位论文能力的引擎,对于多通道的DSP设计是理想的器件;2)重构的灵活性:FPGA可再配置特性使其实现的高性能DsP具有极大的灵活性,对于不同的算法可以动态加载实现;3)最佳的性价比:随着半导体工艺的线宽进一步缩小,器件规模增加,FPGA价格不断降低,可以以低成本方案来实现设计系统的集成化。图1—1XilinxFPGA的信号处理性能Xilinx公司的Spalxan一3ADSP系列是一款面向低功耗低成本应用场合的高性能FPGA。它拥有大量数字信号处理所需要的资源,包括乘法器,加法/累加器,存储单元,而且还具有丰富的逻辑和I/O端口资源。这些资源完全可以用来实现一个高性能的DDC:而最新推出的更高性能的virtex一5系列FPGA,已经可以在一片FPGA中实现一个功能强大的软件无线电接收机系统。随着FPGA性能提高,规模增大,成本不断降低,用FPGA实现高速DDC已经成为信号处理系统中常用的手段。13课题背景3.1项目简介在无线电通信中的众多测量任务之一就是频域中的信号检测。频谱分析仪就是1功能众多并广泛使用的射频测试仪表中的一种。频谱分析仪被用于所有的无线或有线通信应用中,包括研发、生产、安装与维护。手持频谱分析仪由于具有小体积、轻重量和低功耗,以及良好的可携带性.在移动通信的安装与维护、频谱资源监管等方面,具有广阔的市场前景。随着新一第一章引言代无线标准包括802.1la,3G和WiKAX等的发展,对测量频率范围、显示平均噪声电平、动态范围、测量带宽和相位噪声等方面都提出了更高的要求。与台式谱仪相比较,手持式频谱分析仪由于需具各良好的可移动性,故其体积与重量在设计中都是首先需要考虑的;且由于很多时候是使用于野外,需要采用电池供电,其功耗也是设计的重点。目前,由于手持频谱分析仪的广阔应用市场,越来越多的仪器生产厂家开始关注这个新兴的频谱分析仪市场,R&S、Anritsu、Agilent、Willtek等公司都推出了产品。在这种前提下,为了提高产品的竞争力赢得客户的青睐,所研制的手持式频谱分析仪必须有所突破。除了射频前端的硬指标如频率范围、动态范围、相位噪声和TOI等需要重点研究设计之外;还要大力投入数字中频处理部分的研发,其中需要提高改善的主要指标有频率分辩带宽(I强W)和分析解调带宽等,当然不能缺少嵌入式处理器的控制和电源管理。数字中频的实现框图如图1.2,模拟中频信号经过ADC采样后,被送到DDC进行数字下变频到数字基带信号,再经由FPGA的协同处理(包括FFT,数据交换和时序控制等)和DSP处理(视频滤波,对数转换和解调分析等处理),最终的结果被送到MCU控制部分进行显示、存储或传输。图1.2谱仪数字中频部分的原理框图1.3.2数字下变频器ISL5216简介项目中使用的数字下变频芯片是ISL5216,是Intersil公司推出的可编程DDC,它被设计用来实现高动态范围的应用。ISL5216有4路可编程的数字下变频通道。对于输入的信号可以选择任意一个通道来进行处理,也可以四路同时并行处理。每条通道都可分为前端部分和后端部分,前端和后端通过总线路由连接。单通道输出带宽能达到1MHz,还能通过总线路由将通道级联以提供更大的带宽3MHz。前端部分由数字混频器,数控振荡器(NCO)和积分梳状滤波器(CIC)组成。32位的NCO相位累加器在输入时钟为95M]-Iz时可提供0.0221Hz的频率分辨率,3电子科技大学硕士学位论文其无杂散动态范围大于115dB。支持1~5级CIC滤波器级联和1~5个半带滤波器级联,它们共同构成抽取模组。后端部分由有限冲击响应滤波器(FIR)、自动增益控制(AC,-C)模块和笛卡尔坐标到极坐标转换器等组成。FIR滤波引擎由一组半带抽取滤波器(I-IBF)、内插滤波器、最高255阶FIR滤波器以及重采样滤波器组成。笛卡尔坐标到极坐标转换器提供幅度和相位输出,它之后与鉴频器相连接实现FM解调。ISL5216支持最高95MSPS的数据输入,4路并行的17位的输入支持16位定点或一路到多路的17位浮点输入信号。此外,ISL5216具有110dB的带外衰减,4到65536倍的抽取率,24位的内部数据通路,4个通道每个通道提供2路串行输出,可选择包括1分量、Q量、幅度、相位、频率和AGC增益等多种输出形式。1.3.3基于FPGA实现DDC的替代方案从ISL5216的技术指标看出,它是一款性能强大的数字下变频商用ASIC,但考虑到以下几方面的项目需求,有必要寻求更高性能,低成本低功耗的解决方案。i)信号处理带宽,ISL5216的单通道信号处理带宽为1MHz,4个通道级联也仅能提供3MHz的带宽。但是对于测试测量仪器来说,通常需求的技术指标都要比其它电子、通信设备的指标要高,才能满足用户的需求,而且只有提供更宽的信号处理带宽,才能提高产品的竞争力。2)物料(BOM)成本,图1.2的方案中负责信号处理的器件是DDC、FPGA和DSP,对于无线信号接收链路中的数字化部分,一般DDC和FPGA共同构成数字前端(DFE)负责大运算量和高速率的数据处理(包括下变频、抽取、滤波和FFT等运算)。对于谱仪来说,信号经过数字下变频之后,一般要做FFT处理得出幅度谱(因为FFT比扫描检波方式具有速度优势),但是ISL5216不具备这方面的功能,只能送到FPGA或DSP进行处理,而DSP对于高速率高带宽信号的FFT处理,响应时间还是相对较长,因此这部分功能只有在FPGA内部处理。因此,要是把昂贵的商用ISL5216集成到FPGA内部,这样不仅减少物料成本,还可以减少PCB布局布线空间,和减少数据交互的过程,提高系统集成度。3)功耗的考虑,根据ISL5216的资料,在2.5~3.3V工作电压时,所有功能处于工作状态,电流是7.125mA/MHz。当工作在80.MHz时,所需典型电流为570IliA;加上ISL5216与FPGA之间的接口FIFO和FFT运算,这些功能消耗的功率相对于手持式频谱仪来说,具有很大的优化空间。基于以上的考虑,和当前FPGA工艺、性能的提高和开发工具的高效性,计划利4第一章引言用XJlinxSpartan3A—DSPFPGA来实现、验证和评估基于FPGA的DDC性能。为了兼容现有ISL5216的配置参数和程序代码,本设计中DDC的参数主要以ISL5216为参考。所设计基于FPGA的DDC技术指标如下表1.1。表1-1基于FPGA的DDC设计技术指标参数最大数据输入速率160MSPS设计指标数据输入格式最大系统处理时钟NC0相位分辨率NC0无杂散动态范围复数,16一bit160心Z0.000000084度>115dBfixed信道滤波器5级CIC5级HB255阶可编程FIR滤波系数的量化位数抽取因子范围18-bit1"--32768(整个抽取通道)1~32(CIC抽取范围)2。(1=0,1.“5,HB抽取范围)1~32(255阶FIR的抽取范围)最大信号处理带宽(混叠衰减>100dB)8MHz(处理时钟为160IHz,数据采样率20MSPS,cIc和HB旁路)10Mttz(处理时钟为160MHz,数据采样率大于等于40MSPS,CIC旁路,采用HBF5)7.2hflqz(处理时钟为160MHz,数据采样率大于等于40MSPS,CIC抽取率大于等于2)数据输出类型/格式同相分量I,正交分量Q;并行24-bit1.4本人工作和本文内容安排在本课题中,本人所做的主要工作有:1)基于FPGA的DDC系统方案的选型和设计;2)各模块的划分和接口定义,难点是各模块时钟和数据位宽的处理;5电子科技大学硕士学位论文3)利用Matlab/Simulink、XilinxSyaemGenerator和XilinxISE工具进行算法建模和仿真。4)用XilinxFPGA开发工具实现DDC中所有的模块包括数控振荡器(NCO)、复数数字混频器(M眦R)、5级积分梳状滤波器(ClC)、5级半带滤波器(FIB)和255阶可编程FIR滤波器,并整合所有的模块;5)对比Matlab/Simulink的建模仿真数据和FPGA最终实现数据,分析各模块和整个DDC工作的功能和性能。本文内容安排共有六章:第一章简单介绍了数字下变频技术和当前FPGA的信号处理性能,并说明了课题的背景和本人主要工作。第二章描述了数字下变频基本理论和结构,对完成各级数字信号处理所涉及到的正交下变频理论CIC、FIB、CORDIC、多相滤波结构和多速率信号处理等关键理论和算法做了适当阐述。第三章介绍了FPGA的数字信号处理特性和Xilinx点和与DSP处理相关的硬件资源。第四章详细介绍了各模块NCO、MIXER、CIC、FIB和255阶FIR的设计和实现过程,并对所有模块的整合集成、验证和性能分析。第五章给出了手持频谱分析仪的工作原理,和讨论了数字下变频器在频谱仪中的主要应用。Spa_rtan3A-DSPFPGA的特第六章对本论文的工作做了总结,并展望未来要继续完善和开展的工作。6第二章数字下交频基本理论和实现算法第二章数字下变频基本理论和实现算法数字下变频器通常由数控振荡器、数字混频器和数字低通抽取滤波器三个主要部分组成,如图2.1所示。DDC将数字化的中频信号变至基带,得到正交的I、Q数据,以便进行基带信号处理。原理上,数字下变频器和模拟下变频器是一致的,都是将输入信号与本地振荡信号混频,然后经滤波器滤除不需要的分量。。冈-J7F’l抖l’L尘_J’I汀■■—]I—_◆舶叫C0¥~神xz(n)基}加卜-I★co.L一工带川,T处-叫L阡H◆D卜k@翌j—:酬理图2.1数字下变频基本结构框图2.1数字正交变换下变频原理2.1.1复数字中频信号的数字正交下变频图2-2复数字中频信号的数孚。F变频假设复模拟中频带通输入信号(载波纹)为XAIF_PREFILr(f),经过抗混叠滤波器后得到复模拟中频信号:x胛(f)=a(t)e脚+删(2-1)如图2-2,该信号经过满足Nyquist采样定理的采样周期为I(采样频率Z)的ADC转换后,得到复数字中频信号Il】:7电子科技大学硕士学位论文XDW(nT,)=a(nT,)·P脚删”驯,-)|)、怕纠:口(甩Z).P妒(一‘).一掣‘从复中频信号表达式中可看出,信号的瞬时包络,瞬时相位和瞬时频率分别为:I锄(,2I)=a@正)I伊b伊(,z互)=吐甩乃+秒(,2Z)1‰(刀c):‰㈣I)】一‰[(甩一1)c)】(2-3)【=cooT,+{O(.Ts)一秒[(,z一1)I】)这三个特征分量包含了带通信号的全部信息,而‰(玎Z)表达式中的载频分量P/掣£作为信息载体不含任何有用信息。因此,把ADC的输出信号与NCO产生的本振信号P—J伽£相乘,把载频下移(-acts,变成零载频,其结果称为复数字基带信号或称为零中频信号,即有:XDIF一朋(栉Z)=吒肛(行Z)·P叫%肿’=【口(nZ)·e归‘”L’·P7%”L】·e一7%”‘=a(nL).eJO(”‘)(2—4)=口(力Z)cos[曰(挖Z)】+ja(nT,)sin[O(nT。)】2=XDlF—B1(。nl瓦)+A玎啦QZ)s)+jxDlF.BQ川i|){X‰DIF:揣黧a(nT,№)sosin矽[O@(nT功,):【阻5,…。一阳@正)=】上式(2-5)的两个分量分别称为复数字基带信号的同相分量和正交分量。吼耵一朋∽正)=lXDIF一朋(nTs)I={[‰圳(刀z)】2+[锄啦@互)]2ll陀={{口(以互)∞s[臼(胛Z)】)2+{口(胛T,)sin【口(刀互)])2}“‘=口(甩互)faDZ一肋仍互)=留一1【恐盯一阳(nT,)/xvlF一肼伽乃)】(2-6)=tg卅[a(nT,)sin[O(nT,)]/a(nT,)eos[O(nT,)]】=tg’1[tg(O(nr2)】=O(nr,)‰一ss(nr,)=Colt—ss(nr,)一‰一ss[(n一1)互】=口(疗正)一研(刀一1)Z】上式(2-6)的三个分量分别称为基带信号的瞬时包络,瞬时相位和瞬时频率。与复中频信号k(甩互)的瞬时包络,瞬时相位和瞬时频率的差别分别为:8第二章数字下变频基本理论和实现算法f△。(,2正)=0A圭{△矿(刀I)=q,2I(2—7)【△珊@互)=q互它们的频谱搬移过程如下图2.3,取它们的离散时间傅立叶变换(D乃7『.1):I‰(P归)=D孵【x肿(刀互)】{■,cD(Pp)=D弦玎P叫掣L】(2—8)l‰一BB(d∞)=DTFT[xDn:_BB(nT,)】从以上分析可知,一个中心频率为吐C的带通信号,既可以用其解析信号锄(刀C)JIPW‘一一1l,A’~一2rt—A一∞i.咀厅2靠71‰矿1▲1I②..11r一导一图2-3复中频信号下变频的频谱搬移过程表示,也可以用其基带信号‰一肋(力正)来表示,除了载波不同外,它们所携带的信号特征分量是一样的。由以上变换还可知,基带信号的采样速率Z仍然很高,为了满足后端基带处理速度的要求,需要对该高速的基带信号进行抽取滤波。2.1.2实数字中频信号的数字正交下变频在现实工程系统中,想要严格的获得复模拟中频信号z。厢(f)是比较困难的。不过理论上有两种方法可以实现:方法一是需要两个严格相互正交的模拟本振对从天线接收到的实射频信号进行正交混频和滤波,最后得到复模拟中频信号,但这样会增加系统集成的成本和复杂度。方法二是把天线接收到的实射频信号与本振混频得到一个模拟实窄带中频信号,如图2-4。9电子科技大学硕士学位论文图2-4实中频信号的下变频框图假设实窄带中频信号为:%一胛p)=口(,)·eos[coj+e(t)】对其进行Hilbert变换得到其正交分量,其中日[.】表示Hilbert变换:(2—9)k一肛(‘)=研%一肼O)】=a(t)·sin[coJ+O(t)】最后得到复模拟中频信号:(2—10)k(r)=Xw.al一胛(,)+豇赫一atp(t)=口(f)·eos[co。t+秒O)】+jaO)·sm[吐t+p(f)】:口(f)P儿掣+p(‘)】(2—11)算法虽简单,但要实现理想的Hilbert阶跃滤波器是非常困难的。因此,输入到ADC转换器的信号通常是实窄带中频信号,即前面提到的复中频信号的实部:k—D羔Re{嘣a(t)e‰jt=脚,+F(f")=口0).+秒(r)1f)】)叫畛cos[w—J坝例(2-12)其中Re{.)表示取复数的实部,相应的采样信号为:Xreat一脚@I)=a(nr,)·eos[w。nT,+秒(甩Z)】以下给出实数字中频信号的数字正交下变频的变换过程:工。删一肼@Z)=彳刚一oJ:Anr,)·e一脾”L=【口(玎正)·cos[wonT,+p(刀Z)】】·e一7晖町’(2—13)=(二)口∽乃)。{cos【口0互)]+cos[9∽正)】·∞s(2q万互)一sin[0(nr,)]·sill(2q栉互))+-,(÷)口(刀Z)。{sin[口(刀e)】一sin[0(nr,)]·eos(2con互)一cos[0(nT,)]·sin(2co,nT,)}=咕)口仞z)·eJe加m+∈)口(拧互).e-AO(n乙m碱1=X,ea/一D,,一肋(刀Z)+t训一D师一船(拧Z)(2—14)10第二章数字下变频基本理论和实现算法{‰Xreal:::篙l影1/22;:毫筹三№?【一D矿册(甩7二)=(c2嗡,)‘口(刀互)·e。咿伸‘p2啡肿j由以上表达式中可以看出,混频后产生数字基带分量和载波的二倍频分i-2aocT,,只要用数字低通滤波器就可以滤除这些高频分量,最后得到复数字基带信号:Xreal一肼一肋(即乃)=G)口(聆e)·e,o伽m(2-16)这个信号相对于复数字中频信号下变频的基带信号,仅仅是幅度小一倍,其他信息完全一样。取它们的离散时间傅立叶变换为:l‰一v1F(ep)=DTFT[x,,d一肼0互)】{,‰o::)_DTFT[e-.脾加oIX。蒯一ozr(e归)=DTFT[x。刚一肼@互)】【(2-17)=‰一肼一ns(ep)+k一肼一ns(e归)l阱一一(∥Xl。下图2.5表示了它们的频谱搬移过程。A—n‘CjA∞i。一2Jr2tr’1—q正1峥妒1⑦一2Jrp■矿~.Jrp_眇1:.图2-5实中频信号的下变频频谱搬移过程由此可见,实数字中频信号的正交下变频相对于复中频信号的正交下变频,只是在数字混频后多加了低通滤波,所以它们的实现结构可以做到相互兼容。电子科技大学硕士学位论文2.1.3数字正交下变频主要实现方法2.1.3.1直接数字混频实现数字正交下变频由上面下变频的数学推导公式(2-4)可知,这是个复数乘法,实际应用中,通常需要把复信号的实部和虚部当做两个单独实信号来处理【2】,即:IRe{芳D肛一肋(疗互))=Re{≯D,,(刀Z))‘cos(oJ:T.)+Im{xD师(nT,)}·sin((o。nT,)【hn{吒耵一肋QI))=hn{吒盯伽互))·cos(q刀Z)一Re{XDIr(nT,)}·sin(a,。nT,)可见,需要4个实数乘法器和两个加法器,其直接实现框图为【3】:,。,o、图2-6直接数字混频实现下变频当输入的信号为实数字中频信号且hn{‰(玎I))=0时,数字下变频可以只由两个乘法器来实现。图2-6的NCO实质是直接数字频率合成。数字频率合成的特点是频率转换快、输出信号建立时间短、频谱纯度高、频率分辨率低,输出信号可以做到严格正交。其实现方法主要有查表法、CORDIC算法和泰勒级数插值法等。不管其实现方式如何不同,它们的基本实现结构是类似的,不同的是相位幅值转换器。图2.7NCO的实现框图NCO基本原理组成框图如图2.7所示。其中参考信号用于提供NCO内部各部分的同步工作;相位累加器是NCO的核心。作用是对频率控制字Ⅳ不断进行线性累加,当累加器输出溢出时,就完成了一个周期。一个周期内累加器的输出数据可12第二章数字下变频基本理论和实现算法以认为代表了正余弦曲线的相位,当相位累加器的位数较大时,通常需要插入一个相位量化器来对前面的高相位分辨率的输出转换成位数较少的低相位分辨率的相位,通过相位幅值转换器实现了从相位数据输出得到相应的幅值数据。相位量化器会引入量化误差。相位幅值转换可以有很多的方法,最常用的是基于查表的方法。该方法存储了一系列的波形数据,通过累加器输出的相位数据,来寻址查找输出相应的幅值数据。该方法需要大量的波形数据预先存在RoM中,而基于CORDIC方法的相位幅值转换方法,可以省去大量的ROM资源。可以看出NCO的关键部分是相位幅值转换,而根据相位到幅值映射的方式不同,可分为两大类:1)基于函数计算的方法,如CORDIC算法和抛物线近似法等,这类算法的优点是可以实现高纯度的正弦信号,缺点是实现算法的逻辑电路复杂,从而了输出频带范围。2)基于查表法,这类方法是在ROM中存储完整的或者部分的正弦信号,相位累加器的输出作为读取ROM的地址信号。此时,ROM的地址位数决定相位分辨精度,而ROM的样点位数决定幅度的分辩精度。这一技术优点是实现比较容易,不足是杂散比较大。但为了提高其性能指标,国内外学者提出了许多新技术及改进方案。基于正弦信号万/4对称的方法,由Sunderland提出的三角近似法,由Bellaouar提出的基于泰勒级数线性插值法等【4】。泰勒级数插值法是在查表法的基础上,把相位量化器在量化中舍弃的低比特位的相位信息,通过泰勒展开,得到一个插值数据来校准ROM中输出的数据,最终减少相位量化器带来的量化误差和减少ROM的存储深度,达到性能和资源利用的折中。正弦函数的泰勒级数展开为:1sin(0)≈sin(o,)+cos(O,)·(e-e,)一去s域只)·(口一日)2+…Z(2—19)ROM中只存储高位地址倪的正余弦幅度值,低地址位的矽一2则通过乘法器来实现相乘,最后通过加法器把泰勒展开的高价项作相加,即可比较精确的算出伊相位处的正弦值,使输出的正弦幅度值更加光滑。2.1.3.2CORDIC算法实现数字正交下变频CORDIC算法是Voider在1959年开发出来的,用于笛卡儿坐标与极坐标之间的转换。这是一种迭代算法,仅需移位、累加和减法运算。在循环旋转模式下,CORDIC可以计算一个矢量(‰,儿)旋转了任意角度气后的笛卡儿坐标(‘,%),迭代过程可以用下面的等式15J来描述:13电子科技大学硕士学位论文薯+1=葺-d,.yf2一’.yin=yj+dixiZt+l=-4aretan(2一)(2-20)谚=-1z,<O时当代入初始旋转向量(%,Yo)和旋转角度‰,并且经过”次迭代后,CORDIC的迭代结果为:矗≈4l[XoeoS(zo)一Yosin(zo)】Yn≈4[yoeos(zo)+Xosin(zo)]Zn≈04=兀√1+2。27n一1—(2—21)如果把输入中频信号xD,F∽Z)的每个复数样本转换成对应的初始旋转向量,初x胛0Z)的复数相位连续旋转,这样就实现了数字下变频。由于它是迭代算法,r;磊-II..…一l1wetan(2“):图2-8CORDIC实现的数字下变频器结构与上一节介绍的直接数字混频实现下变频一样,CORDIC实现变频同样需要产14始旋转相角为本振信号的瞬时相位鳞刀Z,那么CORDIC算法就可以用于信号如果要实现高速应用的目标,我们有必要对每一级迭代用特定的流水结构来实现。在这种流水结构中,固定基本旋转角度arctan(2叫)可以采用查表实现。用CORDIC算法实现数字下变频的框图示于图2.8。生数字本振的相位值,主要不同的地方是乘法的实现上,前一种是直接相乘,而后一种是通过迭代得出相乘结果。第二章数字下变频基本理论和实现算法2.1.3.3基于重采样实现数字下变频从输入的复数字中频信号式(2—2)开始,假定有用信道位于固定的中频哝上,在吐上采用复数字带通滤波器,则该信道可从相邻信道中分离出来【2】,如图2-9。图2-g经过数字滤波的中频信号(滤波器带宽等于信道带宽)经过滤波后的信号为:锄珊∽C)=‰∽£)·PJ‰‘刀m.eJ。Zc以瓦且1岌足F式成立:(2—22)%:喜.簪,七乩2,…,M(2-23)M-1%2万‘百,七=1,2,…,即载频为采样速率的彬M陪。把上式(2—23)代入式(2—22)就可以得到:芳D,,一触(,2C)=口肿0正).ej‰伽m.e弘万争(2-24)对信号‰一批(甩e)进行M次抽取(即重采样),最终可得到:硫一肚(嗍)=%(崛)’e/%‘㈣‘P,2疗扣=口触(,崛).沙‘崛’后的频谱结构如图2.10,达到正交下变频到基带信号的目的。(2—25)假设抽取后的采样周期崛用来表示信号已经足够短,即满足采样定理,则重采样图2-10重采样后信号的频谱结构采用重采样的数字下变频结构如图2-11,这种变频方式是纯粹的采样处理,不需要乘法器,但需要调谐ADC采样频率到载波的整数倍,以及在抽取前要添加带通滤波器。15电子科技大学硕士学位论文图2-11重采样实现下变频原理图2.2整数倍抽取与频谱结构变化在模拟中频信号数字化过程中,数据采样频率越高,噪声基底就越低。因为在ADC量化位数固定的情况下,量化噪声功率保持不变而噪声将在更宽的系统带宽上扩展。所以提高采样频率有利于提高输入信号的信噪比。对于精密的测量仪器来说,这一指标尤其重要,所以谱仪中一般采用过采样对输入的模拟中频信号进行采样量化。然而随着采样速率的提高带来的另外一个问题就是采样后的数据流速率很高,导致后续的信号处理速度跟不上,特别是对有些同步解调分析算法,其计算量大,很难满足实时性要求,所以有必要对A/D后的数据流进行降速处理。这就需要用到不同采样率的抽取滤波器,从而涉及到多速率信号处理,即整数倍抽取。所谓整数倍抽取【1】是指把原始采样序列x(n)每隔∞.1)个数据取一个,以形成新序列xn(m),D是整数倍抽取率。抽取前后的序列可表示为:xn(m)=x(mD)为了对比抽取前后的频谱变化,先定义一个新信号:(2-26)m,=≯蒜tn坳…据恒等式:∽27,五1台D-IP.2u∥n___芝/=f:;,蒜如皿。一则y(n)可表示为:∽28,yc,z,=xc,z,l吉篓P/三孚}又由于XD(m)=x(Dm)=y(Om),则xo(m)的Z变换为:c2—29,%(z)=∑xD(m)z一=∑y(Dm)z一=∑y(m)z-面把式(2.29)代入式(2-30)可得:16(2—30)第二章数字下交频基本理论和实现算法一卧啦轳驴协3。,:去篁量f∥,:0mⅫIz(历)P等b百111:育1乙D-!x(P1.百2zlm.乒1)u,卸把z-'e弘代入上式,可得抽取序列b(研)之D刀可变换为:%(∥)=石二1.1-1x[ej(e-2石t)lD](2-32)由上式可见,抽取序列的频谱为抽取前序列之频谱经频移和D倍扩展后的D个频谱的晷加和。图2.12给出了抽样前后的频谱结构。(a)抽取后频谱发生混叠(b)添加滤波器后的抽取图2.12抽取前后频谱结构变化图2.12(a)的频谱发生了混叠,使抽取后的序列中无法重构原来的信号x(n)。因此,必须在抽取之后的抽样率q/D仍然满足抽样定理,否则就必须在抽取前使用抗混叠滤波器,即把信号的频带在戤/2D以下。图2-13完整的抽取框图完整的系统抽取结构如图2-13。图2-12(b)是图2.12(a)qbx(n)先经过截止频率为哦/3D的低通滤波器后再抽取的频谱结构,这时频谱没有发生混叠。2.3FIR的高效滤波结构由前面章节知道,实中频信号经过数字正交混频后,产生了载波的二倍频分量;17电子科技大学硕士学位论文同时要降低信号速率,需经过抽取,但抽取会产生频谱混叠和扩展。因此,为了减少抽取后的频谱混叠,需要在抽取前进行滤波,为了不产生相位和幅度失真,RIR是较佳选择。FIR即其单位冲激响应为有限长的滤波器,其最大的特点就是可以做成严格的线性相位,同时又可以具有任意的幅度特性,而且永远是稳定的系统。FIR滤波器的单位冲激响应厅(刀)是有限长的(0≤n≤N一1)),其Z变换为:H(z)=>:h(n)z叫●■■一n=0.N..一-l(2—33)这是z卅的(N-1)阶多项式,有限z平面(o<lzI<∞)有(N-1)个零点,而位于z平面原点z=0处,则有(M1)阶极点【6】。传统的的FIR实现结构如图2.14,主要由延迟单元、乘法器、加法器,和存储滤波系数的存储单元RAM或ROM。图2-14传统的FIR直接实现结构在数字下变频中的滤波,要做到滤波后的信号不产生相位失真,一般都是用FIR滤波器。但是,要在高速采样数据流中,采用FIR的直接实现结构来实现实时滤波,将需要很高的处理时钟速率或很多并行处理的硅片资源。在本论文中,主要用到积分梳状(CIC)滤波器,半带(HB)滤波器,多相滤波结构,它们都是在FIR传统原型结构的基础上,经过变换而得出的高效实时处理结构。2.3.1积分梳状(CIC)滤波器积分梳状滤波器的冲击响应具有如下形式【l】:f1.0≤刀≤D一1ho(,2)2锰其他‘2q4’是幅度为1的矩形窗,式中的D称为CIC滤波器的阶数,在实际应用中,通常因式分解为D艰奉M其中R是后面将会提到的CIC滤波器的抽取因子,而M是梳状滤波器的差分延迟因子(通常取1或2)。从冲击响应表达式看出,CIC滤波器实际是一个系数都为1的偶对称的特殊FIR滤波器,D可以是奇数或为偶数,所以其频率相位响应也是线性的。18第二章数字下变频基本理论和实现算法根据Z变换的定义,CIC的Z变换为:风(z)=∑z一=矧讹)=》‘=糟毒一O∽35)(2一kJ—z,当有Ⅳ个相同的Ho(z)滤波器级联时,其Z变换可表示为:一隆。]Jv=研(1_z_弦M)N缈2衫,J_篱]~∽36,其中,N为CIC滤波器的级数,R为CIC的抽取因子,M为梳状滤波部分的差分延迟因子。酢)的离散时间傅立叶变换可表示为:n(e戌衫)=日(z)l:。∥盯(2-37)由于CIC实质是一个系数为偶对称的FIR滤波器,每级相位频率响应为线性的:臼(缈)二一彩.掣)(2-38)∞39,因此,不对其展开分析比较。在此,仅就参数R、N、M对幅度频率响应的影响进行比较和分析。幅度频响表达式为:其中f为数字频率,数字角频率为2∥。下图2.15为R=7,N=3,M=I的幅号占尝宝譬爱图2·15GIG的幅度响应度频响,只显示了0到Nyquist频率之间的幅度响应谱,图中的横坐标采样频率是以抽取之前的速率进行归一化的。由上图2-15可知,第一个零点幅度频率为(1腴),19电子科技大学硕士学位论文第一旁瓣最高幅度的频率为[3/(2卡R)】,在此引入旁瓣衰减:as=/I-.2046N㈣,(dB)=·卜二—丹≈.幸lg嗣…131日(口广2矿素)l4=20·lg∽40)(2一其中,上式中取M=I,胗>1时,约等号成立。即旁瓣衰减基本上只与级联级数有关。CIC滤波器的低通截止频率为工,而R倍抽取之后的速率等于输入速率的(1腿),在此,引入带宽比例因子6:z=6。(玄)(2-41)则通带最大衰减(纹波)为:(2-42)当b/R<<l,M=I或2时,上式可简化为:8,≈20"N'lgI南I下图2.16(a)中表示了不同级联Ⅳ-1到5的通带衰减情况【7】o,1’寒So■I∽㈣j』\心:\K≮N\I卜弋;‘I!I:/Ax\jj、(J,N^、^,X{?0K~~‘1,'j人^^,jVN-5NN\;入I?毒f·^、I一.N-1、、‘。;\}\N。21、i{I0j.姚I矾!I--、,14-31\;}\;^i’一1.八.\(a)CIC通带衰减(b)CIC混叠衰减图2.16CIC的通带衰减和混叠衰减(~为级联数,∥尺=1为CIC输出速率)根据前一节的抽取频谱变化知道,经过CIC滤波R倍抽取之后,频率区间为:力宰去一z≤厂<,z掌i1+z,cn早·2。【.孚J)c2一必,的信号会混叠到有用的通带信号(O■助的区间内。从幅度响应表达式和图2.15可明显看出,混叠到有用带宽信号内的最大混叠频率为【(去)一6·唼)】,定义最大混叠第二章数字下变频基本理论和实现算法衰减为:A=20-lg(2-45)当6《1,胗>1,34=1或2时,上式可简化为:A≈-20·N·lgb(2—46)图2.16(b)表示了不同级联数的混叠衰减情况。可见要达到较理想的通带滤波效果,带宽比例因子b的选取不宜过大,否则通带波纹会较大,对通过的信号产生幅度失真。根据CIC的Z变换表达式,其Ⅳ级级联R倍抽取的实现结构如图2.17,主要分为Ⅳ个一阶的累加器,Ⅳ个差分延迟为M的梳状滤波器和一个抽取器。h嘲哪0rSeOoaOxr/aSed啪L———————————、,_————————JN∞岫fh图2.17CIC的实现结构2.3.2半带(船)滤波器IzOI坫图2.18半带滤波器的幅度响应具有如上图2,18幅度频率响应的FIR滤波器称为半带(船)滤波器【1】’其阻带宽度∽一Q,)和通带宽度(Q。)是相等的,并且通带与阻带波纹也相同。其幅度响应H(ejn)满足以下关系:p钉娟s(2-47)【吒=睡一21电子科技大学硕士学位论文半带滤波器除了具有上述重要性质外,还具有如下主要特征:H(eyn)=1一H(ej‘7一Q’)0。2)=.5I-Z-48,)㈣=1,k=O眨,±4,...即HB的冲击响应h(k)除了零点不为零外,在其余偶数点都为零,所以采用半带滤波器来实现抽取滤波,只需一半的计算量,有很高的计算效率,适合实时信号处理。根据HB的系数特点,对传统的FIR实现结构加以改进,则实现半带滤波器的ASIC资源只需原来的一半;如果半带滤波器的系数具有对称性,ASIC资源只需传统实现结构如图2.14的1/4。2.3.3多相滤波结构从2.2节的抽取模型知,数字滤波器位于抽取算子之前,也就是说滤波是在降速之前实现的,这提高了系统运算速度的要求,对实时处理是极其不利的。而这一节介绍的多相滤波结构可有效的解决这一问题。设滤波器的系统函数【1】为:日(z)=∑h(n)z”月=Ⅻ可重新写为:(2—49)H(z)=…+办(一D)·zD+厅【(一(D一1)]·z‘D一1’+…+厅(一1)·z一1+办(0)·zo+厅(1).z一1+…+办(D)·z—D+办[((D+1)】·z‘‘D+1’+…(2—50):yyh(nD+K).z-(nD根’K=OH=—∞D—l厂Ⅷ1=∑z—rJ∑h(nD+K)·(z。)一”I又令:乓(z)=∑h(nD+K)·(z)哪(2-51)则式(2—50)可写为:日/I\Z、,=川∑脚Zr乓,LZD(2-52)第二章数字下变频基本理论和实现算法这就是多相滤波结构,其网络图如图2.19(8)所示,将其应用于抽取器,由抽取的等效关系,即可得到抽取器的多相滤波结构如图2.19(b)。由此可见,此时的数字滤波器&(z)都位于抽取器之后,滤波运算是在降速之后,这就大大降低了对处理速度的要求,提高实时处理能力;同时还有一个好处是每一分支滤波器的系数由原先的Ⅳ个减少为(∥历个,可以减少滤波运算的累积误差,提高计算精度。{专卜匝p!尹岖r{卤.三.(口)滤波器的多相结构}掰(6)抽取器的多相滤波结构图2.19多相滤波结构2.4本章小结本章主要对数字下变频的基本结构和原理做了简单介绍,并对各个模块涉及的主要相关理论和算法作了分别阐述,作为本论文在FPGA设计实现DDC时的理论依据。电子科技大学硕士学位论文第三章基于FPGA的DSP嵌入式系统3.1DSP的一般特性数字信号处理(DSP)与模拟信号处理相比有许多优点:相对于温度和工艺等的变化,数字信号要比模拟信号更稳健;数字表示的信号可以通过改变字长来更好地控制精度,所以DSP技术可以在放大信号的同时去除噪声和干扰,而在模拟信号中信号和噪声同时被放大;此外数字信号还可以不带误差地被存储和恢复。DSP的硬件实现通常设计成能满足实时处理的紧凑的流量约束,每输入新的采样数据就需要实时地处理,这与先在缓冲器存储然后按批作业处理有所不同。如果系统的吞吐能力比要求的采样率低,新的输入就需要停止或缓冲。在DSP系统中,一旦所有的输入数据有效,就可以执行任何的任务或计算,系统是由数据流同步的,而不是系统的时钟。由于DSP系统是由时钟驱动的数字系统,因此可以利用具有丰富逻辑和DSP资源的FPGA来实现有效的DSP设计。3.2FPGA实现DSP如今,数字信号处理的复杂度逐年增大,对传统的DSP处理器结构而言,在需要实时信号处理的地方就难以胜任。由于半导体工艺的不断提高,实现DSP系统不再是专用DSP器件的专利,现在越来越多地利用高性能高密度的FPGA对信号进行处理。FPGA通过并行方式可以提供极高性能的信号处理能力,且可编程的灵活结构降低了设计的风险。FPGA支持DSP运算的机制与指令集结构的信号处理器是完全不同的。FPGA是一种完全基于硬件来实现数字信号处理的。开拓DSP数学模型固有的并行性,使FPGA可以按流水线和并行的方式以硬件实现DSP,则它的处理速度比按程序和指令以软件方式实现DSP要快得多。与固定宽度的处理器和ASIC器件不同,FPGA提供设计者以定制的字长来适应特定的情况或在相同情况下采用不同的设计参数。此外,查找表结构的FPGA具有系统内可再编程的特性,任何时候都允许设计者方便地在系统中重构其设计,24第三章基于FPGA的DSP嵌入式系统从而快速地构造复杂的高性能的DSP系统。高度的并行性、定制化的灵活性和性价比的优势都使得FPGA成为实现高性能数字信号处理的首选器件之一。很多时候也作为通用DSP器件的协处理器,处理实时、大运算量的算法。3.3Spartan3A—DSPFPGA的DSP硬件资源在XJIinxSpartan3A.DSP中有多达126个DSP48ASlice和53712个逻辑单元和2268KbitsBlockRAM,如表3.1。这些资源能够构成一个天然的并行处理引擎,能胜任许多复杂的高性能信号处理。如前所述,FPGA是利用分布在器件内丰富DSP资源来换取性能的提高,这些分布的DSP资源包括【8】:1)查找表UJT结构可以实现组合逻辑、分布RAM和串行可寻址移位寄存器;2)大容量的双口BlockRAM存储器的多种用途,能与嵌入乘法器配对使用;3)具有高速率乘法,累加和级联性能的DSP48ASlice。表3.1XilinxSpartan3A—DSPFPGA资源CLBDeviceXC3SDIBOOAXC3SD3400ASystemEquivalentGates。LogicCells1800KM00K37.44053.712A唧IOneCI.B=FourTOtalSlicesTotalSlices16.64023,872DistributedBlockRAMBitsllj1512K2268KDSP48As84126MaximumMaximumDIfierentialDCMs:User110ⅣOPa嘛88519469227213队MBits(it260K373KRows}Columns881044B58CLEs4.1605,9683.3.1FPGA逻辑资源的DSP特性高性能的DSP应用要求极大量的资源,尽管FPGA集成度很高,可以提供丰富的资源,但是仍要在逻辑单元中加入实现DSP功能的能力来节省资源,许多DSP的算法都要执行一个加权和(∑4(f瞰f))的核心运算,它包括乘法器、加法器和延时单元等基本运算单元。FPGA在结构上具有实现这些基本功能的特性。如图3.1所示,Xilinx的逻辑单元结构【9】9,由~个四输入的查找表(LUT),一个触发器以及以及其他逻辑电路构成一个逻辑单元。为实现DSP的基本功能,在查找表后增加进位链和乘法专用与门等,可以利用一个查找表来实现一位全加器或乘法器的进位以及“和’’或“积”的输出,既节省资源,也便于级联加速运算。查找表能够能实现ROM/RAM,如图3.2。在实现存放滤波器的系数时,可以将与地址对应的系数存储在ROM中,将乘法变换为查表后进行加法来实现,达到提高速度和节省资源的目的;同时,查找表还可配置成RAM的形式来使用,对需要小规模RAM的应用场合,提供了极大的灵活性,且可降低时序约束的要求。25电子科技大学硕士学位论文8HIFTINCOUT图3-1XilinxSpartan3A逻辑单元结构图3.2查找表配置成ROM/RAM的等效结构查找表还可配置为最多实现16级的可寻址移位寄存器(SRLl6),如图3.3,在实现DSP延时单元时能节省大量触发器。DINCLKAf3:o】图3.3查找表配置成可寻址移位寄存器的等效结构3.3.2Block.RAM专用模块随着半导体工艺尺寸不断地缩小,芯片已从受限于逻辑内核变成受限于焊盘管脚数量,因此逻辑内核中有空间集成一定规模的存储器和为实现DSP算法最有效的硬件乘法器。Xilinx公司的Sparta.n3A-DSP系列集成了一定数量的18Kb的片内BlockRAM,最多的BlockRAM达到126块。第三章基于FPGA的DSP嵌入式系统18Kb的片内块RAM是真正的双口RAM,有两个的时钟和两个控制的对公共存储区进行存取的同步口,这两个同步口的功能是相同的,但是两个口的数据宽度可以单独配置,提供片内总线宽度的变换。这些大容量的块RAM为需要存储大量数据的场合,如FFT数据缓存,DDS的波形数据表等提供了保证,从而不需要在数据处理单元的外部扩展存储器。这样既提高了系统的集成性,又可以降低功耗和成本。3.3.3DSP48A专用模块Sparten3A.DSP系列提供的DSP48ASlice,具有高性能的乘法、加法/累加和级联的能力【lo】,如图3_4所示,使得FPGA可以为高性能的信号处理提供理想的解决方案,可以针对数字通信和视频图象处理等应用开发高性能的DSP引擎,也可作为通用DSP系统的预处理器或协处理器。SpartemqA-DSP系列中DSP48A模块最多达到126个,工作频率高达250MHz,成为算术密集应用的理想器件,且相对Virtexd,/5系列FPGA还有低成本和低功耗的优势。嘲尸CN图34SpaCmn3A—DSP内部的DSP48ASlice结构DSP48A模块主要由一个预加法器,一个18x18位二进制补码乘法器,一个48位符号扩展的加法/减法/累加器,和其它进位逻辑组成。其适应DSP应用中的众多功能,操作数输入、中间积和累加器输出的可编程流水线操作,以及48位内部总线等提高其吞吐量和适应性,无需一般的结构布线就可以实现前一个DSP48A的27电子科技大学硕士学位论文输出与后一个DSP48A输入的级联。另外,该模块集成了预加法器,为实现具有系数对称的FIR提供了极大的便利。DSP48A的数据输入和控制输入直接馈送到算术部分,任意选择一次或两次寄存,以构建高度流水线操作的DSP系统。启用流水线寄存器时,最高工作频率为250MHz。CLBCL8CLBCLBCLBCLBCLBCLBCLeCLBCLBCLBCLBCL8CLBCLBBlockRAMCLBCLBCLBCLBCLBCLBCLBCLBCLBCLBCUBCLBCLBCLBCL8CL8CLBCLB矗芷∞凸CL8CLeCLBCLBC旧CLBCLBCLBCLBBlOCkRAM矗芷∞oCLBCLBCLBCLBCL8图3-5DSP48A的布局如图3.5,DSP48A的高度是四个可配置逻辑块(CLB)的高度,与块RAM的高度匹配。DSP48A和块RAM有各自的布线资源可加倍数据通信带宽;其周围丰富的CLB为实现算术处理提供了大量的SIUl6延迟单元、DistributedRAM和控制逻辑。DSP48A专门的布线区域和反馈通道,使相邻的DSP48A可以通过级联输入数据通路(B级联)和级联输出数据通路(P级联)提供一个级联的输入和输出流,具有高性能DSP应用的多种特性。DSP48A的瓜Z和C4艘删通过加法/减法器进行抽象的结果为:AdderOut=(Z±(X+CARR}'IN))(3—1)根据不同的需要,上式可解析为不同的表达式,例如在具有对称系数的FIR滤波器中,用得最多的表达式为:Adder0ut=(BCIN±(彳幸(D±B)+CARR明Ⅳ))(3-2)3.4本章小结本章首先介绍了传统数字信号处理(DSP)的方法,并指出它在某些应用上的不足;FPGA高度的并行性、重构的灵活性、最佳的性价比等优点,使它成为了实现高速高带宽DSP应用的首选平台。结合Xilinx.FPGA的DSP硬件资源,从内部硬件结构上解释用FPGA来实现DSP的可行性。28第四章DDC的设计实现与性能分析第四章DDC的设计实现与性能分析灵活性,确定为直接数字混频的实现方式(NCO+M唧。本设计DDC的FPGA实现框图如图4.1,主要模块有NCO,MIXER,5级CIC,5级HB,和255阶可编程FIR,除了这些模块还有接口控制模块和增益控制模块。本文着重描述前面5个模块的具体设计实现,测试性能分析和整个DDC系统的整合与实现。权衡数字下变频的三种实现算法,结合整个谱仪系统的设计方案和系统配置的图4-1DDC的FPGA实现框图4.1NCO的设计与实现NCO的项目需求指标是最高输出采样频率为160MHz,相位分辨率是0.000000084度,无杂散动态范围SFDR为115dB,输出中心载波频率可配置。4.1.1根据指标设计NCO参数根据第二章中NCO的基本结构,重新细化得到它的实现结构如下图4—2。不管用查表法、CORDIC或泰勒级数插值法来实现高频率分辨率的NCO,相位累加器或相位量化器都是不可缺少,在这里假设相位量化器就是一个相位截断,直接把p(,z)的低位舍去,如图4.3。根据DDS的理论‘1¨,NCO的相位分辨率、频率分辩率和输出频率分别为:△矽=2衫2‰町=3600/2‰,A/=/。,,/2岛撕(4-I)厶=厶.(ae/2%㈣)29电子科技大学硕士学位论文PbaseAccumulatorQ1Phaselncrement△e—BAo一IAl.}一B,mF]‰Sine/CosineL乜厂]∥D17蛳,匕p_ooDkl.uepTaTableDepth=2BoI—lA8一一相位增量控制字;玩一一一相位增量控制字输入的位宽O(n)一一相位累加器的输出相位;岛(。)一一相位累加器输出的位宽O(n)一一相位量化器的输出相位;岛(。)一一相位量化器输出的位宽厶一--NCO的工作时钟(输出采样率);厶一一NCO输出的载波频率图4—2NCO的实现框图图4-3相位量化器的截断当相位量化器旁路的时候,岛(。)与岛(。)是相等的。根据指标相位分辨率0.000000084度,可得:岛㈨=ceil[1092(3600/0.0000000840)】-32(4—2)当相位量化器旁路时,相位累加器的位宽岛㈨同样为32,可算得频率分辨率为:鲈=(160'106)/232=0.0372Hz(4-3)如果采用量化器旁路的方式直接查表方式实现NCO,则ROM的寻址空间就要2锄町=232=4G个存储单元,即使利用n'/4的对称方式进行查表,也需要4G/8=500M的寻址单元,用FPGA是难以实现的。这个时候为了保证相位分辨率,有两种方法可以选择,一个是插入相位量化器,对相位累加器的输出位宽进行截断,但是这样会带来量化误差,不过这些误差可以用Dither和泰勒级数插值法来进行修正。这些误差在时域的表现就是抖动,在频域就是杂散,使SFDR恶化,下一节会对相位截断效应进行分析;另外是采用CORDIC来实现,COI①IC的迭代精度,是靠迭代更多的次数来换取的,根据CORDIC算法得:30第四章DDc的设计实现与性能分析j△矽≥tg-l(2一点)(4—4)【K=ceil{-l092[培(△矽)】)=ceil{一l092[tg(2x/2码佃’)】)=30总的迭代次数为K+l--31次,要是用流水线结构来实现的话,至少有31个时钟延迟,假如初始数据宽度为16位,则内部的迭代数据宽度为16+31--'47位,因为每迭代一次,数据宽度要增加一位,要是用FPGA来实现这么大规模的迭代,也有不少难度。因此,要实现高频率分辨率和相位分辨率的NCO,对相位累加器的输出相位进行截断是在所难免的,在本论文中,采用查找表法结合泰勒级数插值法来实现NCO,以满足设计指标和低的输出延迟。4.1.2相位截断效应分析NCO性能指标包括频率分辨率、无杂散动态范围和输出信号正交性等。而无杂散动态范围指标主要取决于相位值和幅度值的量化,查找表的存储深度和数据宽度分别决定着相位角度值分辨率和幅度值分辨率。在理想情况下,相位数据位数足够大时,NCO频率分辨率可很高,在实际中不可能实现,因为波形存储器ROM容量消耗太大。改善其杂散性能主要有三种办法:(1)压缩ROM存储量,增大寻址位数。比如利用正弦值对称性,储存1/8周期的幅度,利用对称性恢复其他象限幅度值。(2)随机抖动技术。相位截断误差和幅度量化误差引起的杂散分量较大,给误差信号加上一特定随机序列,则可破坏误差信号周期性,从而提高无杂散动态范围。(3)泰勒级数插值法,利用相位量化过程中舍弃的相位信息进行泰勒插值处理,并对查表得到的数据进行补偿,最终得到高的无杂散动态范围。4.1.2.1相位截断相位累加器输出的数据位宽为岛㈨的高分辩率相位O(n),会被相位量化器截断为宽度岛(。)的低相位分辨率o∽),此时被舍弃的位数为岛(。)一%(。)。设绝对相位量化误差被表示为磊,这个误差可以理解为对理想输出相位值的相位调制,最终通过O(n)查表输出的幅度值就会存在抖动,具体可表现为下式【12】:fo(珂)=乡(挖)+岛(船)jlP归‘疗’=eJ.[。e,(n、)+Se‘疗Ⅺ=e声‘刀’’PJ西‘疗’,(Se(n)《1,P』岛‘甩’≈1+jSo(n))≈P声伽’【1+旃(”)】I≈e妒伽)+jSo(n)·ej烈帕31(4—5)…’电子科技大学硕士学位论文相位误差磊可表示为图4-4,图中的误差已经被规一化。直接用截断后的相位去查表输出波形,其输出信号的功率谱为图4-5,NCO的参数配置为:相位累加器易(。)为32位,相位量化器输出也即查找表地址宽度岛(帕为12位,幅度输出也即查找表输出数据宽度为12位,输出采样频率为120MHz,载波频率为10.7MHz。图4-4相位截断误差图4-5相位截断频谱4.1.2.2相位截断谱中杂散的幅度和分布特点某些特定的相位步进字不会产生相位截断效应,而其它的相位步进字则会产生。理论分析表明,如果截断位数岛(。)一岛(。)的值大于或等于4,则产生相位截断谱的峰值杂散可以非常的近似为6.02毛(。)dB。当△口,岛(。),岛(。)的关系满足㈣:GcDf△幺2昂《町一%l一’1:2岛㈨一%㈨-1(4—6)会产生最大的相位截断谱6.02/30㈤dB,其中GCD表示取最大公约数(GreatestCommonDivisor)。当△口,岛(。),岛(。)的关系满足:GcDf△以2岛㈤一%‘町1:2%t町一%㈣(4—7)将不会产生相位截断效应。除以上两种格式之外的相位步进字都会产生相位截断效应,其产生的最大相位截断频谱在O到6.02Be(。)dB之间。由上图4-5可知,截断后的相位为12位,SFDR约等于72dB,与理论值相吻合。由于隔一定数量的采样时钟之后,截断相位与无截断相位重合,相位截断误差为O。用相位误差重复率PERR(PhaseErrorRepetitionRate)表示两次截断误差归零的间隔时钟数,其计算式如下:PERR=LCM(AO,2%㈣喝㈣)/△032(4—8)第四章DDC的设计实现与性能分析其中,LCM表示取最小公倍数(LeastCommonMultiple)。从资料分析和实际仿真的结果可以总结出,相位截断频谱在数字角频率上的分布位置符合以下公式:o=厶·(志±簧),其中。<刀<PERR代入上面截断谱中的参数,可知图4-5的杂散分布情况符合这个规律。(4-9)4.1.3泰勒级数插值实现NCO基于泰勒插值的NCO实现框图如下:SINEcoSINE图禾6基于泰勒插值的NCO在描述采用泰勒级数插值法如何实现NCO前,先简单介绍采用相位抖动(PhaseDithered)技术是如何改善NCO的SFDR。4.1.3.1PhaseDithered技术由于NCO在一定的相位步进字下工作时,相位截断误差具有一定的周期性,正是这个周期性的相位截断误差产生了不希望的杂散。因此,可以通过添加PHASEDITHERED随机抖动序列来破坏这种量化误差的周期性。DITHER序列的方差可设置为约等于相位截断所舍弃的低比特的值,并把这个DITHER序列与相位累加器的输出叠加,叠加的结果作为相位量化器的输入,量化器的输出作为查找表的输入地址,过程如上图4.6。DITHER序列的噪声功率谱接近白噪声谱,通过DITHER,相位截断谱的杂散会被频谱展宽,使杂散的幅度得到抑制。根据理论,添加DITHER后,NCO的输出SFDR相对相位截断后直接查表的方法有约12dB的改善,图4.7是添加了DITHER的频谱。此时,NCO的参数配置为:相位累加器岛㈨为32位,相位量化器输出也即查找表地址宽度为%㈨12位,幅度输出也即查找表输出数据宽度为14位,输出采样频率为120MHz,载波频率为10.7MHz。33电子科技大学硕士学位论文锄m脚柚旷妒W唧晰州m唧”惝桫p懒4‰RrⅢ1"11m。一jFWM/at')∞∞∞图4—7添加了Dither技术的NCO频谱DITHER技术,虽然对SFDR有12dB的改善,但是要实现115dB的SFDR,根据上面的最大杂散计算公式ciel((115.12)/6.021=18,即仍然需要18位的相位量化宽度,对FPGA来说依然是很大的ROM存储资源开销。4.1.3.2泰勒级数插值实现NCO为了达到压缩ROM存储空间减少FPGA资源的占用,同时提高无杂散动态范围等性能的目的,泰勒级数插值是很好的选择。目前,FPGA芯片除了丰富的可编程逻辑资源外,还扩充了专用的硬件乘法器等特殊功能模块。泰勒级数插值正是利用了FPGA内的乘法器资源DSP48A,采用先查表然后用泰勒级数插值的方法,通过流水线式运算在每个时钟都得到一个插值数据,从而输出的数据不再局限于波形表中存储的数据,使正弦波更加光滑。具体实现过程如上图4.6。NCO最终实现的输出数据宽度为21位,SFDR大于115dB,达到项目需求指标。4.1.3.3仿真频谱波形和时序图和FPGA使用资源1。t一一1。…’圆抛舶·1(Z“Ⅲ0-DAT_IN·曲R』J,‘’舢djlKo.wR眦o.DAl百‘暑量脚£“”C0-SEL-■_h哟伽....。.一一L√FⅢ孔枷锄k.J......加40∞了“7,0刨7M柚_瑚FⅢ^_r.cyf№J图4-8泰勒插值实现NCO的频谱图4-9泰勒插值实现NCO的项层图实现NCO所采用的FPGA型号为XilinxSpartan3A.DSP系列的XC3SDl800A,图34第四章DDc的设计实现与性能分析4-8为用泰勒插值法所实现的NCO在载波频率为107MFIz的频谱,输出采样率为120MHz。从FPGA的时序图4-11看,满足功能的需求;从图4—12综合的结果看,使用了两个DSP48A乘法嚣,主要用于需要乘法的泰勒插值运算。图4-10泰勒插值实现NCO的Matlab仿真渡形…”w自±E“目自日)“…"1F■m∞mE557州ד‘O‘,”口口5圜4—11NCO舳FPGA愤直时帛图4-12NCO的FPGA资源使用情况4.2复数MIXER的设计与实现4.21乘法分解早期的FPOA由于没有专用的硬件乘法器,要实现三角函数乘法,一般利用DA算法来实现,DA算法的乘法延时一般和乘数的数据宽度有关,由于是利用FPGA内部的逻辑资源来搭建的,处理速度受到:或者使用CORDlC算法退代实现乘法功能,由前面章节可知,选代的精度越高,迭代次数越多,延迟越大。35电子科技大学硕士学位论文在本论文中,复数乘法器的实现是利用FPGA的硬件乘法器DSP48A,可达到很高乘法速度,延时小。由于DSP48A只能接受18x18位的输入,而用户数据输入是16位,NCO输出的数据是21位,因此,在设计实现高性能的21x16的复数乘法运算,根据第二章中复数混频器的实现结构,需要DSP48A来并行处理。两个复数相乘,可分解为4次实数乘法,下面先介绍21x16的有符号补码表示的实数乘法运算,设这两个实数表示为鸽[20:O]和鼠[15:0】,运算过程如下:^120:o】Bop5:01凸,434:o]l-枷一口咖删_14bits_∥一心f20】^【20:o】】B[17:o】=b蚋一extended一2bUs—of一岛【15】.矗,115:o】】凸彳…71㈣6:川研17:01s/fin—extended-1曲如矿一研17】lo,A【16:o]1xB[17:o]=35bits【34:17】116:o】弋乡kr34:·,】Jx研-,:o】=s劬鼢{[35:18】『17:o】L,,。i二。FFs日。T凸一’’’/[52:35]/。[34:17)/[’16:0]tilt—off一脚一J劬一of一尸【521图4-1321xRESULT[36:0】=/[36:0116有符号补码的实数乘法分解为了提高数据吞吐量,使用两个DSP48A并行来实现,实现框图如下图4.14,共Slico2《A[34:17'1B【”:oD科17:Ol图4-14DSP48A实现21x18的实数乘法框图有3个时钟的延迟,对输出P[52:0]舍去高16位,并保留最低37位数据P[36:0]36第四章DDC的设计实现与性能分析就是相乘结果,由于高16位是符号位扩展的结果,舍弃不会影响输出结果。4.2.221x16位复数乘法的设计及实现重写本论文中要实现的复数MIXER如下:fRe{毪肛一船积1)}=Re{吒糖(露互))·coS(纹忍互)+h{吒护(露1)>‘sin(counT,)【IIIl{k一即Qt)}=Im{xDzr(nT,))·cos(皱nT,)一Re{xur(nT,)}‘sin(counT,)其中中频数据的实部虚部都是16位,而NCO输出数据的为21位。为了充分利用DSP48A中的18x18的乘法器,需要把中频数据算术扩展为18位,NCO数据算术扩展为35位,并利用上~节的乘法分解方法,用8个DSP48A来实现MIXER。图4-15用4个DSP48A实现复数乘法的实部其中要得到实部输出,需要用到上一节的两个21x16位实数相乘结构的级联。假设16位中频信号z肼∽乃)的实虚部分别符号扩展为18位的B—real[17:0】和Bimag[17:0],同时把NCO输出21位的信号e-jmenT,分别符号扩展为35位的【彳一real[34:17】,0,A—real[16:o】】和【么一imag[34:17],0,A—imag[16:o】】。则实现实部输出框图如图4.15。同样要得到虚部输出,也要4个DSP48A级联。最终MIXER的FPGA实现如下图4.16,共有13个时钟延迟。37善一篓电子科技大学硕士学位论文一二i:二.——三三事]二荸:{导—善—二二二.’三;:r[三己。:io—i三芎;二:量’量孝三型一一一_^,;+_=一一[三一一。!:‘i商1——————一;一旱毫!=.孑≤≮=}!一+:J三挚-Ⅵ…∞“Ht■’sL’”口4“r"HE’om5×图4·1621x16位复数MIXER的FPGA实现二]Ij二\I[二i、:二CU二i、!二t:U二一:(j二?二131∞#am,m¨.目¨‘0oI"———1———————————————————jii———————————————■——一r一“K日’·5i……e‘,7n口a1…uⅦ_3’o#“∞m1口‘’7r——T——_——_7ii——_—Tl■Fi7巧可10■-_-●j丽而iF—●—■—一mX1…5"‘日圈牟17复数MIXER的FPGA时序图4—18复数MIXER的FPGA资源利用MIXER的时序((01+02+0与(03-04+1)相乘)和FPGA资源使用情况分别如图4—17和图4-18,从时序图可以看出,有13个时钟延迟。第四章DDc的瑷计实现与性能分析4.23混频器仿真结果及性能分析1相位调制复中频信号输入的仿真及分析423设输入复中频激励信号㈣为:同相分量输入为:01+cos(2‘PI+Fc+“+sin(2+P141000000+∞);正交分量输入为:01*sin(2*P1+厅+u+sin(2+PI。1000000+“)),其中Fc为载波10MHz,调制信号为1M}Iz的正弦波,“为时间变量,采样频率为120MHz。7。随,。。。。从.,。..}r伽如”mn川W』k忡川:.。。。。、A-謇留罂詈暑譬‘“。8;5—叫【署普詈碍黑尸805。!。j,。。。。毗&。、.嗳黑曼曼曼j7兰骂竺!苎蛩舞'。粤三!竺。垂L,—o雕I■丸■1(f(a】输入同相分量的功率谱;0)输出同相分带的功率谱(c)赣^正交分量的功率谱:(d)输出的正交分麓的功率谱(e)输入复数信号的功率谱:(0输出复数信号的功率谱圈4-19混频器MIXER的复中频信号输入的频谱搬移过程当给混频器输入复中频信号时,频谱搬移过程如图4-19,这与第二章的推导公式(2-4)一致。下变频过程中并没有产生载波的二倍频分量,理想情况下,可以不需要低通滤波器,仅根据需要进行简单地抽取,即可获得低速率的基带信号。虽然给混频器输入复中频信号,可以降低数字下变频硬件系统的复杂性,但是是以增加模拟中频处理部分的硬件复杂性和成本为代价的,例如需要产生正交的模拟本振信号,需要两个模拟混频器和两个数宇,模拟转换器等。39电子科技大学硕士学位论文一(a)输入的同相分量:(b)输入的正交分量:(C)同相输出端的波形:(d)正交输出端的波形图4-20混频器的复中频输入的Mat|ab仿真波形“一·=一。、j一~.j17一一—iLo——■L-——!!:‘一』兰—上—塑_—』L+—兰兰;生』兰—生—些兰=—』坠』o——!!—世,j示fi2i:,jii霉oi菰=尸萧茂}≮[二c‘…‘r,e,r5‘^…一丁可i甄-■i叠§i,’"巧E,ji—m,_丽百厂ji石i丘j!燮_』!坐■旦oiE生!’I!j监。』“!L!!生一』=!!:一一…一一图4-21混频器的复中频输入的硬件仿真时序从频谱图看出,输入的信号存在直流分量,是由于对输入测试的模拟信号采用截断量化并用16位定点补码表示造成的,根据统计分析理论嘲,截断量化误差的均值和方差分别为:^一^1一15以一了一—F2622115”c2百2—ir2即量化噪声有直流分量。经混频后,直流分量会被搬移相应的频率间隔。如果对明显的看出混频后输出的同相分量和正交分量仅仅是数字基带信号。输入信号采用舍入量化,则不会产生直流分量,因为舍入误差的均值为0。图4—20和图4·21分别为混频器的Mmlab时域仿真波形和硬件时序。从时域波形图中亦可第四童DI)c的设计实现与性能分析4232相位调制实中频信号输入的仿真及分析输入实中频激励信号为:同相输入端输入为:01+cos(2+PI+Fc+u+sin(2+PI*lOOOOOO*u)):正交输入端输入为:0,其中凡为载波信号10正弦波.Ⅳ为时间变量,采样频率为120MHz。7MHz,调制信号为频率1MI-Iz的警兰兰兰耋|警要篓竺::=三::”哪忡州】}一^”H^一”氍川”。M蚺PpH州口a,uz2》’o二☆自■口口EEl=●■■■■og=z2二,io山。垂』}一wⅧH一(c)正交输入瑞输入0:(e)输入实信号的功率谱;:JL一”七j『_1_===可—F、(d)输出复信号的正交分量(f)输出复信号的功率谱(a)同相输入端的实信号:(b)输出复信号的同相分量圈4-22混频器MIXER的实中频信号输入的频谱搬移过程当给混频器输入实中频信号时,其信号的频谱搬移过程如图4—22,与第二章的推导公式(2—14)一致,下变频过程中产生了载波的二倍频分量,园此需要在速率抽取之前添加低通滤波器,滤除载波二倍频处的无用分量保留数字基带分量。图4.23为给混频器输入实中频信号时的M“lab时域仿真波形,从输出的同相和正交分量波形亦可清楚地看出,存在载波的二次谐波分量,与复中频信号输入时具有明显地不同。!㈥碱燃一㈣翮电子科技大学硕士学位论文;蛾黼M蛾瞒低锅诋娥(a)同相端输入信号;(b)止交端输八为0;(c)同相端输出信号:(d)正交端输出信号图4-23混频器的实中频输^的Matlab仿真波形43积分梳状(CIC)滤波器性能分析与设计实现CIC滤波器的FPGA实现结构43I根据CIC滤波器的z变换表达式,对第二章中的CIC滤波结构稍微做一下改变,如图4.24,主要是引入了延迟寄存器。一阶积分器的延迟反馈同时作为下个。焉三i,q。呻【!:f+二一!卜。二,三二÷+—“二叫三二=一:=_■二1+i型+匿4—24CIC∞实现框幽上。5稿矗司.n野.^当+一L一^一—一积分器的输入,用FPGA实现积分器,实际上就是累加器;而各个梳状滤波器亦称为差分器,它们之间插入一个延迟寄存器,可得出其流水线结构,这样可以提高FPGA实现的Ⅱ丁靠性,和提高数据吞吐率。432CIC三个参数的选取依据和分析重新写CiC滤波器的三个主要指标如下:第四章DDC的设计实现与性能分析%=20·lg≈13.46·N((1B)心o.叫剥A≈-20·N·lgbCIC滤波器的特点可归结为三大指标分别是旁瓣衰减口。,通带衰减坑和混叠衰减4,以及三大参数抽取率R,差分延迟M和级联级数Ⅳ。其中指标万。和彳的选取还与实际使用中带宽比例因子b的选取有关。为了进一步看清CIC三个参数对滤波器频响的影响,可见以下三幅图4.25、图4.26和图4.27,它们分别是独自改变参数Ⅳ、R和M时,CIC频响的变化。图4-25级数Ⅳ对CIC的影响从图直观看出,增加级数Ⅳ,旁瓣衰减,通带衰减和混叠衰减与级联级数呈正比例增大,级联级数越多,衰减越厉害。多级级联在增大阻带衰减、减小混叠影响的同时也增大了通带衰减,降低了带内平坦度,会使通带的可选截止频率变小。因此实际使用中,通常Ⅳ不宜过大,一般不超过5。为了兼容现有项目DSP的设计思想和控制代码,Ⅳ选取为5级级联与ISL5216的相同。增加抽取倍数R,主要影响幅度零点的位置和个数;第一旁瓣衰减也会加大,但是改善不明显。在本论文中,五的选取范围为1~32。增加差分延迟因子,主要改变幅度零点的位置,且略微加大了旁瓣衰减和混叠衰减,但是同时增加了通带衰减,会导致通带带宽选择范围变小。因此M的选取一般是1或2,本论文中,只以M=1来设计实现CIC滤波器。43电子科技大学硕士学位论文图4.26抽取率月对CIC的影响加卸舶Nom'mhzedfmq∞ncy·cycles,'smrnple图年27延迟因子M对tic的影响在某些应用中,输入的数据率高于后端皿和Fm所能处理的最高速率,而信号带宽又大于CIC在规定阻带衰减下最小抽取时的无混叠信号带宽,在这种情况下可以采用先对数据进行内插补零再用CIC抽取器抽取的方式来提高可处理的信号带宽。因此,在一定的阻带衰减下增加无混叠信号带宽,有两种方式,一是降低抽取因子D,另一种是提高采样率。最终CIC设计参数确定为表4.1。表4-1GIG设计参数CIC参数级联级数Ⅳ5抽取倍数R1~32差分延迟因子M1参数值当抽取倍数定为l时,CIC滤波器被旁路,混频器MIXER的输出通过数据选择器被直接送到HB进行处理。第四章DDC的设计实现与性能分析4.3.3CIC的处理数据位宽与时钟处理4.3.3.1数据的处理位冤CIC滤波器的幅度频率响应重写如下:附∽l=[哿]N=[脚·Sa(万脚).S{t.i(∥)]N,(其*Sa(x)=sin(x)/x)即存在处理增益(肼)川,因此在输入数据宽度为‰的情况下,CIC抽取滤波器的全精度数据处理宽度旧为:选取混频器数据输出截断后的数据位宽‰为18位,则在N=5,M=1,R取不同的值,CIC滤波器内部的数据处理全精度宽度为下表:表年2CIC不同抽取率时的全精度数据宽度‰猁r=ceil(N·l092(肼)+忍勰)(4—11)N=5M=1Bclc.x纠xR=223R=428R=833R=1638R=3243CIC滤波器输入数据宽度为18位补码表示的数,因此在R=32时输出的数据宽度在无舍尾的情况下应该为43位,但事实上用不到这么高的数据精度,可以进行舍尾截取,舍去最低25位,保留高18位作为输出。但舍尾后会造成一个问题,如果尺较小,那么其输出的满幅宽度也较少,当R=2时,输出的满幅位宽只需要23位,同样被截取低25位后,分辨率只剩O位,造成有效位数大大降低。因此,应该在CIC滤波器输入端加一级桶形移位器,根据尺的大小对输入数据进行左移位,使得滤波抽取后得到的满幅输出接近43位,保证在小抽取因子情况下,输出数据截取25位后依然有足够的分辨率。移位器的移位值SG可按以下公式【l6】计算:SG=Floor[1092(32)’-l092(尺)’】,2≤R≤32Floor指朝负方向取整。移位值与抽取因子的关系曲线如图4.28。因此,总结CIC抽取滤波器内部数据处理宽度的变化过程为:输入CIC的数据为宽度18位的二的补码数据,符号扩展为43位;处理宽度为43位的桶型移位器根据抽取倍数作相应的移位;接着所有5个累加器的数据宽度都是43位,以保证数据的精度和累加器不产生溢出;由于根据上面图4-24的实现结构,CIC抽取45(4—12)电子科技大学硕士学位论文滤波器的增益都集中到累加器部分,而差分器可视为不存在处理增益,所以数据的处理仍然为43位。在最后一级差分器输出的43位数据中,截取高18位作为CIC抽取滤波的输出。ClCihiftvaluesVSdecim酬factorl‘《j蒡宅呈>≮笙∽U石l。k~弋\确i—、品峭、^^.h图4—28CIC内部数据移位与抽取因子的关系4.3.3.2设计43位的桶形移位器桶形移位器(BarrelShifter)是一种存储型的移位寄存器,在单个时钟周期内能使任何位数的数据完成移位或循环。这种结构中,移位器的输出使用了存储寄存器,以实现流水线操作,增加数据处理能力。此处的桶型移位器与传统的有所区别,图4.29CIC的桶型移位器框图这里只把输入的18位数据符号扩展为43位,只跟据抽取因子决定左移的位数SG,移出的SG个高位数据舍去,同时在低位补上SG个0。左移最大的位数是在R=2时,需要左移SG=20位,由于FPGA有DSP48A乘法单元,所以一个二进制数据B需要算术左移SG位,相当于B.2跖,因此利用DSP48A来实现桶型移位器相当的方便,实现框图如上图4.29。桶型移位器的FPGA实现如图4.30,一共需要2个DSP48A,其中查找表的值如表4.3。第四辛DDC的设计实现与性能分析图4-30桶§o移忙器的FPGA实现表4-3桶型移位器ROM的配置置2nSG置12n2513232n17152—5272—142n15162n5282nO52n13172—4292—062n1272n10192n3312nO82—10202—3322n092—92l2—3102n8222n2112n7122n7242n22n20142—5182—4302—0232n22“SG置2“6252“1262nl2一跖4333ClC抽取时钟的处理CIC抽取滤器的时钟,与CIC数据通道前面的混频器MIXER和NCO的处理图4-31ClC抽取器时钟,都与数字中频数据输入的采样时钟乃叶}(撮大输入数据速率为160MHz)。当CIC捕取滤波之后,数掘的输jb速率降为Fs/R,抽取器是位1‘累加器和莘分器电r科拄^学碗十学位论文之间。它是通过分频器和月=有时钟使能的寄存器米实现,如蚓4-3434CIC的实现和仿真验证ClC的实现和资源利用4341根据上面的讨论,CIC抽取滤波器的FPGA实现.主篮由5部分纽成.‘E'.ffJ分别是:抽般倍数片的写入寄存咀路、桶型移化寄存器、5个一阶秘分器(祟加器ACC)的级联、速率抽取器,和5个阶差分器的级联。实现的顶脏图,时序仿真和资源利用分别如下图4.32、罔4-33和图4-34。输出有两个信号,CIC滤波后的数据和数据输…指示信号。H~■。“…。r一。』r-ii-+iiHii(M量一。。蚓4.32ClC抽墩滤波器斗勺FPGA宜现I“4.33ClC抽取滤波器的FPGA仿真时序ld4-34CIC扣j墩滤波器的FPGA资满一利川第四章DDC的设计实现与性能分析4.3。4.2单频正弦信号的仿真测试输入测试信号为:幅度为0.1,频率为1MHz,采样频率为120MHz的正弦序列。图4.35为CIC抽取滤波前的信号功率谱,由于采用的是18位的截断量化,所以存在.108dB左右的杂散。图4.36为经过CIC滤波4陪抽取后的功率谱,杂散幅度相对滤波前有所抬升,这是由于CIC抽取时带外信号混叠到30MHz的系统处理带宽造成的,但是这些杂散都处于所需带宽之外,不影响系统性能,而且可通过DDC后续的滤波器进一步抑制。图4.37是仿真波形图。l_-om,。1。4图4.351MHz单频正弦波信号通过CIC之前的功率谱图4.361MHz单频正弦波信号通过CIC4陪抽取滤波后的频谱49电子科技大学硕士学位论文“『。。T一一——T—一——————————1一__一一。I一一一———————T_—].:孵I孵{哪#嘲聊哪!f!卵册哪要删卿鄹伊娜唧唧哪卿日鄹c四唧嘲3唧田野!研卿卿9呷丑口卯嗍.--【.........JL..................1....................................。.i...........—......J...................1......—...—.......J—..............—...J..一-:妊《j=-n姚[:|l=c吐删妇础磁正曲.血础}岫越£士}_础l删i衄m幽蛐b6Ii士髓盅‰础i蝴尬姓:删训≥≮\i下\~i..—一,丁、i/—/i/,1\\i、L/图4—371MHz单频正弦信号通过CIC前后的波形图4.3.4.3随机噪声的仿真测试锄越私0一一204060801∞120Frame:54Frequency(MHz)图4.38随机噪声CIC滤波前的功率谱输入测试信号:均值为0,方差为0.1的随机序列噪声,采样频率为120MHz。CIC抽取滤波前后的频谱为图4.38和图4.39,可看出CIC适合于采样数据速率的变换,而滤波的功能是有限的且会引入混叠,但在较小的带宽比例因子内的信号带宽不会受太大的影响。50第四章DIX;的设计实现与性能分析51020FrequencyfMHz)图4-39随机噪声ClC4倍抽取滤波后的功率谱h雕垂车眭捧菲枣洋群雄弹引毒髑躺露噩图4-40随机噪声通过CIC滤波器前后的波形图4.4半带(HB)抽取滤波器的参数配置与设计实现由于本课题的目的之一是用FPGA来实现商用数字下变频ASIC芯片ISL5216,并用基于FPGA的DDC来替换项目中用到的ISL5216,考虑到程序代码的兼容和可移植性,因此,本课题的HB采用与ISL5216相同的参数配置方式。4.4.1HB抽取滤波器的参数配置HB的系数配置4.4.1.1HB滤波器的5级滤波器的系数分别如下表4.4,HBFl~船F5的抽头数分别5l电子科技大学硕士学位论文为7、11、15,19和23,系数都是基于点(Ⅳ-1)/2偶对称【7】,且具有线性相位。表“半带滤波器的系数表系数hOhlh2h3h4h5HBFlHBF2HBF3.0.001305580.000000000HBF40.0003786090.000000000HBF5.0.0003471370.000000000.O.0313034060.0059299470.0000000000.2812805180.4999542240.2812805180.0000000000.000000000.0.0490360260.0123796460.0000000000.293090820.4999694820.000000000.0.060550690.0000000000.2994537350.499954224.0.0038108830.002513170.0000000000.0192451480.0000000000.000000000.O.0101585390.000000000h6h7h8h9hlO.0.03l3034060.29309082l穿t自¥’晷}》j.0.0699043270.030551910.0000000000.3040924070.5000000000.3040924070.0000000000.000000000.0.0819816590.0000000000.3094177250.500000000i鼍i}}舞;!?÷:j一;i0.000000000蕈:’鳝。,·:5曩.0.0490360260.2994537350.0000000000.005929947、:一’*等P,1卮。1j寸叫妒孵弩0.000000000.0.06055069-!托hllh12h13h14h15h16办J7h180.0000000000.012379646毽,,..。:舒:..0.0699043270.3094177250.000000000O.0192451480.0000000000.000000000.O.0819816590.0000000000.030551910.000000000.0.0101585390.0000000000.00251317翟:程1。一一r。。o0.000000000势::ji:§:‘。;童一0.00130558呼’溉簿¨弘‘;‘;‘lj《是r,。ni.0.003810883一.专0.0000000000.000378609h19h20h21h22矗,?of。7,.辱一}.,·。阜棼.0:≯.一支二!::j:j;,l0.000000000蠡÷譬节j“鞋j?{孓1盆罐,争毒毒曹托盏森妊‘;々拳!,秘密t毒捌q%。《二。一龟,{既。卷。《缓童嘉嘉毒.0.000347137百图4-41为5个半带滤波器的的幅度响应,5个滤波器的通带都非常平坦,且在输入速率工的四分之一处通带衰减都为6dB,阻带衰减随着滤波器阶数的增加而加大。图4-42为HB滤波器的混叠衰减特性,所谓混叠衰减就是由于抽取而造成的带外信号混叠到通带内的衰减值,该值越大越好,但是该值与通带带宽的选取52第四章DDc的设计实现与性能分析有关,它们是相互制约的矛盾关系。例如针对HBF3,在0.12瓢时,混叠衰减为40dB;而在o.0625y,处,混叠衰减为88dB,其中工为抽取前的数据速率。i一—》挺H8‘5HBF2℃心蚤HBFtI、沁\‘≠jj一锣汁雌F31\\\\lf|—n、、7一\。≥\\\f\,、一¨\YOO.1250.250.37-';lf’I^\硐O-5fl图4_41半带滤波器的幅度响应特性一!c乏豸簪罗7!/二卅多乡1/……2眨夕多T夕。l/。一’V://^,、j,¥|lv/V0,,j/{^/:/\/i’…’/{\f、HBF4|,厂、∥Vo.'25/I户t…..。—警械女1{,个q一K1『O.0025o.'S7‘0.21If8图442半带滤波器的混叠衰减特性4.4.1.2HB的抽取倍数抽取率可配置为直通1或2’,其中f表示HB级联的个数,抽取器的实现方式是在多相滤波器的前端添加一个一对多开关,可用一个解复用器来实现。5个HB滤波器可任意组合,但是抽头系数多的HB必须级联在系数少的I-ti3后面。4.4.1.3数据宽度和处理速率本课题中半带滤波器主要由第三章中提到的DSP48A来实现,它具有18位预加/减法器和18x18的乘法器,考虑到系数的对称性和防止数据作预加后不产生溢出,因此数据输入的有效宽度选取为17位,系数量化为18位(1位符号位,17位小数位)。考虑到尽可能提高DDC的处理带宽,各个HB滤波器都采用Parallel.FIR的多相滤波结构,下一节会详细讨论。各级HB能够处理的最大数据速率为160MHz,各级之间不存在速率的相互制约关系。53电子科技大学硕士学位论文4.4.2HB抽取滤波器的设计与实现许多商用DDC芯片中各级HB的实现是基于MACC.FIR的滤波结构。所谓MACC.FIR,即所有滤波抽头系数共用一个乘累加器MACC,在相邻输入数据的时间间隔(1锯0内通过时分复用的方法把所有抽头系数与相应数据相乘并累加,并把累加的结果作为本次滤波的输出值。由于每个ASIC的最高处理时钟.岛都是有上限的,并且各级滤波器的抽头系数M不一样,各级HB的输入速率.届和抽头系数M之间需满足以下关系:厂gr,ys≥M,(f=1,2,3,4,5)jsi(4—13)由于它们之间的相互制约关系,各级HB的最高输入速率受到。这种方法的好处是节省ASIC资源,但降低了HB的数据吞吐率。而在本课题中,采用Parallel.FIR,所谓Parallel.FIR就是各抽头系数独自使用一个乘法器,一个时钟周期就可以得到一个滤波输出值,如图4-43(a),具有很高的数据运算速率。但这种方法相对MACC.FIR,需要的ASIC资源是MACC.FIR的Ⅳ倍,显然是难以接受的。不过由于HB滤波器系数的特殊性,接近一半的系数为零又具有对称性,所选用FPGA又具有较多的DSP48A,因此用Parallel.FIR来实现HB是很好的选择。这样每一级的HB都可以实时处理与系统时钟相当的数据速率,且每一级的HB之间没有相互制约的关系。’(no抄‘f./2‘f92’(n砸三]-y(n卜图4_43半带抽取滤波器的直接实现HBFl的抽头系数为7个,且hO=-h6,hl=h5=0,h2=h4,h3为对称中心的系数。下面开始设计HBFl的具体实现方式,其他四个半带滤波器的设计过程与HBFl的基本一样。此处HB的实现是采用多相滤波结构。在讨论半带抽取滤波器的多相滤波结构之前,先对比直接实现FIR加一个2倍抽取器的实现形式,从图4-43(a)54第四章DDC的设计实现与性能分析中看出,需要7个DSP48A。由于HBFl存在零值系数,结构可简化为图4-43(b),DSP48A减少为5个。可见,直接实现方式不但节省资源有限,而且FIR工作在速率抽取器之前,即工作在高速率的时钟域。(a)——嘣nC(b)——.xrn‘(c)—xrnC图4舢半带抽取滤波器的多相结构根据第二章的多相滤波抽取结构,HBFl的滤波实现结构表示为图4-44(a),这是基本的多相滤波抽取结构,抽取的实现放在多相滤波之前,这样多相滤波就可工作在较低的速率下,因而可进一步提高整个DDC系统的速率性能。根据半带滤波器的系数特点,除了中间对称的偶数点不为零外,其他的偶数点系数都为零,实现结构简化为图4-44(b),而且系数还具有偶对称性,因此可进一步简化为图4-44(c)。前面这三种实现方式的多相滤波都工作在输入数据速率五的一半,即有一55电子科技大学硕士学位论文半时间处于空闲状态,通过时间复用方式,可进一步简化为图4-44(d),即乘法器减少一半,代价是增加一小部分控制逻辑。对比中可看出,这种实现方法要比图4-44(a)要节省5个乘法器和4个可寻址移位寄储器SRLl6,而又不牺牲Parallel-FIR并行处理数据的性能。根据图4-44(d)1拘实现方式,5个HB的FPGA实现用到的主要资源如表4.5。表4.5半带抽取滤波器的FPGA资源利用情况FPGA资源HBFl23HBF234HBF335HBF446HBF547DSP48A(个数)系数RAM(18bit.SRLl6个数)各个HB的速率抽取是在多相结构中实现的:而各个滤波器是否启用,是通过图4-45来实现的,例如当配置HBFl为直通时,只要把图中的信号HBFl一EN配置为高电平,则直接选通上级HB滤波器的输出送到下级HB滤波器。依此类推,通过组合HBFlEN,HBF2EN,HBF3EN,HBF4EN,HBF5EN共5个配置信号,HB滤波器的配置一共有组合数为:5ya:32J,一’i=0(4—14)当i=0时,表示5个HB都是被旁路。图4_45半带滤波器的配置实现方式HB滤波器的最终FPGA实现如图4_46,经过时序仿真,其结果满足系统要求,见图4-47。而图4.48是FPGA的资源利用情况,其中DSP48ASLICE一共用了16个,跟前面的算法设计相一致,见表4-5。.:::二=丑哩:…‘‘=,L车_::兰fj。瑶≥==_二i二!-=一—=_:=::j一■…f一’———一…”。;,=-_i:=:==J’。’车i::::。一4i韦:::。’—。==彳:!:第四章DDc的设计实现与性能分析鼍!≮一车jr菩一{』F警{d+毫。~蔓:兰』苎妻七J图4-46HB滤波器的FPGA实现,E三三茎茎:三茎三i三三三至要霉耋军三三三喜三三喜三三圈美重短匝童重芏亘馥耍蚕雹叵届重耗砸文蚕矗豆霉亘重珏匣EE三重至三j=二兰三三三三三三重£三三三==三三三j=二玉i三图“7HB滤波器的FPGA仿真时序图4148HB滤波器的FPGA资源利用情况4.43I-B滤波器的仿真验证MHz。输入测试信号:均值为0,方差为0l的随机序列噪声,采样频率为120功率谱如图4.38。限于篇幅,只列出了HBFl和HBF5的性能曲线。图4.49分别测试HBFl和HBF5各自的滤波效果,结果分析:”从0Hz~15MHz,幅度略微上翘,这是抽取造成的混叠,因此为了带宽内的混叠尽量小,一般是提高采样率、取小的带宽比例因子,或是提高HBagFft数:2)15~30MHz,HBF5比HBFl滚降要好,因为HBF5比HBFl过渡带耍陡;3)30MHz相对0Hz处没有达型6dB,是因为此处在2倍抽取时,混叠最大,混叠回来的功率与此处输入功率相当,因此30MHz相对0Hz处只有3dB的衰减。HBFl和HBF5级联的滤波性能见图4.50,滤波效果要比它们各自滤波效果要好。图4-51为Matlab仿真波形。电子科技大学硕士学位论文图4_49随机噪声单独经过HBFl(CHl下)和HBF5(CH2上)的功率谱——OrlI1l‘I加┃锄第四章DDC的设计实现与性能分析“.¨.¨¨。¨.引¨刚¨,¨.射u叭¨。¨.引¨图4-51HBFl与HBF5级联的Matlab仿真波形4.5Semi.ParallelFIR滤波器的设计实现前面实现的CIC和HB抽取滤波器组主要目的是完成采样速率的抽取功能,通过大的抽取,使数据流速率快速降下来。而本节所讨论的255阶FIR,主要目的是对整个数字信道进行整形滤波,一般不作抽取功能,信号经过CIC和HB滤波抽取后,输入到256阶FIR抽取滤波器时采样速率相对来说已经很低,所以,在一定的处理时钟速率下,能够有更高阶的FIR滤波,使得滤波器的通带波动、过渡带宽度和阻带最小衰减等指标能够设计得较好。4.5.1Semi.ParallelFIR滤波结构基于FPGA专用乘法器的FIR滤波器,主要有三种实现方式MACC.FIR、Parallel.FIR和Semi.ParallelFIR。而选用哪一种滤波结构来实现FIR,除了要考虑FPGA内部专用乘法器的个数和系统处理时钟外,还取决于两个重要参量【17】:输入数据速率和FIR滤波器的阶数,图4.52为基于XilinxFPGA的FIR滤波结构选取依据【18】。Semi-ParallelFIR是MACC-FIR和Parallel.FIR的折中。59电子科技大学硕士学位论文图4.52基于FPGA专用乘法器的FIR结构选取依据输入数据速率B,滤波系数个数Ⅳ,系统处理时钟Fpro和所需专用乘法器的个数M它们之间相互关系为:M=(乓木N)/E。(4-15)在此设计中,根据系统需求,FIR最大数据输入速率为20MHz,FIR的256个系数为实数且偶对称,系统处理时钟最大为160MHz。因此,可算出所需DSP48A个数为32个j结合系数的对称性,因此仅需要16个DSP48A。此外,另外还需要一个累加器来对16个DSP48A的运算结果进行累加,为了充分利用DSP48A的级联功能,累加器也用DSP48A来实现,因此FIR的实现总共需要17个DSP48A。4.5.2Semi.ParallelFIR的设计Semi.ParallelFIR的实现框图为图4.53所示。一共用了16+1个DSP48Aslice,16个18bitsX8用于存放FIR系数的DistributedRAM(这些RAM是由LUT构成的SI也16),32个17bitsX8的数据移位寄存器,以及控制逻辑部分。在FIR的最后添加了一个1 ̄32倍的抽取器,以满足系统大的抽取需求,由于FIR滤波器有255阶,过渡带可以做得很陡峭和阻带衰减可做得较大,因此,在进行抽取时,带外信号混叠到通带内可忽略。第四章DDC的设计实现与性能分析图4-53Semi—ParallelFIR的FPGA实现框图4.5.2.1DSP48A的配置DSP48ASlice非常适合于具有对称系数FIR的实现,见图4.54,系数从彳口输入,数据从B和D端口输入。另外,DSP48A具备级联功能,可把上级数据运算的结果进行相加或累加,这样可减少硅资源,提高速率性能和降低功耗。图4-54DSP48A的算术运算框图下表4.6是图4.53中各个DSP48ASlice控制码OPMODE的配置情况,其中第1到第16个DSP48A的控制码是固定的,只有第17个用作累加器的DSP48A在不同的时钟周期,有不同的配置。6l电子科技大学硕士学位论文表4.6FIR滤波器中各个DSP48ASlice的配置DSP48ASlice处理时钟周期OPMODE[7:0]’’00010001’’’’00010101’’’’00000100’’“00000110”“00000110”算术表达式第1个第1"-8个第1~8个第1个第2"--7个第8个0叫}研两尸Cnr+囡+∞H圆)】第2~16个第17个Pc㈣PCIN+PPCI-N+P,输出寄存4.5.2.2FIR数据移位寄存器数据移位缓存器主要是由可寻址的SRLl6来实现,如图4.55。数据的宽度为17bits,之所以不是18bits,原因是启用了DSP48A的预加法器(预加法器的输出为18bits),为了保证数据延迟线上的两个数据相加后不产生溢出,因此对输入的数据宽度做了。SRLl6的机理是当WE信号有效时,SRLl6在时钟的作用下,16个数据位依次右移,每来一个时钟,数据就依次移动一位。而地址ADDR[3:0]可任意选取移位寄存器中的任何一位作为输出。同时可根据需要,可使能输出寄存器使数据同步输出,以提高系统性能。一共有32个17bitsX8的移位缓存器,且这32个移位缓存器是级联起来的,在整个数据流延迟线上共有256数据点,为实时实现255阶FIR提供数据来源。1/2SliceM’I一一一一一一一一SR—L一16一E一一一一一一一一一…一1DINiWEADDR[3:0】图4-55SRLl6实现可寻址移位寄存器4.5.2.3FIR系数RAMFIR的系数被量化为18bits,系数存储器是由LUT搭建的SRLl6块,大小为18bitsX8,一共由16块这样的RAM组成255阶FIR的系数RAM。具有偶对称的系数RAM是可配置的,配置这些系数一共需要128个系统时钟。系数存储器之所以不使用大容量的BlockRAM,原因是图4.53中各个DSP48A是同时工作的,因此对应的需要16个存储器同时寻址输出系数值。要是使用BlockRAM,就要16块(18bitsX1K),而每块仅仅使用了其中8个字(18bits),显然是资源的浪费。第四章DDc的设计实现zj性能分析FIR的系数设为^6^,^H^h255,根据需求它们具有偶对称性,因此町把256个系数缩减为128,把这128个系数分为16组,各组的关系如F图4.56。系数RAM…s^I=DsPd8^,≈!≈E…^”Hi≈jD…‘“qi圉里圈匪圈E嗣E蚓E封…口蚓摩田田田胃匿宦日既丑匮日匿田日丑目4—56255阶偶对称FIR的系数存储的组织关系∞{t∞{#∞§t∞Et∞{#为双口RAM防问形式,其中4端u与主拄机相连接用丁系数的配置,而B端口为只读端口用于读出系数供DSP49A使用:4524控制逻辑电路翻4—57FIR为控钮逻辑fn路数据、系数存储器的读写访问,需要根据FIR输入数据室(昂大20MHz)声生地址和读写控制信号,这是255阶FIR的设计难电:由罔4—53实现框图可知.63电子科技大学硕士学位论文一共需要16个如图4.57的MACC(乘加法)级联完成所有系数的处理,这16个MACC是通过级联的方式流水线工作的。整个FIR的工作过程为每输入一个数据,则需要8个系统处理时钟(系统处理时钟至少是FIR输入数据速率的8倍)处理后,才有一个滤波结果数据输出。4.5.2.5FIR抽取器FIR的抽取器与CIC抽取器的设计实现类似,可详见图4.31。FIR的抽取器放置与CIC和HB的有所不同,CIC抽取器是放在累加器和差分器之间,而HB的抽取是通过选通开关的形式放在FIB的前面,这样做可减少CIC和HB的运算量。本课题的255阶FIR滤波器要是也采用多相滤波结构的话,最高输入数据率为20MHz,且要实现1"--'32陪的抽取率,将要用到32种多相滤波结构。这对用FPGA实现是不利的,首先速率的要求达不到,如FIR输入20MHz的数据率,而抽取倍数为1时,则实时处理的系统时钟需要20MHz·(256/2)=2560MI-lz,目前还没有这么高速率的FPGA商用;或者需要128个乘法器并行处理。另外,FPGA资源(包括乘法器,存储器,逻辑资源等)将是极大消耗,因为需要兼顾32种多相结构。因此,255阶FIR的抽取放在末尾进行是比较合理的选择。而且信号经过过渡带陡峭和阻带衰减大的255阶FIR的滤波后再进行抽取,带外信号混叠到有用带宽的分量非常小。抽取器的具体FPGA实现如图4.58。R刊a均,nal图4-58255阶FIR滤波器的抽取器4.5.3Semi.ParallelFIR的实现根据上一节FIR各个功能模块的设计,最终的Semi.ParallelFIR的FPGA实现如附录一。FPGA时序和资源使用情况如图4-59和图4.60。不管是时序还是FPGA64第四章nDc的设计实现与性能分析许漳伸用倍况都与辅期的~砬.耍D臣耍)j亟X垂砸£二二二二亟£二二3图4-59Semi-ParallelFIR的FPGA时序454FIR的验证幽4-61随机噪声经过255阶FIR滤波并4倍抽取之后的幅度谱输入测试信号:均值为0,方差为01的随机噪声,数据采样率为20MHz。功率谱如图4—38。该信号经过255阶FIR滤波并4倍抽取之后,输出信号的幅度谱为圈4-61.Matlab的仿真波形为图4.62。从结果可看出,所设计的FIR滤波嚣完全符合系统设计需求。FIR的滤波系数COEF由如下Matlab代码算出:^t_』r=255;%OrderFc土r=01:%CutoffFrequency65电子科技大学硕士学位论文flag_.fir='scale';%SamplingFlagSidelobeAtten=80;%WindowParameterwin_fir=chebwin(N_fir+l,SidelobeAtten)jCOEF=fir]Ovj;r,Fc_fir,'low:win_fir,flag_fir);h眦旷种惭一时御圪鸭№州刑阡j’|l|’了-.…¨……f..-r耳-.珥干:球::‘iiii’]…1...…『...|...于._干:耳.-。l工:…n可1I||…州叶_1图4-62FIR滤波器的Matlab仿真波形图4.6DDC的整体实现和参数指标DDC的整体实现4.6.1DDC的整体实现主要由前面单独实现的1个NCO、1个MIXER、2个5级CIC、2个5级FIB和2个255阶可变程Semi.ParallelFIR组合来实现,其FPGA的顶层实现如附录二。经过调试测试,DDC的FPGA实现时序如图4.63(CIC、liB和FIR的抽取率分别为4、2和2),FPGA资源利用情况如图4.64。实际综合出来的DSP48A使用个数为80个,与各模块单独实现时所利用的个数总和相一致,如表4.7。第四章DDc的设计实现与性能分析“R口iY女础女“iWin高缔i厦厨∞i蠕i*面婿i冱翮硎丽“蔚i月』6”p≈Ⅲ2X潞*’月5X《自6×’日11ב“^"69x6%’Z”1‘×…oX””x·目6k”日oko”X∞7坼H‘3k“o啦3“’M““L坠坠———————————————ML———————————————坚:!!一图4_63DDC的FPGA时序图4-64DDC的FPGA资源利用情况表4—7DDC中各个模块的FPGA资源利用情况模块DSP48ANCO21MⅨER8CIC20XHB2FIR217x2总数80l160xBlock—RAM4.6200DDC的整体测试7MHz:输入测试信号为160MHz采样率的复数FM信号,载波厅为10同帽分量输入为:01+cos(2+PI+Fc’u+sin(2+PI+100000+“)):正交分量输入为:o】*sin(2+PI+,f+u+sin(2+P1+100000+砷);其中Ⅳ为时间变量。CIC滤波器配置为4倍抽取率,}Ⅲ配置为HBF5(其它4个FIB旁路),255阶FIR的滤波特性如45节的图4—61且抽取率为2。FPGA时序如图4.63,而在各个点分别测试到的幅度特性如图4—65。从中可以看出,输入信号中存在直流分量,这是因为输入信号是采用定点补码截断量化所产生固有的量化误差直流电平,DDC的整体功能基本上实现。电子科技大学硕士学位论文卜j-0卜j:l.'∞妒矾嘶呲啡一Ⅳh刑惭一J;。州”w忡椰∥W~k舢坩¨—讪恤曲瑚锄柏∞舯F,q_’呵眦l(b)狮脚瑚伽l借Fame:柏9Frql·●r‘斜(^●乜I(c)-5.4·3-20123Frame:123FI'犁嗍(MHz)(e)(e)经过255阶FIR后DDC的输出图4-65DDC的整体测试(复数频谱)(a)DDC的输入信号;(b)MIXER的混频输出;(C)ClC的滤波输出;(d)衄F5的滤波输出第四章DDC的设计实现与性能分析4.6.3DDC的参数汇总通过对各个模块的功能仿真和测试,以及DDC系统整合后的调试验证,DDC的FPGA时序已经满足,且从初步的测试结果看,DDC所能达到的主要技术指标如下表4.8。DDC内部实现结构的主要配置参数如表4-9。表4-8实现DDC的性能参数j.DDC参数最大数据输入速率数据输入格式最大系统处理时钟160MSPS。。、.性能参数复数,16-bitfixed160删Z0.000000084度>115dB相位分辨率无杂散动态范围信道滤波器5级CIC5级HB255阶可编程FIR滤波系数量化位数抽取因子范围18一bit1~32768(整个抽取通道)l~32(CIC抽取范围)2。(i=0,1…5,耶抽取范围)l~32(255阶FIR的抽取范围)最大信号处理带宽(混叠衰减>100dB)8M}tz(处理时钟为160MHz,数据采样率20MSPS,CIC和HB旁路)10MHz(处理时钟为160MHz,数据采样率大于等于40MSPS,CIC旁路,采用HBF5)7.2MHz(处理时钟为160MHz,数据采样率大于等于40MSPS,CIC抽取率大于等于2)数据输出类型/格式同相分量I,正交分量Q;并行24-bit电子科技大学硕士学位论文表4.9DDC的主要配置参数模块::..DDCDataInNCOⅣ匝跹R16481816021CICHBFIRDDC,DataOut输入位宽处理位宽输出位宽16||160323221160X184317160174817x1817482420X18||2420最大输入数据速率(MSPS)最大处理时钟速率(MHz)160|160160160160160|抽取范围||||l1~322‘(f_0,1..5)1~32|滤波系数可重配置||系数固定255阶可编程}4.7本章小节这一章详细介绍了DDC中各个模块NCO、复数MIXER、5级CIC、5级HB和255阶可变程Semi.ParallelFIR滤波器的Matlab/Simulink的算法建模仿真,以及基于XilinxSpartan3A.DSPFPGA的设计与实现,同时还对各模块的不同实现方法和性能作了较详细的分析。最后还给出了DDC的FPGA整体实现,并给出了FPGA的资源利用情况,且测试了FM输入信号各个模块的工作情况,实验结果表明DDC不管是在算法仿真还是FPGA的实现时序都满足预期的目标。70第五章DDC在手持频谱仪中的应用第五章DDC在手持频谱仪中的应用5,1手持频谱仪的工作原理对一个信号的观察和测量,主要从时域和频域进行展开,如图5.1。频谱分析仪是使用不同方法在频域内对信号的电压、功率、频率等参数进行测量并显示的仪器。实质上频谱分析仪是也一种接收机。频谱仪有多种分类方法,按照分析处理方法的不同,可分为模拟式频谱仪、数字式频谱仪和模拟/数字混合式频谱仪。模拟式频谱仪以扫描式为基础构成。扫描式频谱仪根据组成方法的差异又分为调谐滤波器型、超外差型两种,分别采用滤波器或混频器实现被分析信号中各频率分量的逐一分离。数字式频谱仪以数字滤波器或快速傅里叶变换为基础构成。现代频谱仪将外差式扫描频谱分析技术与FFT数字信号处理结合起来,前端采用传统的外差式结构,中频处理部分采用数字结构,这样既可以继承外差式结构大的频率范围的优点,又可以充分发挥FFT可以做到很小频率分辨率的优点。Frequencyv@r'susTimeDomain图5.1信号在时域和频域的表示5.1.1经典外差式频谱仪早期的频谱分析仪㈣实质上是一台扫频接收机,其超外差式频谱分析仪原理框图如图5-2。输入信号与本地振荡信号在混频器变频后,经过一组并联的不同频率特性的带通滤波器,和检波器,使输入信号显示在一组带通滤波器限定的频率轴7l电子科技大学硕士学位论文上。显然,由于带通滤波器由无源元件构成,频谱分析仪整体上显得很笨重,而且频率分辨率不高。InputSignaldeolter图5.2经典外差结构的频谱分析仪框图1)超外差式频谱分析仪能够对频率很高的信号进行测量,主要原因是对高频信号进行了多级变频,然后用窄分辨率带宽在较低频率进行准确测量。利用外差式频谱分析仪我们可以实现对高达几十吉赫兹的信号进行准确测量。由于是基于本振G№3鸵14洲z32¨M№h_b¨图孓3频谱分析仪的三级混频结构扫描,对信号进行分析时扫描时间会相对较长,且这种谱仪不能够分析输入信号的相位信息。频谱分析仪的射频/微波前端的功能简述如下:2)输入衰减器,防止混频器的信号电平过高,以致产生增益压缩甚至烧毁器件。3)本地振荡器和扫描发生器,为混频器提供大频率范围的本振频率信号。4)滤波/混频器,混频器之前会放置预选器或低通滤波器来抑制镜频,混频器通常第五章DDC在手持频谱仪中的应用用3 ̄4级来实现变频如图5.3,将要分析的频带信号“搬移"到固定的中频上。5)中频滤波器,用于减少噪声带宽,同时实现对各频率分量的分辨。模拟式频谱分析仪的分辨率带宽RBW就是由中频滤波器的组合响应决定的,而中频数字化的频谱分析仪的RBW一般是由数字下变频器来实现。6)包络检波器,对末端中频信号检波得出幅度电平值。5.1.2频谱分析仪的工作过程下图5_4是频谱仪工作过程的简单分解。图中频谱分析范围是0Hz到3GHz,采用高中频3.6GHz方案,这样可有利于提高镜像抑制。本地振荡器LO随着扫描发生器SweepGenerator的控制信号,改变本地频率送到混频器与输入的信号进行混频,得到中频3.6GHz信号,该中频信号经过中频滤波器(可调节的频率分辩带宽RBW)和检波,得到相应频率点的幅度电平值,最后送到显示器进行显示。图5—4频谱分析仪的工作过程5.1.3频谱分析仪的中频数字化传统外差式谱仪测量速度受限于分辨率带宽,在较低频段区分紧邻的谱线需要很窄的RBW,因此导致扫描时间可能会长到无法忍受。而FFT分析仪的速度仅取决于量化和FFT计算所需的时间,在相等的频率分辨率下,FFT分析较外差扫描式要快得多。现代谱仪将外差扫描频谱分析技术与FFT数字信号处理技术相结合,兼有两种技术的优点:射频/微波前端仍然采用传统的外差式结构,而在中频处理部分采用数字结构,中频信号由ADC量化,FFT则由通用信号处理器或FPGA实现。这种方案充分利用了外差式频谱仪的频率范围和FFT优秀的频率分辨率,使得在很高的频率上进行极窄带宽的频谱分析成为可能,整机性能大大提高。73电子科技大学硕士学位论文数字化中频(D正)频谱分析仪在宽带高中频进行数字化处理,具有分析带宽大、RBW小、测量时间短,可对复杂信号实施时.频变换的功能,因而得到越来越广泛的应用。但由于现有的数字信号处理器(DSP)处理速度有限,往往难以对高速率A/D采样得到的数字信号直接进行实时处理。为了解决这一矛盾,需要采用数字下变频(DDC)技术,将采样得到的高速率信号变成低速率基带信号,以便进一步的分析处理。用FPGA来设计数字下变频器有许多好处:FPGA在硬件上具有很强的稳定性和极高的运算速度,在软件上具有可编程的特点,可以根据不同的系统要求,采用不同的结构来完成相应的功能,便于进行系统功能扩展和性能升级。nI/'A-t№r9—L9L_JL-JI图孓5现代频谱分析仪的数字中频结构框图既然傅立叶变换可把输入信号分解成分立的频率分量,同样可起着滤波器类似的作用,所以可借助傅立叶变换代替滤波器。现代频谱分析仪与模拟分析仪的最大不同是,对图5.2中的中频滤波器,对数放大器,检波器和视频滤波器进行了中频数字化处理,如图5.5所示,为现代频谱分析仪的中频数字化组成框图。被测信号经输入衰减器之后进入混频电路,在扫描本振信号的作用下,被测信号的各种频率成分被依次混频,然后以固定的中频频率通过中频滤波器,被选择出来进行后续处理。在数字中频处理电路中,被测信号的各个频率分量被量化,正交数字下变频,时频域变换,最后送入显示器。从图中可以看出数字下变频是关键的信号通道,运算量巨大,它的输出有数字基带信号的同相分量,正交分量,幅度信息和相位信息,减轻了后端的信号处理量。射频/微波信号经过模拟下变频之后,经高速A/D采集,通过与NCO产生的本振扫频信号混频,下变频后信号不断移入低通数字滤波器,然后提取滤波后的信号幅度,根据当前频率和提取到的幅度值,即可以绘制信号频谱图,同时还可以提取相位信息,对无线通信中的协议进行解调分析。频谱分析仪的中频数字化部分各功能电路的功能简述如下:74第五章DDC在手持频谱仪中的应用1)预选器,根据所分析信号的特性,可选择输入到谱仪的低频直通通道信号,宽带或窄带中频信号;2)抗混叠滤波器,减少ADC转换时的混叠;3)增益自动控制,根据中频信号幅度的大小,调整中频增益,使输入到ADC前端的信号处于理想的采样范围;4)高速高分辨率ADC采样,这是整个中频数字化的关键部件;5)数字下变频(DDC)电路,完成数字混频,实现正交分解,将中频信号向下“搬移’’到基带;另外一个功能是抽取,降低数据采样速率;低通滤波,防止抽取后事实上的采样频率降低可能引起的频谱混叠。随着技术的发展,DDC不仅具有前面三个功能,还具有坐标转换模块(CORDIC)和重采样等功能;6)F兀运算,数字检波,对数放大,视频滤波和解调分析等基带信号处理。5.2DDC在频谱扫描过程中的辅助调谐频谱分析仪之所以能够提供从直流信号到高达几十GHz信号的频谱分析或信号分析,主要是因为有覆盖所要分析频率范围的模拟本地振荡器(有可能存在几个不同频段的本地振荡器组成来共同覆盖整个波段)。但往往这么大频率跨度的本振,其步进频率大小一般是几百赫兹到几十兆赫兹。这里面隐含的两个特性是:频率步进不能做到足够小;另外一个是当本振在频率扫描过程中,本地振荡器的锁相环有一个捕获锁定时间,这对提高谱仪的扫描效率是有制约的。InputSigmd~e⑧图5-6DDC在频谱扫描过程中的辅助调谐而数字下变频DDC中的NCO最大特点有三方面:频率分辨率小,在120MHz75电子科技大学硕士学位论文工作时钟时,频率步进的分辨率是0.028Hz;频率锁定稳定时间短,其时间主要取决于NCO中相位累加器到波形查找表输出寄存器的时钟延迟单元,在本设计中延迟单元数是lO个,10"(1/120MHz)=83.33纳秒;另外一个特点是无杂散动态范围SFDR可以做得很高,在本设计中为115dB。为了提高手持频谱分析仪的谱扫描分析的速度,主要有两种途径,一个是减少模拟本振频率步进的次数,因为模拟本振锁相环锁定稳定的时间是一个重要的参量;另外一个采用不同的时频域转换的算法,传统方法是扫描检波的方式,这种方法在频率分辩带宽RBW较窄时,谱扫描将会很慢(因为这时本振的频率步进很小,因此步进的次数多),而中频数字化之后可采用高效率的FFT进行时频域转换。针对以上目标,采用宽带数字中频,并且模拟本振和数字下变频器DDC中NCO联合调谐,就可以充分利用模拟本振大频率覆盖和大频率步进的优点,亦可发挥NCO的小频率步进和锁定稳定时间小的特点。如上图5-6为模拟本振和DDC中的NCO共同组成谱仪中的频率调谐。它们的工作过程可简单描述为:模拟本地振荡器以末级模拟中频的带宽(可适当选取大的中频带宽)作为步进频率的大小,而NCO在模拟本振每调协一次之后,结合RBW的大小依次设置不同的NCO输出载波频率,即可完成把输入到谱仪的不同的频段的信号下变频到基带。大的频率步进由模拟本振完成,小的频率步进则主要由NCO来完成;这样可减少模拟本地振荡器频率步进的次数,从而缩短锁相环锁定稳定的等待时间达到提高扫描效率的目的;同时可提高下变频频率的准确度和精度,因为NCO的频率分辨率能达到0.028Hz(120MHz工作时钟)。5.3DDC中的可配置数字滤波器实现RBW前面介绍经典外差式频谱分析仪的频率分辩带宽,是由不同的模拟滤波器组来实现的,模拟滤波器越多,所占用的体积空间和功耗都将是成比例的增加,这对小型化电池续航能力要久的手持频谱分析仪来说,是难以接受的。既然是模拟滤波器,带宽就不可能做得很窄,但是在具体应用中,往往需要很窄的频率分辩带宽RBW来发现区分两个相邻的频率分量。对于上面的两个问题,可利用DDC中的255阶FIR可配置数字滤波器来解决。在频谱分析仪中,频率分辨带宽(RBW,ResolutionBandwidth)是一个非常重要的概念,滤波器之特性为高斯滤波器(Gaussian.ShapedFilter)。如图5.7,它是由中频滤波器的3‘lB带宽所决定的,谱仪中滤波器的选择性(Selectivity)一般定义为76第五章DDC在手持频谱仪中的应用60dB带宽和3dB带宽的比值,比值越接近l说明滤波器的选择性越好。sd砌咖‘1而∞dBBW图孓7谱仪的RBW选择性RBW可表示为两个不同频率的信号能够被分辨出来的最小频宽,两个不同频率信号的频宽如低于RBW,此时这两个信号将重叠难以分辨。信号分辨率由中频(巧)滤波器带宽决定。频谱分析仪在对某个信号调谐时,便描绘出它的中频滤波器的响应曲线形状。因此,若两个幅度相近的信号频率十分靠近,则两个信号滤波响应曲线的顶部可能相互重叠,表现为单一响应。若两个信号的幅度不等,但仍靠在一起,则较小的信号可能隐藏在较大的信号之下,因而出现测量误差。所以,对于两个相邻的信号,频谱仪的分辨力取决于分辨率带宽RBW。图5-8给出了不同中频RBW时,对输入信号分辨能力的不同。通常RBW被设置为小于等于被测频谱带宽,但为了提高测量精确性、灵敏度和效率,RBW也3dB唧町◇囚囚田图5_8谱仪RBVV的选择性分解聊◇/\八人可以不同于频谱带宽。RBW太大,噪声将淹没杂散信号;RBW太小则导致扫描时间太长。屏幕显示出来的平均噪声电平(DANL)变化量和RBW之间的关系为:△眦210xlog(BW2/B彤)(孓1)其中,B觋为初始分辨带宽,召赐为改变后的分辨带宽。从中看出,分辨率带宽每增加10倍,谱仪的显示噪声电平便提高10倍。如果要区分两个相邻的信号,理电子科技大学硕士学位论文论上RBW必须小于或等于待分辨的两个信号的频率间隔。随着数字信号处理技术的发展,早期用于实现RBW的模拟中频滤波器组,也渐渐由数字滤波器来代替,在数字下变频器内部一般都有高达255阶的FIR数字滤波器用于信道选择。数字滤波器相对于模拟滤波器的最大特点是选择性可以做得较窄,如典型的模拟滤波器一般为15:1,而数字滤波器可做到5:l甚至更低而且可以编程,如图5-9。l、T巾ic扫lSelect!、1rV,彝Analog15:l5llfIDig。tal、1I、.\J,IGITAL|ANAIFit强f///—v—一///一oHLl.E,■■■~、、图5.9模拟高斯滤波器和数字高斯滤波器的比较本设计DDC中有高达255阶的FIR滤波器,可用于实现频谱分析仪的RBW高斯滤波器。利用高斯窗函数法,设计的一个数据采样率为20MHz,RBW为300KHz的滤波器,其高斯窗函数公式【20】为:w(n一{卜彘]‘,其中-iN娜譬砧25.10,其中FIR的抽取率为5。圆铘船棚书珊瑚(5-2)在这个例子中N--255,a为3。随机噪声经过本设计中的DDC后,滤波效果如图啪恤m图5-10DDC中的FIR用于实现RBW300KHz78第六章结论与展望第六章结论与展望6.1结论本文讨论的基于FPGA实现的数字下变频器,是从手持频谱分析仪项目需求出发,并从谱仪中的数字下变频结构上考虑了各模块彼此间的性能制约,从而选择合理算法和FPGA内部丰富的DSP48A资源,有效提高了关键模块的处理速度和优化了系统配置,增加了整个下变频系统的系统处理时钟和信号处理带宽,使系统性能在已有硬件资源的条件下尽可能的最大化。目前已经实现了DDC中关键的模块,包括数控振荡器NCO,复数混频器,5级CIC滤波器,5级半带滤波器和255阶可编程FIR滤波器;并整合了所有的模块进行系统的调试和测试。所设计的DDC最高输入采样率可达160MSPS,在160MHz系统处理时钟下,最大信号处理带宽能达到10MHz(100dB噪声抑制)。255阶的FIR,能够满足大部分频谱分析仪对数字下变频器的处理速度、处理带宽以及滤波器性能的要求。DDC中NCO的高频率分辨率可为谱仪扫描时提供精确的频率步进,且NCO的快速响应还可提高扫描效率。高的信号处理带宽和高阶数的FIR滤波器为谱仪提供了高带宽的RBW和信号解调分析带宽。本设计最大的特点是处理速度高和处理带宽宽,另外一个特点是5级半带滤波器每一级的处理速度都可以达到160MHz,这为提高系统处理带宽提供了保障。目前已完成Matlab/simulink的算法建模仿真和FPGA的设计和实现工作。从初步的算法仿真和FPGA时序仿真测试结果可以看出FPGA设计已经实现了数字下变频的基本功能。6。2下一步工作任务目前,本设计仅实现了5个主要模块,而当前主流商用DDC内所具有的坐标变换模块、重采样模块和增益自动控制模块还没有设计实现;同时,所作的测试工作还是处于模块和系统的功能验证上,并没有给出精确的系统性能分析,下一步需要做的工作有:1)将该DDC设计下载到硬件电路板上,进行更完备的调试和测试;电子科技大学硕士学位论文2)根据项目系统需求,设计实现坐标变换模块、重采样模块和自动增益控制模块,将更多需要大运算量的处理整合到FPGA内部来实现,进一步提高系统的集成度和降低后端DSP处理器或MCU控制器的工作量;3)由于所选FPGA内部的DSP48A块的乘法器是18x18,设计中的FIR系数量化位数,和各模块之间数据接口的数据宽度只有18位(各自模块内部的处理位宽大于40位),这在一定程度上降低了系统的精度,因此,在器件选型上需要进一步关注精度更高的FPGA;4)利用实测数据进行FFT变换,进行频域分析,确认无杂散动态范围和最大处理信号带宽等参数;5)将DDC设计置于具体频谱分析仪中工作,对实际工作状况进行评估,并根据要求进行改进。6.3未来展望随着软件无线电理论的不断丰富,数字下变频理论也得到了不断的完善。传统的数字下变频结构已经不能有效的实现这些新理论,其中一些基本算法已经不适用,需要对高效算法进行新的研究。同时,当前谱仪的实现结构也在不停的演变完善,数字下变频的位置也不断的向射频端靠近,这就要求DDC需具备更强大的性能来保证有足够的系统处理速度、信号处理带宽和数据/系数量化精度。由于FPGA的可重复配置,用FPGA实现下变频可以为系统提供更加灵活的应用方式和更广泛的应用环境,这也成为未来的一个研究方向。FPGA越来越丰富的硬件资源和不断提高的处理性能为高性能数字下变频设计提供了一个广阔的发挥空间,甚至只用一片FPGA就可以实现功能完善性能优良的软件无线电数字接收机,做到真正的可编程片上系统。致谢致谢首先怀着诚挚的敬意深深感谢我的导师李玉柏教授。在课题设计和论文撰写过程中,给予了大力帮助和悉心指导,给出了分析问题和解决问题的方法性策略,严谨的治学态度和实事求是的工作作风已经成为我在学习和工作中的表率,再一次向表示我真诚的感谢。感谢指导老师董万明高级工程师,董老师在课题研究过程中一直给予大力的指导和帮助,本文的最终完成是与董老师长期以来的悉心关怀分不开的。董老师丰富的工作经验和一丝不苟的敬业精神给作者留下了极其深刻的印象。在本文完成过程中,还得到了同事许文军、陈澍、胡正祥、张斌和夏铁骑无私帮助和支持,在设计思想和技术细节上他们给了我许多有益的探讨和启发,并帮助我克服了许多实际工作中遇到的困难,在此作者深表感谢。谨以此文献给我的父母。父母的期许和持续不断的鼓励,是我坚持努力学习的最大动力,同时带给了我克服困难的勇气和信念。还感谢他们对我生活、学习和工作无微不至的照顾和支持。最后还感谢朋友陈万桥的支持和理解,让我有足够的时间和充沛的精力投入到学习和课题研究中。8l电子科技大学硕士学位论文参考文献[1]杨小牛,楼才义,徐建良.软件无线电原理与应用.北京:电子工业出版社,2001,8—55[2]WalterTuttlebee.软件无线电技术与实现,杨小牛等译.北京:电子工业出版社,2005,20-86[3]Mitola,J.The33(5):26-38softwareradioarchitecture.IEEECommunicationsMagazine,1995,[4]孟玉洁,贾怀义,陶成.DDS中几种关键的ROM压缩方法.天津通信技术,2004,1:37-39[5]RayAndraka.ASurveyofCORDICAlgorithmsforFPGAbasedcomputers.AndrakaConsultingGroup,Ine.1995,5-8[6]程佩青.数字信号处理教程(第二版).北京:清华大学出版社,2000,100-145[7]IntersilCorporation.ISL5216datasheet.www.intersil.eom,2002,51-68[8]XilinxInc.Spartan-3A[9]XilinxInc.Spartan-3[10]XilinxDSPFPGAFamilydata.sheet.www.xilinx.corn,2008,35-52usgrGenerationFPGAguide.www.xilinx.com,2008,22-32Ine.XtremeDSPDSP48AforSpartan-3ADSPFPGAsuserguide.www.xilinx.tom,2008,30-45[11]张厥盛,郑继禹,万心平.锁相技术.西安:西安电子科技大学出版社,2003,35—78[12]XilinxInc.XilinxLogicCoreDDSCompilerv2.0productspecification.www.xilinx.corn,2007,4-9[13]Analog5.10DevicesInc.ATechnicalTutorialonDigitalsiguaJSynthesis.www.anaiog.corn,1999,[14]Leonw.Couch.II.数字与模拟通信系统(第六版),罗新民等译.北京:电子工业出版社,2005,15-63[15]Xilinx15-19Inc.XilinxLogicCoreCICCompilerv1.1productspecification.www.xilinx.corn,2008,[16]陈勇.基于FPGA实现高速专用数字下变频器:[硕士学位论文].成都:电子科技大学,2005,45-66[17]Xilinx[18]Xilinx8.12Inc.XtremeDSPforVtrtex-4FPGAsusgrguide.www.xilinx.eom,2008,32-62Ine.XilinxLogicCoreFIRCompilerv3.2productspecification.www.xilin】【.eom,2007,参考文献[19]AgilentTechnologieslnc.Agilentspectrumanalysisbasics.www.agilent.tom,1999,25—89[20]飞思科技产品研发中心.Matlab7辅助信号处理技术与应用.北京:电子工业出版社,2005,20—25683晷林《o厶皿蛊配‰一。一焉急山∽堡价冷I啭釜电子科技大学硕士学位论文匦嗵匿景眯《厶‰蛊¨啭釜附录董矗E电子科技大学硕士学位论文个人简历张锡权,男,1980年6月生;2000年9月"-'2004年6月,就读于重庆邮电大学通信与信息工程学院电子信息工程专业,获学士学位;2004年7月"-'2007年5月,就职于大唐电信科技股份有限公司成都光通信分公司,从事SDH设备和网同步设备的硬件开发;2007年6月~至今,就职于安捷伦科技(成都)有限公司,任工程师。2006年2月~至今,就读于电子科技大学通信与信息工程学院电子与通信工程专业,攻读硕士学位。基于FPGA的DDC在频谱仪中的设计

作者:

学位授予单位:

张锡权

电子科技大学

1.学位论文 韦书俊 一种采用软件无线电技术的频谱分析仪设计 2006

近几年个人通信的飞速发展,通信标准的不断增加,比如小灵通,GSM,CDMA等。因此,在网络环境测试中,一种能够测试不同频段的频谱分析仪就显得尤为重要。通用的频谱分析仪要求能够灵活配置以满足测试需要,能够通过软件控制以适应不同的通信标准,要求具有宽频特性。而且该接收机应该是一个开放的系统。而这些特点刚好是采用软件无线电能够带来的优点。 本文首先从阐述软件无线电的概念入手,对频谱分析仪所用的技术:多速率数字信号处理技术、中频数据采样及数字下变频理论进行了分析和探讨。然后建立了频谱仪接收机的数学模型,尽可能的简化射频模拟前端,将模数/数模变换器尽量靠近天线,在对信号充分数字化的基础上依靠软件来定义无线电的各项功能。 在这些理论基础上设计了一种基于FPGA+DSP的频谱仪接收机的实验平台,重点讨论了数字下变频的FPGA实现。接收机采用宽中频数字化结构,即选择在中频进行采样量化,将数字下变频、数字解调等数字信号处理部分由软件定义,并下载到FPGA中进行实现。采用这种结构大大降低了采样速率和数字信号处理的速度,对硬件性能要求低,比较容易实现。而且该平台还采用NIOS软核处理器技术,充分体现了软件无线电的思想,具有通用性和可配置性。 论文提出了一种频谱分析仪设计方案,该方案充分体现了软件无线电对多频段多模式信号进行处理的灵活性,开放性和兼容性的特点,同时也表明FPGA可重构性和并行处理的优势,特别适合于软件无线电模块化标准化的设计要求。

2.期刊论文 赵彦全 一种手持式频谱分析仪的设计与实现 -国外电子测量技术2009,28(9)

为适应野外作业对频谱测量的需求,研制手持式频谱分析仪.通过采用软件无线电设计思想,在超外差接收后直接进行A/D采样,将频谱功能实现数字化,节省了体积与功耗,实现了性能指标较高的手持式频谱仪.

3.学位论文 袁祥荆 基于软件无线电的通信综合测试仪的DSP软件算法与实现 2008

在通信设备、雷达、广播设备、微波器件、医疗设备等的设计与生产过程中,经常需要对信号进行频谱分析,同时还需要对信号的多种参数进行测量,如射频信号的频率、功率,调制信号的调制度,解调输出的音频信号的失真度等。为了满足以上的应用需求,通信综合测试仪集成了五个功能:频谱仪、频率计、功率计、调制度分析仪和音频分析仪。 通信综合测试仪是基于软件无线电的思想,其硬件部分由射频下变频模块和中频数字化处理模块组成,选用的是TI公司的高性能定点DSP:TMS320C16。 本人所做的主要工作如下:理解通信综合测试仪的总体设计方案,明确中频数字化处理模块中DSP的接口方式和详细功能;基于预先提出的指标进行各种算法的选择与仿真;制定DSP与PCI主机,DSP与FPGA的命令和数据交互的通信协议;完成了所有DSP软件代码的编写和调试,通过整机联调验证了DSP软件开发的正确性和稳定性;基于通信综合测试仪的硬件特性,优化测量结果,以达到整个系统的预期指标;编写bootloader的程序,实现上电后DSP程序的自动加载并运行。 该通信综合测试仪实现了预期的五个测量功能,能满足预先提出的所有指标,并且在信息产业部电子402计量站完成了所有指标的鉴定。DSP作为其核心处理器,集成了大量的算法,高效且充分的利用了DSP的硬件资源完成了各种测量任务。通信综合测试仪具有友好的人机界面显示,把虚拟仪器的应用扩展到了频率高达3GHz的射频信号分析,满足高性能、易操作、小体积、低功耗的要求。

4.学位论文 桂竟晶 基于虚拟仪器的TD-SCDMA直放站测试系统开发 2007

随着TD-SCDMA技术的不断成熟,TD-SCDMA网络也即将进入商业化运营阶段。基站、微基站、直放站终端的研发进一步深入,产品化的进程越来越快;这些产品的一致性测试也急需展开。目前对于TD-SCDMA直放站射频一致性测试大都采用信号源,频谱仪,矢量网络分析仪,噪声仪等传统仪器,测试过程复杂,成本高昂。针对这一现状,武汉理工大学和湖北众友科技实业股份有限公司联合研制和开发了本课题中的综合TD-SCDMA直放站射频一致性测试系统。本文基于虚拟仪器的软件无线电思想,实现综合TD-SCDMA直放站射频一致性测试系统,相对于使用信号源,频谱仪,矢量网络分析仪,噪声仪等昂贵精密仪器的传统测试,本系统具虚拟仪器性价比高,集成性好,兼容性好,操作方便,扩展性强,适用面广等优点,而且本文使用单一的测试系统来完成一致性测试能大大缩减测试系统的成本和测试时间。所以开展基于虚拟仪器技术的TD-SCDMA直放站射频一致性测试系统开发与研究势在必行,同时也是尽快缩小我国与其它发达国家电测水平差距的一条可行之路。 对于任何一种无线通信系统,射频收发机都是非常重要的一部分,收发信机的性能好坏直接会影响整个系统的干扰情况,进而决定系统容量。不同的通信系统对于射频收发信机的指标要求是不一样的,甚至会有一些全新的指标去衡量。验证一个产品是否符合规范的要求,就显得尤为重要,这一过程就是一致性测试。本课题研究的是已近存在和正在研发的TD-SCDMA直放站的射频指标的一致性测试系统,本系统可以应用于实验室,给研发工作提供帮助。 作者的主要研究工作如下: (1)本文针对目前TD-SCDMA直放站的测试系统价格高,测试过程繁杂。作者先分析了TD-SCDMA直放站射频一致性指标传统的测试方法和原理,结合TD-SCDMA信号的特点和测试要求,运用软件无线电的思想,给出了基于虚拟仪器的TD-SCDMA直放站射频一致性综合测试系统的方案。 (2)根据数字信号处理理论,对于标称最大输出功率、ALC、增益的测试方法提出了改进;给出了频域测量项目的基于虚拟仪器的软件实现;给出了频率误差、传输时延新的测试方法,并用LabVIEW编程实现。 (3)用LabVIEW编写测试系统软件框架,集成了TD-SCDMA直放站射频一致性测试软件模块,并给出了部分测试结果。

5.期刊论文 邵怀宗.袁祥荆.吴颖.彭启琮 小型化通信电台综合测试系统的设计研究 -兵工学报2009,30(10)

介绍了一种小型化通信电台测试系统的设计方案和相应的关键技术.该设计方案采用了软件无线电的设计理念,使系统具有整体小型化、易于升级和可重新配置等特点.其主要功能包括频谱仪、功率计、频率计、调制度测量和单音频信号分析等功能,可检测频率范围为100 kHz~3 GHz. 用于无线频谱的监测,也为各类电台的维护提供了一种小型化的检测设备.因此,具有较广泛的应用价值.

6.学位论文 苏鹏 1GHz-2GHz射电频谱仪系统设计与仿真 2002

射电频谱仪是通过高的频率分辨率和高的时间分辨率,在广泛的频谱范围内和连续的时间演化上进行射电天文观测的仪器,它是射电天文研究的重要方法和主要工具。软件无线电技术和数字信号处理技术广泛应用于现代电子系统的设计与制造中。本文设计了基于软件无线电技术和数字信号处理技术的新一代射电频谱仪,它的突出优点是:1.高的频率分辨率和高的时间分辨率。2.技术指标软件可调。3.分析功能可以改变。本文的主要内容包括:1.射电天文。2.射电频谱仪理论分析。3.1GHz—2GHz射电频谱仪系统设计。4.1GHz—2GHz射电频谱仪计算机仿真。本文设计的软件式射电频谱仪打破了射电天文界目前只使用硬件式射电频谱仪的现状,是射电天文界的一个新的、大胆的尝试。2002年3月,在上海天文台举行的射电天文国际合作预研项目评审会上获得了专家评审团的赞赏和好评,一致认为软件式射电频谱仪开拓了射电频谱仪设计的新的领域,是新一代射电频谱仪的典型代表。

7.学位论文 王 基于FPGA的数字中频扩频收发机的研究与实现 2008

FPGA是目前硬件设计的研究热点之一。由于其具有逻辑单元丰富、集成度高以及可灵活配置等诸多优点,而被广泛应用于算法实现以及产品原型验证之中。特别是近年来随着现代微电子技术的长足发展,使得在FPGA硬件平台上设计实现功能更加复杂的数字通信系统成为可能。而扩频通信技术在军事通信与民用通信中都得到了广泛的应用,是目前第三代移动通信标准中的核心技术,已经成为各国研究与应用的焦点。在未来无线通信系统中,扩频通信技术也将充分发挥它的优越性,必将得到人们越来越多的关注。本课题将以FPGA为硬件载体,结合软件无线电技术设计实现数字中频扩频收发系统。 本文首先介绍了数字中频扩频收发系统的整体结构及设计参数,对扩频码字、QPSK调制方式、加扰和解扰电路、差分编码以及差分解码等作了简单说明,同时对扩频收发系统中的关键组成部分的FPGA硬件实现的细节作了比较详尽的描述,并给出了具体的设计参数及仿真波形。由于同步技术在整个通信系统中占有核心的地位,是保证系统正常运行的根本,因此在文中对接收机中的载波同步、符号同步和扩频码同步的算法做了比较详细的理论分析,并且在理论研究的基础上提出了FPGA硬件实现方案。整个系统是以QuartusⅡ 6.0作为软件开发平台,通过Verilog HDL语言编程以及调用Altera公司提供的IP Core加以实现的。 对系统中的各部分硬件实现电路分别采用ModelsimSE仿真工具进行功能仿真和后仿真,并使用

Debussy5.3波形观测工具对仿真波形进行分析并与理论结果比较,改进并优化设计。最后将发射系统和接收系统分别下载到CycloneⅡ系列FPGA芯片EP2C70F672C6和Stratix Ⅱ系列FPGA芯片EP2S180F1020C3的开发板上进行调试,通过QuartusⅡ6.0内嵌的逻辑分析仪--SignalTapⅡ,实时观测系统的运

行情况,同时采用示波器和频谱仪对系统中的关键信号进行观测分析,并获得硬件测试结果,得出有效结论。

本文链接:http://d.g.wanfangdata.com.cn/Thesis_Y1463700.aspx

下载时间:2010年1月17日

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 517ttc.cn 版权所有 赣ICP备2024042791号-8

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务