Q格式运算讲解学习

　·37·

　第3章 DSP 芯片的定点运算

　3.1 数的定标在定点 DSP芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于 DSP芯片所给定的字长，一般为 16位或 24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以 16位字长为例。

　DSP芯片的数以 2的补码形式表示。每个 16位数用一个符号位来表示数的正负， 0表示数值为正，

　1则表示数值为负。其余 15位表示数值的大小。因此二进制数 0010000000000011b ＝ 8195 二进制数 1111111111111100b ＝ - 4 对 DSP 芯片而言，参与数值运算的数就是 16 位的整型数。但在许多情况下，数学运算过程中的数不一定都是整数。那么， DSP芯片是如何处理小数的呢？应该说， DSP芯片本身无能为力。那么是不是说 DSP芯片就不能处理各种小数呢？当然不是。这其中的关键就是由程序员来确定一个数的小数点处于 16位中的哪一位。这就是数的定标。

　通过设定小数点在 16位数中的不同位置，就可以表示不同大小和不同精度的小数了。

　数的定标有 Q表示法和

　S表示法两种。表 3.1列出了一个 16 位数的 16种Q表示、 S表示及它们所能表示的十进制数值范围。

　从表 3.1可以看出，同样一个 16位数，若小数点设定的位置不同，它所表示的数也就不同。例如：

　16进制数 2000H ＝ 8192，用 Q0表示 16进制数 2000H ＝ 0.25，用 Q15表示但对于 DSP芯片来说，处理方法是完全相同的。

　从表 3.1还可以看出，不同的 Q所表示的数不仅范围不同，而且精度也不相同。

　Q越大，数值范围越小，但精度越高；相反， Q越小，数值范围越大，但精度就越低。例如， Q0的数值范围是 - 32768到+32767 ，其精度为 1，而 Q15 的数值范围为 - 1 到0.9999695，精度为 1/32768 = 0.00003051 。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价；而想提高精度，则数的表示范围就相应地减小。在实际的定点算法中，为了达到最佳的性能，必须充分考虑到这一点。

　· 38·

　＝ 16384/32768=0.5 。

　16384 ，式中 16384 × 2- 15 浮点数与定点数的转换关系可表示为：

　浮点数 (x) 转换为定点数 ( x )：

　x (int) x q q 2Q 定点数 ( x q

　)转换为浮点数 (x) ：

　x ( float )x q

　2 Q 例如，浮点数 x=0.5 ，定标 Q ＝ 15 ，则定点数 Q＝ 15 表示的定点数 x q

　＝ 0.5 32768 表示下取整。反之，一个用 16384 ，其浮点数为

　·39·

　表3.1 Q表示、 S表示及数值范围 Q表示 S表示十进制数表示范围 Q15 S0.15 - 1≤ X≤ 0.9999695 Q14 S1.14 - 2≤ X≤ 1.9999390 Q13 S2.13 - 4≤ X≤ 3.9998779 Q12 S3.12 - 8≤ X≤ 7.9997559 Q11 S4.11 - 16≤ X≤ 15.9995117 Q10 S5.10 - 32≤ X≤ 31.9990234 Q9 S6.9 - 64≤ X≤ 63.9980469 Q8 S7.8 - 128≤ X≤ 127.9960938 Q7 S8.7 - 256≤ X≤ 255.9921875 Q6 S9.6 - 512≤ X≤ 511.9804375 Q5 S10.5 - 1024≤ X ≤ 1023.96875 Q4 S11.4 - 2048≤X ≤ 2047.9375 Q3 S12.3 - 4096≤ X≤ 4095.875 Q2 S13.2 - 8192≤ X≤ 8191.75 Q1 S14.1 - 16384≤ X ≤16383.5 Q0 S15.0 - 32768≤ X ≤ 32767

　 3.2 高级语言：从浮点到定点在编写

　DSP模拟算法时，为了方便，一般都是采用高级语言

　(如 C语言 )来编写模拟程序。程序中所用的变量一般既有整型数，又有浮点数。如例 3.1程序中的变量 i是整型数，而pi是浮点数， hamwindow 则是浮点数组。

　例 3.1 256点汉明窗计算int

　i; float pi=3.14159; float hamwindow[256]; for(i=0;i<256;i++) hamwindow[i]=0.54 - 0.46*cos(2.0*pi*i/255); 如果要将上述程序用某种定点 DSP芯片来实现，则需将上述程序改写为 DSP芯片的汇编语言程序。为了 DSP 程序调试的方便及模拟定点 DSP实现时的算法性能，在编写 DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算

　· 40·

　的定点实现方法。

　3.2.1 加法/减法运算的 C语言定点模拟设浮点加法运算的表达式为：

　float x,y,z;

　·41·

　q q z=x+y; 将浮点加法 /减法转化为定点加法 /减法时最重要的一点就是必须保证两个操作数的定标值一

　样。

　若两者不一样，则在做加法

　/减法运算前先进行小数点的调整。为保证运算精度，需使 Q 值小的数调整为与另一个数的 Q 值一样大

　。此外，在做加法 /减法运算时，必须注意结果可能会超过 16位表示。

　如果加法

　/减法的结果超出 16位的表示范围，则必须保留 32 位结果，以保证运算的精度。

　1. 结果不超过 16位表示范围设 x的Q值为Qx， y的 Q值为 Qy，且Qx>Qy ，加法 / 减法结果 z的定标值为 Qz，则 z＝ x+y z q

　Q z

　x q

　Q x

　Q y q

　2 = x q

　2 Q x

　y 2(Q x

　Q y ) 2 Q x

　= [ x q

　y q

　2(Q x

　Q y

　) ]

　2 Q x

　z q [ xq

　y 2(Q x

　Q y ) ]

　2( Qz

　Q x )

　所以定点加法可以描述为：

　int x,y,z; long temp; /* 临时变量 */ temp＝ y<<(Qx － Qy); temp＝ x＋ temp; z＝ (int)(temp>>(Qx － Qz)), 若Qx≥ Qz z＝ (int)(temp<<(Qz － Qx)), 若QxQ ≤ z 例 3.2 定点加法设x＝ 0.5， y＝3.1，则浮点运算结果为 z＝ x+y ＝ 0.5+3.1 ＝ 3.6; Qx＝ 15， Qy＝13， Qz＝ 13，则定点加法为：

　x＝ 16384； y＝25395; temp＝ 25395<<2 ＝ 101580; temp＝ x+temp ＝ 16384+101580 ＝ y

　· 42·

　117964; z＝ (int)(117964L>>2) ＝ 29491; 因为 z的Q值为 13，所以定点值 z＝ 29491即为浮点值 z＝ 29491/8192 ＝3.6。

　例 3.3 定点减法设x＝ 3.0， y＝3.1，则浮点运算结果为 z＝ x- y＝ 3.0- 3.1＝ - 0.1; Qx＝ 13， Qy＝13， Qz＝ 15，则定点减法为：

　x＝ 24576； y＝25295； temp＝ 25395; temp＝ x- temp＝ 24576- 25395＝ - 819; 因为 Qx<Qz ，故 z＝ (int)( - 819<<2) ＝ - 3276 。由于 z的 Q值为 15，所以定点值 z＝ - 3276即为浮点值 z＝ - 3276/32768 - 0.1。

　2. 结果超过 16位表示范围

　·43·

　设 x的Q值为Qx， y的 Q值为 Qy，且Qx>Qy ，加法结果 z的定标值为 Qz,则定点加法为：

　int x ， y； long temp， z； temp＝ y<<(Qx - Qy) ； temp＝ x＋ temp; z＝ temp>>(Qx - Qz)，若Qx ≥ Qz z＝ temp<<(Qz - Qx) ，若Qx ≤ Qz 例 3.4 结果超过 16位的定点加法设x＝ 15000， y＝ 20000，则浮点运算值为 z＝ x＋ y＝ 35000，显然 z>32767 ，因此Qx＝ 1， Qy＝ 0， Qz＝ 0，则定点加法为：

　x＝ 30000； y＝20000； temp＝ 20000<<1 ＝ 40000; temp＝ temp+x ＝40000+30000 ＝ 70000; z＝ 70000L>>1 ＝ 35000; 因为 z的Q值为 0，所以定点值 z=35000就是浮点值，这里 z是一个长整型数。

　当加法或加法的结果超过 16位表示范围时，如果程序员事先能够了解到这种情况，并且需要保证运算精度时，则必须保持 32位结果。如果程序中是按照 16位数进行运算的，则超过 16位实际上就是出现了溢出。如果不采取适当的措施，则数据溢出会导致运算精度的严重恶化。一般的定点 DSP芯片都设有溢出保护功能，当溢出保护功能有效时，一旦出现溢出，则累加器 ACC 的结果为最大的饱和值 (上溢为 7FFFH ，下溢为 8001H) ，从而达到防止溢出引起精度严重恶化的目的。

　3.2.2 乘法运算的 C语言定点模拟设浮点乘法运算的表达式为：

　float x,y,z; z = xy; 假设经过统计后 x的定标值为 Qx， y的定标值为 Qy ，乘积 z的定标值为 Qz，则 z = xy z q

　2 z = x q

　y q

　2 (Q x Q y ) Q z = ( x y )2 z ( Q x

　Q y

　) q q q

　所以定点表示的乘法为：

　int x,y,z; Q

　· 44·

　long temp; temp = (long)x; z = (temp× y) >> (Qx+Qy - Qz); 例 3.5 定点乘法设x = 18.4 ， y = 36.8 ，则浮点运算值为 z =18.4× 36.8 = 677.12; 根据上节，得 Qx = 10 ， Qy = 9 ， Qz = 5 ，所以

　·45·

　Q Q x = 18841 ； y = 18841 ； temp = 18841L; z = (18841L*18841)>>(10+9 - 5) = 354983281L>>14 = 21666; 因为 z的定标值为

　5，故定点 z = 21666 即为浮点的 z = 21666/32 = 677.08 。

　3.2.3 除法运算的 C语言定点模拟设浮点除法运算的表达式为：

　float x,y,z; z = x/y; 假设经过统计后被除数 x的定标值为 Qx，除数 y的定标值为 Qy，商 z的定标值为 Qz，则 z = x/y

　z q

　2 z = x q

　2 x Q y

　y q

　x q

　2 z q

　(Q z

　Q x

　 y q

　Q y

　)

　所以定点表示的除法为：

　int x,y,z; long temp; temp = (long)x; z = (temp<<(Qz - Qx+Qy))/y; 例 3.6 定点除法设x = 18.4 ， y = 36.8 ，浮点运算值为 z = x/y = 18.4/36.8 = 0.5; 根据上节，得 Qx = 10 ， Qy = 9 ， Qz = 15 ；所以有x = 18841, y = 18841; temp = (long)18841; z = (18841L<<(15 - 10+9))/18841 = 308690944L/18841 = 16384; 因为商 z的定标值为

　15，所以定点

　z = 16384即为浮点 z = 16384/2 15 = 0.5。

　3.2.4 程序变量的 Q值确定

　· 46·

　在前面几节介绍的例子中，由于 x、y、z的值都是已知的，因此从浮点变为定点时 Q值很好确定。在实际的 DSP应用中，程序中参与运算的都是变量，那么如何确定浮点程序中变量的 Q值呢？从前面的分析可以知道，确定变量的 Q值实际上就是确定变量的动态范围，动态范围确定了，则 Q值也就确定了。

　设变量的绝对值的最大值为 max ，注意 max 必须小于或等于 32767。取一个整数 n，使它满足 2n 1 则有 max 2n

　·47·

　，则 2 Q 2 15 2 n 2 (15 n) Q = 15 - n 例如，某变量的值在 - 1至＋ 1之间，即 max <1，因此 n = 0， Q＝ 15- n = 15。

　确定了变量的 max 就可以确定其 Q值，那么变量的 max 又是如何确定的呢？一般来说，确定变量的 max 有两种方法：一种是理论分析法，另一种是统计分析法。

　1. 理论分析法有些变量的动态范围通过理论分析是可以确定的。例如：

　(1)

　三角函数，

　y = sin(x)或y = cos( x)，由三角函数知识可知， |y|≤ 1； (2)

　汉明窗，

　y( n)

　= 0.54- 0.46cos [2 n/(N - 1)] ， 0≤ n≤ N- 1。因为 - 1≤ cos [2 n/(N - 1)] ≤ 1，所以 0.08≤ y(n)≤ 1.0； N (3) FIR卷积。

　y(n)= k 1 h( k) x( n 0 k ) ，设 N 1 h( k) k 0 1.0 ，且 x( n)是模拟信号 12位量化值，即有 x(n) 11 y( n) ≤2 11 ；

　(4) 理论已经证明，在自相关线性预测编码 (LPC) 的程序设计中，反射系数不等式：

　k i 满足下列 k i

　1.0 ， i= 1,2, ,p, p为LPC 的阶数。

　2. 统计分析法对于理论上无法确定范围的变量，一般采用统计分析的方法来确定其动态范围。所谓统计分析，就是用足够多的输入信号样值来确定程序中变量的动态范围，这里输入信号一方面要有一定的数量，另一方面必须尽可能地涉及各种情况。例如，在语音信号分析中，统计分析时就必须采集足够多的语音信号样值，并且在所采集的语音样值中，应尽可能地包含各种情况，如音量的大小、声音的种类

　 (男声、女声

　)

　等。只有这样，统计出来的结果才能具有典型性。

　当然，统计分析毕竟不可能涉及所有可能发生的情况，因此，对统计得出的结果在程序设计时可采取一些保护措施，如适当牺牲一些精度， Q值取比统计值稍大些，使用 DSP 芯片提供的溢出保护功能等。

　3.2.5 浮点至定点变换的 C程序举例本节通过一个例子来说明 C 程序从浮点变换至定点的方法。这是一个对语音信号(0.3kHz~3.4kHz) 进行低通滤波的

　C语言程序，低通滤波的截止频率为 800Hz ，滤波器采用 19 点的有限冲击响应 FIR滤波。语音信号的采样频率为 8kHz ，每个语音样值按 16位整型数存≤ 2

　· 48·

　放在 insp.dat文件中。

　例 3.7 语音信号 800Hz 19 点FIR低通滤波 C语言浮点程序#include <stdio.h> const int length = 180 /* 语音帧长为 180点＝ 22.5ms@8kHz 采样 */ void filter(int xin[ ],int xout[ ],int n,float h[ ]); /* 滤波子程序说明 */ /*19 点滤波器系数 */ static float h[19]=

　·49·

　{0.01218354, - 0.009012882,- 0.02881839,- 0.04743239, - 0.04584568, - 0.008692503,0.06446265,0.1544655,0.2289794,0.257883, 0.2289794,0.1544655,0.06446265, - 0.008692503,- 0.04584568, - 0.04743239, - 0.02881839,- 0.009012882,0.01218354}; static int x1[length+20]; /* 低通滤波浮点子程序 */ void filter(int xin[ ],int xout[ ],int n,float h[ ]) { int i,j; float sum; for(i=0;i<length;i++) x1[n+i-1]=xin[i]; for (i=0;i<length;i++) { sum=0.0; for(j=0;j<n;j++) sum+=h[j]*x1[i - j+n - 1]; xout[i]=(int)sum; } for(i=0;i<(n - 1);i++) x1[n - i - 2]=xin[length - 1- i]; }

　 /* 主程序 */ void main( ) { FILE *fp1,*fp2; int frame,indata[length],outdata[length]; fp1=fopen(insp.dat,"rb"); /* 输入语音文件 */

　· 50·

　fp2=fopen(outsp.dat,"wb");

　frame=0; /* 滤波后语音文件 */ while(feof(fp1)==0)

　 {

　 frame++;

　 printf("frame=%d\n",frame);

　 for(i=0;i<length;i++) indata[i]=getw(fp1); /* 取一帧语音数据 */ filter(indata,outdata,19,h); /* 调用低通滤波子程序 */ for(i=0;i<length;i++) putw(outdata[i],fp2); /* 将滤波后的样值写入文件 */ }

　 fcloseall( );

　/* 关闭文件 */ return(0);

　·51·

　} 例 3.8 语音信号 800Hz 19 点FIR低通滤波 C语言定点程序#include <stdio.h> const int length=180; void filter(int xin[ ],int xout[ ],int n,int h[ ]); static int h[19]={399, - 296,- 945,- 1555, - 1503,- 285,2112,5061,7503,8450, 7503,5061,2112, - 285,- 1503,- 1555, - 945,- 296,399}; /*Q15*/ static int x1[length+20]; /* 低通滤波定点子程序 */ void filter(int xin[ ],int xout[ ],int n,int h[ ]) { int i,j; long sum; for(i=0;i<length;i++) x1[n+i - 1]=xin[i]; for (i=0;i<length;i++) { sum=0; for(j=0;j<n;j++) sum+=(long)h[j]*x1[i - j+n - 1]; xout[i]=sum>>15; } for(i=0;i<(n - 1);i++) x1[n - i- 2]=xin[length - i- 1]; } 主程序与浮点的完全一样。

　3.3 DSP定点算术运算定点 DSP芯片的数值表示是基于 2的补码表示形式。每个 16位数用 1个符号位、 i个整数位和 15- i 个小数位来表示。因此数 00000010.10100000 表示的值为 2 1 2 1

　2 3

　=2.625 ，这个数可用

　Q8格式 (８个小数位 )来表示，它表示的数值范围为 - 128~+127.996 ，一个 Q8 定点数的小数精度为 1/256=0.004 。

　· 52·

　虽然特殊情况 ( 如动态范围和精度要求 )必须使用混合表示法，但是，更通常的是全部以Q15格式表示的小数或以 Q0格式表示的整数来工作。这一点对于主要是乘法和累加的信号处理算法特别现实，小数乘以小数得小数，整数乘以整数得整数。当然，乘积累加时可能会出现溢出现象，在这种情况下，程序员应当了解数学里面的物理过程以注意可能的溢出情况。下面讨论乘法、加法和除法的 DSP定点运算，汇编程序以 TMS320C25 为例。

　3.3.1 定点乘法 2个定点数相乘时可以分为下列 3种情况：

　1. 小数乘小数

　·53·

　Q15× Q15＝ Q30

　例 3.9 0.5*0.5 = 0.25 0.100000000000000 ； Q15 × 0.100000000000000 ； Q15 00.010000000000000000000000000000=0.25 ； Q30 2个Q15的小数相乘后得到 1个Q30的小数，即有 2个符号位。一般情况下相乘后得到的满精度数不必全部保留，而只需保留 16位单精度数。由于相乘后得到的高 16位不满

　 15位的小数精度，为了达到 15位精度，可将乘积左移 1位，下面是上述乘法的 TMS320C25 程序 :

　LT OP1 ； OP1=4000H(0.5/Q15) MPY PAC OP2 ； OP2=4000H(0.5/Q15) SACH ANS,1 ； ANS=2000H(0.25/Q15) 2. 整数乘整数 Q0× Q0 = Q0

　例 3.10 17× (- 5)= - 85

　0000000000010001=17 × 1111111111111011= - 5 11111111111111111111111110101011= - 85 3. 混合表示法许多情况下，运算过程中为了既满足数值的动态范围又保证一定的精度，就必须采用

　Q0与 Q15之间的表示法。比如，数值近的数是 1，精度无法保证。因此，数 1.2345，显然 Q15无法表示，而若用 1.2345最佳的表示法是 Q14。

　Q0表示，则最接例 3.11 1.5× 0.75 = 1.125

　01.10000000000000 = 1.5 00.11000000000000 = 0.75 ； Q14 ； Q14 0001.0010000000000000000000000000 = 1.125;Q28 Q14的最大值不大于 2，因此，

　2个Q14数相乘得到的乘积不大于 4。

　一般的，若一个数的整数位为 i位，小数位为 j

　位，另一个数的整数位为 m 位，小数位为 n

　位，则这两个数的乘积为

　( i + m )

　位整数位和

　(j + n) 位小数位。这个乘积的最高16位可能的精度为 ( i + m ) 整数位和

　(15 - i - m) 小数位。

　· 54·

　但是，若事先了解数的动态范围，就可以增加数的精度。例如，程序员了解到上述乘积不会大于 1.8 ，就可以用 Q14 数表示乘积，而不是理论上的最佳情况 Q13 。例 3.11的TMS320C25 程序如下：

　LT OP1 ;OP1 = 6000H(1.5/Q14) MPY PAC OP2 ;OP2 = 3000H(0.75/Q14) SACH ANS,1 ;ANS ＝ 2400H(1.125/Q13) 上述方法为了保证精度均对乘的结果舍位，结果所产生的误差相当于减去 1个 LSB( 最低位 )。采用下面简单的舍入方法，可使误差减少二分之一。

　·55·

　LT OP1

　MPY OP2 PAC ADD

　ONE， 14

　(上舍入 ) SACH ANS ，1

　上述程序说明，不管 ANS 为正或负，所产生的误差是 1/2

　LSB ，其中存储单元 ONE 的值为 1。

　3.3.2 定点加法乘的过程中，程序员可不考虑溢出而只需调整运算中的小数点。而加法则是一个更加复杂的过程。首先，加法运算必须用相同的 Q点表示；其次，程序员或者允许其结果有足

　够的高位以适应位的增长，或者必须准备解决溢出问题。如果操作数仅为 16位长，其结果可用双精度数表示。下面举例说明 16位数相加的两种途径。

　1．保留 32位结果

　LAC OP1 ;(Q15) ADD OP2 ;(Q15) SACH ANSHI ;(高16位结果 ) SACL 2．调整小数点保留 ANSLO 16位结果 ;(低16位结果 ) LAC OP1,15 ;(Q14 数用 ACCH 表示 ) ADD OP2,15 ;(Q14 数用 ACCH 表示 ) SACH ANS ;(Q14) 加法运算最可能出现的问题是运算结果溢出。

　TMS320 提供了检查溢出的专用指令 BV ，此外，使用溢出保护功能可使累加结果溢出时累加器饱和为最大的整数或负数。当然，即使如此，运算精度还是大大降低。因此，最好的方法是完全理解基本的物理过程并注意选择数的表达方式。

　3.3.3 定点除法在通用 DSP芯片中，一般不提供单周期的除法指令，为此必须采用除法子程序来实现。二进制除法是乘法的逆运算。乘法包括一系列的移位和加法，而除法可分解为一系列的减法和移位。下面来说明除法的实现过程。

　设累加器为 8位，且除法运算为 10除以 3。除的过程就是除数逐步移位并与被除数比较的过程，在每一步进行减法运算，如果能减则将位插入商中。

　(1) 除数的最低有效位对齐被除数的最高有效位。

　· 56·

　00001010 － 00011000 11110010 (2) 由于减法结果为负，放弃减法结果，将被除数左移一位再减。

　·57·

　 00010100 － 00011000

　11111000 (3) 结果仍为负，放弃减法结果，被除数左移一位再减。

　00101000 － 00011000

　00010000 (4) 结果为正，将减法结果左移一位后加１，作最后一次减。

　00100001 － 00011000

　00001001

　(5)

　结果为正，将结果左移一位加 1得最后结果。高４位代表余数，低 4位表示商。00010011 即商为 0011=3 ，余数为 0001=1。

　TMS320 没有专门的除法指令，但使用条件减指令 SUBC 可以完成有效灵活的除法功能。使用这一指令的唯一限制是两个操作数必须为正。程序员必须事先了解其可能的运算数的特性，如其商是否可以用小数表示及商的精度是否可被计算出来。这里每一种考虑可

　影响如何使用 SUBC 指令的问题。下面给出两种不同情况下的 TMS320C25 除法程序。

　(1) 分子小于分母 DIV_A:

　LT NUMERA

　MPY DENOM PAC SACH

　TEMSGN

　;取商的符号 LAC DENOM

　ABS

　 SACL DENOM ;使分母为正 ZALH ABS NUMERA ;使分子为正 RPTK 14

　SUBC DENOM ;除循环 15次 SACL QUOT

　LAC TEMSGN

　· 58·

　BGEZ ZAC A1 ;若符号为正 ,则完成 SUB QUOT

　SACL QUOT ;若为负 ,则商为负 A1: RET

　·59·

　这个程序中，分子在 NUMERA 中，分母在 DENOM 中，商存在 QUOT 中， TEMSGN 为暂存单元。

　(2) 规定商的精度 DIV_B:

　LT NUMERA

　MPY DENOM

　PAC

　 SACH TEMSGN ;取商的符号 LAC DENOM

　ABS

　 SACL DENOM ;使分母为正 LACK 15

　ADD FRAC

　SACL FRAC ;计算循环计数器 LAC NUMERA

　ABS RPT

　FRAC ;使分子为正 SUBC DENOM ;除循环 16+FRAC 次 SACL QUOT

　LAC TEMSGN

　BGEZ B1 ;若符号为正 ,则完成 ZAC

　 SUB QUOT

　SACL QUOT ;若为负 ,则商为负 B1: RET 与 DIV_A 相同，这个程序中，分子在 NUMERA

　中，分母在 DENOM 中，商存在 QUOT 中， TEMSGN 为暂存单元。

　FRAC 中规定商的精度，如商的精度为 Q13

　，则调用程序前FRAC 单元中的值应为 13。

　3.4 非线性运算的定点快速实现在数值运算中，除基本的加减乘除运算外，还有其他许多非线性运算，如对数运算、开方运算、指数运算、三角函数运算等，实现这些非线性运算的方法一般有：

　(1) 调用 DSP

　· 60·

　编译系统的库函数； (2) 查表法； (3) 混合法。下面分别介绍这三种方法。1．调用 DSP编译系统的库函数 TMS320C2X/C5X 的C编译器提供了比较丰富的运行支持库函数。在这些库函数中，包含了诸如对数、开方、三角函数、指数等常用的非线性函数。在 C程序中 (也可在汇编程序中 )只要采用与库函数相同的变量定义，就可以直接调用。例如，在库函数中，定义了以 10为底的常用对数 log10( ) ：

　·61·

　＃ include <math.h> double log10(double x); 在 C程序中按如下方式调用：

　float x,y; x = 10.0; y = log10(x); 从上例可以看出，库函数中的常用对数

　 log10(

　)要求的输入值为浮点数，返回值也为浮点数，运算的精度完全可以保证。直接调用库函数非常方便，但由于运算量大，很难在实时DSP中得到应用。2．查表法在实时 DSP应用中实现非线性运算，一般都采取适当降低运算精度来提高程序的运算速度。查表法是快速实现非线性运算最常用的方法。采用这种方法必须根据自变量的范围和精度要求制作一张表格。显然输入的范围越大，精度要求越高，则所需的表格就越大，即存储量也越大。查表法求值所需的计算就是根据输入值确定表的地址，根据地址就可得到相应的值，因而运算量较小。查表法比较适合于非线性函数是周期函数或已知非线性函数输入值范围这两种情况，例 3.12和例 3.13分别说明这两种情况。

　例 3.12

　已知正弦函数

　y=cos(x) ，制作一个

　512点表格，并说明查表方法。由于正弦函数是周期函数，函数值在－ 1至＋ 1之间，用查表法比较合适。

　由于 Q15的表示范围为－

　1至32767/32768 之间，原则上讲－

　1至＋ 1的范围必须用

　Q14表示。但一般从方便和总体精度考虑，类似情况仍用 Q15表示，此时＋ 1用32767来表示。

　(1) 产生 512点值的 C语言程序如下所示 :

　#define N 512 #define pi 3.14159 int sin_tab[512]; void

　main( ) { int i; for(i=0;i<N;i++) sin_tab[i]=(int)(32767*sin(2*pi*i/N)); } (2) 查表查表实际上就是根据输入值确定表的地址。设输入 x在0~2 之间，则 x对应于 512点表

　· 62·

　的地址为：

　index = (int)(512*x/2 )，则 y = sin(x) = sin_tab[index] 。

　如果 x用 Q12 定点数表示，将 512/2 用 Q8表示为 20861，则计算正弦表的地址的公式为：

　index = (x*20861L)>>20 。

　例 3.13 用查表法求以 2为底的对数，已知自变量取值范围为 0.5~1,要求将自变量范围均匀划分为 10等分。试制作这个表格并说明查表方法。

　(1) 做表：

　log2(x) ，由于 x在0.5到1之间，因此

　y在- 1到0之间， x和y均可用 Q15 表示。由于对 x 均匀划分为

　10段，因此，

　10段对应于输入 x的范围如表

　3.2所示。若每一段的对数值都取第 1

　·63·

　点的对数值，则表中第 1段的对数值为 y0(Q15) = (int)(log2(0.5) × 32768)，第 2段的对数值为 y1(Q15) = (int)(log2(0.55)

　×32768) ，依次类推。

　表3.2 logtab0 10 点对数表 (输入0.5~1) 地址

　输入值对数值 (Q15) 0

　0.50~0.55 - 32768 1

　0.55~0.60 - 28262 2

　0.60~0.65 - 24149 3

　0.65~0.70 - 20365 4

　0.70~0.75 - 16862 5

　0.75~0.80 - 13600 6

　0.80~0.85 - 10549 7

　0.85~0.90 - 7683 8

　0.90~0.95 - 4981 9

　0.95~1.00 - 2425

　(2) 查表 : 查表时，先根据输入值计算表的地址，计算方法为：

　index=((x - 16384) × 20)>>15 。式中， index 就是查表用的地址。例如，已知输入 x= 26869 ，则 index=6 ，因此 y=- 10549。

　3．混合法 (1) 提高查表法的精度上述方法查表所得结果的精度随表的大小而变化，表越大，则精度越高，但存储量也越大。当系统的存储量有限而精度要求也较高时，查表法就不太适合。那么能否在适当增加运算量的情况下提高非线性运算的精度呢？下面介绍一种查表结合少量运算来计算非线性函数的混合法，这种方法适用于在输入变量的范围内函数呈单调变化的情形。

　混合法是在查表的基础上采用计算的方法以提高当输入值处于表格两点之间时的精度。提高精度的一个简便方法是采用折线近似法，如图 3.1所示。

　仍以求以

　2为底的对数为例 (例3.13) 。设输入值为 x，则精确的对数值为 y，在表格值的两点之间作一直线，用 y＇作为 y的近似值，则有：

　y＇＝ y 0 ＋ y

　 y " y 0

　 x y 0

　x 0

　图3.1 提高精度的折线近似法

　· 64·

　其中 y 0 由查表求得。现在只需在查表求得 y 0 的基础上增加 y即可。

　y的计算方法如下：

　y=( x/ x 0 ) y= x( y 0 / x 0 ) 式中 y 0 / x 0 对每一段来说是一个恒定值，可作一个表格直接查得。此外计算 x时需用到每段横坐标的起始值，这个值也可作一个表格。这样共有三个大小均为 10 的表格，分别为存储每段起点对数值的表 logtab0 、存储每段 y 0 / x 0

　值的表 logtab1 和存储每段输入起始值 x 0 的表 logtab2 ，表 logtab1 和表 logtab2可用下列两个数组表示：

　·65·

　int logtab1[10]={22529,20567,18920,17517,16308, 15255,14330,13511,12780,12124}; /* y 0 / x 0 : Q13*/ int logtab2[10]={16384,18022,19660,21299,22938, 24576,26214,27853,29491,31130}; /* x 0 : Q15*/ 综上所述，采用混合法计算对数值的方法可归纳为：

　①根据输入值，计算查表地址：

　index=((x - 16384)× 20)>>15; ②查表得 y 0 =logtab0[index]; ③计算 x=x - logtab2[index]; ④计算 y＝ ( x× logtab1[index])>>13;

　⑤计算得结果 y=y 0 + y。

　例 3.14 已知 x=0.54 ，求 log2(x) 。

　0.54的精确对数值为y=log2(0.54)= - 0.889 。混合法求对数值的过程为：

　①定标 Q15，定标值 x=0.54*32768=17694 ； ②表地址 index=((x - 16384)× 20)>>15=0; ③查表得 y 0 =logtab0[0]= - 32768; ④计算 x=x - logtab2[0]=17694 - 16384=1310; ⑤计算 y＝ ( xlogtab1[0])>>13=(1310*22529L)>>13=3602; ⑥计算结果

　y=y 0 + y=- 32768+3602= - 29166。

　结果 y为Q15定标，折算成浮点数为 - 29166/32768= - 0.89，可见精度较高。

　(2) 扩大自变量范围如上所述，查表法比较适用于周期函数或自变量的动态范围不是太大的情形。对于像对数这样的非线性函数，输入值和函数值的变化范围都很大。如果输入值的变化范围很

　大，则作表就比较困难。那么能否比较好地解决这个问题，既不使表格太大，又能得到比较高的精度呢？下面讨论一种切实可行的方法。

　设 x是一个大于 0.5的数，则 x可以表示为下列形式：

　x = m 2 e

　式中， 0.5≤ m≤ 1.0，e为整数。则求 x 的对数可以表示为：

　log2(x) = log2( m 2 e

　) = log2(m) + log2( 2 e

　) = e + log2(m)

　· 66·

　也就是说，求 x的对数实际上只要求 m的对数就可以了，而由于 m的数值在 0.5~1.0 之间，用上面介绍的方法是完全可以实现的。例如：

　log2(10000) = log2(0.61035 × 214 ) = log2(0.61035) + 14 = 13.2877

　可见，如果一个数可以用比较简便的方法表示为上面的形式，则求任意大小数的对数也是比较方便的。

　TMS320C2X/C5X 指令集提供了一条用于对 ACC 中的数进行规格化的指令 NORM ，该指令的作用就是使累加器中的数左移，直至数的最高位被移至累加器的第 30位。例如，对数值 10000进行规格化的 TMS320C25 程序为：

　LAC #10000 SACL TEMP ZALH TEMP

　·67·

　Q LAR AR1,#0FH RPT 14 NORM * －上述程序执行后， AR1=#0eH ， ACCH=2000(10 进制 )。对一个

　16位整数 x 进行上述程序处理实际上就是做这样一个等效变换：

　x = x 2 2 15 Q 32768 其中，寄存器 AR1 包含的值为 15- Q ，累加器 ACC 高 16 位包含的值为16384~32768之间。

　例 3.15 实现以 2为底的对数的 C定点模拟程序 int logtab0[10] ＝{ - 32768,- 28262,- 24149,- 20365,- 16862, - 13600,- 10549,- 7683,- 4981,- 2425}; /*Q15*/ int logtab1[10] ＝{22529,20567,18920,17517,16308, 15255,14330,13511,12780,12124}; /*Q13*/ int logtab2[10] ＝{16384,18022,19660,21299,22938, 24576,26214,27853,29491,31130}; /*Q15*/ int log2_fast(int Am) {

　x 2 Q

　，其数值在 int point,point1; int index,x0,dx,dy,y; point ＝0; while(Am<16384) {point++ ； Am ＝Am<<1;} /* 对 Am 进行规格化 */ point1 ＝ (15- point - 4)*512; /* 输入为 Q4，输出为 Q9*/ index ＝ ((Am - 16384)*20L)>>15; /* 求查表地址 */ dx ＝ Am- logtab2[index]; dy ＝ ((long)dx*logtab1[index])>>13; y＝ (dy+logtab0[index])>>6;

　· 68·

　 /*Q9*/ y＝ point1+y; return (y); } 上述程序中，输入值 Am 采用 Q4表示，输出采用 Q9表示，如果输入输出的 Q值与上面程序中的不同，则应做相应的修改。

　3.5 小结本章讨论了DSP 芯片进行定点运算所涉及的一些基本问题，这些问题包括：数的定标， DSP程序的定点模拟， DSP芯片的定点运算以及定点实现非线性函数的快速实现方法等。充分理解这些问题对于用定点芯片实现 DSP算法具有非常重要的作用。

推荐访问:运算讲解格式