一款32位嵌入式CPU的定点加法器设计

日期：2007-05-24 作者：管理员

　　从CPU的指令执行频率上看，算术逻辑单元、程序计数器、协处理器是CPU中使用频率最多的模块，而加法器正是这些模块的核心部件，几乎所有的关键路径都与之有关，因而设计一种通用于这些模块的加法器是整个CPU设计中关键的一步。为此，笔者根据32位CPU的400MHz主频的要求，结合CPU流水线结构，借鉴各种算法成熟的加法器，提出一种电路设计简单、速度快、功耗低、版图面积小的32位改进定点加法器的设计方案。

　　1 设计思想

　　对于高性能CPU中使用的加法器，速度显然是第一位的，所以考虑采用并行计算的方法，并且在电路的设计上采用少量的器件来获得速度上的巨大提升。从面积有度出发，链式进位加法器（Ripple-Carry Adder）的器件最少，面积最小，版图工作量也最小，可是由于加法器的高位进位要等待低位的运算结束后才能得到，所以没有办法在速度上达到要求。鉴于此，采用类似于链式加法器的结构。省先从进位选择加法器（Carry-Select Adder）得到提示，将32位加法器一分为二，分为低16位加法器和高16位加法器，再将低16位加法器的进位输出

作为选择信号，用于选择高16位加法器的和及第27位的进位输出（这个进位输出要在溢出逻辑判断中使用，而普通的加法器则不用产生进位）。通过这样的处理，将一个32位的加法器简化就成了两上16位的加法器，如图1所示。

一款32位嵌入式CPU的定点加法器设计如图

　　另外，从超前进位加法器（Carry-Look-Ahead Adder）获得提示，在超前进位加法器中引入中间变量G和P用于加速进位链的速度。而G和P在逻辑表达式上与前一级的进位无关，只与每一级的操作数输入有关，而且它们又是构成本级进位的必要部分。在微处理器的数据通道上，数据传输是并行进行的，即两个32位操作数几乎同一时间到达时加法器。所以，G和P不论是加法器的最低位还是加法器的最高位，几乎都可以在相同的时间内得到，因而进位链上就可以借鉴这个特点加速进位的传递。以一个四位加法器为例，有如下的逻辑推导过程：

　　C4=C3P4+G4=（C2P3+G3）·P4=G4=C2P3P4+G3P4+G4=(C1P2+G2) ·P3·P4+G3P4+G4=C1P2P3P4+G2P3P4+G3P4=(C0P1+G1) ·(P2P3P4)+(G2P3P4+G3P4+G4)=C0·(P1P2P3P4)+(G1P2P3P4+G2P3P4+G3P4+G4)

　　令上式中P1P2P3P4为Pgroup，G1P2P3P4+G2P3P4+G3P4+G4为Ggroup，如果将32位加法器划分为若干的小块，则每一个小块都可以有自己相对应的Ggroup和Pgroup。由此可知对于整个加法器的时延来说，关键路径的时延总值可以由三部分组成：①产生Ggroup和Pgroup的时延；②进位传递逻辑上的器件时延；③加法器进位链上的导线时延。对于这三类时延，时延①与时延（②+③）存在重叠的部分，于是使这两类时延合理衔接，可以使得进位链上的逻辑级数最小，从而使得电路上的传输时延达到最小上。

　　2 具体实现

　　2．1 4位加法器模块的实现

　　在具体的电路设计中，先将32位数据通道划分成了高低两部分，然后以4位为单位划分成更小的模块。这些模块在结构上是基本一致的，但在功能上要完成本模块四组操作数（A[k:k+3]和B[k:k+3]）与进位Ck的加法运算，并要产生模块的中间变量Ggroup和Pgroup的运算。

　　对于单一的每一位，定义它的G和P分别为：Gi=AiBi,Pi=Ai+Bi,加法器的和SUMi=Ai+Bi+Ci-1=Pi+Ci-1,考虑到器件的实际驱动能力，结合加法器的另一个功能--减法运算，设计出如图2所示的带减法功能的一位加法器电路。

点击看原图

　　设计的4位加法器进位链如图3所示，除C0外，输入（Pi和Gi）都是由图2的一位加法器产生的，所有4位进位链Ci都按超前进位加法器连接方式直接接入相应位置。由此可以看出，进位信号到达各位的逻辑级数是相当的，只要在进位信号到达之间使所有的中间信号Gi和Pi都能及时产生，就能及时得到每一位的和（SUM）。

点击看原图

　　图4是产生4位加法器块进位及块的Ggroup和Pgroup信号的电路。借鉴于超前进位加法器的传递逻辑电路，可知并不是所有的4位加法器都需要向它的下一个模块传送进位信号，而只要产生传递进位所需的Ggroup和Pgroup信号即可。而有些位置，由于进位链设计的实际需要，要需要利用4位加法器模块产生的进位信号，而不必采用传递逻辑产生的进位信号，而不必采用传递逻辑产生的进位信号，具体的情况还是有区别的。为了充

分利用图3中产生的相关信号的复位，在进位信号C4的产生电路部分，进位链方向上的逻辑级数只有两组，可以说还是比较简单了。可是，综合前面所谈到的4位加法器的电路，可以发现有一些中间信号（Pi和Gi）的负载是不均衡的，如P2的负载比P3或P4要重很多。所以在设计的时候，如果考虑到尽量降低版图的复杂程度，就要在面积上做出适当的牺牲，尽量以最大负载进行考虑，使得器件的设计符合时延上的要求；同时还要充分考虑到在深亚微米工艺条件下导线的时延问题，即设计的电路不但要考虑到所承受的器件的负载，而且还要结合版图设计中实现的导线负载，定出上述电路的合理尺寸。

点击看原图

　　2．2 传递逻辑电路实现

　　完成上述基本4位加法器的电路设计后，要构造一个完整的32位加法器还需借助于传递逻辑电路。传递逻辑电路要吧对4位加法器模块的进位进行传递，也可以对由两个4位加法器模块组成的8位加法器模块的进位进行传递。对于8位加法器模块，由于低4位的进行可以表示为C4=C0Ggroup+Pgroup，则8位加法器模块的进位为：

　　C8=C4Ggroup'+Pgroup'=Pgroup'(C0

Ggroup+Pgroup)+Ggroup

　　=Pgroup'PgroupC0+Pgroup'Ggroup+Ggroup'

　　由此可以设计如图5和图6所示的两种进位传递逻辑电路。

一款32位嵌入式CPU的定点加法器设计如图

　　2．3 溢出逻辑电路实现

　　设计中还采用了判断溢出的方法。当两个有符号数进行加减法运算时，若最高的数值位符号位的进位（本设计中的C30）值与符号位产生的进位（本设计中的C31）输出值不同，则表明加减运算产生了溢出。

　　由上述可知，加法器时延的关键路径在进位链上，而进行溢出判断所需要的信息C30与C31都在这条路径上。于是采用类似于进位跳加法器（Carry-Skip Adder）的方法，使得低位的进位快速跳位到高位，使C30与C31快速产生，具体实现如下：

　　①溢出的逻辑表达式推导

　　由于Joverflow=(C30+C31)·Overflag(Overflag)表示当前ALU加法器进行有符号运算），需要进行溢出判断（它是ALU控制模块在译码阶段产生的，在指令执行阶段起始段就输出到数据通道，所以它不在关键路径上）。

　　对于C31与C30，有C31=C30P31+G31，所以 C30+C31=C30C31+C30C31

　　=（C27G28G29G30G31+C27P28P29P30P31G31）（1）

　　+（P28G28G29G30G31+G28P29P30P31G31

　　+P29G29G30G31+P30G30G31+G29P30P31G31+G30P31G31 （2）

　　显然，分式（1）是和进位链无关的一部分，可以在每一个流水线的指令执行阶段起始段很快得到，而分式（2）则是和进位链有关的部分，其具体逻辑值将取决于进位G27的值。分式（1）中高位的Gi和Pi都可以在进位C27到来之间预先得到，只要C27一到就可以进行逻辑判断，得到相应的逻辑。

　　所以令P1=G28G29G30G31+C27P28P29P30P31G31

　　P2=P28P29P30P31G31

　　Gtotal=式（2）

　　则 Overflow=(C30+C31)·Overflag=(C27P1+C27P2+Gtotal) ·Overflag (3)

　　②溢出逻辑电路实现

　　根据式（3）的逻辑表达式，可设计出加法器溢出逻辑产生电路，如图7所示。

　　设计得到的32位加法器在SMIC流片后，经测试，运算速度在400MHz以上，满足设计要求，为后续浮点加法器的设计提供了很好的铺垫

12

更多>同类技术

全年征稿 / 资讯合作

2398080099

联系邮箱：

版权与免责声明

凡本网注明“来源：CK365测控网”的所有作品，均为北京新科时代传媒信息技术有限公司-CK365测控网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：CK365测控网”。违反上述声明者，本网将追究其相关法律责任。
本网转载并注明自其它来源的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。

推荐图文

Rockwell自动化系统在烟片在线回潮生产线中	研祥EPX产品在物联网药品电子监管码系统中
容易使用和弹性的大型电子公告板解决方案

推荐技术

可能喜欢

• 手把手教你详细的硬件电路设计 - 全文	• 嵌入式视觉系统与标准视觉系统的比较
• 基于嵌入式Linux中进程调度实现方法	• PCB板有铅喷锡与无铅喷锡的区别你知道吗？
• 嵌入式技术在物联网中的应用	• 电动汽车控制器和整车控制器
• 嵌入式硬件通信接口协议-SPI（一）协议基础	• ARM嵌入式系统硬件怎么用？教你一招
• 单片机设计新思路：把主程序放入中断如何？	• 单片机和嵌入式的区别终于看懂了