我们的设计需要多大容量的芯片?我们的设计能跑多快?这是经常困扰工程师的两个问题。对于前一个问题,我们可能还能先以一个比较大的芯片实现原型,待原型完成再选用大小合适的芯片实现。对于后者,我们需要一个比较精确的预估,我们的设计能跑50M,100M还是133M?首先让我们先来看看Fmax是如何计算出来的。
图(1)是一个通用的模型用来计算FPGA的。我们可以看出,Fmax受Tsu,Tco,Tlogic和Troute四个参数影响。(由于使用FPGA全局时钟,时钟的抖动在这里不考虑)。
时钟周期T = Tco + Tlogic + Troute + Tsu
时钟频率Fmax = 1/Tmax
其中:
Tco:D触发器的输出延时
Tlogic:组合逻辑延时
Troute:布线延时
Tsu:D触发器的建立时间
图(1)时钟周期的计算模型
由图(1)可以看出,在影响Fmax的四个参数中,由于针对某一个器件Tsu和Tco是固定的,因此我们在设计中需要考虑的参数只有两个Tlogic和Troute.通过良好的设计以及一些如Pipeline的技巧,我们可以把Tlogic和Troute控制在一定的范围内。达到我们所要求的Fmax.
经验表明一个良好的设计,通常可以将组合逻辑的层次控制在4层以内,即(Lut Levels《=4)。而Lut Levels(组合逻辑的层次)将直接影响Tlogic和Troute的大小。组合逻辑的层次多,则Tlogic和Troute的延时就大,反之,组合逻辑的层次少,则Tlogic和Troute的延时就小。
让我们回过头来看看Xilinx和Altera的FPGA是如何构成的。是由Logic Cell(Xilinx)或Logic Element(Altera)这一种基本结构和连接各个Logic Cell或Logic Element的连线资源构成。无论是Logic Cell还是Logic Element,排除其各自的特点,取其共性为一个4输入的查找表和一个D触发器。如图(2)所示。而任何复杂的逻辑都是由此基本单元复合而成。图(3)。上一个D触发器的输出到下一个D触发器的输入所经过的LUT的个数就是组合逻辑的层次(Lut Levels)。因此,电路中用于实现组合逻辑的延时就是所有Tlut的总和。在这里取Lut Levels = 4.故Tlogic = 4 * Tlut.
图(2)FPGA基本逻辑单元
图(3)复杂组合逻辑的实现
解决的Tlogic以后,我们来看看Troute如何来计算。由于Xilinx和Altera在走线资源的设计上并不一样,并且Xilinx没有给出布线延时的模型,因此更难于分析,不过好在业内对布线延时与逻辑延时的统计分析表明,逻辑延时与布线延时的比值约为1:1到1:2.由于我们所选用的芯片大量的已经进入0.18um和0.13um深亚微米的工艺,因此我们取逻辑延时与布线延时的比值为1:2.
Troute = 2 * Tlogic
Tmax = Tco + Tlogic + Troute + Tsu
= Tco + Tsu + 3 * Tlogic
= Tco + Tsu + 12 * Tlut
下表是我们常用的一些Xilinx和Altera器件的性能估算。我们选取的是各个系列中的最低的速度等级。由于Altera的APEX,APEX II系列器件的不同规模的参数不同,我们选取EP20K400E和EP2A15作代表。
# 以EP20K400E-3 的数据计算得出。
## 以 EP2A15-9 的数据计算得出。