このページで説明する加算器を共有して面積を小さくするテクニックは勝手に使っていいのかという質問がありました。 勝手に使っていただいて大丈夫です。
はじめに
XilinxのFPGA(Artix-7)でDSPを使用せずにLUTで加算器を作る場合、加算器の入力を構成するLUTに余裕があり、共有するためのセレクタを詰め込んでも面積は増えない。 そのテクニックが、現在、開発中のICF3-Fの制御部で使うことができそうで、効果がありそう。
論理合成ツール
XilinxのVivado 2018.2です。評価ボード Artyの(Artix-7 XC7A35T-L1CSG324I)の設定で合成しています。 合成オプションは、面積、最優先(Flow_AreaOptimaized_high)です。
対象となる論理
ICF3-Fは商用だがブロック図(2018年9月11日追加)を公開していいる。 図の左側にループ制御用の16bitレジスタI,Jがある。その部分の論理について加算器を共有させて面積を小さくする。 レジスタI,Jは即値(n)を代入すること、分岐命令(BI命令、BJ命令)のときには値を-1にする論理です。 BI命令とBJ命令は同時に来ることはないので-1をする加算器の共用化が可能です。
対象となるverilogコード
module subij( input CLK, input CEI, input CEJ, input BI, input BJ, input [15:0] n, output INOR, output JNOR); always @(posedge CLK) begin I<= BI ? I-1 : CEI ? n : I; J<= BJ ? J-1 : CEJ ? n : J; end assign INOR = ~|I; assign JNOR = ~|J;
Iレジスタにnを代入するにはCEIを1にします。分岐命令のBI命令の場合はCEIとBIが1になります。Jレジスタも同様。 このコードでは、論理合成ツールはBIとBJが同時にくる可能性のために加算器を共用できません。 少しコードを変更して加算器が共用できるコードに変更します。
module subij( input CLK, input CEI, input CEJ, input BI, input BJ, input [15:0] n, output INOR, output JNOR); always @(posedge CLK) begin I<= CEI ? (BI ? I-1 : n) : I; J<= CEJ ? (BI ? n : J-1) : J; end assign INOR = ~|I; assign JNOR = ~|J;
これ以外のコードも試しましたが、シミュレーションすると誤った結果となってしまいました。
論理合成ツールによる結果
38LUT 32FFで約10スライスの面積。加算器の共有ができていません。
人間による結果
22LUT 32FFで8スライスの面積。まだLUTが8スライス内に入りそうです。 加算器を共有する論理をLUT,CARRY4,FFで作りスライスの場所を固定しました。固定したものはオレンジ色になるようです。
まとめ
実際のケースで加算器を共有する方法をやってみました。 加算器を共有化を確実にするにはLUT、CARRY4、FFをスライスに固定するなど少々、手間がかかりますが面積を小さくすることはできるようです。 これ、ICF3-Fの1032bitの大型加算器でも使えるので、かなり効果があるかも。