シリコン基板の上に集積可能なデバイスとして、MOSトランジスタと、バイポーラトランジスタがある。この両者を混在する技術をBiCMOS(Bipolar CMOS)技術と呼ぶ。最初にアナログ回路においてBiCMOS技術が適用、実用化された。1983年頃から、ディジタル回路への応用に向けて、CMOSとバイポーラを同一基板上に複合するプロセス技術が報告され、また、この技術を用いてメモリ等幾つかの論理LSIが作製された。1984年になると同じ微細化レベルの加工技術の純MOSLSIと同等性能のMOSと、純バイポーラLSIと同等性能のバイポーラを同一基板上に組み合わせることが初めて可能となった。CMOSをはじめとするMOSの特徴は、高集積、低消費電力であり、ECLをはじめとするバイポーラの特徴は高速動作である。ディジタル回路におけるBiCMOS技術の狙いはこの両者の利点を融合することである。 2mBiCMOS技術は、3000ゲートのゲートアレーに適用され、ゲート遅延時間0.8ns(標準負荷0.8pF時)を達成した。これは、2mCMOSゲートアレーのほぼ半分である。この高速動作は、基本回路内で高性能バイポーラと高性能CMOSを複合したことにより、初めて得られたものである。2mBiCMOS技術は、次に、64Kb SRAMに適用され、アクセス時間15nsを達成した。このアクセス時間は、2mCMOS技術によるSRAMの、やはり、ほぼ半分である。 本研究の目的は、ミニコン、オフコン、サーバ等と呼ばれる中型計算機、ワークステーション、パソコンと呼ばれる小型計算機のCPUとして用いられるプロセッサを、BiCMOS技術により高性能化することである。BiCMOSプロセッサの狙いは、CMOSプロセッサ並の集積度を保ったまま、ECLプロセッサ並のマシンサイクルを実現することである。プロセッサの性能は、プロセス/デバイス、回路、論理、命令、コンパイラと多岐にわたる技術により決まる。本論文が扱うのは回路方式、論理方式である。中でも、最も独創的なものは第2章と第3章で述べるバイポーラをセンス回路として用いるBiCMOS低振幅回路の提案である。第4章と第5章では、この技術をプロセッサレベルで活かすために生まれた回路、論理方式上の工夫について述べる。第6章は結論である。 本論文では第1章で下記の設計指針に基づくBiCMOSプロセッサを提案する。 指針1:CMOSベースのマクロセルを用い、集積度をあげ、遅延時間がかかり、数に制約のある信号のチップ間渡りを低減する。 指針2:バイポーラを用いたドライバ、センス回路により、クリティカルパスの遅延時間を短縮する。この際、集積度を下げないことが指針1の関点から重要である。 プロセッサの動作周波数を決める最も遅延時間の長いパスをそのプロセッサのクリティカルパスと呼ぶ。このパスの遅延時間を短縮することがプロセッサ高速化の上で重要である。代表的なクリティカルパスに下記の3つがある。 (1)演算パス-オペランドのアドレス計算、及び、オペランドの処理をするパス。ビットスライス状に配置された、ALU、レジスタファイル、乗算器等よりなる。 (2)制御パス-命令をデコードし、演算パスを制御するパス。マイクロ命令を格納するROMと、マイクロ命令をデコードするポリセルよりなる。 (3)メモリパス-アドレスを変換し、命令、及び、オペランドの読み出しを行うパス、TLB、キャッシュという2種の連想メモリよりなる。 各パスにおいて、BiCMOSマクロセルが高性能化の鍵となる部品である。本論文では、本節で述べた設計指針に基づき、マクロセルを高速化するBiCMOS回路を提案する。この回路は、エミッタ接地のバイポーラをセンス回路としMOS回路網を低振幅動作させることにより高速化する回路である。これにより、初めてBiCMOSプロセッサを実現し、その後のBiCMOSプロセッサ実用化への道を開いた。 第2章では、演算パスのBiCMOSによる高速化方式を示す。Gmの高いバイポーラをセンス回路として使い、スイッチ回路として働くCMOS回路網の電圧振幅を下げる低振幅キャリー伝搬回路を提案する。さらに、2mBiCMOS技術により試作評価の結果、32ビットキャリー伝搬時間5.9nsを得た。また、CMOS回路との評価を定量的に行い、提案したBiCMOS回路の伝搬時間がCMOS回路の33%〜43%であることを実証した。 また、エミッタフォロワのバイポーラを帰還回路で制御し、バス電位を精度良く設定する低振幅バスプリチャージ回路を提案した。さらに、2mBiCMOS技術により試作評価した結果、レジスタアクセス時間6.6nsを得た。これはCMOS回路の50%のアクセス時間である。 第3章では、制御パス、メモリパスのBiCMOSによる高速化方式を示す。2mBiCMOS技術により128Kb(2K語、64b/語)のROMの試作を行い、読み出し時間17nsを得た。メモリセルにMOSを用いることにより、集積度はCMOSと同等に保ちながら、バイポーラによる低振幅センス回路とバイポーラドライバを用いることにより、読み出しサイクル時間をCMOSのほぼ半分にできた。 1.3mBiCMOS技術により64エントリのTLB、4KBのキャッシュメモリを試作した。アクセス時間のシミュレーション値は17nsである。コンパレータとセンス回路を一体化することにより高速化を達成した。 第4章では、1.0m/5VBiCMOS技術により開発した70MHz/529Kトランジスタの32bCISCプロセッサについて述べた。全トランジスタの1.5%に当たる8Kトランジスタのバイポーラにより演算パスで55%、制御パスで59%、ポリセルによるデコードパスで81〜84%に遅延時間を短縮できることを示した。本チップは、第2、3章のBiCMOS低振幅回路を用いることにより初めて実現可能となったBiCMOSプロセッサである。また、 (1)毎サイクルアクセス可能なオンチップROMに使用頻度の高いマイクロ命令を4K語、5サイクルピッチでアクセス可能な主メモリへ使用頻度の低いマイクロ命令を12K語と、マイクロ命令を分割して格納することにより、仮想的に16K語のマイクロ命令アドレス空間を実現し、かつ、実効性能を保ちながら、マイクロ命令読み出しパスからチップ渡りを削除した。 (2)PLLを内蔵し、内部クロックを分周器出力からとることにより、参照クロックに同期したデュティの正しいクロックを得た。 (3)ポリセルにおいて、低速小面積のCMOSゲートと同一論理機能の高速大面積のBiCMOSゲートを準備し負荷により使いわける方式により、BiCMOSセルの比率を17%、バイポーラトランジスタのトランジスタ比率を2.5%に押さえながら、遅延時間を81〜84%に短縮した。 第5章では、3.3V/BiCMOS技術により、動作周波数120MHz、消費電力17WのRISCプロセッサを開発した。本プロセッサは整数演算6段、浮動小数点演算7段のパイプライン方式で、パイプラインシミュレータによる性能評価とチップ面積のトレードオフに基づき、 (1)整数命令同志を含む2命令を並列処理する命令制御方式、 (2)命令8KB、データ16KBの1次キャッシュを内蔵し、2次キャッシュは外付けとする2階層キャッシュ構成のメモリ制御方式、 (3)倍精度乗算、加算を1サイクルピッチで並列に処理可能な浮動小数点演算方式、 を採用した。また、その過程で、(1)ペナルティ有無判定パス、(2)ロードユースパス、(3)キャッシュヒット判定パス、(4)浮動小数点演算パスの4つがクリティカルになることを明らかにした。 序論で提案したCMOSベースのマクロセルを活用して、一部にバイポーラを用いる設計手法により、 (1)2.8Mトランジスタ(内マクロセルは面積比69%、トランジスタ比91%)を集積し、 (2)消費電力を半減し、17Wを達成し、 (3)1〜1.5%のバイポーラを用いてクリティカルパスを73〜86%に短縮した。 クリティカルパス短縮の効果は第4章でまとめた5Vプロセッサの55〜84%に比べて、73〜86%と小さいが、3.3V電源時もBiCMOS技術がプロセッサ高速化に有効なことを実証した。 以上要約すると、本研究では、CMOSベースのマクロセルを用い集積度を上げ、クリティカルパスにバイポーラを用いて遅延時間を短縮するという設計指針を提案し、キャリー伝搬回路等バイポーラをセンス回路として用いる低振幅動作の回路を提案した。さらに、5V/BiCMOS技術による529KトランジスタのCISCプロセッサで1.5%のバイポーラの付加で、遅延時間を55%〜84%に、3.3V/BiCMOS技術による2.8MトランジスタのRISCプロセッサで1〜1.5%のバイポーラの付加で遅延時間を73〜86%にできることを実証し、BiCMOSプロセッサを実用技術に導いた。 |