Nothing Special   »   [go: up one dir, main page]

JP6953229B2 - 半導体装置 - Google Patents

半導体装置 Download PDF

Info

Publication number
JP6953229B2
JP6953229B2 JP2017154880A JP2017154880A JP6953229B2 JP 6953229 B2 JP6953229 B2 JP 6953229B2 JP 2017154880 A JP2017154880 A JP 2017154880A JP 2017154880 A JP2017154880 A JP 2017154880A JP 6953229 B2 JP6953229 B2 JP 6953229B2
Authority
JP
Japan
Prior art keywords
data
chip
circuit
transistor
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017154880A
Other languages
English (en)
Other versions
JP2019033234A (ja
Inventor
山崎 舜平
舜平 山崎
黒川 義元
義元 黒川
青木 健
健 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Semiconductor Energy Laboratory Co Ltd
Original Assignee
Semiconductor Energy Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Semiconductor Energy Laboratory Co Ltd filed Critical Semiconductor Energy Laboratory Co Ltd
Priority to JP2017154880A priority Critical patent/JP6953229B2/ja
Publication of JP2019033234A publication Critical patent/JP2019033234A/ja
Application granted granted Critical
Publication of JP6953229B2 publication Critical patent/JP6953229B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Semiconductor Memories (AREA)
  • Non-Volatile Memory (AREA)
  • Thin Film Transistor (AREA)

Description

例えば、本発明の一態様は、半導体装置、半導体装置を有する電子機器に関する。
なお、本明細書において、半導体装置とは、半導体特性を利用することで機能しうる装置全般を指す。トランジスタ、半導体回路、演算装置、記憶装置等は半導体装置の一態様である。また、表示装置、撮像装置、電気光学装置、発電装置(薄膜太陽電池、有機薄膜太陽電池等を含む)、及び電子機器は半導体装置を有している場合がある。
チャネル形成領域に金属酸化物を有するトランジスタ(以下、「金属酸化物トランジスタ」、「酸化物半導体トランジスタ」、または「oxトランジスタ」と呼ぶ場合がある。)が知られている。oxトランジスタはオフ電流が非常に小さい。メモリセルの書込みトランジスタをoxトランジスタで構成することで、保持特性の優れたメモリセルを提供することが可能である。例えば、非特許文献1には、oxトランジスタを用いた多値NOSRAM(登録商標)が開示されている。
なお、本明細書では、NOSRAMとは、メモリセルが2トランジスタ型(2T)、又は3トランジスタ型(3T)ゲインセルであり、メモリセルの書込みトランジスタがoxトランジスタであるメモリ装置のことをいう。なお、「NOSRAM」とは、「Nonvolatile Oxide Semiconductor RAM」の略称である。
近年、人工知能(AI)分野の技術発展が著しい。特許文献1には、oxトランジスタが用いられ、ニューラルネットワークを構成することが可能な半導体装置が記載されている。
特開2016−219011号公報
例えば、本発明の一形態の課題は、oxトランジスタを有する新規な半導体装置を提供すること、またはAIの演算が可能な低消費電力半導体装置を提供することである。
本発明の一形態は、例示した全ての課題を解決する必要はない。複数の課題の記載は互いの課題の存在を妨げるものではない。例示した以外の課題は本明細書等の記載から自ずと明らかになり、これらの課題も本発明の一形態の課題となり得る。
複数の課題の例示は、互いの課題の存在を妨げるものではない。本発明の一形態は、例示した全ての課題を解決する必要はない。また、列記した以外の課題が、本明細書等の記載から、自ずと明らかとなるものであり、このような課題も、本発明の一形態の課題となり得る。
(1)本発明の一形態は、第1プロセッサチップと、第2プロセッサチップと、メモリ部と、データバスとを有する半導体装置であり、第1プロセッサチップ、第2プロセッサチップ、およびメモリ部は、それぞれ、データバスと電気的に接続され、第1プロセッサチップは、人工知能の演算を行う演算回路アレイを有し、演算回路アレイは、複数の演算回路を有し、演算回路は、第1トランジスタ、第2トランジスタ、容量素子、および保持ノードを有し、第1トランジスタのチャネル形成領域は金属酸化物を有し、第1トランジスタは保持ノードへのデータの書き込みを制御する機能をもち、第2トランジスタのゲートは保持ノードに電気的に接続され、容量素子は、保持ノードに電気的に接続され、第2プロセッサチップは、CPUコアを有する。
(2)上記形態(1)において、保持ノードは、アナログデータが書き込まれる。
(3)本発明の一形態は、第1プロセッサチップと、第2プロセッサチップと、メモリ部と、データバスとを有する半導体装置であり、第1プロセッサチップ、第2プロセッサチップ、およびメモリ部は、それぞれ、データバスと電気的に接続され、第1プロセッサチップは、人工知能の演算を行う演算回路アレイを有し、演算回路アレイは、複数の演算回路を有し、演算回路は、複数のメモリ回路を有し、複数のメモリ回路は、それぞれ、複数のメモリセルを有し、複数のメモリセルは、それぞれ、保持ノードと、保持ノードへのデータの書き込みを制御するトランジスタを有し、トランジスタのチャネル形成領域は金属酸化物を有し、第2プロセッサチップは、CPUコアを有する。
(4)上記形態(3)において、保持ノードは、デジタルデータが書き込まれる。
本明細書等において、「第1」、「第2」、「第3」などの序数詞は、順序を表すために使用される場合がある。または、構成要素の混同を避けるために使用する場合がある。これらの場合、序数詞の使用は構成要素の個数を限定するものではない。例えば、「第1」を「第2」または「第3」に置き換えて、本発明の一形態を説明することができる。
本明細書等において、XとYとが接続されていると記載されている場合は、XとYとが電気的に接続されている場合と、XとYとが機能的に接続されている場合と、XとYとが直接接続されている場合とが、本明細書等に開示されているものとする。したがって、所定の接続関係、例えば、図または文章に示された接続関係に限定されず、図または文章に示された接続関係以外のものも、図または文章に記載されているものとする。X、Yは、対象物(例えば、装置、素子、回路、配線、電極、端子、導電膜、層など)であるとする。
トランジスタは、ゲート、ソース、およびドレインと呼ばれる3個の端子を有する。ゲートは、トランジスタの導通状態を制御する制御端子である。ソースまたはドレインとして機能する2個の端子は、トランジスタの入出力端子である。2つの入出力端子は、トランジスタの導電型(nチャネル型、pチャネル型)及びトランジスタの3個の端子に与えられる電位の高低によって、一方がソースとなり他方がドレインとなる。このため、本明細書等においては、ソースやドレインの用語は、入れ替えて用いることができるものとする。また、本明細書等では、ゲート以外の2個の入出力端子を第1端子、第2端子等と呼ぶ場合がある。
ノードは、回路構成やデバイス構造等に応じて、端子、配線、電極、導電層、導電体、不純物領域等と言い換えることが可能である。また、端子、配線等をノードと言い換えることが可能である。
電圧は、ある電位と、基準の電位(例えば接地電位(GND)またはソース電位)との電位差のことを示す場合が多い。よって、電圧を電位と言い換えることが可能である。なお、電位とは相対的なものである。よって、GNDと記載されていても、必ずしも0Vを意味しない場合もある。
本明細書において、「上に」、「下に」などの配置を示す語句は、構成同士の位置関係を、図面を参照して説明するために、便宜上用いている場合がある。また、構成同士の位置関係は、各構成を描写する方向に応じて適宜変化するものである。従って、明細書で説明した語句に限定されず、状況に応じて適切に言い換えることができる。
本明細書等において、「膜」という言葉と「層」という言葉とは、場合によっては、または、状況に応じて、互いに入れ替えることが可能である。例えば、「導電層」という用語を「導電膜」という用語に変更することが可能な場合がある。例えば、「絶縁膜」という用語を「絶縁層」という用語に変更することが可能な場合がある。
本発明の一形態によって、oxトランジスタを有する新規な半導体装置を提供することが可能である。
複数の効果の記載は、他の効果の存在を妨げるものではない。また、本発明の一形態は、必ずしも、例示した効果の全てを有する必要はない。また、本発明の一形態について、上記以外の課題、効果、および新規な特徴については、本明細書の記載および図面から自ずと明らかになるものである。
半導体装置の構成例を示す機能ブロック図。 A―C:oxメモリ回路の構成例を示す回路図。 oxAIチップの回路部の構成例を示す模式図。 A、B:評価ボードの構成例を示す斜視模式図。 oxAIチップによって構成される全結合型ニューラルネットワークの構造を示す図。 oxAIチップの構成例を示す機能ブロック図。 MACアレイの構成例を示す回路図。 oxAIチップの構成例を示す機能ブロック図。 演算回路アレイの構成例を示すブロック図。 演算回路の構成例を示す回路図。 A:メモリ回路の構成例を示す回路図。B:メモリセルの構成例を示す回路図。 メモリ回路の構成例を示す回路図。 A、B:スイッチ回路の構成例を示す回路図。 oxAIチップによって構成される畳み込みニューラルネットワークの構造を示す。 A、B:半導体装置が組み込まれたコンピュータの斜視模式図。 電子機器を例示する図。
以下に、本発明の実施の形態を説明する。ただし、本発明の一形態は、以下の説明に限定されず、本発明の趣旨およびその範囲から逸脱することなくその形態および詳細を様々に変更し得ることは、当業者であれば容易に理解される。したがって、本発明の一形態は、以下に示す実施の形態の記載内容に限定して解釈されるものではない。
以下に示される複数の実施の形態は適宜組み合わせることが可能である。また1の実施の形態の中に、複数の構成例(作製方法例、動作方法例、使用方法例等も含む。)が示される場合は、互いの構成例を適宜組み合わせること、および他の実施の形態に記載された1または複数の構成例と適宜組み合わせることも可能である。
図面において、大きさ、層の厚さ、又は領域は、明瞭化のために誇張されている場合がある。よって、必ずしもそのスケールに限定されない。なお図面は、理想的な例を模式的に示したものであり、図面に示す形状又は値などに限定されない。例えば、ノイズによる信号、電圧、若しくは電流のばらつき、又は、タイミングのずれによる信号、電圧、若しくは電流のばらつきなどを含むことが可能である。
〔実施の形態1〕
本実施の形態では、人工知能のための演算機能を有する半導体装置、および当該半導体装置が搭載される電子機器などについて説明する。人工知能の演算処理とは、例えば、機械学習、ニューラルネットワークなどのAIに関する数理モデルに基づく演算処理である。
図1は、半導体装置の構成例を示す機能ブロック図である。図1に示す半導体装置100は、データバス110、入出力(I/O)インターフェース112、メモリ部114、FPGAチップ115、oxAIチップ120を有する。I/Oインターフェース112、メモリ部114、FPGAチップ115、およびoxAIチップ120は、データバス110を介してデータを授受する。
I/Oインターフェース112は、各種の周辺機器150を接続するための複数種類のインターフェースを備えていることが好ましい。例えば、USBコネクタ、HDMI、(登録商標)コネクタ、eDPコネクタ、ePCIe、LANコネクタなどが設けられる。
「USB」はUniversal Serial Busの略称である。「HDMI/eDP」はHigh−Definition Multimedia Interface/の略称である。ことである。eDPはembedded DisplayPortの略称である。「ePCIe」はPeripheral Component Interconnect Expressの略称である。「LAN」は、Local Area Networkの略称である。
メモリ部114は、1個または2個以上のメモリチップを有する。例えば、メモリ部114に複数種類のメモリチップを設けて、メモリ部114を階層化する。例えば、SRAMチップ、DRAMチップ、およびフラッシュメモリチップがメモリ部114に設けられる。DRAMチップに代えて、NOSRAMチップ、またはDOSRAMチップを設けてもよい。フラッシュメモリチップに代えて、NOSRAMチップ、またはDOSRAMチップを設けてもよい。
「DOSRAM(登録商標)」とは、「Dynamic Oxide Semiconductor RAM」の略称であり、oxトランジスタと容量素子とでなる1トランジスタ1容量型のメモリセルを有するRAMを指す。NOSRAM、およびDOSRAMともメモリセルの書込みトランジスタがoxトランジスタであるので、不揮発性メモリとして用いることができる。
半導体装置100にFPGAチップ115が搭載されているため、半導体装置100は拡張性が高い。FPGAチップ115には、CPUコア、およびメモリ装置が組み込まれている。
半導体装置100の用途等によって、半導体装置100に組み込まれるICチップの種類は取捨される。少なくとも、CPUコアを内蔵するプロセッサチップと、AIの演算を実行するプロセッサチップとを半導体装置100に組み込むことが好ましい。FPGAチップ115がCPUコアを内蔵しているため、半導体装置100は、エッジ側デバイス向けの組み込みシステムの開発に好適である。例えば、ユーザは、半導体装置100にモニタ、キーボードなどの入出力装置を接続することで、エッジ側端末で動作するソフトウエアの開発を行うことができる。
<oxAIチップ120>
oxAIチップ120は、oxトランジスタが用いられたAIの演算処理が可能なICチップである。oxAIチップ120が使用するデータには、重み係数データ(学習可能なデータ)、画像データ、教師データなどがある。oxAIチップ120の演算結果は、例えば、推論データとして出力される。
oxAIチップ120の特長には、演算に用いられるデータ(代表的には、重み係数データ)を記憶するメモリ回路が演算回路と近接して設けられていることである。このメモリ回路に、oxトランジスタが用いられている。本明細書では、oxトランジスタを有するメモリ回路を、「oxメモリ回路」と呼ぶ場合がある。図2A〜図2Cにoxメモリ回路の回路構成例を示す。
図2Aに示すoxメモリ回路11は、2Tゲインセルと同じ回路構成であり、書込みトランジスタMW1、読出しトランジスタMR1、容量素子CS1を有する。読出しトランジスタMR1のゲートが保持ノードSNである。書込みトランジスタMW1、読出しトランジスタMR1はそれぞれoxトランジスタである。
金属酸化物のバンドギャップは2.5eV以上あるため、oxトランジスタは極小のオフ電流をもつ。一例として、ソースとドレイン間の電圧が3.5V、室温(25℃)下において、チャネル幅1μm当たりのオフ電流を1×10−20A未満、1×10−22A未満、あるいは1×10−24A未満とすることができる。すなわち、ドレイン電流のオン/オフ電流比を20桁以上150桁以下とすることができる。なお、書込みトランジスタMW、読出しトランジスタMRの半導体層については後述する。
oxメモリ回路11のノードSNには、書込みトランジスタMW1を介して電荷が充電される。oxトランジスタが極小オフ電流であることから、書込みトランジスタMW1は、ノードSNの電荷を殆んどリークさせない。従って、oxメモリ回路11は不揮発性メモリ回路として機能でき、かつ多値化が容易である。よって、oxメモリ回路11を不揮発性アナログメモリ回路として、oxAIチップ120に設けることができる。
oxトランジスタに適用される金属酸化物は、Zn酸化物、Zn‐Sn酸化物、Ga‐Sn酸化物、In‐Ga酸化物、In‐Zn酸化物、In‐M‐Zn酸化物(Mは、Ti、Ga、Y、Zr、La、Ce、Nd、SnまたはHf)などがある。また、インジウムおよび亜鉛を含む酸化物に、アルミニウム、ガリウム、イットリウム、銅、バナジウム、ベリリウム、ホウ素、シリコン、チタン、鉄、ニッケル、ゲルマニウム、ジルコニウム、モリブデン、ランタン、セリウム、ネオジム、ハフニウム、タンタル、タングステン、またはマグネシウムなどから選ばれた一種、または複数種が含まれていてもよい。
oxトランジスタの信頼性、電気特性の向上のため、半導体層に適用される金属酸化物は、CAAC‐OS、CAC−OS、nc‐OSなどの結晶部を有する金属酸化物であることが好ましい。CAAC‐OSとは、c‐axis‐aligned crystalline metal oxide semiconductorの略称である。CAC‐OSとは、Cloud‐Aligned Composite metal oxide semiconductorの略称である。nc‐OSとは、nanocrystalline metal oxide semiconductorの略称である。
CAAC‐OSは、c軸配向性を有し、かつa‐b面方向において複数のナノ結晶が連結し、歪みを有した結晶構造となっている。なお、歪みとは、複数のナノ結晶が連結する領域において、格子配列の揃った領域と、別の格子配列の揃った領域との間で格子配列の向きが変化している箇所を指す。
CAC‐OSは、キャリアとなる電子(または正孔)を流す機能と、キャリアとなる電子を流さない機能とを有する。電子を流す機能と、電子を流さない機能とを分離させることで、双方の機能を最大限に高めることができる。つまり、CAC‐OSをoxトランジスタのチャネル形成領域に用いることで、高いオン電流と、極めて低いオフ電流との双方を実現できる。
書込みトランジスタMW1のバックゲート電圧を変化させることで、書込みトランジスタMW1のしきい値電圧を変化させることができる。書込みトランジスタMW1はバックゲートの無いoxトランジスタでもよい。読出しトランジスタMR1についても同様である。
金属酸化物は、エネルギーギャップが大きく、電子が励起されにくいこと、ホールの有効質量が大きいことなどから、oxトランジスタは、一般的なSiトランジスタと比較して、アバランシェ崩壊等が生じにくい場合がある。従って、例えばアバランシェ崩壊に起因するホットキャリア劣化等を抑制できる場合がある。ホットキャリア劣化を抑制できることで、高いドレイン電圧でoxトランジスタを駆動することができる。従って、書込みトランジスタMWがOSトランジスタであることで、ノードSNに高い電圧を印加することが可能になるため、oxメモリ回路11の多値化が容易である。
oxトランジスタは、電子を多数キャリアとする蓄積型トランジスタである。そのため、pn接合を有する反転型トランジスタ(代表的には、Siトランジスタ)と比較して短チャネル効果の一つであるDIBL(Drain‐Induced Barrier Lowering)の影響が小さい。つまり、oxランジスタは、Siトランジスタよりも短チャネル効果に対する高い耐性を有する。
oxトランジスタは、短チャネル効果に対する耐性が高いために、oxトランジスタの信頼性を劣化させずに、チャネル長を縮小できるので、oxトランジスタを用いることで回路の集積度を高めることができる。チャネル長が微細化するのに伴いドレイン電界が強まるが、上掲したように、oxトランジスタはSiトランジスタよりもアバランシェ崩壊が起きにくい。
また、oxトランジスタは、短チャネル効果に対する耐性が高いために、Siシリコン等トランジスタよりもゲート絶縁物を厚くすることが可能となる。例えば、チャネル長及びチャネル幅が50nm以下の微細なトランジスタにおいても、10nm程度の厚いゲート絶縁物を設けることが可能な場合がある。ゲート絶縁物を厚くすることで、寄生容量を低減することができるので、回路の動作速度を向上できる。またゲート絶縁物を厚くすることにで、リーク電流が低減されるため、静的消費電流の低減につながる。
図2Bに示すoxメモリ回路12はoxメモリ回路11の変形例であり、読出しトランジスタMW2がnチャネル型Siトランジスタである。読出しトランジスタMW2はpチャネル型Siトランジスタでもよい。
図2Cに示すoxメモリ回路13は、3トランジスタ型ゲインセルであり、書込みトランジスタMW3、読出しトランジスタMR3、選択トランジスタMS3、容量素子CS3を有する。トランジスタMW3、MR3、MS3はそれぞれバックゲートを有するoxトランジスタである。これらトランジスタの一部、または全てがバックゲートの無いoxトランジスタでもよい。
図2Dに示すoxメモリ回路14は、oxメモリ回路13の変形例である。読出しトランジスタMR4、選択トランジスタMS4はそれぞれnチャネル型Siトランジスタである。トランジスタMR4、MS4の一方または双方はpチャネル型Siトランジスタでもよい。
容量素子CS1の充放電によってデータを書き換えるため、oxメモリ回路11は原理的には書き換え回数に制約はなく、低エネルギーで、データの書き込みおよび読み出しが可能であり、データの保持に電力を消費しない。よって、oxメモリ回路11をoxAIチップ120に組み込むことで、低消費電力なAIチップを提供することが可能になる。oxメモリ回路12〜14もoxメモリ回路11と同様の特長を有する。
図3Aに、oxAIチップ120の回路部121Aの積層構造を模式的に示す。回路部121Aは積層構造をもち、Siトランジスタ層1011、配線層1012、oxトランジスタ層1013に大別される。oxトランジスタ層1013をSiトランジスタ層1011に積層して設けることができるため、oxAIチップ120の面積を小さくすることができる。
回路部121B(図3B参照)、回路部121C(図3C参照)のように、複数のoxトランジスタ層1013を設けてもよい。回路部121Cは、回路部121A、121Bと異なり、Siトランジスタ層1011が設けられていない。回路部121Cのoxトランジスタ層1013の数は、1層の場合がある。
oxAIチップ120のより具体的な回路構成は、実施の形態2で説明する。後述するように、oxAIチップ120の演算部を少ない素子数、配線数で演算部を構成することができるため、集積化に有利である。演算回路の集積化により、並列処理数を増やすことができるので、oxAIチップ120は、市販のGPUチップと同様、もしくはそれ以上の演算性能を実現できる可能性をもつ。
例えば、市販のGPUチップの動作周波数が3GHz、乗算の並列処理数が10である場合、GPUチップの演算性能は3×1012OPS(Operations Per Second)=3Tera OPS(TOPS)である。例えば、oxAIチップ120は、10乃至10個程度の演算回路を設けることができ、乗算の並列処理数を10乃至10とすることができる。この場合、oxAIの動作周波数を3MHz又は30MHzに低下しても、oxAIチップ120の演算性能はGPUと同程度である。動作周波数の低減は、ICチップの動的消費電力の削減に非常に有効である。
また、AIの演算など大規模な演算処理を行うため、GPUチップは高い周波数で駆動する。そのため、ことから,大電力を消費し、高温なる。oxAIチップ120は、動作周波数を低減できるため、oxAIチップ120の発熱を抑えることができる。したがって、半導体装置100において、oxAIチップ120の放熱機構をGPUチップのものよりも簡素にすることができる。
上掲したように、GPUチップは、演算性能の向上と、省電力化および発熱抑制との関係はトレードオフの関係である。これに対して、oxAIチップ120は、動作周波数を低減しても演算性能の劣化を少なくできる。したがって、oxAIチップ120は、時間および電力に対して高効率に、大規模な演算処理を実行することができる。
<<評価ボード>>
例えば、半導体装置100は、評価ボードとして用いることができる。図4A、図4Bは、評価ボードの構成例の斜視模式図である。
図4Aに示すように、評価ボード200のボード210には、様々な電子部品が組み込まれている。図4Aの例では、oxAIチップ220、メモリチップ231、232、FPGAチップ235、236、PCIeコネクタ240、USBコネクタ242、HDMI入力(RX)コネクタ244、HDMI出力(TX)コネクタ245を有する。
FPGAチップ236は、メモリ装置、CPUコアを含む。HDMI入力コネクタ244、HDMI出力コネクタ245に代えて、eDP入力コネクタ、eDP出力コネクタを設けてもよい。
oxAIチップ220は、コネクタ(図示されない)を使用して、ボード210と着脱可能となっている。例えば、別のアーキテクチャのoxAIチップ222、またはGPUチップ225を付け替えることができる。評価ボード200を用いて、AIの演算処理機能を持つ、複数種類のチップの性能および機能の確認を行うことができる。
図4Bに示す評価ボード202においては、oxAIチップは、専用のボード212に実装されている。ボード210には、コネクタ250A、250Bが設けられ、ボード212にはコネクタ252A、252Bが設けられている。コネクタ250A、250Bはそれぞれコネクタ250A、250Bと接続される。
<<電子機器>>
ここでは、oxAIチップが組み込まれた電子機器について説明する。
図15A、図15Bに、コンピュータ7000の一例を示す。図15Aに示すように、コンピュータ7000は、筐体7010、モニタ部7012、キーボード7013、ポート7015を有する。キーボード7013、ポート7015は筐体7010に設けられている。ポート7015としては、例えば、USBポート、LANポート、HDMIポートなどがある。
モニタ部7012は、開閉可能に筐体7010に取り付けられている。図15Aには、モニタ部7012が開いている状態が示され、図15Bには、モニタ部7012が閉じている状態を示す。例えば、モニタ部7012の最大開角度は135°程度である。
図15Bに示すように、筐体7010には開閉可能なカバー7011が設けられている。筐体7010内部には、複数の半導体装置100が着脱可能に組み込まれている。、筐体7010の内部には、半導体装置100を冷却する装置、または放熱する装置が設けられていてもよい。カバー7011を開けて、半導体装置100を交換することができるので、コンピュータ7000の拡張性は高い。コンピュータ7000に複数のoxAIチップを組み込むことで、様々なAIの処理を高速に行うことが可能になる。
図16に、半導体装置100が組み込まれた電子機器の他の例を示す。図16に示すロボット7100は、演算装置、照度センサ、マイクロフォン、カメラ、スピーカ、ディスプレイ、各種センサ(赤外線センサ、超音波センサ、加速度センサ、ピエゾセンサ、光センサ、ジャイロセンサなど)、および移動機構などを備える。演算装置の少なくとも半導体装置100を使用することができる。
マイクロフォンは、使用者の音声および環境音などの音響信号を検知する機能を有する。また、スピーカは、音声および警告音などの音響信号を発する機能を有する。ロボット7100は、マイクロフォンを介して入力された音響信号を演算装置で解析し、必要な音響信号をスピーカから発することができる。ロボット7100は、マイクロフォン、演算装置、およびスピーカを用いて、使用者とコミュニケーションをとることが可能である。
カメラは、ロボット7100の周囲を撮像する機能を有する。また、ロボット7100は、移動機構を用いて移動する機能を有する。ロボット7100は、カメラを用いて周囲の画像を撮像し、AIを用いて画像を解析して移動する際の障害物の有無などを察知することができる。
図16に示す飛行体7200は、演算装置、プロペラ、カメラ、およびバッテリなどを有し、自立して飛行する機能を有する。演算装置の少なくとも一部に半導体装置100を使用することができる。
例えば、飛行体7200は、カメラを用いて周囲の画像を撮像し、半導体装置100を用いて画像を解析し、移動する際の障害物の有無などを察知することができる。また、AIによってバッテリの蓄電容量の変化から、バッテリ残量を推定することができる。
図16に示す掃除ロボット7300は、演算装置、上面に配置されたディスプレイ、側面に配置された複数のカメラ、ブラシ、操作ボタン、各種センサなどを有する。演算装置の少なくとも一部に半導体装置100を使用することができる。図示されていないが、掃除ロボット7300には、タイヤ、吸い込み口等が備えられている。掃除ロボット7300は自走し、ゴミを検知し、下面に設けられた吸い込み口からゴミを吸引することができる。
例えば、掃除ロボット7300はカメラが撮影した半導体装置100で解析し、壁、家具または段差などの障害物の有無を判断することができる。また、画像解析により、配線などブラシに絡まりそうな物体を検知した場合は、ブラシ5103の回転を止めることができる。
掃除ロボット7300は、半導体装置100を用いて、バッテリの残量や吸引したゴミの量などから活動可能な残り時間などを推測することができる。また、掃除ロボット7300は、走行を繰り返しながら自身の軌跡を学習し、効率の良い走行経路を導き出すことができる。
図16に示すスマートフォン7400(携帯情報端末)は、演算装置、マイクロフォン、カメラ、スピーカ、およびディスプレイを有する。演算装置の少なくとも一部に半導体装置100を使用することができる。また、スマートフォン7400に各種センサを設けてもよい。
半導体装置100はスマートフォン7400の使用頻度、使用方法などを基に学習し、バッテリ残量などを推定する機能を有する。また、使用者の使用方法などを学習して使用者の動作を予測し、使い易さを高めることができる。
図16に示す自動車7500は、エンジン、タイヤ、ブレーキ、操舵装置などの他に、演算装置、各種センサなどを有する。演算装置の少なくとも一部に半導体装置100を使用することができる。例えば、半導体装置100は、ナビゲーション情報、速度、エンジンの状態、ギアの選択状態、ブレーキの使用頻度などの情報を用いて学習することで、自動車7500の走行状態を最適化するための制御を行う。
自動車7500に進行方向を撮影するカメラを設け、撮影した画像を半導体装置100で解析して障害物の有無を判断し、安全性を高めることができる。
図16に示すゲーム機7600は、演算装置、筐体、表示部、カメラ、マイクロフォン、スピーカ、操作キー等を有する。演算装置の少なくとも一部に半導体装置100を使用することができる。ゲーム機7600は、使用者をカメラで撮影し、撮影した画像から使用者を特定することができる。
ゲーム機7600は、使用者の使用状態を学習し、ソフトウエアと連動してゲームの進行などを変更できる。また、使用者をカメラで撮影し、撮影した画像から使用者の疲労具合を検出し、表示部に警告を表示することもできる。また、半導体装置100はバッテリの蓄電容量の変化から、バッテリ残量を推定する機能を有する。
図16に示すノート型パーソナルコンピュータ7700は、演算装置、筐体、表示部、キーボード、ポインティングデバイスなどを有する。演算装置の少なくとも一部に半導体装置100を使用することができる。
oxAIチップ120は、大規模な並列演算処理を低消費電力で可能なため、使用できる電力に制約がある電子機器(例えば、スマートフォン)に組み込むことが容易である。
物体認識、音声認識、翻訳など、AIが成果を上げている分野が広がっている。例えば、スマートフォンで音声認識を行う場合、通常、スマートフォンは音声データを取得するだけで、AIを用いた音声認識処理はクラウド側のコンピューティングシステムが行う。つまり、クラウド側のコンピューティングシステムの処理が終わらないと、スマートフォンでの処理を行えない。よって、半導体装置100を組み込むことで、スマートフォンにおいて、AIによって音声データをリアルタイムで処理することが可能になる。このように、半導体装置100は、エッジコンピューティングの発展に寄与することができる。
〔実施の形態2〕
本実施の形態では、oxAIチップの具体的な構成例を説明する。
<<アナログoxAIチップ>>
ここでは、アナログ演算を利用した超並列コンピューティングが可能なoxAIチップ400について説明する。oxAIチップ400は、全結合型ニューラルネットワーク(FCNN)に非常に有利である。oxAIチップ400の構成例、動作方法例の理解を容易にするため、図5に示すFCNNが回路によって構成されているとする。図5に示すFCNNは、1個の隠れ層をもつ。入力層、隠れ層、出力層のユニット数はそれぞれ1024、128、32である。活性化関数にはReLU(Rectified Liner Unit)が用いられている。oxAIチップ400のFCNNは、例えば、手書き文字認識、汎用AIに適用される。
図6は、oxAIチップ400の構成例を示す機能ブロック図である。図6に示すoxAIチップ400は、レシーバ(RX)401、デジタル‐アナログコンバータ(DAC)403、404、積和演算回路(MAC)アレイ405、406、ゲートドライバ407、デジタル‐アナログコンバータ(DAC)408、トランスミッタ(TX)409を有する。
oxAIチップ400のデータ伝送方式は差動伝送方式である。例えば、レシーバ401として、LVDS(小振幅差動伝送方式:Low Voltage Differential Signaling)レシーバが用いられ、トランスミッタ409としてLVDSトランスミッタが用いられる。
リセット信号rest_nは、oxAIチップ400をリセットする。
データin_w[7:0]は、学習済みデータである。例えば、重み係数を表す8ビットデジタル信号である。イネーブル信号en_la_w、クロック信号dclk_wに従い、DAC404は、データin_w[7:0]をアナログデータに変換する。ゲートドライバ407は、MACアレイ405、406へのアナログデータの書込みを制御する。ゲートドライバ407には、クロック信号gclk、パルス幅制御信号gpwc、スタートパルス信号gspが入力される。
oxAIチップ400が処理するデータは8ビットデジタルデータであり、差動伝送方式で入力される。例えば、レシーバ401として、LVDS(小振幅差動伝送方式:Low Voltage Differential Signaling)レシーバが用いられる。レシーバ401は、差動クロック信号rx_clp、rx_clnに従い、入力データrx_dp[7:0]、rx_dn[7:0]をシングルエンド形式の8ビットデータに変換する。DAC403は、この8ビットデータをアナログデータに変換する。DAC404から出力されるアナログデータは、逐次MACアレイ405に書き込まれる。
<MACアレイ405、406>
図7を参照して、MACアレイ405の回路構成例を説明する。MACアレイ405には、1024行144列の行列状に乗算回路40が設けられている。乗算回路40は、図2Bのoxメモリ回路12と同じ回路構成である。つまり、乗算回路40は、演算回路と、重み係数を記憶する不揮発性ローカルメモリ回路双方の機能を持つ。このことにより、oxAIチップ400は、GPUと比べて非常に少ないトランジスタ数によって、超並列演算を実現できる。トランジスタ数の低減は、oxAIチップ400の小型化、消費電力の低減につながる。
MACアレイ405には、乗算回路40の配列に応じて、ゲート線GL1、データ線VX1、WD1、RD1が設けられている。データ線WD1は重み係数データを乗算回路40に入力するための配線である。データ線WD1には、DAC403からアナログデータが入力される。ゲート線GL1は、重み係数データを入力する乗算回路40を選択するための信号線である、ゲート線GL1は、ゲートドライバ407によって駆動される。
乗算回路40に重み係数データw0を書き込むことで、乗算回路40の保持ノード(読出しトランジスタのゲート)の電圧は、重み係数データに応じた電圧Vw0となる。
データ線VX1は、CFNNが処理するデータの入力用配線である。データ線VX1には、DAC402からアナログデータが入力される。データ線RD1には、乗算回路40の演算結果が読みだされる。データ線RD1には、電流源42、オフセット回路43が電気的に接続されている。
乗算回路40に流れる電流I0は、保持ノードの電圧Vx0とデータ線RD1の電圧Vx0の積に比例する。つまり、電流I0は、重み係数と入力データの積を表している。同様に、電流I1は、保持ノードの電圧Vw1と電圧Vx1との積に比例する。つまり乗算回路40は、重み係数データと入力データとの積を計算することができる。
データ線RD1あたり1024個の乗算回路40が電気的に接続されている。電流源42は参照電流Irefを生成する。オフセット回路43に入力される電流Ioutは、参照電流Irefと電流Imacとの差分である。電流Imacは、1024個の乗算回路40を流れる電流の総和であり、重み係数と入力データとの積和した値を表す。参照電流IrefとImacとの差分ととることで、電流Ioutのノイズ成分を低減できる。
オフセット回路43は、電流Ioutを電圧Voutに変換し、参照電圧Vrefと電圧Voutとの差分をとる。これにより、電圧Voutのノイズ成分が低減される。オフセット回路43、VrefとVoutとの差分電圧を増幅して、活性化関数回路44に出力する。活性化関数回路44は処理したデータをMACアレイ405に出力する。
なお、MACアレイ405の144列のうちの16列は、電流Ioutの生成に寄与せず積和演算に用いられる参照データを保持する。
MACアレイ406は、MACアレイ405と同様の構成である。乗算回路40が36行128列の行列状に配置されている。MACアレイ406において、36行のうちの4行は、電流Ioutの生成に寄与せず、参照データの保持に用いられる。
図6に示すイネーブル信号en_cmは、MACアレイ405、406の電流源42用のイネーブル信号である。イネーブル信号en_absは、MACアレイ405、406のオフセット回路43用のイネーブル信号であり、信号osp1、osn1、en_res1はMACアレイ405のオフセット回路43の制御信号であり、信号osp2、osn2、en_res2はMACアレイ406のオフセット回路43の制御信号である。
<ADC408、TX409>
ADC408には、MACアレイ406から32のアナログデータが並列に入力される。ADC408は、シリアルパラレル変換を行うため、出力段にレジスタを備える。ADC408は、1チャネルの8ビットデジタルデータを出力する。
信号clk_sar、res_sar、go、stby_adcは、それぞれ、ADC408用のクロック信号、リセット信号、イネーブル信号、スタンバイ信号である。信号dclk_p2s、en_p2s_per、en_p2s_serは、それぞれ、レジスタ用のクロック信号、ラッチ信号、出力イネーブル信号である。ADC408には、32のアナログデータが入力され、8ビットデジタルデータをトランスミッタ409へ出力する。信号stby_txはトランスミッタ409用のスタンバイ信号である。
トランスミッタ409は、信号dclk_p2sに応じて、8ビットデジタルデータを差分形式のデータtx_dp[7:0]、tx_dn[7:0]に変換し、出力し、信号dclk_p2sを差分形式のクロック信号tx_clp、tx_clnに変換し、出力する。差分データtx_dp[7:0]、tx_dn[7:0]は、FCNNが取得した32種類の推論データである。
MACアレイ405、406の入力および出力データはアナログデータであるので、入出力データがデジタルデータである場合と比較し、MACアレイ405、406の配線数を大幅に低減することができる。乗算回路40は、乗算機能と、重み係数データの保持機能双方を備えるため、演算時にデータを読み込むことがない。つまり、乗算回路40は、データの授受の時間ペナルティーおよび電力ペナルティーが実質的にない。
並列処理アーキテクチャをもつプロセッサとしてGPUが知られている。GPUも、CPUと同様に、演算部とメモリ部間のデータ授受が演算効率のボトルネックとされている。これに対して、oxAIチップ400はこのような問題点がない。
乗算回路40は、2Tゲインセルと同じ回路構成であり、少ないトランジスタ数によって、アナログデータの掛け算を行うことができる。したがって、多数の乗算回路40を用いて、積和演算部を構成することで、低消費電力で、超並列演算処理が可能なoxAIチップ400を提供することができる。例えば、乗算回路40の数が10乃至10個程度であり、動作周波数3MHz又は30MHzである場合、oxAIチップ400の演算性能は、3TOPS(Tere Operations Per Second)乃至3POPS(Peta OPS)程度である。
<<プログラマブルoxAIチップ>>
ここで示すoxAIチップ450は、プログラマブルNNを構成できる。oxAIチップ450が演算するデータの形式はデジタルである。oxAIチップ450の演算回路は、専用の不揮発性ローカルメモリ回路を有し、不揮発性ローカルメモリはoxメモリ回路で構成されている。oxAIチップ450のNNは、例えば、各種画像処理(例えば、ノイズ除去、高解像度化)、物体認識、汎用AIとして用いることができる。
図8は、oxAIチップ450の構成例を示す機能ブロック図である。oxAIチップ450は、コントローラ460、I2Cモジュール462、レシーバ(RX)463、トランスミッタ(TX)464、データドライバ466、ワードドライバ467を有する。コントローラ460は、演算回路アレイ470、演算部471、SRAM472、セレクタ474、475、デマルチプレクサ476を有する。
oxAIチップ450の入力データには、動作設定データ、学習済みデータ、パイプライン構造データ、演算回路アレイ470が処理するデータがある。学習済みデータ、パイプライン構造データは、コントローラ460のコンフィギュレーションデータとして、oxAIチップ450に入力される。
データsdaはシリアル形式の動作設定データであり、I2Cモジュール462に書き込まれる。I2Cモジュール462は、書き込まれた動作設定データをコントローラ460に出力する。信号i2c_clk、i2c_resetb、sclは、それぞれ、I2Cコントローラ用クロック信号、I2Cリセット信号、I2Cクロック信号である。信号O_SAVE、O_LOAD、OS_USEは、動作設定データのバックアップ制御に用いられる。
データDATA0は、データドライバ466に入力される。データDATA0はコンフィグレーションデータである。データドライバ466からは信号nSTATUSが出力される。信号nSTATUSは、コンフィギュレーション状態をあらわす信号である。
oxAIチップ450へのデータ伝送方式には、シングルエンド方式と、LVDS方式とが可能である。データdin[7:0]はシングルエンド方式の入力データであり、セレクタ474に入力される。レシーバ463は、oxAIチップ400のレシーバと同様の構成であり、差動クロック信号rx_clp、rx_clnに従い、差動入力データrx_dp[7:0]、rx_dn[7:0]をシングルエンド方式のデータrx_ds[7:0]に変換し、セレクタ474に出力する。信号stby_rx、hpe_rxはそれぞれ、はレシーバ463のスタンバイ信号である。
信号nCONFIG、DCLKがコントローラ460に入力され、コントローラ460は信号CONF_DONEを出力する。信号nCONFIG、DCLKはそれぞれ、コンフィギュレーション開始信号、コンフィギュレーション用クロック信号である。信号CONF_DONEはコンフィギュレーションが完了したことを表す信号である。
信号sys_clk、sys_resetb、user_resetb、context_ex[5:0]はシステムクロック信号、システムリセット信号、ユーザリセット信号、外部コンテキスト信号である。信号data_enは、コントローラ460への入力データの伝送を実行する期間を設定する信号である。これらの信号は、コントローラ460に入力される。コントローラ460は信号State[2:0]、sabstate[2:0]を出力する。信号State[2:0]、sabstate[2:0]はそれぞれコントローラ460内部の状態、サブ状態をあらわす。
演算回路アレイ470には、セレクタ475の出力データが入力される。演算回路アレイ470は処理したデータを演算部471に出力する。演算部471の出力データはSRAM472で一時的に記憶される。SRAM472から読み出されたデータは、セレクタ475、デマルチプレクサ476に出力される。セレクタ475は、セレクタ474の出力データ、SRAM473の出力データの何れか一方を演算回路アレイ470に出力する。
デマルチプレクサ476は、データの出力形式を選択する機能をもつ。デマルチプレクサ476の一方の出力データは、シングルエンド形式のデータdout[7:0]としてoxAIチップ450外部に出力される。他方の出力データはトランスミッタ464で処理され、差動形式のデータtx_dp[7:0]、tx_dn[7:0]に変換され、oxAIチップ450外部に出力される。
<演算回路アレイ470>
図9〜図13を参照して、演算回路アレイ470について説明する。図9に示すように、演算回路アレイ470は、複数の演算回路21、複数のスイッチ回路22が行列状に設けられている。演算回路21、スイッチ回路22はプログラマブル回路である。演算回路アレイ470の処理内容に合わせて、演算回路21は回路構成される。演算回路アレイ470の処理内容に合わせて、スイッチ回路22の回路構成を変更することにより、演算回路21の接続関係が変更される。
なお、図9中の「U」、「D、「L」、「R」はスイッチ回路22の配線の名称であり、かつ接続方向(上、下、左、右)を表している。
図10に演算回路21の構成例を示す。演算回路21は、入力レジスタ51、メモリ回路52、乗算回路53、加算回路54、出力レジスタ55A、55B、セレクタ56A〜56D、メモリ回路57A〜57Cを有する。メモリ回路52、57A〜57Cは、演算回路21の不揮発性ローカルメモリ回路であり、oxメモリ回路が適用されている。
入力レジスタ51には、データsinが入力される。入力レジスタ51はラッチ信号slatの制御でデータsinを保持する。入力レジスタ51は、保持データをデータsoutとして、セレクタ56Aに出力する。メモリ回路57Aの出力信号に従い、セレクタ56Aは、データsinとデータsoutの何れか一方を選択し、選択したデータを乗算回路53に出力する。データsoutは、演算回路21の外部に出力される。入力レジスタ51を設けることで、データsinを入力レジスタ51で一時的に保持することで、データsinをシフトしたデータsoutを出力することができる。
メモリ回路52は、コンテキスト信号contex_W[1:0]が入力される。コンテキスト信号contex_W[1:0]は、信号contex_ex[5:0]をデコードすることで生成される内部信号である。メモリ回路52は複数の重み係数データを記憶している。重み係数データは、コンフィギュレーションデータとして、メモリ回路52に書き込まれている。コンフィギュレーションデータはデータドライバ446から伝送される。
図11Aに示すように、メモリ回路52は、フリップフロップ71、デコーダ72、メモリセル73_0〜73_3、トランジスタ77、ラッチ回路78を有する。メモリセル73_0〜73_3は、oxメモリ回路13(図2C参照)と同じ回路構成であり、3個のoxトランジスタでなるゲインセルである。
信号word0〜word3はワードドライバ67で生成される。信号word0〜word3によって1個のメモリセルが選択され、選択されたメモリセルにコンフィギュレーションデータが書き込まれる。
フリップフロップ71は、コンテキスト信号context_W[1:0]を保持するする。デコーダ72は、コンテキスト信号context_W[1:0]をデコードして、切替え信号context_W0〜context_W3を生成し、出力する。機能を有する。切替え信号context_W0〜context_W3は、重み係数データを出力するメモリセルを選択する機能を持つ。選択されたメモリセルから読み出された重みデータは、データcmoutとして、乗算回路53へ出力される。トランジスタ77は、データcmoutが読みだされる配線を電圧Vpreにプリチャージする機能を持つ。信号prchに従い、トランジスタ77は当該配線をプリチャージする。
図11Bにメモリセルの他の構成例を示す。図11Bに示すメモリセル74は、メモリセル73_0の変形例であり、読出しトランジスタのゲートに2個のインバータ回路でなるラッチ回路が設けられている。例えば、これらインバータ回路は、nチャネル型Siトランジスタとpチャネル型SiトランジスタでなるCMOS回路である。
図12にメモリ回路57Aの構成例を示す。メモリ回路57Aは、メモリセル91_0、91_1、トランジスタ92_0、92_1、93を有する。メモリ回路57Aには、コンフィギュレーションデータ、切替え信号context_A0、context_A1、信号wordA0、wordB0、wordA1、wordB1が入力される。
メモリセル91_0、91_1は、それぞれ、2個のoxメモリ回路12(図2B)で構成される。メモリセル91_0にコンフィギュレーションデータ“1”を書き込む場合は、信号wordA0を“H”にし、信号wordB0、wordA1、wordB1を“L”にする。メモリセル91_1にコンフィギュレーションデータ“0”を書き込む場合は、信号wordB0を“H”にし、信号wordA0、wordA1、wordB1を“L”にする。
セレクタ56Aへ制御信号する間は、トランジスタ93はオフ状態である。切替え信号context_A0、context_A1により、トランジスタ92_0、92_1の何れか一方がオン状態になる。例えば、トランジスタ92_0がオンになると、メモリセル91_0の保持データに応じた論理の制御信号が、セレクタ56Aに出力される。
メモリ回路57B、57Cは、メモリ回路57Aと同じ回路構成をもつ。
乗算回路53は、データsdataとデータcmoutとの積を計算し、計算結果を表すデータmoutを生成する。データmoutは、加算回路54およびセレクタ56Bに出力される。
データainは、他の演算回路21の出力データ、または、セレクタ475の出力データである。加算回路54は、データainとデータmoutとの和を計算し、計算結果を表すデータaoutを生成する。データaoutはセレクタ56Bに出力される。
出力レジスタ55Aはセレクタ56Bの出力データを保持し、出力レジスタ55Bはセレクタ56Cの出力データを保持する。出力レジスタ55A、55Bを設けることで、信号遅延による演算エラーを防ぐことができる。信号res_rgは、出力レジスタ55A、55Bのリセット信号である。
出力レジスタ55Aは保持データをセレクタ56Dに出力する。セレクタ56Dまたは出力レジスタ55Bの出力データが、データsoutとして演算回路21から出力される。
演算回路アレイ470には演算回路21が行列状に配列されているので、演算回路アレイは、積和演算装置として機能させることができる。
演算回路アレイ470の出力データは、演算部471に入力される。例えば、演算部471は、活性化関数の機能および/またはプーリング層の機能を持つ。
<スイッチ回路22の構成>
図13A、図13Bを参照して、スイッチ回路22を説明する。図13Aに示すように、スイッチ回路22には、8個のスイッチ回路25が設けられている。データsoutの出力用配線26Sは、配線U、D、L、Rのうちの何れか1に電気的に接続される。データacoutの出力用配線26Aについても同様である。
図13Bに示すように、スイッチ回路25は、フリップフロップ80、デコーダ81、メモリセル83_0、83_1、配線87を有する。配線87は、配線L、R、UまたはDのいずれかの配線である。図13Bには、4ビットデータを伝えるためのスイッチ回路25を図示している。
フリップフロップ80は、コンテキスト信号context_Cを保持する。デコーダ72は、コンテキスト信号context_Cをデコードして、切替え信号context_C0、context_C1を生成する。メモリセル83_0には信号context_C0、word0が入力され、メモリセル83_1には信号context_C0、word1が入力される。
メモリセル83_0の書込みトランジスタは、バックゲートを有するoxトランジスタである。メモリセル83_0において、バックゲートを有さないnチャネル型トランジスタはSiトランジスタである。なお、メモリセル83_0の全てのトランジスタがoxトランジスタであってもよい。メモリセル83_1についても堂々である。
信号word0によって、書込みトランジスタをオン状態にすることで、メモリセル83_0へコンフィギュレーションデータが書き込まれる。切替え信号context_C0によって、メモリセル83_0が選択される場合、メモリセル83_0が保持しているコンフィギュレーションデータに応じて、配線87と演算回路21間の接続状態が決定される。
演算回路21およびスイッチ回路22は不揮発性ローカルメモリ回路を内蔵しているため、回路21、22は、演算中にoxAIチップ450の外部のメモリ装置にアクセスする必要がない。よって、oxAIチップ450もoxAIチップ400と同様に演算部とメモリ部間のデータ授受が演算効率のボトルネックにならない。演算回路21間でデータの受け渡しと、演算処理とが逐次実行されるため、演算を高効率に行える。
演算回路21およびスイッチ回路22がマルチコンテキスト方式のプログラマブルな回路であるため、少ないハードウエハ資源で、超並列演算処理を効率よく実行することが可能である。また、様々なNNをoxAIチップ450のハードウエアによって実現することができる。例えば、図14に示すような畳み込みNNをoxAIチップ450のハードウエハで実現することができる。図14の数値は、層のサイズ、深さ(チャネル数)を表している。例えば、入力層の幅W、高さH、チャネル数Mは、それぞれ38、24、1である。入力層のフィルタのサイズW×H×Mは3×3×1である。
11、12、13、14:oxメモリ回路、
100:半導体装置、 110:データバス、 112:I/O(入出力)インターフェース、 114:メモリ部、 115:FPGAチップ、120:oxAIチップ、
121A、121B、121C:回路部、 150:周辺機器、
200、202:評価ボード、 202:評価ボード、 210、212:ボード、
220、222:oxAIチップ、 225:GPUチップ、 231、232:メモリチップ、 235、236:FPGAチップ、 240:PCIeコネクタ、 242:USBコネクタ、 244:HDMI入力コネクタ、 244:HDMI入力コネクタ、 245:HDMI出力コネクタ、
250A、250B、252A、252B:コネクタ

Claims (1)

  1. 第1プロセッサチップと、
    第2プロセッサチップと、
    メモリ部と、
    データバスと、を有し、
    前記第1プロセッサチップ、前記第2プロセッサチップ、および前記メモリ部は、それぞれ、前記データバスと電気的に接続され、
    前記第1プロセッサチップは、人工知能の演算を行う演算回路アレイを有し、
    前記演算回路アレイは、複数の演算回路を有し、
    前記演算回路は、複数のメモリ回路を有し、
    前記複数のメモリ回路は、それぞれ、複数のメモリセルを有し、
    前記複数のメモリセルは、それぞれ、保持ノードと、前記保持ノードへのデータの書き込みを制御するトランジスタを有し、
    前記トランジスタのチャネル形成領域は金属酸化物を有し、
    前記第2プロセッサチップは、CPUコアを有することを特徴とする半導体装置。
JP2017154880A 2017-08-10 2017-08-10 半導体装置 Active JP6953229B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017154880A JP6953229B2 (ja) 2017-08-10 2017-08-10 半導体装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017154880A JP6953229B2 (ja) 2017-08-10 2017-08-10 半導体装置

Publications (2)

Publication Number Publication Date
JP2019033234A JP2019033234A (ja) 2019-02-28
JP6953229B2 true JP6953229B2 (ja) 2021-10-27

Family

ID=65524442

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017154880A Active JP6953229B2 (ja) 2017-08-10 2017-08-10 半導体装置

Country Status (1)

Country Link
JP (1) JP6953229B2 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274661A (ja) * 1993-03-18 1994-09-30 Hitachi Ltd シナプス回路およびそれを用いたニューラルネットワークシステム
JP3737841B2 (ja) * 1995-08-22 2006-01-25 株式会社ジャストシステム ニューラルネットワーク
US7533071B2 (en) * 2005-06-28 2009-05-12 Neurosciences Research Foundation, Inc. Neural modeling and brain-based devices using special purpose processor
KR101979758B1 (ko) * 2010-08-27 2019-05-17 가부시키가이샤 한도오따이 에네루기 켄큐쇼 기억 장치, 반도체 장치
US10679017B2 (en) * 2015-04-21 2020-06-09 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and system thereof
JP6674838B2 (ja) * 2015-05-21 2020-04-01 株式会社半導体エネルギー研究所 電子装置
KR20170025715A (ko) * 2015-08-31 2017-03-08 에스케이하이닉스 주식회사 시냅스 및 이를 포함하는 뉴로모픽 장치
KR20230169441A (ko) * 2015-10-23 2023-12-15 가부시키가이샤 한도오따이 에네루기 켄큐쇼 모듈 및 전자 기기
US11521070B2 (en) * 2015-10-29 2022-12-06 Preferred Networks, Inc. Information processing device and information processing method

Also Published As

Publication number Publication date
JP2019033234A (ja) 2019-02-28

Similar Documents

Publication Publication Date Title
CN111033438B (zh) 运算装置及电子设备
JP7504964B2 (ja) 半導体装置
JP6545541B2 (ja) 撮像装置、監視装置、及び電子機器
TWI672045B (zh) 攝像裝置、監視裝置、以及電子裝置
JP2019046199A (ja) プロセッサ、および電子機器
JP7234110B2 (ja) メモリセル及び半導体装置
JP7179740B2 (ja) 電子機器
JP7337782B2 (ja) 半導体装置
JP7110223B2 (ja) 給電装置およびその動作方法
CN113593622B (zh) 存内计算装置及运算装置
JP2019033233A (ja) 半導体装置、および電子機器
US11908947B2 (en) Semiconductor device
JP6953229B2 (ja) 半導体装置
KR20220072005A (ko) 멀티플렉서 및 이를 포함하는 반도체 장치
JP2019046337A (ja) 半導体装置
JP2017527942A (ja) メモリ・デバイスのためのバス回路
JP7581209B2 (ja) 半導体装置
US20220276839A1 (en) Semiconductor device
US20230040508A1 (en) Semiconductor device
JP7582957B2 (ja) 半導体装置および判定システム
US20220384433A1 (en) Semiconductor device
CN112836812A (zh) 基于浮栅晶体管的神经元网络
Suárez et al. Offset-compensated comparator with full-input range in 150nm FDSOI CMOS-3D technology

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210929

R150 Certificate of patent or registration of utility model

Ref document number: 6953229

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250