Nothing Special   »   [go: up one dir, main page]

JP2019033233A - Semiconductor device, and electronic equipment - Google Patents

Semiconductor device, and electronic equipment Download PDF

Info

Publication number
JP2019033233A
JP2019033233A JP2017154879A JP2017154879A JP2019033233A JP 2019033233 A JP2019033233 A JP 2019033233A JP 2017154879 A JP2017154879 A JP 2017154879A JP 2017154879 A JP2017154879 A JP 2017154879A JP 2019033233 A JP2019033233 A JP 2019033233A
Authority
JP
Japan
Prior art keywords
data
transistor
chip
circuit
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2017154879A
Other languages
Japanese (ja)
Inventor
山崎 舜平
Shunpei Yamazaki
舜平 山崎
黒川 義元
Yoshimoto Kurokawa
義元 黒川
青木 健
Takeshi Aoki
健 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Semiconductor Energy Laboratory Co Ltd
Original Assignee
Semiconductor Energy Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Semiconductor Energy Laboratory Co Ltd filed Critical Semiconductor Energy Laboratory Co Ltd
Priority to JP2017154879A priority Critical patent/JP2019033233A/en
Publication of JP2019033233A publication Critical patent/JP2019033233A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Thin Film Transistor (AREA)
  • Semiconductor Memories (AREA)
  • Non-Volatile Memory (AREA)

Abstract

To provide a novel semiconductor device capable of arithmetic processing of AI (artificial intelligence).SOLUTION: A semiconductor device has a first processor chip, a memory, and a data bus. The first processor chip and the memory are electrically connected with the data bus, respectively. The first processor chip has an arithmetic circuit array performing calculation of AI, and the arithmetic circuit array has multiple arithmetic circuits. Each of multiple arithmetic circuits has a first transistor, a second transistor, a capacitive element, and a holding node. The first transistor has a function for controlling the writing of data in the holding node, and the channel formation region thereof has a metal oxide. The gate of the second transistor is electrically connected with the holding node, and the capacitive element is electrically connected with the holding node. Furthermore, the semiconductor device may have a second processor chip having an FPGA.SELECTED DRAWING: Figure 1

Description

例えば、本発明の一態様は、半導体装置、半導体装置を有する電子機器に関する。 For example, one embodiment of the present invention relates to a semiconductor device and an electronic device including the semiconductor device.

なお、本明細書において、半導体装置とは、半導体特性を利用することで機能しうる装置全般を指す。トランジスタ、半導体回路、演算装置、記憶装置等は半導体装置の一態様である。また、表示装置、撮像装置、電気光学装置、発電装置(薄膜太陽電池、有機薄膜太陽電池等を含む)、及び電子機器は半導体装置を有している場合がある。 Note that in this specification, a semiconductor device refers to all devices that can function by utilizing semiconductor characteristics. A transistor, a semiconductor circuit, an arithmetic device, a memory device, or the like is one embodiment of a semiconductor device. In addition, a display device, an imaging device, an electro-optical device, a power generation device (including a thin film solar cell and an organic thin film solar cell), and an electronic device may include a semiconductor device.

チャネル形成領域に金属酸化物を有するトランジスタ(以下、「金属酸化物トランジスタ」、「酸化物半導体トランジスタ」、または「oxトランジスタ」と呼ぶ場合がある)が知られている。oxトランジスタはオフ電流が極めて小さい。メモリセルの書込みトランジスタをoxトランジスタで構成することで、保持特性の優れたメモリセルを提供することが可能である。例えば、非特許文献1には、oxトランジスタを用いた多値NOSRAM(登録商標)が開示されている。 A transistor having a metal oxide in a channel formation region (hereinafter may be referred to as a “metal oxide transistor”, an “oxide semiconductor transistor”, or an “ox transistor”) is known. The ox transistor has an extremely small off-state current. By configuring the write transistor of the memory cell with an ox transistor, it is possible to provide a memory cell with excellent retention characteristics. For example, Non-Patent Document 1 discloses a multi-value NOSRAM (registered trademark) using an ox transistor.

なお、本明細書では、NOSRAMとは、メモリセルが2トランジスタ型(2T)、又は3トランジスタ型(3T)ゲインセルであり、メモリセルの書込みトランジスタがoxトランジスタであるメモリ装置のことをいう。なお、「NOSRAM」とは、[Nonvolatile Oxide Semiconductor RAM]の略称である。 Note that in this specification, NOSRAM refers to a memory device in which a memory cell is a two-transistor (2T) or three-transistor (3T) gain cell, and a write transistor of the memory cell is an ox transistor. Note that “NOSRAM” is an abbreviation for [Nonvolatile Oxide Semiconductor RAM].

近年、人工知能(AI)分野の技術発展が著しい。特許文献1には、oxトランジスタが用いられ、ニューラルネットワークを構成することが可能な半導体装置が記載されている。 In recent years, technological development in the field of artificial intelligence (AI) has been remarkable. Patent Document 1 describes a semiconductor device that uses an ox transistor and can constitute a neural network.

特開2016−219011号公報JP 2016-219011 A

T.Matsuzaki et al.,“A 128kb 4bit/Cell Nonvolatile Memory with Crystalline In−Ga−Zn Oxide FET Using Vt Cancel Write Method,”ISSCC Dig.Tech.Papers,2015,pp.306―307.T.A. Matsuzaki et al. "A 128 kb 4 bit / Cell Nonvolatile Memory with Crystalline In-Ga-Zn Oxide FET Using Vt Cancel Write Method," ISSCC Dig. Tech. Papers, 2015, pp. 306-307.

例えば、本発明の一形態の課題は、oxトランジスタを有する新規な半導体装置を提供すること、またはAIの演算が可能な低消費電力半導体装置を提供することである。 For example, an object of one embodiment of the present invention is to provide a novel semiconductor device having an ox transistor, or to provide a low power consumption semiconductor device capable of calculating AI.

本発明の一形態は、例示した全ての課題を解決する必要はない。複数の課題の記載は互いの課題の存在を妨げるものではない。例示した以外の課題は本明細書等の記載から自ずと明らかになり、これらの課題も本発明の一形態の課題となり得る。 One embodiment of the present invention need not solve all of the problems illustrated. The description of a plurality of tasks does not disturb the existence of each other's tasks. Problems other than those illustrated will be apparent from the description of this specification and the like, and these problems may also be a problem of one embodiment of the present invention.

複数の課題の例示は、互いの課題の存在を妨げるものではない。本発明の一形態は、例示した全ての課題を解決する必要はない。また、列記した以外の課題が、本明細書等の記載から、自ずと明らかとなるものであり、このような課題も、本発明の一形態の課題となり得る。 The illustration of a plurality of issues does not preclude the existence of each other's issues. One embodiment of the present invention need not solve all of the problems illustrated. In addition, problems other than those listed will become apparent from the description of the present specification and the like, and such problems may also be a problem of one embodiment of the present invention.

(1)本発明の一形態は、第1プロセッサチップと、メモリ部と、データバスとを有する半導体装置であり、第1プロセッサチップ、およびメモリ部は、それぞれ、データバスと電気的に接続され、第1プロセッサチップは、人工知能の演算を行う演算回路アレイを有し、演算回路アレイは、複数の演算回路を有し、演算回路は、複数のメモリ回路を有し、複数のメモリ回路は、それぞれ、複数のメモリセルを有し、複数のメモリセルは、それぞれ、保持ノードと、保持ノードへのデータの書き込みを制御するトランジスタを有し、トランジスタのチャネル形成領域は金属酸化物を有する。 (1) One embodiment of the present invention is a semiconductor device including a first processor chip, a memory unit, and a data bus, and the first processor chip and the memory unit are electrically connected to the data bus, respectively. The first processor chip includes an arithmetic circuit array that performs artificial intelligence operations, the arithmetic circuit array includes a plurality of arithmetic circuits, the arithmetic circuit includes a plurality of memory circuits, and the plurality of memory circuits include Each of the plurality of memory cells includes a holding node and a transistor that controls writing of data to the holding node, and a channel formation region of the transistor includes a metal oxide.

(2)上記形態(1)において、保持ノードは、アナログデータが書き込まれる。 (2) In the above form (1), analog data is written in the holding node.

(3)本発明の一形態は、第1プロセッサチップと、メモリ部と、データバスとを有する半導体装置であり、第1プロセッサチップ、およびメモリ部は、それぞれ、データバスと電気的に接続され、第1プロセッサチップは、人工知能の演算を行う演算回路アレイを有し、演算回路アレイは、複数の演算回路を有し、演算回路は、複数のメモリ回路を有し、複数のメモリ回路は、それぞれ、複数のメモリセルを有し、複数のメモリセルは、それぞれ、保持ノードと、保持ノードへのデータの書き込みを制御するトランジスタを有し、トランジスタのチャネル形成領域は金属酸化物を有することを特徴とする半導体装置。 (3) One embodiment of the present invention is a semiconductor device including a first processor chip, a memory unit, and a data bus, and the first processor chip and the memory unit are electrically connected to the data bus, respectively. The first processor chip includes an arithmetic circuit array that performs artificial intelligence operations, the arithmetic circuit array includes a plurality of arithmetic circuits, the arithmetic circuit includes a plurality of memory circuits, and the plurality of memory circuits include , Each having a plurality of memory cells, each of the plurality of memory cells including a holding node and a transistor for controlling data writing to the holding node, and a channel formation region of the transistor including a metal oxide A semiconductor device characterized by the above.

(4)上記形態(3)において、保持ノードは、デジタルデータが書き込まれる。 (4) In the above form (3), digital data is written in the holding node.

(5)上記形態(1)乃至(4)の何れか一に係る半導体装置は、第2プロセッサチップを更に有する。 (5) The semiconductor device according to any one of the above aspects (1) to (4) further includes a second processor chip.

本明細書等において、「第1」、「第2」、「第3」などの序数詞は、順序を表すために使用される場合がある。または、構成要素の混同を避けるために使用する場合がある。これらの場合、序数詞の使用は構成要素の個数を限定するものではない。例えば、「第1」を「第2」または「第3」に置き換えて、本発明の一形態を説明することができる。 In this specification and the like, ordinal numbers such as “first”, “second”, and “third” may be used to indicate order. Or it may be used to avoid confusion between components. In these cases, the use of ordinal numbers does not limit the number of components. For example, one form of the present invention can be described by replacing “first” with “second” or “third”.

本明細書等において、XとYとが接続されていると記載されている場合は、XとYとが電気的に接続されている場合と、XとYとが機能的に接続されている場合と、XとYとが直接接続されている場合とが、本明細書等に開示されているものとする。したがって、所定の接続関係、例えば、図または文章に示された接続関係に限定されず、図または文章に示された接続関係以外のものも、図または文章に記載されているものとする。X、Yは、対象物(例えば、装置、素子、回路、配線、電極、端子、導電膜、層など)であるとする。 In this specification and the like, when it is described that X and Y are connected, X and Y are electrically connected and X and Y are functionally connected The case and the case where X and Y are directly connected are disclosed in this specification and the like. Therefore, it is not limited to a predetermined connection relationship, for example, the connection relationship shown in the figure or text, and anything other than the connection relation shown in the figure or text is also described in the figure or text. X and Y are objects (for example, devices, elements, circuits, wirings, electrodes, terminals, conductive films, layers, etc.).

トランジスタは、ゲート、ソース、およびドレインと呼ばれる3個の端子を有する。ゲートは、トランジスタの導通状態を制御する制御端子である。ソースまたはドレインとして機能する2個の端子は、トランジスタの入出力端子である。2つの入出力端子は、トランジスタの導電型(nチャネル型、pチャネル型)及びトランジスタの3個の端子に与えられる電位の高低によって、一方がソースとなり他方がドレインとなる。このため、本明細書等においては、ソースやドレインの用語は、入れ替えて用いることができるものとする。また、本明細書等では、ゲート以外の2個の入出力端子を第1端子、第2端子等と呼ぶ場合がある。 The transistor has three terminals called gate, source, and drain. The gate is a control terminal that controls the conduction state of the transistor. Two terminals functioning as a source or a drain are input / output terminals of the transistor. One of the two input / output terminals is a source and the other is a drain depending on the conductivity type (n-channel type, p-channel type) of the transistor and the potential applied to the three terminals of the transistor. Therefore, in this specification and the like, the terms source and drain can be used interchangeably. In this specification and the like, the two input / output terminals other than the gate may be referred to as a first terminal, a second terminal, and the like.

ノードは、回路構成やデバイス構造等に応じて、端子、配線、電極、導電層、導電体、不純物領域等と言い換えることが可能である。また、端子、配線等をノードと言い換えることが可能である。 A node can be restated as a terminal, a wiring, an electrode, a conductive layer, a conductor, an impurity region, or the like depending on a circuit configuration, a device structure, or the like. Further, a terminal, a wiring, or the like can be referred to as a node.

電圧は、ある電位と、基準の電位(例えば接地電位(GND)またはソース電位)との電位差のことを示す場合が多い。よって、電圧を電位と言い換えることが可能である。なお、電位とは相対的なものである。よって、GNDと記載されていても、必ずしも0Vを意味しない場合もある。 In many cases, the voltage indicates a potential difference between a certain potential and a reference potential (for example, a ground potential (GND) or a source potential). Thus, a voltage can be rephrased as a potential. Note that the potential is relative. Therefore, even if it is described as GND, it may not necessarily mean 0V.

本明細書において、「上に」、「下に」などの配置を示す語句は、構成同士の位置関係を、図面を参照して説明するために、便宜上用いている場合がある。また、構成同士の位置関係は、各構成を描写する方向に応じて適宜変化するものである。従って、明細書で説明した語句に限定されず、状況に応じて適切に言い換えることができる。 In this specification, terms and phrases such as “above” and “below” may be used for convenience in describing the positional relationship between components with reference to the drawings. Moreover, the positional relationship between components changes suitably according to the direction which draws each structure. Therefore, the present invention is not limited to the words and phrases described in the specification, and can be appropriately rephrased depending on the situation.

本明細書等において、「膜」という言葉と「層」という言葉とは、場合によっては、または、状況に応じて、互いに入れ替えることが可能である。例えば、「導電層」という用語を「導電膜」という用語に変更することが可能な場合がある。例えば、「絶縁膜」という用語を「絶縁層」という用語に変更することが可能な場合がある。 In this specification and the like, the terms “film” and “layer” can be interchanged with each other depending on the case or circumstances. For example, it may be possible to change the term “conductive layer” to the term “conductive film”. For example, it may be possible to change the term “insulating film” to the term “insulating layer”.

本発明の一形態によって、oxトランジスタを有する新規な半導体装置を提供することが可能である。 According to one embodiment of the present invention, a novel semiconductor device including an ox transistor can be provided.

複数の効果の記載は、他の効果の存在を妨げるものではない。また、本発明の一形態は、必ずしも、例示した効果の全てを有する必要はない。また、本発明の一形態について、上記以外の課題、効果、および新規な特徴については、本明細書の記載および図面から自ずと明らかになるものである。 The description of a plurality of effects does not disturb the existence of other effects. Further, one embodiment of the present invention does not necessarily have all of the exemplified effects. Further, problems, effects, and novel features of the embodiment of the present invention other than those described above will be apparent from the description of the present specification and the drawings.

半導体装置の構成例を示す機能ブロック図。FIG. 11 is a functional block diagram illustrating a configuration example of a semiconductor device. A―C:oxメモリ回路の構成例を示す回路図。A circuit diagram showing a configuration example of an AC: ox memory circuit. oxAIチップの回路部の構成例を示す模式図。The schematic diagram which shows the structural example of the circuit part of an oxAI chip. A、B:評価ボードの構成例を示す斜視模式図。A, B: The perspective schematic diagram which shows the structural example of an evaluation board. oxAIチップによって構成される全結合型ニューラルネットワークの構造を示す図。The figure which shows the structure of the fully connected neural network comprised by oxAI chip. oxAIチップの構成例を示す機能ブロック図。The functional block diagram which shows the structural example of an oxAI chip. MACアレイの構成例を示す回路図。The circuit diagram which shows the structural example of a MAC array. oxAIチップの構成例を示す機能ブロック図。The functional block diagram which shows the structural example of an oxAI chip. 演算アレイの構成例を示すブロック図。The block diagram which shows the structural example of a calculation array. 演算回路の構成例を示す回路図。The circuit diagram which shows the structural example of an arithmetic circuit. A:メモリ回路の構成例を示す回路図。B:メモリセルの構成例を示す回路図。A: A circuit diagram showing a configuration example of a memory circuit. B: A circuit diagram showing a configuration example of a memory cell. メモリ回路の構成例を示す回路図。FIG. 3 is a circuit diagram illustrating a configuration example of a memory circuit. A、B:スイッチ回路の構成例を示す回路図。A and B: Circuit diagrams showing a configuration example of a switch circuit. oxAIチップによって構成される畳み込みニューラルネットワークの構造を示す。2 shows the structure of a convolutional neural network composed of oxAI chips. A、B:半導体装置が組み込まれたコンピュータの斜視模式図。A and B: schematic perspective views of a computer in which a semiconductor device is incorporated. A:スーパーコンピュータの斜視模式図。B:計算機の内部構造例を示す斜視模式図。A: A schematic perspective view of a supercomputer. B: A schematic perspective view showing an example of the internal structure of a computer. 電子機器を例示する図。FIG. 9 illustrates an electronic device.

以下に、本発明の実施の形態を説明する。ただし、本発明の一形態は、以下の説明に限定されず、本発明の趣旨およびその範囲から逸脱することなくその形態および詳細を様々に変更し得ることは、当業者であれば容易に理解される。したがって、本発明の一形態は、以下に示す実施の形態の記載内容に限定して解釈されるものではない。 Hereinafter, embodiments of the present invention will be described. However, one form of the present invention is not limited to the following description, and it is easily understood by those skilled in the art that the form and details can be variously changed without departing from the spirit and scope of the present invention. Is done. Therefore, one embodiment of the present invention is not construed as being limited to the description of the embodiment modes to be given below.

以下に示される複数の実施の形態は適宜組み合わせることが可能である。また1の実施の形態の中に、複数の構成例(作製方法例、動作方法例、使用方法例等も含む。)が示される場合は、互いの構成例を適宜組み合わせること、および他の実施の形態に記載された1または複数の構成例と適宜組み合わせることも可能である。 A plurality of embodiments shown below can be appropriately combined. Further, in the case where a plurality of structure examples (including a manufacturing method example, an operation method example, a usage method example, and the like) are given in one embodiment, appropriate combinations of the structure examples with each other and other implementations It is also possible to appropriately combine with one or a plurality of configuration examples described in the embodiment.

図面において、大きさ、層の厚さ、又は領域は、明瞭化のために誇張されている場合がある。よって、必ずしもそのスケールに限定されない。なお図面は、理想的な例を模式的に示したものであり、図面に示す形状又は値などに限定されない。例えば、ノイズによる信号、電圧、若しくは電流のばらつき、又は、タイミングのずれによる信号、電圧、若しくは電流のばらつきなどを含むことが可能である。 In the drawings, the size, layer thickness, or region may be exaggerated for clarity. Therefore, it is not necessarily limited to the scale. The drawings schematically show an ideal example, and are not limited to the shapes or values shown in the drawings. For example, variation in signal, voltage, or current due to noise, variation in signal, voltage, or current due to timing shift can be included.

〔実施の形態1〕
本実施の形態では、人工知能のための演算機能を有する半導体装置、および当該半導体装置が搭載される電子機器などについて説明する。人工知能の演算処理とは、例えば、機械学習、ニューラルネットワークなどのAIに関する数理モデルに基づく演算処理である。
[Embodiment 1]
In this embodiment, a semiconductor device having an arithmetic function for artificial intelligence, an electronic device in which the semiconductor device is mounted, and the like will be described. The arithmetic processing of artificial intelligence is arithmetic processing based on a mathematical model related to AI such as machine learning and neural network.

図1は、半導体装置の構成例を示す機能ブロック図である。図1に示す半導体装置100は、データバス110、入出力(I/O)インターフェース112、メモリ部114、FPGAチップ115、oxAIチップ120を有する。I/Oインターフェース112、メモリ部114、FPGAチップ115、およびoxAIチップ120は、データバス110を介してデータを授受する。 FIG. 1 is a functional block diagram illustrating a configuration example of a semiconductor device. A semiconductor device 100 illustrated in FIG. 1 includes a data bus 110, an input / output (I / O) interface 112, a memory unit 114, an FPGA chip 115, and an oxAI chip 120. The I / O interface 112, the memory unit 114, the FPGA chip 115, and the oxAI chip 120 exchange data via the data bus 110.

I/Oインターフェース112は、各種の周辺機器150を接続するための複数種類のインターフェースを備えていることが好ましい。例えば、USBコネクタ、HDMI、(登録商標)コネクタ、eDPコネクタ、ePCIe、LANコネクタなどが設けられる。 The I / O interface 112 preferably includes a plurality of types of interfaces for connecting various peripheral devices 150. For example, a USB connector, HDMI, (registered trademark) connector, eDP connector, ePCIe, LAN connector, and the like are provided.

「USB」はUniversal Serial Busの略称である。「HDMI/eDP」はHigh−Definition Multimedia Interface/の略称である。ことである。eDPはembedded DisplayPortの略称である。「ePCIe」はPeripheral Component Interconnect Expressの略称である。「LAN」は、Local Area Networkの略称である。 “USB” is an abbreviation for Universal Serial Bus. “HDMI / eDP” is an abbreviation for High-Definition Multimedia Interface /. That is. eDP is an abbreviation for embedded DisplayPort. “EPCIe” is an abbreviation for Peripheral Component Interconnect Express. “LAN” is an abbreviation for Local Area Network.

メモリ部114は、1個または2個以上のメモリチップを有する。例えば、メモリ部114に複数種類のメモリチップを設けて、メモリ部114を階層化する。例えば、SRAMチップ、DRAMチップ、およびフラッシュメモリチップがメモリ部114に設けられる。DRAMチップに代えて、NOSRAMチップ、またはDOSRAMチップを設けてもよい。フラッシュメモリチップに代えて、NOSRAMチップ、またはDOSRAMチップを設けてもよい。 The memory unit 114 has one or more memory chips. For example, a plurality of types of memory chips are provided in the memory unit 114, and the memory unit 114 is hierarchized. For example, an SRAM chip, a DRAM chip, and a flash memory chip are provided in the memory unit 114. A NOSRAM chip or a DOSRAM chip may be provided in place of the DRAM chip. A NOSRAM chip or a DOSRAM chip may be provided instead of the flash memory chip.

「DOSRAM(登録商標)」とは、「Dynamic Oxide Semiconductor RAM」の略称であり、oxトランジスタと容量素子とでなる1トランジスタ1容量型のメモリセルを有するRAMを指す。NOSRAM、およびDOSRAMともメモリセルの書込みトランジスタがoxトランジスタであるので、不揮発性メモリとして用いることができる。 “DOSRAM (registered trademark)” is an abbreviation of “Dynamic Oxide Semiconductor RAM” and refers to a RAM having a one-transistor one-capacitance type memory cell composed of an ox transistor and a capacitor. Both NOSRAM and DOSRAM can be used as nonvolatile memories because the write transistor of the memory cell is an ox transistor.

半導体装置100にFPGAチップ115が搭載されているため、半導体装置100は拡張性が高い。FPGAチップ115には、メモリ装置が組み込まれている。 Since the FPGA chip 115 is mounted on the semiconductor device 100, the semiconductor device 100 has high expandability. A memory device is incorporated in the FPGA chip 115.

半導体装置100の用途等によって、半導体装置100に組み込まれるICチップの種類は取捨される。少なくとも、AIの演算を実行するプロセッサチップを半導体装置100に組み込むことが好ましい。 Depending on the application of the semiconductor device 100 and the like, the types of IC chips incorporated in the semiconductor device 100 are discarded. It is preferable to incorporate at least a processor chip that executes an AI operation in the semiconductor device 100.

ユーザは、半導体装置100にホスト装置155(例えば、パーソナルコンピュータ(PC))を接続することで、半導体装置100で動作するソフトウエアの開発を行うことができる。半導体装置100は、ホスト装置155に対するアクセラレータとして機能させることができる。 A user can develop software that operates on the semiconductor device 100 by connecting a host device 155 (for example, a personal computer (PC)) to the semiconductor device 100. The semiconductor device 100 can function as an accelerator for the host device 155.

<oxAIチップ120>
oxAIチップ120は、oxトランジスタが用いられたAIの演算処理が可能なICチップである。oxAIチップ120が使用するデータには、重み係数データ(学習可能なデータ)、画像データ、教師データなどがある。oxAIチップ120の演算結果は、例えば、推論データとして出力される。
<OxAI chip 120>
The oxAI chip 120 is an IC chip that can perform AI arithmetic processing using ox transistors. Data used by the oxAI chip 120 includes weight coefficient data (data that can be learned), image data, teacher data, and the like. The calculation result of the oxAI chip 120 is output as inference data, for example.

oxAIチップ120の特長には、演算に用いられるデータ(代表的には、重み係数データ)を記憶するメモリ回路が演算回路と近接して設けられていることである。このメモリ回路に、oxトランジスタが用いられている。本明細書では、oxトランジスタを有するメモリ回路を、「oxメモリ回路」と呼ぶ場合がある。図2A〜図2Cにoxメモリ回路の回路構成例を示す。 A feature of the oxAI chip 120 is that a memory circuit that stores data (typically, weight coefficient data) used for calculation is provided close to the calculation circuit. An ox transistor is used in this memory circuit. In this specification, a memory circuit including an ox transistor may be referred to as an “ox memory circuit”. 2A to 2C show circuit configuration examples of the ox memory circuit.

図2Aに示すoxメモリ回路11は、2Tゲインセルと同じ回路構成であり、書込みトランジスタMW1、読出しトランジスタMR1、容量素子CS1を有する。読出しトランジスタMR1のゲートが保持ノードSNである。書込みトランジスタMW1、読出しトランジスタMR1はそれぞれoxトランジスタである。 The ox memory circuit 11 shown in FIG. 2A has the same circuit configuration as the 2T gain cell, and includes a write transistor MW1, a read transistor MR1, and a capacitor element CS1. The gate of the read transistor MR1 is the holding node SN. Each of the write transistor MW1 and the read transistor MR1 is an ox transistor.

金属酸化物のバンドギャップは2.5eV以上あるため、oxトランジスタは極小のオフ電流をもつ。一例として、ソースとドレイン間の電圧が3.5V、室温(25℃)下において、チャネル幅1μm当たりのオフ電流を1×10−20A未満、1×10−22A未満、あるいは1×10−24A未満とすることができる。すなわち、ドレイン電流のオン/オフ電流比を20桁以上150桁以下とすることができる。なお、書込みトランジスタMW、読出しトランジスタMRの半導体層については後述する。 Since the band gap of metal oxide is 2.5 eV or more, the ox transistor has a minimum off-state current. As an example, the off-current per channel width of 1 μm is less than 1 × 10 −20 A, less than 1 × 10 −22 A, or 1 × 10 at a source-drain voltage of 3.5 V and room temperature (25 ° C.). It can be less than −24 A. That is, the on / off current ratio of the drain current can be 20 digits or more and 150 digits or less. The semiconductor layers of the write transistor MW and the read transistor MR will be described later.

oxメモリ回路11のノードSNには、書込みトランジスタMW1を介して電荷が充電される。oxトランジスタが極小オフ電流であることから、書込みトランジスタMW1は、ノードSNの電荷を殆んどリークさせない。従って、oxメモリ回路11は不揮発性メモリ回路として機能でき、かつ多値化が容易である。よって、oxメモリ回路11を不揮発性アナログメモリ回路として、oxAIチップ120に設けることができる。 The node SN of the ox memory circuit 11 is charged with charge through the write transistor MW1. Since the ox transistor has a minimum off-state current, the write transistor MW1 hardly leaks the charge of the node SN. Therefore, the ox memory circuit 11 can function as a nonvolatile memory circuit and can be easily multi-valued. Therefore, the ox memory circuit 11 can be provided in the oxAI chip 120 as a nonvolatile analog memory circuit.

oxトランジスタに適用される金属酸化物は、Zn酸化物、Zn‐Sn酸化物、Ga‐Sn酸化物、In‐Ga酸化物、In‐Zn酸化物、In‐M‐Zn酸化物(Mは、Ti、Ga、Y、Zr、La、Ce、Nd、SnまたはHf)などがある。また、インジウムおよび亜鉛を含む酸化物に、アルミニウム、ガリウム、イットリウム、銅、バナジウム、ベリリウム、ホウ素、シリコン、チタン、鉄、ニッケル、ゲルマニウム、ジルコニウム、モリブデン、ランタン、セリウム、ネオジム、ハフニウム、タンタル、タングステン、またはマグネシウムなどから選ばれた一種、または複数種が含まれていてもよい。 Metal oxides applied to ox transistors are Zn oxide, Zn-Sn oxide, Ga-Sn oxide, In-Ga oxide, In-Zn oxide, In-M-Zn oxide (M is Ti, Ga, Y, Zr, La, Ce, Nd, Sn, or Hf). In addition, oxides containing indium and zinc include aluminum, gallium, yttrium, copper, vanadium, beryllium, boron, silicon, titanium, iron, nickel, germanium, zirconium, molybdenum, lanthanum, cerium, neodymium, hafnium, tantalum, tungsten , Or one or more selected from magnesium or the like may be included.

oxトランジスタの信頼性、電気特性の向上のため、半導体層に適用される金属酸化物は、CAAC‐OS、CAC−OS、nc‐OSなどの結晶部を有する金属酸化物であることが好ましい。CAAC‐OSとは、c‐axis‐aligned crystalline metal oxide semiconductorの略称である。CAC‐OSとは、Cloud‐Aligned Composite metal oxide semiconductorの略称である。nc‐OSとは、nanocrystalline metal oxide semiconductorの略称である。 In order to improve the reliability and electrical characteristics of the ox transistor, the metal oxide applied to the semiconductor layer is preferably a metal oxide having a crystal part such as CAAC-OS, CAC-OS, or nc-OS. CAAC-OS is an abbreviation for c-axis-aligned crystalline metal oxide semiconductor. CAC-OS is an abbreviation for Cloud-Aligned Composite metal oxide semiconductor. nc-OS is an abbreviation for nanocrystalline metal oxide semiconductor.

CAAC‐OSは、c軸配向性を有し、かつa‐b面方向において複数のナノ結晶が連結し、歪みを有した結晶構造となっている。なお、歪みとは、複数のナノ結晶が連結する領域において、格子配列の揃った領域と、別の格子配列の揃った領域との間で格子配列の向きが変化している箇所を指す。 The CAAC-OS has a c-axis orientation and has a crystal structure in which a plurality of nanocrystals are connected in the ab plane direction to have a strain. Note that the strain refers to a portion where the orientation of the lattice arrangement is changed between a region where the lattice arrangement is aligned and a region where another lattice arrangement is aligned in a region where a plurality of nanocrystals are connected.

CAC‐OSは、キャリアとなる電子(または正孔)を流す機能と、キャリアとなる電子を流さない機能とを有する。電子を流す機能と、電子を流さない機能とを分離させることで、双方の機能を最大限に高めることができる。つまり、CAC‐OSをoxトランジスタのチャネル形成領域に用いることで、高いオン電流と、極めて低いオフ電流との双方を実現できる。 The CAC-OS has a function of flowing electrons (or holes) serving as carriers and a function of not flowing electrons serving as carriers. By separating the function of flowing electrons from the function of not flowing electrons, both functions can be maximized. That is, by using the CAC-OS for the channel formation region of the ox transistor, both a high on-state current and an extremely low off-state current can be realized.

書込みトランジスタMW1のバックゲート電圧を変化させることで、書込みトランジスタMW1のしきい値電圧を変化させることができる。書込みトランジスタMW1はバックゲートの無いoxトランジスタでもよい。読出しトランジスタMR1についても同様である。 By changing the back gate voltage of the write transistor MW1, the threshold voltage of the write transistor MW1 can be changed. The write transistor MW1 may be an ox transistor without a back gate. The same applies to the read transistor MR1.

金属酸化物は、エネルギーギャップが大きく、電子が励起されにくいこと、ホールの有効質量が大きいことなどから、oxトランジスタは、一般的なSiトランジスタと比較して、アバランシェ崩壊等が生じにくい場合がある。従って、例えばアバランシェ崩壊に起因するホットキャリア劣化等を抑制できる場合がある。ホットキャリア劣化を抑制できることで、高いドレイン電圧でoxトランジスタを駆動することができる。従って、書込みトランジスタMWがOSトランジスタであることで、ノードSNに高い電圧を印加することが可能になるため、oxメモリ回路11の多値化が容易である。 Metal oxides have a large energy gap, electrons are difficult to be excited, and the effective mass of holes is large. Therefore, ox transistors are less likely to cause avalanche collapse or the like than general Si transistors. . Therefore, for example, hot carrier deterioration due to avalanche collapse may be suppressed. By suppressing the hot carrier deterioration, the ox transistor can be driven with a high drain voltage. Therefore, since the write transistor MW is an OS transistor, a high voltage can be applied to the node SN, so that the ox memory circuit 11 can be easily multi-valued.

oxトランジスタは、電子を多数キャリアとする蓄積型トランジスタである。そのため、pn接合を有する反転型トランジスタ(代表的には、Siトランジスタ)と比較して短チャネル効果の一つであるDIBL(Drain‐Induced Barrier Lowering)の影響が小さい。つまり、oxランジスタは、Siトランジスタよりも短チャネル効果に対する高い耐性を有する。 The ox transistor is a storage type transistor having electrons as majority carriers. Therefore, the influence of DIBL (Drain-Induced Barrier Lowering), which is one of the short channel effects, is smaller than that of an inverting transistor having a pn junction (typically, a Si transistor). In other words, the ox transistor has higher resistance to the short channel effect than the Si transistor.

oxトランジスタは、短チャネル効果に対する耐性が高いために、oxトランジスタの信頼性を劣化させずに、チャネル長を縮小できるので、oxトランジスタを用いることで回路の集積度を高めることができる。チャネル長が微細化するのに伴いドレイン電界が強まるが、上掲したように、oxトランジスタはSiトランジスタよりもアバランシェ崩壊が起きにくい。 Since the ox transistor has high resistance to the short channel effect, the channel length can be reduced without deteriorating the reliability of the ox transistor. Therefore, by using the ox transistor, the degree of circuit integration can be increased. As the channel length becomes finer, the drain electric field becomes stronger. However, as described above, the ox transistor is less prone to avalanche collapse than the Si transistor.

また、oxトランジスタは、短チャネル効果に対する耐性が高いために、Siシリコン等トランジスタよりもゲート絶縁物を厚くすることが可能となる。例えば、チャネル長及びチャネル幅が50nm以下の微細なトランジスタにおいても、10nm程度の厚いゲート絶縁物を設けることが可能な場合がある。ゲート絶縁物を厚くすることで、寄生容量を低減することができるので、回路の動作速度を向上できる。またゲート絶縁物を厚くすることにで、リーク電流が低減されるため、静的消費電流の低減につながる。 In addition, since the ox transistor has high resistance to the short channel effect, the gate insulator can be made thicker than a transistor such as Si silicon. For example, even in a minute transistor with a channel length and a channel width of 50 nm or less, a thick gate insulator of about 10 nm may be provided. Since the parasitic capacitance can be reduced by increasing the thickness of the gate insulator, the operation speed of the circuit can be improved. Moreover, since the leakage current is reduced by increasing the thickness of the gate insulator, static current consumption is reduced.

図2Bに示すoxメモリ回路12はoxメモリ回路11の変形例であり、読出しトランジスタMW2がnチャネル型Siトランジスタである。読出しトランジスタMW2はpチャネル型Siトランジスタでもよい。 An ox memory circuit 12 shown in FIG. 2B is a modification of the ox memory circuit 11, and the read transistor MW2 is an n-channel Si transistor. The read transistor MW2 may be a p-channel Si transistor.

図2Cに示すoxメモリ回路13は、3トランジスタ型ゲインセルであり、書込みトランジスタMW3、読出しトランジスタMR3、選択トランジスタMS3、容量素子CS3を有する。トランジスタMW3、MR3、MS3はそれぞれバックゲートを有するoxトランジスタである。これらトランジスタの一部、または全てがバックゲートの無いoxトランジスタでもよい。 The ox memory circuit 13 illustrated in FIG. 2C is a three-transistor gain cell, and includes a write transistor MW3, a read transistor MR3, a selection transistor MS3, and a capacitor element CS3. The transistors MW3, MR3, and MS3 are ox transistors each having a back gate. Some or all of these transistors may be ox transistors without a back gate.

図2Dに示すoxメモリ回路14は、oxメモリ回路13の変形例である。読出しトランジスタMR4、選択トランジスタMS4はそれぞれnチャネル型Siトランジスタである。トランジスタMR4、MS4の一方または双方はpチャネル型Siトランジスタでもよい。 An ox memory circuit 14 illustrated in FIG. 2D is a modification of the ox memory circuit 13. The read transistor MR4 and the select transistor MS4 are n-channel Si transistors. One or both of the transistors MR4 and MS4 may be p-channel Si transistors.

容量素子CS1の充放電によってデータを書き換えるため、oxメモリ回路11は原理的には書き換え回数に制約はなく、低エネルギーで、データの書き込みおよび読み出しが可能であり、データの保持に電力を消費しない。よって、oxメモリ回路11をoxAIチップ120に組み込むことで、低消費電力なAIチップを提供することが可能になる。oxメモリ回路12〜14もoxメモリ回路11と同様の特長を有する。 In order to rewrite data by charging / discharging the capacitive element CS1, the ox memory circuit 11 has no restriction on the number of rewrites in principle, can write and read data with low energy, and does not consume power to hold data. . Therefore, by incorporating the ox memory circuit 11 into the oxAI chip 120, an AI chip with low power consumption can be provided. The ox memory circuits 12 to 14 have the same features as the ox memory circuit 11.

図3Aに、oxAIチップ120の回路部121Aの積層構造を模式的に示す。回路部121Aは積層構造をもち、Siトランジスタ層1011、配線層1012、oxトランジスタ層1013に大別される。oxトランジスタ層1013をSiトランジスタ層1011に積層して設けることができるため、oxAIチップ120の面積を小さくすることができる。 FIG. 3A schematically shows a stacked structure of the circuit unit 121A of the oxAI chip 120. FIG. The circuit portion 121A has a stacked structure and is roughly divided into a Si transistor layer 1011, a wiring layer 1012, and an ox transistor layer 1013. Since the ox transistor layer 1013 can be stacked over the Si transistor layer 1011, the area of the oxAI chip 120 can be reduced.

回路部121B(図3B参照)、回路部121C(図3C参照)のように、複数のoxトランジスタ層1013を設けてもよい。回路部121Cは、回路部121A、121Bと異なり、Siトランジスタ層1011が設けられていない。回路部121Cのoxトランジスタ層1013の数は、1層の場合がある。 A plurality of ox transistor layers 1013 may be provided as in the circuit portion 121B (see FIG. 3B) and the circuit portion 121C (see FIG. 3C). Unlike the circuit portions 121A and 121B, the circuit portion 121C is not provided with the Si transistor layer 1011. The number of ox transistor layers 1013 in the circuit portion 121C may be one layer.

oxAIチップ120のより具体的な回路構成は、実施の形態2で説明する。後述するように、oxAIチップ120の演算部を少ない素子数、配線数で演算部を構成することができるため、集積化に有利である。演算回路の集積化により、並列処理数を増やすことができるので、oxAIチップ120は、市販のGPUチップと同様、もしくはそれ以上の演算性能を実現できる可能性をもつ。 A more specific circuit configuration of the oxAI chip 120 will be described in a second embodiment. As will be described later, the arithmetic unit of the oxAI chip 120 can be configured with a small number of elements and wires, which is advantageous for integration. Since the number of parallel processes can be increased by integrating the arithmetic circuit, the oxAI chip 120 has a possibility of realizing an arithmetic performance equal to or higher than that of a commercially available GPU chip.

例えば、市販のGPUチップの動作周波数が3GHz、乗算の並列処理数が10である場合、GPUチップの演算性能は3×1012OPS(Operations Per Second)=3Tera OPS(TOPS)である。例えば、oxAIチップ120は、10乃至10個程度の演算回路を設けることができ、乗算の並列処理数を10乃至10とすることができる。この場合、oxAIの動作周波数を3MHz又は30MHzに低下しても、oxAIチップ120の演算性能はGPUと同程度である。動作周波数の低減は、ICチップの動的消費電力の削減に非常に有効である。 For example, if 3GHz the operating frequency of the commercial GPU chip, the number of parallel processes of multiplying 10 3, operation performance of the GPU chip is 3 × 10 12 OPS (Operations Per Second) = 3Tera OPS (TOPS). For example, the oxAI chip 120 can be provided with about 10 6 to 10 8 arithmetic circuits, and the number of parallel processing of multiplication can be 10 6 to 10 8 . In this case, even if the operating frequency of oxAI is reduced to 3 MHz or 30 MHz, the computing performance of the oxAI chip 120 is comparable to that of the GPU. Reducing the operating frequency is very effective for reducing the dynamic power consumption of the IC chip.

また、AIの演算など大規模な演算処理を行うため、GPUチップは高い周波数で駆動する。そのため、ことから,大電力を消費し、高温なる。oxAIチップ120は、動作周波数を低減できるため、oxAIチップ120の発熱を抑えることができる。したがって、半導体装置100において、oxAIチップ120の放熱機構をGPUチップのものよりも簡素にすることができる。 In addition, the GPU chip is driven at a high frequency in order to perform large-scale calculation processing such as AI calculation. Therefore, large power is consumed and the temperature becomes high. Since the oxAI chip 120 can reduce the operating frequency, heat generation of the oxAI chip 120 can be suppressed. Therefore, in the semiconductor device 100, the heat dissipation mechanism of the oxAI chip 120 can be made simpler than that of the GPU chip.

上掲したように、GPUチップは、演算性能の向上と、省電力化および発熱抑制との関係はトレードオフの関係である。これに対して、oxAIチップ120は、動作周波数を低減しても演算性能の劣化を少なくできる。したがって、oxAIチップ120は、時間および電力に対して高効率に、大規模な演算処理を実行することができる。 As described above, the GPU chip has a trade-off relationship between the improvement of calculation performance, power saving, and heat generation suppression. On the other hand, the oxAI chip 120 can reduce the deterioration of the calculation performance even if the operating frequency is reduced. Therefore, the oxAI chip 120 can execute large-scale arithmetic processing with high efficiency with respect to time and power.

<<評価ボード>>
例えば、半導体装置100は、評価ボードとして用いることができる。図4A、図4Bは、評価ボードの構成例の斜視模式図である。
<< Evaluation Board >>
For example, the semiconductor device 100 can be used as an evaluation board. 4A and 4B are schematic perspective views of configuration examples of the evaluation board.

図4Aに示すように、評価ボード200のボード210には、様々な電子部品が組み込まれている。図4Aの例では、oxAIチップ220、メモリチップ231、232、FPGAチップ235、236、PCIeコネクタ240、USBコネクタ242、HDMI入力(RX)コネクタ244、HDMI出力(TX)コネクタ245を有する。 As shown in FIG. 4A, various electronic components are incorporated in the board 210 of the evaluation board 200. 4A includes an oxAI chip 220, memory chips 231, 232, FPGA chips 235, 236, a PCIe connector 240, a USB connector 242, an HDMI input (RX) connector 244, and an HDMI output (TX) connector 245.

FPGAチップ236は、メモリ装置を含む。HDMI入力コネクタ244、HDMI出力コネクタ245に代えて、eDP入力コネクタ、eDP出力コネクタを設けてもよい。 The FPGA chip 236 includes a memory device. Instead of the HDMI input connector 244 and the HDMI output connector 245, an eDP input connector and an eDP output connector may be provided.

oxAIチップ220は、コネクタ(図示されない)を使用して、ボード210と着脱可能となっている。例えば、別のアーキテクチャのoxAIチップ222、またはGPUチップ225を付け替えることができる。評価ボード200を用いて、AIの演算処理機能を持つ、複数種類のチップの性能および機能の確認を行うことができる。 The oxAI chip 220 is detachable from the board 210 using a connector (not shown). For example, the oxAI chip 222 or the GPU chip 225 of another architecture can be replaced. Using the evaluation board 200, it is possible to check the performance and functions of a plurality of types of chips having an AI processing function.

図4Bに示す評価ボード202においては、oxAIチップは、専用のボード212に実装されている。ボード210には、コネクタ250A、250Bが設けられ、ボード212にはコネクタ252A、252Bが設けられている。コネクタ250A、250Bはそれぞれコネクタ250A、250Bと接続される。 In the evaluation board 202 shown in FIG. 4B, the oxAI chip is mounted on a dedicated board 212. The board 210 is provided with connectors 250A and 250B, and the board 212 is provided with connectors 252A and 252B. Connectors 250A and 250B are connected to connectors 250A and 250B, respectively.

<<電子機器>>
ここでは、oxAIチップが組み込まれた電子機器について説明する。
<< Electronic equipment >>
Here, an electronic device incorporating an oxAI chip will be described.

図15A、図15Bに、コンピュータ7000の一例を示す。図15Aに示すように、コンピュータ7000は、筐体7010、モニタ部7012、キーボード7013、ポート7015を有する。キーボード7013、ポート7015は筐体7010に設けられている。ポート7015としては、例えば、USBポート、LANポート、HDMIポートなどがある。 15A and 15B show an example of the computer 7000. As illustrated in FIG. 15A, the computer 7000 includes a housing 7010, a monitor unit 7012, a keyboard 7013, and a port 7015. A keyboard 7013 and a port 7015 are provided in the housing 7010. Examples of the port 7015 include a USB port, a LAN port, and an HDMI port.

モニタ部7012は、開閉可能に筐体7010に取り付けられている。図15Aには、モニタ部7012が開いている状態が示され、図15Bには、モニタ部7012が閉じている状態を示す。例えば、モニタ部7012の最大開角度は135°程度である。 The monitor portion 7012 is attached to the housing 7010 so that it can be opened and closed. FIG. 15A shows a state where the monitor unit 7012 is open, and FIG. 15B shows a state where the monitor unit 7012 is closed. For example, the maximum opening angle of the monitor unit 7012 is about 135 °.

図15Bに示すように、筐体7010には開閉可能なカバー7011が設けられている。筐体7010内部には、複数の半導体装置100が着脱可能に組み込まれている。筐体7010の内部には、半導体装置100を冷却する装置、または放熱する装置が設けられていてもよい。カバー7011を開けて、半導体装置100を交換することができるので、コンピュータ7000の拡張性は高い。コンピュータ7000に複数のoxAIチップを組み込むことで、様々なAIの処理を高速に行うことが可能になる。 As shown in FIG. 15B, the housing 7010 is provided with a cover 7011 that can be opened and closed. A plurality of semiconductor devices 100 are detachably incorporated in the housing 7010. A device for cooling the semiconductor device 100 or a device for radiating heat may be provided in the housing 7010. Since the cover 7011 can be opened and the semiconductor device 100 can be replaced, the expandability of the computer 7000 is high. By incorporating a plurality of oxAI chips into the computer 7000, various AI processes can be performed at high speed.

多数の半導体装置100によって、大型並列計算機、スーパーコンピュータ、およびサーバなど大規模な並列演算を行うコンピューティングシステムを構築することができる。図16Aにスーパーコンピュータ7200の一例を示す。スーパーコンピュータ720には、複数のラック7210を有する。複数のラック7210にはそれぞれラックマウント型の計算機7220が複数格納されている。図16Bに示すように、計算機7220はマザーボード7224、PCカード7225を有する。PCカード7225に半導体装置100が適用されている。これにより、低消費電力なスーパーコンピュータ720を提供することができる。計算機7220の発熱が抑えられるので、スーパーコンピュータ7200の冷却設備の電力を削減することができる。 A large number of semiconductor devices 100 can be used to construct a computing system that performs large-scale parallel operations such as a large parallel computer, a supercomputer, and a server. FIG. 16A shows an example of a supercomputer 7200. The super computer 720 has a plurality of racks 7210. A plurality of rack mount computers 7220 are stored in each of the plurality of racks 7210. As shown in FIG. 16B, the computer 7220 includes a motherboard 7224 and a PC card 7225. The semiconductor device 100 is applied to the PC card 7225. Thereby, the supercomputer 720 with low power consumption can be provided. Since the heat generation of the computer 7220 is suppressed, the power of the cooling facility of the supercomputer 7200 can be reduced.

図17に示すように、半導体装置100は様々な電子機器(例えばPC7500、ゲーム機7520、7530、ナビゲーションシステム7540、TV(テレビジョン受像)装置7550)に組み込むことができる。 As shown in FIG. 17, the semiconductor device 100 can be incorporated into various electronic devices (for example, a PC 7500, game machines 7520 and 7530, a navigation system 7540, and a TV (television receiver) device 7550).

PC7500は据え置き型である。PC7500には、キーボード7502、およびモニタ装置7503が無線又は有線により接続されている。ノートPC、タブレット型端末などのコンピュータにも、半導体装置100を組み込むことができる。 The PC 7500 is a stationary type. A keyboard 7502 and a monitor device 7503 are connected to the PC 7500 wirelessly or by wire. The semiconductor device 100 can also be incorporated into a computer such as a notebook PC or a tablet terminal.

ゲーム機7520は据え置き型ゲーム機の例である。ゲーム機7520には、無線または有線でコントローラ7522が接続されている。ゲーム機7530は携帯型ゲーム機の例である。ゲーム機7520に半導体装置100が組み込まれているので、例えば、ゲーム機7520は、AIを用いることで、ユーザを楽しませるようにゲームを展開させることが可能である。ゲーム機7530についても同様である。コントローラ7522をPC7500に接続して、PC7500をゲーミングPCとして用いることができる。 Game machine 7520 is an example of a stationary game machine. A controller 7522 is connected to the game machine 7520 wirelessly or by wire. The game machine 7530 is an example of a portable game machine. Since the semiconductor device 100 is incorporated in the game machine 7520, for example, the game machine 7520 can develop a game so as to entertain the user by using AI. The same applies to the game machine 7530. The controller 7522 can be connected to the PC 7500 so that the PC 7500 can be used as a gaming PC.

図17は、ナビゲーションシステム7540が自動車のコントロールパネルに組み込まれている例を示している。半導体装置100を組み込んでいるため、ナビゲーションシステム7540において、AIによって渋滞を予測して、案内するルートを設定する、AIによる音声対話などが可能になる。 FIG. 17 shows an example in which a navigation system 7540 is incorporated in a control panel of an automobile. Since the semiconductor device 100 is incorporated, in the navigation system 7540, it is possible to predict a traffic jam by AI and set a route to be guided, and to perform voice conversation by AI.

例えば、TV装置7550に内蔵された半導体装置100を、AIのアルゴリズムを利用した画像エンジンとして機能させることができる。半導体装置100は、ノイズ除去、解像度アップコンバージョンなどの画像処理を行う。 For example, the semiconductor device 100 incorporated in the TV device 7550 can function as an image engine using an AI algorithm. The semiconductor device 100 performs image processing such as noise removal and resolution up-conversion.

〔実施の形態2〕
本実施の形態では、oxAIチップの具体的な構成例を説明する。
[Embodiment 2]
In this embodiment, a specific configuration example of the oxAI chip will be described.

<<アナログoxAIチップ>>
ここでは、アナログ演算を利用した超並列コンピューティングが可能なoxAIチップ400について説明する。oxAIチップ400は、全結合型ニューラルネットワーク(FCNN)に非常に有利である。oxAIチップ400の構成例、動作方法例の理解を容易にするため、図5に示すFCNNが回路によって構成されているとする。図5に示すFCNNは、1個の隠れ層をもつ。入力層、隠れ層、出力層のユニット数はそれぞれ1024、128、32である。活性化関数にはReLU(Rectified Liner Unit)が用いられている。oxAIチップ400のFCNNは、例えば、手書き文字認識、汎用AIに適用される。
<< Analog oxAI chip >>
Here, the oxAI chip 400 capable of massively parallel computing using analog operations will be described. The oxAI chip 400 is very advantageous for a fully connected neural network (FCNN). In order to facilitate understanding of the configuration example and the operation method example of the oxAI chip 400, it is assumed that the FCNN shown in FIG. The FCNN shown in FIG. 5 has one hidden layer. The numbers of units in the input layer, hidden layer, and output layer are 1024, 128, and 32, respectively. ReLU (Rectified Liner Unit) is used for the activation function. The FCNN of the oxAI chip 400 is applied to handwritten character recognition and general-purpose AI, for example.

図6は、oxAIチップ400の構成例を示す機能ブロック図である。図6に示すoxAIチップ400は、レシーバ(RX)401、デジタル‐アナログコンバータ(DAC)403、404、積和演算回路(MAC)アレイ405、406、ゲートドライバ407、デジタル‐アナログコンバータ(DAC)408、トランスミッタ(TX)409を有する。 FIG. 6 is a functional block diagram illustrating a configuration example of the oxAI chip 400. The oxAI chip 400 shown in FIG. 6 includes a receiver (RX) 401, digital-analog converters (DAC) 403 and 404, product-sum operation circuit (MAC) arrays 405 and 406, a gate driver 407, and a digital-analog converter (DAC) 408. , A transmitter (TX) 409.

oxAIチップ400のデータ伝送方式は差動伝送方式である。例えば、レシーバ401として、LVDS(小振幅差動伝送方式:Low Voltage Differential Signaling)レシーバが用いられ、トランスミッタ409としてLVDSトランスミッタが用いられる。 The data transmission method of the oxAI chip 400 is a differential transmission method. For example, an LVDS (Low Voltage Differential Signaling) receiver is used as the receiver 401, and an LVDS transmitter is used as the transmitter 409.

リセット信号rest_nは、oxAIチップ400をリセットする。 The reset signal rest_n resets the oxAI chip 400.

データin_w[7:0]は、学習済みデータである。例えば、重み係数を表す8ビットデジタル信号である。イネーブル信号en_la_w、クロック信号dclk_wに従い、DAC404は、データin_w[7:0]をアナログデータに変換する。ゲートドライバ407は、MACアレイ405、406へのアナログデータの書込みを制御する。ゲートドライバ407には、クロック信号gclk、パルス幅制御信号gpwc、スタートパルス信号gspが入力される。 Data in_w [7: 0] is learned data. For example, an 8-bit digital signal representing a weighting factor. In accordance with the enable signal en_la_w and the clock signal dclk_w, the DAC 404 converts the data in_w [7: 0] into analog data. The gate driver 407 controls the writing of analog data to the MAC arrays 405 and 406. The gate driver 407 receives the clock signal gclk, the pulse width control signal gpwc, and the start pulse signal gsp.

oxAIチップ400が処理するデータは8ビットデジタルデータであり、差動伝送方式で入力される。例えば、レシーバ401として、LVDS(小振幅差動伝送方式:Low Voltage Differential Signaling)レシーバが用いられる。レシーバ401は、差動クロック信号rx_clp、rx_clnに従い、入力データrx_dp[7:0]、rx_dn[7:0]をシングルエンド形式の8ビットデータに変換する。DAC403は、この8ビットデータをアナログデータに変換する。DAC404から出力されるアナログデータは、逐次MACアレイ405に書き込まれる。 Data processed by the oxAI chip 400 is 8-bit digital data, and is input by a differential transmission method. For example, a LVDS (Low Voltage Differential Signaling) receiver is used as the receiver 401. The receiver 401 converts the input data rx_dp [7: 0] and rx_dn [7: 0] into single-ended 8-bit data in accordance with the differential clock signals rx_clp and rx_cln. The DAC 403 converts this 8-bit data into analog data. Analog data output from the DAC 404 is sequentially written to the MAC array 405.

<MACアレイ405、406>
図7を参照して、MACアレイ405の回路構成例を説明する。MACアレイ405には、1024行144列の行列状に乗算回路40が設けられている。乗算回路40は、図2Bのoxメモリ回路12と同じ回路構成である。つまり、乗算回路40は、演算回路と、重み係数を記憶する不揮発性ローカルメモリ回路双方の機能を持つ。このことにより、oxAIチップ400は、GPUと比べて非常に少ないトランジスタ数によって、超並列演算を実現できる。トランジスタ数の低減は、oxAIチップ400の小型化、消費電力の低減につながる。
<MAC arrays 405 and 406>
A circuit configuration example of the MAC array 405 will be described with reference to FIG. The MAC array 405 is provided with multiplication circuits 40 in a matrix of 1024 rows and 144 columns. The multiplier circuit 40 has the same circuit configuration as the ox memory circuit 12 in FIG. 2B. That is, the multiplier circuit 40 has both functions of an arithmetic circuit and a nonvolatile local memory circuit that stores weighting coefficients. As a result, the oxAI chip 400 can realize a massively parallel operation with a very small number of transistors compared to the GPU. Reduction of the number of transistors leads to downsizing of the oxAI chip 400 and reduction of power consumption.

MACアレイ405には、乗算回路40の配列に応じて、ゲート線GL1、データ線VX1、WD1、RD1が設けられている。データ線WD1は重み係数データを乗算回路40に入力するための配線である。データ線WD1には、DAC403からアナログデータが入力される。ゲート線GL1は、重み係数データを入力する乗算回路40を選択するための信号線である、ゲート線GL1は、ゲートドライバ407によって駆動される。 The MAC array 405 is provided with a gate line GL1 and data lines VX1, WD1, and RD1 in accordance with the arrangement of the multiplication circuits 40. The data line WD1 is a wiring for inputting weight coefficient data to the multiplication circuit 40. Analog data is input from the DAC 403 to the data line WD1. The gate line GL1 is a signal line for selecting the multiplication circuit 40 to which weight coefficient data is input. The gate line GL1 is driven by the gate driver 407.

乗算回路40に重み係数データw0を書き込むことで、乗算回路40の保持ノード(読出しトランジスタのゲート)の電圧は、重み係数データに応じた電圧Vw0となる。 By writing the weight coefficient data w0 into the multiplier circuit 40, the voltage of the holding node (the gate of the read transistor) of the multiplier circuit 40 becomes the voltage Vw0 corresponding to the weight coefficient data.

データ線VX1は、CFNNが処理するデータの入力用配線である。データ線VX1には、DAC402からアナログデータが入力される。データ線RD1には、乗算回路40の演算結果が読みだされる。データ線RD1には、電流源42、オフセット回路43が電気的に接続されている。 The data line VX1 is an input wiring for data processed by the CFNN. Analog data is input from the DAC 402 to the data line VX1. The operation result of the multiplication circuit 40 is read out to the data line RD1. A current source 42 and an offset circuit 43 are electrically connected to the data line RD1.

乗算回路40に流れる電流I0は、保持ノードの電圧Vx0とデータ線RD1の電圧Vx0の積に比例する。つまり、電流I0は、重み係数と入力データの積を表している。同様に、電流I1は、保持ノードの電圧Vw1と電圧Vx1との積に比例する。つまり乗算回路40は、重み係数データと入力データとの積を計算することができる。 The current I0 flowing through the multiplier circuit 40 is proportional to the product of the voltage Vx0 of the holding node and the voltage Vx0 of the data line RD1. That is, the current I0 represents the product of the weight coefficient and the input data. Similarly, the current I1 is proportional to the product of the holding node voltage Vw1 and the voltage Vx1. That is, the multiplication circuit 40 can calculate the product of the weight coefficient data and the input data.

データ線RD1あたり1024個の乗算回路40が電気的に接続されている。電流源42は参照電流Irefを生成する。オフセット回路43に入力される電流Ioutは、参照電流Irefと電流Imacとの差分である。電流Imacは、1024個の乗算回路40を流れる電流の総和であり、重み係数と入力データとの積和した値を表す。参照電流IrefとImacとの差分ととることで、電流Ioutのノイズ成分を低減できる。 1024 multiplication circuits 40 are electrically connected per data line RD1. The current source 42 generates a reference current Iref. The current Iout input to the offset circuit 43 is the difference between the reference current Iref and the current Imac. The current Imac is the sum of the currents flowing through the 1024 multiplication circuits 40, and represents the product sum of the weighting coefficient and the input data. By taking the difference between the reference currents Iref and Imac, the noise component of the current Iout can be reduced.

オフセット回路43は、電流Ioutを電圧Voutに変換し、参照電圧Vrefと電圧Voutとの差分をとる。これにより、電圧Voutのノイズ成分が低減される。オフセット回路43、VrefとVoutとの差分電圧を増幅して、活性化関数回路44に出力する。活性化関数回路44は処理したデータをMACアレイ405に出力する。 The offset circuit 43 converts the current Iout into the voltage Vout, and takes the difference between the reference voltage Vref and the voltage Vout. Thereby, the noise component of the voltage Vout is reduced. The offset circuit 43 amplifies the differential voltage between Vref and Vout and outputs the amplified voltage to the activation function circuit 44. The activation function circuit 44 outputs the processed data to the MAC array 405.

なお、MACアレイ405の144列のうちの16列は、電流Ioutの生成に寄与せず積和演算に用いられる参照データを保持する。 Of the 144 columns of the MAC array 405, 16 columns do not contribute to the generation of the current Iout and hold reference data used for the product-sum operation.

MACアレイ406は、MACアレイ405と同様の構成である。乗算回路40が36行128列の行列状に配置されている。MACアレイ406において、36行のうちの4行は、電流Ioutの生成に寄与せず、参照データの保持に用いられる。 The MAC array 406 has the same configuration as the MAC array 405. Multiplier circuits 40 are arranged in a matrix of 36 rows and 128 columns. In the MAC array 406, four of the 36 rows do not contribute to the generation of the current Iout and are used to hold reference data.

図6に示すイネーブル信号en_cmは、MACアレイ405、406の電流源42用のイネーブル信号である。イネーブル信号en_absは、MACアレイ405、406のオフセット回路43用のイネーブル信号であり、信号osp1、osn1、en_res1はMACアレイ405のオフセット回路43の制御信号であり、信号osp2、osn2、en_res2はMACアレイ406のオフセット回路43の制御信号である。 The enable signal en_cm shown in FIG. 6 is an enable signal for the current source 42 of the MAC arrays 405 and 406. The enable signal en_abs is an enable signal for the offset circuit 43 of the MAC arrays 405 and 406, the signals osp1, osn1, and en_res1 are control signals of the offset circuit 43 of the MAC array 405, and the signals osp2, osn2, and en_res2 are MAC arrays. This is a control signal for the offset circuit 43 at 406.

<ADC408、TX409>
ADC408には、MACアレイ406から32のアナログデータが並列に入力される。ADC408は、シリアルパラレル変換を行うため、出力段にレジスタを備える。ADC408は、1チャネルの8ビットデジタルデータを出力する。
<ADC 408, TX 409>
The ADC 408 receives analog data from the MAC arrays 406 to 32 in parallel. The ADC 408 includes a register at the output stage in order to perform serial / parallel conversion. The ADC 408 outputs one channel of 8-bit digital data.

信号clk_sar、res_sar、go、stby_adcは、それぞれ、ADC408用のクロック信号、リセット信号、イネーブル信号、スタンバイ信号である。信号dclk_p2s、en_p2s_per、en_p2s_serは、それぞれ、レジスタ用のクロック信号、ラッチ信号、出力イネーブル信号である。ADC408には、32のアナログデータが入力され、8ビットデジタルデータをトランスミッタ409へ出力する。信号stby_txはトランスミッタ409用のスタンバイ信号である。 The signals clk_sar, res_sar, go, and stby_adc are a clock signal, a reset signal, an enable signal, and a standby signal for the ADC 408, respectively. The signals dclk_p2s, en_p2s_per, and en_p2s_ser are a register clock signal, a latch signal, and an output enable signal, respectively. The ADC 408 receives 32 analog data and outputs 8-bit digital data to the transmitter 409. The signal stby_tx is a standby signal for the transmitter 409.

トランスミッタ409は、信号dclk_p2sに応じて、8ビットデジタルデータを差分形式のデータtx_dp[7:0]、tx_dn[7:0]に変換し、出力し、信号dclk_p2sを差分形式のクロック信号tx_clp、tx_clnに変換し、出力する。差分データtx_dp[7:0]、tx_dn[7:0]は、FCNNが取得した32種類の推論データである。 The transmitter 409 converts the 8-bit digital data into differential format data tx_dp [7: 0] and tx_dn [7: 0] according to the signal dclk_p2s, outputs the data, and outputs the signal dclk_p2s to the differential format clock signals tx_clp and tx_cln. And output. The difference data tx_dp [7: 0] and tx_dn [7: 0] are 32 types of inference data acquired by the FCNN.

MACアレイ405、406の入力および出力データはアナログデータであるので、入出力データがデジタルデータである場合と比較し、MACアレイ405、406の配線数を大幅に低減することができる。乗算回路40は、乗算機能と、重み係数データの保持機能双方を備えるため、演算時にデータを読み込むことがない。つまり、乗算回路40は、データの授受の時間ペナルティーおよび電力ペナルティーが実質的にない。 Since the input and output data of the MAC arrays 405 and 406 are analog data, the number of wires of the MAC arrays 405 and 406 can be greatly reduced as compared with the case where the input / output data is digital data. Since the multiplication circuit 40 has both a multiplication function and a weight coefficient data holding function, data is not read at the time of calculation. That is, the multiplication circuit 40 has substantially no data transmission time penalty and power penalty.

並列処理アーキテクチャをもつプロセッサとしてGPUが知られている。GPUも、CPUと同様に、演算部とメモリ部間のデータ授受が演算効率のボトルネックとされている。これに対して、oxAIチップ400はこのような問題点がない。 A GPU is known as a processor having a parallel processing architecture. Similarly to the CPU, data exchange between the calculation unit and the memory unit is a bottleneck of calculation efficiency in the GPU. On the other hand, the oxAI chip 400 does not have such a problem.

乗算回路40は、2Tゲインセルと同じ回路構成であり、少ないトランジスタ数によって、アナログデータの掛け算を行うことができる。したがって、多数の乗算回路40を用いて、積和演算部を構成することで、低消費電力で、超並列演算処理が可能なoxAIチップ400を提供することができる。例えば、乗算回路40の数が10乃至10個程度であり、動作周波数3MHz又は30MHzである場合、oxAIチップ400の演算性能は、3TOPS(Tere Operations Per Second)乃至3POPS(Peta OPS)程度である。 The multiplier circuit 40 has the same circuit configuration as the 2T gain cell, and can perform analog data multiplication with a small number of transistors. Therefore, by configuring the product-sum operation unit using a large number of multiplication circuits 40, it is possible to provide the oxAI chip 400 that can perform the massively parallel operation processing with low power consumption. For example, when the number of multiplication circuits 40 is about 10 6 to 10 8 and the operation frequency is 3 MHz or 30 MHz, the calculation performance of the oxAI chip 400 is about 3 TOPS (Tele Operations Per Second) to 3 POPS (Peta OPS). is there.

<<プログラマブルoxAIチップ>>
ここで示すoxAIチップ450は、プログラマブルNNを構成できる。oxAIチップ450が演算するデータの形式はデジタルである。oxAIチップ450の演算回路は、専用の不揮発性ローカルメモリ回路を有し、不揮発性ローカルメモリはoxメモリ回路で構成されている。oxAIチップ450のNNは、例えば、各種画像処理(例えば、ノイズ除去、高解像度化)、物体認識、汎用AIとして用いることができる。
<< Programmable oxAI chip >>
The oxAI chip 450 shown here can constitute a programmable NN. The data format calculated by the oxAI chip 450 is digital. The arithmetic circuit of the oxAI chip 450 has a dedicated non-volatile local memory circuit, and the non-volatile local memory is composed of an ox memory circuit. The NN of the oxAI chip 450 can be used as, for example, various image processing (for example, noise removal and high resolution), object recognition, and general-purpose AI.

図8は、oxAIチップ450の構成例を示す機能ブロック図である。oxAIチップ450は、コントローラ460、I2Cモジュール462、レシーバ(RX)463、トランスミッタ(TX)464、データドライバ466、ワードドライバ467を有する。コントローラ460は、演算回路アレイ470、演算部471、SRAM472、セレクタ474、475、デマルチプレクサ476を有する。 FIG. 8 is a functional block diagram illustrating a configuration example of the oxAI chip 450. The oxAI chip 450 includes a controller 460, an I2C module 462, a receiver (RX) 463, a transmitter (TX) 464, a data driver 466, and a word driver 467. The controller 460 includes an arithmetic circuit array 470, an arithmetic unit 471, an SRAM 472, selectors 474 and 475, and a demultiplexer 476.

oxAIチップ450の入力データには、動作設定データ、学習済みデータ、パイプライン構造データ、演算回路アレイ470が処理するデータがある。学習済みデータ、パイプライン構造データは、コントローラ460のコンフィギュレーションデータとして、oxAIチップ450に入力される。 The input data of the oxAI chip 450 includes operation setting data, learned data, pipeline structure data, and data processed by the arithmetic circuit array 470. The learned data and pipeline structure data are input to the oxAI chip 450 as configuration data of the controller 460.

データsdaはシリアル形式の動作設定データであり、I2Cモジュール462に書き込まれる。I2Cモジュール462は、書き込まれた動作設定データをコントローラ460に出力する。信号i2c_clk、i2c_resetb、sclは、それぞれ、I2Cコントローラ用クロック信号、I2Cリセット信号、I2Cクロック信号である。信号O_SAVE、O_LOAD、OS_USEは、動作設定データのバックアップ制御に用いられる。 Data sda is operation setting data in a serial format, and is written in the I2C module 462. The I2C module 462 outputs the written operation setting data to the controller 460. Signals i2c_clk, i2c_resetb, and scl are an I2C controller clock signal, an I2C reset signal, and an I2C clock signal, respectively. The signals O_SAVE, O_LOAD, and OS_USE are used for backup control of operation setting data.

データDATA0は、データドライバ466に入力される。データDATA0はコンフィグレーションデータである。データドライバ466からは信号nSTATUSが出力される。信号nSTATUSは、コンフィギュレーション状態をあらわす信号である。 The data DATA0 is input to the data driver 466. Data DATA0 is configuration data. The data driver 466 outputs a signal nSTATUS. The signal nSTATUS is a signal indicating a configuration state.

oxAIチップ450へのデータ伝送方式には、シングルエンド方式と、LVDS方式とが可能である。データdin[7:0]はシングルエンド方式の入力データであり、セレクタ474に入力される。レシーバ463は、oxAIチップ400のレシーバと同様の構成であり、差動クロック信号rx_clp、rx_clnに従い、差動入力データrx_dp[7:0]、rx_dn[7:0]をシングルエンド方式のデータrx_ds[7:0]に変換し、セレクタ474に出力する。信号stby_rx、hpe_rxはそれぞれ、はレシーバ463のスタンバイ信号である。 As a data transmission method to the oxAI chip 450, a single end method and an LVDS method can be used. Data din [7: 0] is single-ended input data and is input to the selector 474. The receiver 463 has the same configuration as that of the receiver of the oxAI chip 400, and the differential input data rx_dp [7: 0] and rx_dn [7: 0] are converted into single-ended data rx_ds [according to the differential clock signals rx_clp and rx_cln. 7: 0] and output to the selector 474. Signals stby_rx and hpe_rx are standby signals for the receiver 463, respectively.

信号nCONFIG、DCLKがコントローラ460に入力され、コントローラ460は信号CONF_DONEを出力する。信号nCONFIG、DCLKはそれぞれ、コンフィギュレーション開始信号、コンフィギュレーション用クロック信号である。信号CONF_DONEはコンフィギュレーションが完了したことを表す信号である。 The signals nCONFIG and DCLK are input to the controller 460, and the controller 460 outputs the signal CONF_DONE. Signals nCONFIG and DCLK are a configuration start signal and a configuration clock signal, respectively. The signal CONF_DONE is a signal indicating that the configuration is completed.

信号sys_clk、sys_resetb、user_resetb、context_ex[5:0]はシステムクロック信号、システムリセット信号、ユーザリセット信号、外部コンテキスト信号である。信号data_enは、コントローラ460への入力データの伝送を実行する期間を設定する信号である。これらの信号は、コントローラ460に入力される。コントローラ460は信号State[2:0]、sabstate[2:0]を出力する。信号State[2:0]、sabstate[2:0]はそれぞれコントローラ460内部の状態、サブ状態をあらわす。 Signals sys_clk, sys_resetb, user_resetb, context_ex [5: 0] are a system clock signal, a system reset signal, a user reset signal, and an external context signal. The signal data_en is a signal that sets a period for executing transmission of input data to the controller 460. These signals are input to the controller 460. The controller 460 outputs signals State [2: 0] and sabbstate [2: 0]. Signals State [2: 0] and sabbstate [2: 0] represent the internal state and sub-state of controller 460, respectively.

演算回路アレイ470には、セレクタ475の出力データが入力される。演算回路アレイ470は処理したデータを演算部471に出力する。演算部471の出力データはSRAM472で一時的に記憶される。SRAM472から読み出されたデータは、セレクタ475、デマルチプレクサ476に出力される。セレクタ475は、セレクタ474の出力データ、SRAM473の出力データの何れか一方を演算回路アレイ470に出力する。 The output data of the selector 475 is input to the arithmetic circuit array 470. The arithmetic circuit array 470 outputs the processed data to the arithmetic unit 471. The output data of the calculation unit 471 is temporarily stored in the SRAM 472. Data read from the SRAM 472 is output to the selector 475 and the demultiplexer 476. The selector 475 outputs either the output data of the selector 474 or the output data of the SRAM 473 to the arithmetic circuit array 470.

デマルチプレクサ476は、データの出力形式を選択する機能をもつ。デマルチプレクサ476の一方の出力データは、シングルエンド形式のデータdout[7:0]としてoxAIチップ450外部に出力される。他方の出力データはトランスミッタ464で処理され、差動形式のデータtx_dp[7:0]、tx_dn[7:0]に変換され、oxAIチップ450外部に出力される。 The demultiplexer 476 has a function of selecting an output format of data. One output data of the demultiplexer 476 is output to the outside of the oxAI chip 450 as single-ended data dout [7: 0]. The other output data is processed by the transmitter 464, converted into differential data tx_dp [7: 0], tx_dn [7: 0], and output to the outside of the oxAI chip 450.

<演算回路アレイ470>
図9〜図13を参照して、演算回路アレイ470について説明する。図9に示すように、演算回路アレイ470は、複数の演算回路21、複数のスイッチ回路22が行列状に設けられている。演算回路21、スイッチ回路22はプログラマブル回路である。演算回路アレイ470の処理内容に合わせて、演算回路21は回路構成される。演算回路アレイ470の処理内容に合わせて、スイッチ回路22の回路構成を変更することにより、演算回路21の接続関係が変更される。
<Arithmetic circuit array 470>
The arithmetic circuit array 470 will be described with reference to FIGS. As shown in FIG. 9, the arithmetic circuit array 470 includes a plurality of arithmetic circuits 21 and a plurality of switch circuits 22 arranged in a matrix. The arithmetic circuit 21 and the switch circuit 22 are programmable circuits. The arithmetic circuit 21 is configured according to the processing contents of the arithmetic circuit array 470. By changing the circuit configuration of the switch circuit 22 in accordance with the processing contents of the arithmetic circuit array 470, the connection relationship of the arithmetic circuits 21 is changed.

なお、図9中の「U」、「D、「L」、「R」はスイッチ回路22の配線の名称であり、かつ接続方向(上、下、左、右)を表している。 Note that “U”, “D,“ L ”, and“ R ”in FIG. 9 are the names of the wirings of the switch circuit 22 and represent the connection directions (up, down, left, and right).

図10に演算回路21の構成例を示す。演算回路21は、入力レジスタ51、メモリ回路52、乗算回路53、加算回路54、出力レジスタ55A、55B、セレクタ56A〜56D、メモリ回路57A〜57Cを有する。メモリ回路52、57A〜57Cは、演算回路21の不揮発性ローカルメモリ回路であり、oxメモリ回路が適用されている。 FIG. 10 shows a configuration example of the arithmetic circuit 21. The arithmetic circuit 21 includes an input register 51, a memory circuit 52, a multiplier circuit 53, an adder circuit 54, output registers 55A and 55B, selectors 56A to 56D, and memory circuits 57A to 57C. The memory circuits 52 and 57A to 57C are nonvolatile local memory circuits of the arithmetic circuit 21, and ox memory circuits are applied.

入力レジスタ51には、データsinが入力される。入力レジスタ51はラッチ信号slatの制御でデータsinを保持する。入力レジスタ51は、保持データをデータsoutとして、セレクタ56Aに出力する。メモリ回路57Aの出力信号に従い、セレクタ56Aは、データsinとデータsoutの何れか一方を選択し、選択したデータを乗算回路53に出力する。データsoutは、演算回路21の外部に出力される。入力レジスタ51を設けることで、データsinを入力レジスタ51で一時的に保持することで、データsinをシフトしたデータsoutを出力することができる。 Data sin is input to the input register 51. The input register 51 holds data sin under the control of the latch signal slat. The input register 51 outputs the retained data as data sout to the selector 56A. In accordance with the output signal of the memory circuit 57A, the selector 56A selects either the data sin or the data sout, and outputs the selected data to the multiplication circuit 53. The data sout is output to the outside of the arithmetic circuit 21. By providing the input register 51, the data sin can be temporarily stored in the input register 51, so that the data sout obtained by shifting the data sin can be output.

メモリ回路52は、コンテキスト信号contex_W[1:0]が入力される。コンテキスト信号contex_W[1:0]は、信号contex_ex[5:0]をデコードすることで生成される内部信号である。メモリ回路52は複数の重み係数データを記憶している。重み係数データは、コンフィギュレーションデータとして、メモリ回路52に書き込まれている。コンフィギュレーションデータはデータドライバ446から伝送される。   The memory circuit 52 is input with a context signal context_W [1: 0]. The context signal context_W [1: 0] is an internal signal generated by decoding the signal context_ex [5: 0]. The memory circuit 52 stores a plurality of weight coefficient data. The weight coefficient data is written in the memory circuit 52 as configuration data. Configuration data is transmitted from the data driver 446.

図11Aに示すように、メモリ回路52は、フリップフロップ71、デコーダ72、メモリセル73_0〜73_3、トランジスタ77、ラッチ回路78を有する。メモリセル73_0〜73_3は、oxメモリ回路13(図2C参照)と同じ回路構成であり、3個のoxトランジスタでなるゲインセルである。 As illustrated in FIG. 11A, the memory circuit 52 includes a flip-flop 71, a decoder 72, memory cells 73_0 to 73_3, a transistor 77, and a latch circuit 78. The memory cells 73_0 to 73_3 have the same circuit configuration as the ox memory circuit 13 (see FIG. 2C) and are gain cells including three ox transistors.

信号word0〜word3はワードドライバ67で生成される。信号word0〜word3によって1個のメモリセルが選択され、選択されたメモリセルにコンフィギュレーションデータが書き込まれる。 Signals word 0 to word 3 are generated by the word driver 67. One memory cell is selected by signals word0 to word3, and configuration data is written to the selected memory cell.

フリップフロップ71は、コンテキスト信号context_W[1:0]を保持するする。デコーダ72は、コンテキスト信号context_W[1:0]をデコードして、切替え信号context_W0〜context_W3を生成し、出力する。機能を有する。切替え信号context_W0〜context_W3は、重み係数データを出力するメモリセルを選択する機能を持つ。選択されたメモリセルから読み出された重みデータは、データcmoutとして、乗算回路53へ出力される。トランジスタ77は、データcmoutが読みだされる配線を電圧Vpreにプリチャージする機能を持つ。信号prchに従い、トランジスタ77は当該配線をプリチャージする。 The flip-flop 71 holds the context signal context_W [1: 0]. The decoder 72 decodes the context signal context_W [1: 0] to generate and output the switching signals context_W0 to context_W3. It has a function. The switching signals context_W0 to context_W3 have a function of selecting a memory cell that outputs weight coefficient data. The weight data read from the selected memory cell is output to the multiplication circuit 53 as data cmout. The transistor 77 has a function of precharging a wiring from which data cmout is read to the voltage Vpre. In accordance with the signal prch, the transistor 77 precharges the wiring.

図11Bにメモリセルの他の構成例を示す。図11Bに示すメモリセル74は、メモリセル73_0の変形例であり、読出しトランジスタのゲートに2個のインバータ回路でなるラッチ回路が設けられている。例えば、これらインバータ回路は、nチャネル型Siトランジスタとpチャネル型SiトランジスタでなるCMOS回路である。 FIG. 11B shows another configuration example of the memory cell. A memory cell 74 illustrated in FIG. 11B is a modified example of the memory cell 73_0, and a latch circuit including two inverter circuits is provided at the gate of the read transistor. For example, these inverter circuits are CMOS circuits composed of an n-channel Si transistor and a p-channel Si transistor.

図12にメモリ回路57Aの構成例を示す。メモリ回路57Aは、メモリセル91_0、91_1、トランジスタ92_0、92_1、93を有する。メモリ回路57Aには、コンフィギュレーションデータ、切替え信号context_A0、context_A1、信号wordA0、wordB0、wordA1、wordB1が入力される。 FIG. 12 shows a configuration example of the memory circuit 57A. The memory circuit 57A includes memory cells 91_0 and 91_1 and transistors 92_0, 92_1, and 93. Configuration data, switching signals context_A0 and context_A1, and signals wordA0, wordB0, wordA1 and wordB1 are input to the memory circuit 57A.

メモリセル91_0、91_1は、それぞれ、2個のoxメモリ回路12(図2B)で構成される。メモリセル91_0にコンフィギュレーションデータ“1”を書き込む場合は、信号wordA0を“H”にし、信号wordB0、wordA1、wordB1を“L”にする。メモリセル91_1にコンフィギュレーションデータ“0”を書き込む場合は、信号wordB0を“H”にし、信号wordA0、wordA1、wordB1を“L”にする。 Each of the memory cells 91_0 and 91_1 includes two ox memory circuits 12 (FIG. 2B). When the configuration data “1” is written to the memory cell 91_0, the signal wordA0 is set to “H”, and the signals wordB0, wordA1, and wordB1 are set to “L”. When the configuration data “0” is written to the memory cell 91_1, the signal wordB0 is set to “H”, and the signals wordA0, wordA1, and wordB1 are set to “L”.

セレクタ56Aへ制御信号する間は、トランジスタ93はオフ状態である。切替え信号context_A0、context_A1により、トランジスタ92_0、92_1の何れか一方がオン状態になる。例えば、トランジスタ92_0がオンになると、メモリセル91_0の保持データに応じた論理の制御信号が、セレクタ56Aに出力される。 While the control signal is sent to the selector 56A, the transistor 93 is in the off state. One of the transistors 92_0 and 92_1 is turned on by the switching signals context_A0 and context_A1. For example, when the transistor 92_0 is turned on, a logic control signal corresponding to the data held in the memory cell 91_0 is output to the selector 56A.

メモリ回路57B、57Cは、メモリ回路57Aと同じ回路構成をもつ。 The memory circuits 57B and 57C have the same circuit configuration as the memory circuit 57A.

乗算回路53は、データsdataとデータcmoutとの積を計算し、計算結果を表すデータmoutを生成する。データmoutは、加算回路54およびセレクタ56Bに出力される。 The multiplication circuit 53 calculates the product of the data sdata and the data cmout, and generates data mout representing the calculation result. Data mout is output to addition circuit 54 and selector 56B.

データainは、他の演算回路21の出力データ、または、セレクタ475の出力データである。加算回路54は、データainとデータmoutとの和を計算し、計算結果を表すデータaoutを生成する。データaoutはセレクタ56Bに出力される。 Data ain is output data of another arithmetic circuit 21 or output data of the selector 475. The adder circuit 54 calculates the sum of the data ain and the data mout and generates data aout representing the calculation result. Data aout is output to selector 56B.

出力レジスタ55Aはセレクタ56Bの出力データを保持し、出力レジスタ55Bはセレクタ56Cの出力データを保持する。出力レジスタ55A、55Bを設けることで、信号遅延による演算エラーを防ぐことができる。信号res_rgは、出力レジスタ55A、55Bのリセット信号である。 The output register 55A holds the output data of the selector 56B, and the output register 55B holds the output data of the selector 56C. By providing the output registers 55A and 55B, it is possible to prevent calculation errors due to signal delay. The signal res_rg is a reset signal for the output registers 55A and 55B.

出力レジスタ55Aは保持データをセレクタ56Dに出力する。セレクタ56Dまたは出力レジスタ55Bの出力データが、データsoutとして演算回路21から出力される。 The output register 55A outputs the retained data to the selector 56D. The output data of the selector 56D or the output register 55B is output from the arithmetic circuit 21 as data sout.

演算回路アレイ470には演算回路21が行列状に配列されているので、演算回路アレイは、積和演算装置として機能させることができる。 Since the arithmetic circuit array 470 has the arithmetic circuits 21 arranged in a matrix, the arithmetic circuit array can function as a product-sum arithmetic device.

演算回路アレイ470の出力データは、演算部471に入力される。例えば、演算部471は、活性化関数の機能および/またはプーリング層の機能を持つ。 Output data of the arithmetic circuit array 470 is input to the arithmetic unit 471. For example, the calculation unit 471 has an activation function function and / or a pooling layer function.

<スイッチ回路22の構成>
図13A、図13Bを参照して、スイッチ回路22を説明する。図13Aに示すように、スイッチ回路22には、8個のスイッチ回路25が設けられている。データsoutの出力用配線26Sは、配線U、D、L、Rのうちの何れか1に電気的に接続される。データacoutの出力用配線26Aについても同様である。
<Configuration of Switch Circuit 22>
The switch circuit 22 will be described with reference to FIGS. 13A and 13B. As shown in FIG. 13A, the switch circuit 22 is provided with eight switch circuits 25. The output wiring 26S for the data sout is electrically connected to any one of the wirings U, D, L, and R. The same applies to the output wiring 26A for the data acout.

図13Bに示すように、スイッチ回路25は、フリップフロップ80、デコーダ81、メモリセル83_0、83_1、配線87を有する。配線87は、配線L、R、UまたはDのいずれかの配線である。図13Bには、4ビットデータを伝えるためのスイッチ回路25を図示している。 As illustrated in FIG. 13B, the switch circuit 25 includes a flip-flop 80, a decoder 81, memory cells 83_0 and 83_1, and a wiring 87. The wiring 87 is any one of the wirings L, R, U, and D. FIG. 13B shows a switch circuit 25 for transmitting 4-bit data.

フリップフロップ80は、コンテキスト信号context_Cを保持する。デコーダ72は、コンテキスト信号context_Cをデコードして、切替え信号context_C0、context_C1を生成する。メモリセル83_0には信号context_C0、word0が入力され、メモリセル83_1には信号context_C0、word1が入力される。 The flip-flop 80 holds the context signal context_C. The decoder 72 decodes the context signal context_C and generates switching signals context_C0 and context_C1. Signals context_C0 and word0 are input to the memory cell 83_0, and signals context_C0 and word1 are input to the memory cell 83_1.

メモリセル83_0の書込みトランジスタは、バックゲートを有するoxトランジスタである。メモリセル83_0において、バックゲートを有さないnチャネル型トランジスタはSiトランジスタである。なお、メモリセル83_0の全てのトランジスタがoxトランジスタであってもよい。メモリセル83_1についても堂々である。 The write transistor of the memory cell 83_0 is an ox transistor having a back gate. In the memory cell 83_0, the n-channel transistor having no back gate is a Si transistor. Note that all the transistors of the memory cell 83_0 may be ox transistors. The memory cell 83_1 is also imposing.

信号word0によって、書込みトランジスタをオン状態にすることで、メモリセル83_0へコンフィギュレーションデータが書き込まれる。切替え信号context_C0によって、メモリセル83_0が選択される場合、メモリセル83_0が保持しているコンフィギュレーションデータに応じて、配線87と演算回路21間の接続状態が決定される。 Configuration data is written to the memory cell 83_0 by turning on the writing transistor with the signal word0. When the memory cell 83_0 is selected by the switching signal context_C0, the connection state between the wiring 87 and the arithmetic circuit 21 is determined in accordance with the configuration data held in the memory cell 83_0.

演算回路21およびスイッチ回路22は不揮発性ローカルメモリ回路を内蔵しているため、回路21、22は、演算中にoxAIチップ450の外部のメモリ装置にアクセスする必要がない。よって、oxAIチップ450もoxAIチップ400と同様に演算部とメモリ部間のデータ授受が演算効率のボトルネックにならない。演算回路21間でデータの受け渡しと、演算処理とが逐次実行されるため、演算を高効率に行える。 Since the arithmetic circuit 21 and the switch circuit 22 incorporate a nonvolatile local memory circuit, the circuits 21 and 22 do not need to access a memory device outside the oxAI chip 450 during the operation. Therefore, similarly to the oxAI chip 400, the oxAI chip 450 does not cause a calculation efficiency bottleneck to exchange data between the arithmetic unit and the memory unit. Since data exchange and arithmetic processing are sequentially performed between the arithmetic circuits 21, arithmetic can be performed with high efficiency.

演算回路21およびスイッチ回路22がマルチコンテキスト方式のプログラマブルな回路であるため、少ないハードウエハ資源で、超並列演算処理を効率よく実行することが可能である。また、様々なNNをoxAIチップ450のハードウエアによって実現することができる。例えば、図14に示すような畳み込みNNをoxAIチップ450のハードウエハで実現することができる。図14の数値は、層のサイズ、深さ(チャネル数)を表している。例えば、入力層の幅W、高さH、チャネル数Mは、それぞれ38、24、1である。入力層のフィルタのサイズW×H×Mは3×3×1である。 Since the arithmetic circuit 21 and the switch circuit 22 are multi-context programmable circuits, it is possible to efficiently execute massively parallel arithmetic processing with few hardware resources. Various NNs can be realized by the hardware of the oxAI chip 450. For example, the convolution NN as shown in FIG. 14 can be realized by a hard wafer of the oxAI chip 450. The numerical values in FIG. 14 represent the layer size and depth (number of channels). For example, the input layer width W, height H, and number of channels M are 38, 24, and 1, respectively. The size of the input layer filter W × H × M is 3 × 3 × 1.

11、12、13、14:oxメモリ回路、
100:半導体装置、 110:データバス、 112:I/O(入出力)インターフェース、 114:メモリ部、 115:FPGAチップ、120:oxAIチップ、
121A、121B、121C:回路部、 150:周辺機器、
200、202:評価ボード、 202:評価ボード、 210、212:ボード、
220、222:oxAIチップ、 225:GPUチップ、 231、232:メモリチップ、 235、236:FPGAチップ、 240:PCIeコネクタ、 242:USBコネクタ、 244:HDMI入力コネクタ、 244:HDMI入力コネクタ、 245:HDMI出力コネクタ、
250A、250B、252A、252B:コネクタ
11, 12, 13, 14: ox memory circuit,
100: Semiconductor device 110: Data bus 112: I / O (input / output) interface 114: Memory unit 115: FPGA chip 120: oxAI chip
121A, 121B, 121C: circuit unit, 150: peripheral device,
200, 202: Evaluation board, 202: Evaluation board, 210, 212: Board,
220, 222: oxAI chip, 225: GPU chip, 231, 232: Memory chip, 235, 236: FPGA chip, 240: PCIe connector, 242: USB connector, 244: HDMI input connector, 244: HDMI input connector, 245: HDMI output connector,
250A, 250B, 252A, 252B: Connector

Claims (7)

第1プロセッサチップと、
メモリ部と、
データバスと、を有し、
前記第1プロセッサチップおよび前記メモリ部はそれぞれ、前記データバスと電気的に接続され、
前記第1プロセッサチップは、人工知能の演算を行う演算回路アレイを有し、
前記演算回路アレイは、複数の演算回路を有し、
前記演算回路は、第1トランジスタ、第2トランジスタ、容量素子、および保持ノードを有し、
前記第1トランジスタのチャネル形成領域は金属酸化物を有し、
前記第1トランジスタは前記保持ノードへのデータの書き込みを制御する機能をもち、
前記第2トランジスタのゲートは前記保持ノードに電気的に接続され、
前記容量素子は、前記保持ノードに電気的に接続されていることを特徴とする半導体装置。
A first processor chip;
A memory section;
A data bus, and
Each of the first processor chip and the memory unit is electrically connected to the data bus;
The first processor chip has an arithmetic circuit array for performing artificial intelligence operations,
The arithmetic circuit array has a plurality of arithmetic circuits,
The arithmetic circuit has a first transistor, a second transistor, a capacitor, and a holding node,
The channel formation region of the first transistor has a metal oxide,
The first transistor has a function of controlling data writing to the holding node,
A gate of the second transistor is electrically connected to the holding node;
The semiconductor device is characterized in that the capacitor is electrically connected to the holding node.
請求項1において、
前記保持ノードは、アナログデータが書き込まれる半導体装置。
In claim 1,
The holding node is a semiconductor device to which analog data is written.
第1プロセッサチップと、
メモリ部と、
データバスと、を有し、
前記第1プロセッサチップ、および前記メモリ部は、それぞれ、前記データバスと電気的に接続され、
前記第1プロセッサチップは、人工知能の演算を行う演算回路アレイを有し、
前記演算回路アレイは、複数の演算回路を有し、
前記演算回路は、複数のメモリ回路を有し、
前記複数のメモリ回路は、それぞれ、複数のメモリセルを有し、
前記複数のメモリセルは、それぞれ、保持ノードと、前記保持ノードへのデータの書き込みを制御するトランジスタを有し、
前記トランジスタのチャネル形成領域は金属酸化物を有することを特徴とする半導体装置。
A first processor chip;
A memory section;
A data bus, and
The first processor chip and the memory unit are each electrically connected to the data bus,
The first processor chip has an arithmetic circuit array for performing artificial intelligence operations,
The arithmetic circuit array has a plurality of arithmetic circuits,
The arithmetic circuit has a plurality of memory circuits,
Each of the plurality of memory circuits includes a plurality of memory cells;
Each of the plurality of memory cells includes a holding node and a transistor that controls writing of data to the holding node.
The channel formation region of the transistor includes a metal oxide.
請求項3において、
前記保持ノードは、デジタルデータが書き込まれる半導体装置。
In claim 3,
The holding node is a semiconductor device to which digital data is written.
請求項1乃至4の何れか1項において、
さらに、FPGAを有する2プロセッサチップが設けられていることを特徴とする半導体装置。
In any one of Claims 1 thru | or 4,
Further, a two-processor chip having an FPGA is provided.
請求項1乃至5の何れか1項に記載の半導体装置を有する評価ボード。   An evaluation board comprising the semiconductor device according to claim 1. 請求項1乃至5の何れか1項に記載の半導体装置を有する電子機器。   An electronic apparatus comprising the semiconductor device according to claim 1.
JP2017154879A 2017-08-10 2017-08-10 Semiconductor device, and electronic equipment Withdrawn JP2019033233A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017154879A JP2019033233A (en) 2017-08-10 2017-08-10 Semiconductor device, and electronic equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017154879A JP2019033233A (en) 2017-08-10 2017-08-10 Semiconductor device, and electronic equipment

Publications (1)

Publication Number Publication Date
JP2019033233A true JP2019033233A (en) 2019-02-28

Family

ID=65524465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017154879A Withdrawn JP2019033233A (en) 2017-08-10 2017-08-10 Semiconductor device, and electronic equipment

Country Status (1)

Country Link
JP (1) JP2019033233A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070182A (en) * 2019-04-01 2019-07-30 京微齐力(北京)科技有限公司 The platform chip of suitable artificial intelligence and its manufacture and design method
WO2021130591A1 (en) * 2019-12-27 2021-07-01 株式会社半導体エネルギー研究所 Semiconductor device
WO2021186279A1 (en) * 2020-03-18 2021-09-23 株式会社半導体エネルギー研究所 Semiconductor device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070182A (en) * 2019-04-01 2019-07-30 京微齐力(北京)科技有限公司 The platform chip of suitable artificial intelligence and its manufacture and design method
CN110070182B (en) * 2019-04-01 2021-08-24 京微齐力(北京)科技有限公司 Platform chip suitable for artificial intelligence and manufacturing and designing method thereof
WO2021130591A1 (en) * 2019-12-27 2021-07-01 株式会社半導体エネルギー研究所 Semiconductor device
WO2021186279A1 (en) * 2020-03-18 2021-09-23 株式会社半導体エネルギー研究所 Semiconductor device

Similar Documents

Publication Publication Date Title
JP7502503B2 (en) Calculation unit
JP7504964B2 (en) Semiconductor Device
JP2019046199A (en) Processor and electronic device
US10908669B2 (en) Methods and apparatus for power management of a memory cell
JP2019033233A (en) Semiconductor device, and electronic equipment
US11962295B2 (en) Multiplexer and semiconductor device including the same
CN105843981B (en) Circuit design system and semiconductor circuit designed by using the same
US11908947B2 (en) Semiconductor device
US10833579B1 (en) Switched capacitor regulators with flying-inverter-controlled power switches
CN116821048A (en) Integrated memory chip and operation method thereof
US9467147B2 (en) Counter circuit and image sensor including the same
CN107404305B (en) Semiconductor circuit having a plurality of transistors
JP6953229B2 (en) Semiconductor device
JP2017527942A (en) Bus circuit for memory devices
US20220276839A1 (en) Semiconductor device
US10366646B2 (en) Devices including first and second buffers, and methods of operating devices including first and second buffers
US20150222301A1 (en) Transmitting circuit and transceiver system including the same
US9904310B2 (en) Regulator circuit and power system including the same
JP7581209B2 (en) Semiconductor Device

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20200713