Nothing Special   »   [go: up one dir, main page]

JPWO2019048965A1 - 物性予測方法および物性予測システム - Google Patents

物性予測方法および物性予測システム Download PDF

Info

Publication number
JPWO2019048965A1
JPWO2019048965A1 JP2019540721A JP2019540721A JPWO2019048965A1 JP WO2019048965 A1 JPWO2019048965 A1 JP WO2019048965A1 JP 2019540721 A JP2019540721 A JP 2019540721A JP 2019540721 A JP2019540721 A JP 2019540721A JP WO2019048965 A1 JPWO2019048965 A1 JP WO2019048965A1
Authority
JP
Japan
Prior art keywords
type
fingerprint
physical properties
physical property
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2019540721A
Other languages
English (en)
Inventor
鈴木 邦彦
邦彦 鈴木
瀬尾 哲史
哲史 瀬尾
晴恵 尾坂
晴恵 尾坂
芳隆 道前
芳隆 道前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Semiconductor Energy Laboratory Co Ltd
Original Assignee
Semiconductor Energy Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Semiconductor Energy Laboratory Co Ltd filed Critical Semiconductor Energy Laboratory Co Ltd
Publication of JPWO2019048965A1 publication Critical patent/JPWO2019048965A1/ja
Priority to JP2023084350A priority Critical patent/JP2023113716A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Neurology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Electroluminescent Light Sources (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

有機化合物の有する物性を誰でも簡便に精度良く予測することが可能な物性予測方法を提供する。また、有機化合物の有する物性を誰でも簡便に精度良く予測することが可能な物性予測システムを提供する。有機化合物の分子構造と物性の相関を学習させる段階と、前記学習の結果をもとに対象物質の分子構造から目的とする物性値を予測する段階とを有し、前記有機化合物の分子構造の表記方法として、複数種類のフィンガープリント法を同時に用いる有機化合物の物性予測方法および物性予測システムを提供する。

Description

本発明の一態様は、有機化合物の物性予測方法および物性予測装置に関する。
有機化合物の物性は、古くは目的とする物質を合成し、直接測定することでしか知りえなかったものであった。しかし、それら特性は当該有機化合物の分子構造により決定するものであるため、ある分子構造を有する有機化合物が備える物性がおおよそどのくらいの値を示すものであるのかは、データの蓄積された昨今であれば、熟練者は目星をつけることが可能となっている。また、近年では、第1原理シミュレーション理論などを用いて計算することによっても予測は可能である。
有機化合物を用いた研究や開発においては、必要とされる特性に応じて、対応する物性を有する有機化合物が選択されて用いられる。そのため、実際に合成することなく、既知物質や未知の物質から、要求される物性の有機化合物を的確に予測し、選択して用いることができれば、開発速度を大きく向上させることができると期待される。
しかし、上述したような的確な予測は誰にでもできるわけではない上に、現状、シミュレーションには膨大なコストや時間がかかってしまう。一方で、候補となる有機化合物は非常に多く存在するため、誰でも簡単に素早く目的の有機化合物の物性を予測できる方法およびシステムが望まれている。
近年、機械学習などの方法を利用して分類、推定、予測などを行う方法が大きな進化を遂げている。特に、畳み込みニューラルネットワークを用いたディープラーニングによる選別や予測の性能は大きく向上しており、様々な分野において優れた成果を上げている。しかし、有機化合物を取り扱う分野において、その構造をコンピュータに齟齬なく理解させた上に物性に関連する特徴を的確に抽出することが可能であり、且つ扱いやすい情報量である有機化合物の記述方法は、未だ十分なものが殆ど存在しないのが現状である。そのため、有機化合物の物性を、誰でも、簡便に、精度良く予測することができる物性予測方法およびシステムは未だ実現していない。
特許文献1では、機械学習を用いた新規物質探索方法およびその装置について開示されている。
特開2017−91526号公報
本発明の一態様では未知の有機化合物の有する物性を誰でも簡便に精度良く予測することが可能な物性予測方法を提供することを目的とする。また、および有機化合物の有する物性を誰でも簡便に精度良く予測することが可能な物性予測システムを提供することを目的とする。
本発明の一態様は、有機化合物の分子構造と物性の相関を学習させる段階と、前記学習の結果をもとに対象物質の分子構造から目的とする物性を予測する段階とを有し、前記有機化合物の分子構造の表記方法として、複数種類のフィンガープリント法を同時に用いる有機化合物の物性予測方法である。
また、本発明の他の一態様は、有機化合物の分子構造と物性の相関を学習させる段階と、前記学習の結果をもとに対象物質の分子構造から目的とする物性を予測する段階とを有し、前記有機化合物の分子構造の表記方法として、2種類のフィンガープリント法を同時に用いる有機化合物の物性予測方法である。
また、本発明の他の一態様は、有機化合物の分子構造と物性の相関を学習させる段階と、前記学習の結果を元に対象物質の分子構造から目的とする物性を予測する段階とを有し、前記有機化合物の分子構造の表記方法として、3種類のフィンガープリント法を同時に用いる有機化合物の物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてAtom Pair型、Circular型、Substructure key型およびPath−based型の少なくともいずれか1を含む物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記複数のフィンガープリント法が、Atom Pair型、Circular型、Substructure key型およびPath−based型の中から選ばれる物性予測方法である。
また、本発明の他の一態様は、上記構成において前記フィンガープリント法としてAtom Pair型およびCircular型を含む物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてCircular型およびSubstructure key型を含む物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてCircular型およびPath−based型を含む物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてAtom Pair型およびSubstructure key型を含む物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてAtom Pair型およびPath−based型を含む物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法として、Atom Pair型、Substructure key型およびCircular型を含む物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法として前記Circular型が用いられる場合、rが3以上である物性予測方法である。
また、本発明の他の一態様は上記構成において、前記Circular型の前記フィンガープリント法はrが5以上である物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法の少なくとも1を用いて学習させる各有機化合物の分子構造を表記した際に、各有機化合物の表記が全て異なる物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法の少なくとも1が、予測したい物性を特徴づける構造の情報を表現可能である物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法の少なくとも1が、置換基、前記置換基の置換位置、官能基、元素数、元素の種類、元素の価数、結合次数および原子座標の少なくとも1を表現可能である物性予測方法である。
また、本発明の他の一態様は、上記構成において、前記物性は、発光スペクトル、半値幅、発光エネルギー、励起スペクトル、吸収スペクトル、透過スペクトル、反射スペクトル、モル吸光係数、励起エネルギー、過渡発光寿命、過渡吸収寿命、S1準位、T1準位、Sn準位、Tn準位、ストークスシフト値、発光量子収率、振動子強度、酸化電位、還元電位、HOMO準位、LUMO準位、ガラス転移点、融点、結晶化温度、分解温度、沸点、昇華温度、キャリア移動度、屈折率、配向パラメータ、質量電荷比およびNMR測定におけるスペクトル、ケミカルシフト値とその元素数もしくはカップリング定数、ESR測定におけるスペクトル、g因子、D値もしくはE値のいずれか1または複数である物性予測方法である。
また、本発明の他の一態様は、入力手段とデータサーバと、前記データサーバに保存された有機化合物の分子構造と物性の相関を学習する学習手段と、前記学習の結果をもとに、前記入力手段から入力された対象物質の分子構造から目的とする物性を予測する予測手段と、前記予測された物性値を出力する出力手段とを有し、前記有機化合物の分子構造の表記方法として、複数種類のフィンガープリント法を同時に用いる有機化合物の物性予測システムである。
また、本発明の他の一態様は、入力手段と、データサーバと、前記データサーバに保存された有機化合物の分子構造と物性の相関を学習する学習手段と、前記学習の結果をもとに、前記入力手段から入力された対象物質の分子構造から目的とする物性を予測する予測手段と、前記予測された物性値を出力する出力手段とを有し、前記有機化合物の分子構造の表記方法として、2種類のフィンガープリント法を同時に用いる有機化合物の物性予測システムである。
また、本発明の他の一態様は、入力手段と、データサーバと、前記データサーバに保存された有機化合物の分子構造と物性の相関を学習する学習手段と、前記学習の結果をもとに、前記入力手段から入力された対象物質の分子構造から目的とする物性を予測する予測手段と、前記予測された物性値を出力する出力手段とを有し、前記有機化合物の分子構造の表記方法として、3種類のフィンガープリント法を同時に用いる有機化合物の物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてAtom Pair型、Circular型、Substructure key型およびPath−based型の少なくともいずれか1を含む物性予測システムである。
また、本発明の他の一態様は、上記構成において前記複数のフィンガープリント法が、Atom Pair型、Circular型、Substructure key型およびPath−based型の中から選ばれる物性予測システムである。
また、本発明の他の一態様は、上記構成において前記フィンガープリント法としてAtom Pair型およびCircular型を含む物性予測システムである。
また、本発明の他の一態様は、上記構成において前記フィンガープリント法としてCircular型およびSubstructure key型を含む物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてCircular型およびPath−based型を含む物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてAtom Pair型および/またはSubstructure key型を含む物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法としてAtom Pair型および/またはPath−based型を含む物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法として、Atom Pair型、Substructure key型およびCircular型を含む物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法として前記Circular型が用いられる場合、rが3以上である物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記Circular型の前記フィンガープリント法はrが5以上である物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法の少なくとも1を用いて学習させる各有機化合物の分子構造を表記した際に、各有機化合物の表記が全て異なる物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法の少なくとも1が、予測したい物性を特徴づける構造の情報を表現可能である物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記フィンガープリント法の少なくとも1が、置換基、前記置換基の置換位置、官能基、元素数、元素の種類、元素の価数、結合次数および原子座標の少なくとも1を表現可能である物性予測システムである。
また、本発明の他の一態様は、上記構成において、前記物性は、発光スペクトル、半値幅、発光エネルギー、励起スペクトル、吸収スペクトル、透過スペクトル、反射スペクトル、モル吸光係数、励起エネルギー、過渡発光寿命、過渡吸収寿命、S1準位、T1準位、Sn準位、Tn準位、ストークスシフト値、発光量子収率、振動子強度、酸化電位、還元電位、HOMO準位、LUMO準位、ガラス転移点、融点、結晶化温度、分解温度、沸点、昇華温度、キャリア移動度、屈折率、配向パラメータ、質量電荷比およびNMR測定におけるスペクトル、ケミカルシフト値とその元素数もしくはカップリング定数、ESR測定におけるスペクトル、g因子、D値もしくはE値のいずれか1または複数である物性予測システムである。
本発明の一態様では、未知の有機化合物の有する物性を誰でも簡便に精度良く予測することが可能な物性予測方法を提供することができる。また、有機化合物の有する物性を誰でも簡便に精度良く予測することが可能な物性予測システムを提供することができる。
本発明の一態様を表すフローチャート。 フィンガープリント法による分子構造の変換方法を表す図。 フィンガープリント法の種類について説明する図。 SMILES表記からフィンガープリント法による表記への変換を説明する図。 フィンガープリント法の種類と表記の重複について説明する図。 複数のフィンガープリント法を用いて分子構造を表記した例を説明する図。 ニューラルネットワークの構成を説明する図。 本発明の一態様の物性予測システムを表す図。 ニューラルネットワークの構成を説明する図。 演算を行う機能を有する半導体装置の構成例を説明する図。 メモリセルの具体的な構成例を説明する図。 オフセット回路OFSTの構成例説明する図。 半導体装置の動作例のタイミングチャートを表す図。 物性予測結果を表す図。
以下、本発明の実施の態様について図面を用いて詳細に説明する。但し、本発明は以下の説明に限定されず、本発明の趣旨及びその範囲から逸脱することなくその形態及び詳細を様々に変更し得ることは当業者であれば容易に理解される。従って、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。
(実施の形態1)
本発明の一態様の物性予測方法は、例えば図1のようなフローチャートで示すことができる。図1によれば、まず、本発明の一態様の物性予測方法は、有機化合物の分子構造と、物性の相関の学習を行う(S101)。
この際、分子構造と物性の相関を機械学習させるには、分子構造を数式で記述する必要がある。分子構造の数式化には、オープンソースのケモインフォマティクスツールキットであるRDKitを利用することができる。RDKitでは、入力した分子構造のSMILES表記(Simplified molecular input line entry specification syntax)をフィンガープリント法によって数式データへ変換することができる。
フィンガープリント法では、例えば図2に示すように、分子構造の部分構造(フラグメント)を各ビットに割り振ることで分子構造を表し、対応する部分構造が分子中に存在すれば「1」、しなければ「0」がビットにセットされる。すなわち、フィンガープリント法を用いることで、分子構造の特徴を抽出した数式を得ることができる。また、一般的にフィンガープリント法で表された分子構造の式は数百から数万のビット長であり、扱いやすい大きさである。また、分子構造を0と1の数式で表すために、フィンガープリント法を用いることで、非常に高速な計算処理を実現することが可能となる。
また、フィンガープリント法には多くの種類(ビット生成のアルゴリズムの違い、原子タイプや結合タイプ、芳香族性の条件を考慮したもの、ハッシュ関数を用いて動的にビット長を生成するものなど)が存在しており、各々特徴がある。
代表的なフィンガープリント法の種類としては、図3に示したように、1)Circular型(起点となる原子を中心に、指定した半径までの周辺原子を部分構造とする)、2)Path−based型(起点となる原子から指定したパスの長さ(Path length)までの原子を部分構造とする)、3)Substructure keys型(ビット毎に部分構造が規定されている)、4)Atom pair型(分子中のすべての原子について生成させた原子ペアを部分構造とする)等がある。RDKitにはこれらの各型のフィンガープリントが実装されている。
図4は実際に、ある有機化合物の分子構造をフィンガープリント法により数式として表した例である。このように、分子構造をいったんSMILES表記に変換してからフィンガープリントに変換することができる。
なお、有機化合物の分子構造をフィンガープリント法で表現する際に、類似する構造を有する異なる有機化合物間で、得られる数式が同一となってしまう場合がある。上述したように、フィンガープリント法は、表記方法によっていくつかの種類が存在するが、同一となってしまう化合物の傾向は、図5の▲1▼Circular型(Morgan Fingerprint)、▲2▼Path−based型(RDK Fingerprint)、▲3▼Substructure keys型(Avalon Fingerprint)、▲4▼Atom pair型(Hash atom pair)に示したように、表記方法によって異なっている。なお図5では、それぞれの両矢印内の分子同士がそれぞれ同一の数式(表記)を示す。そのため、学習に用いるフィンガープリント法としては、その少なくとも1を用いて学習させる各有機化合物の分子構造を表記した際に、各有機化合物の表記が全て異なるフィンガープリント法を用いることが好ましい。図5では、Atom pair型が異なる化合物間で重複なく表記することができることがわかるが、学習させる有機化合物の母集団によってはその他の表記方法でも重複なく表記可能である場合もある。
ここで、本発明の一態様では、学習させる有機化合物をフィンガープリント法で表記する際に、複数の異なる種類のフィンガープリント法を用いることを特徴とする。用いる種類は何種類でも構わないが、2種類または3種類程度がデータ量的にも扱いやすく好ましい。複数種類のフィンガープリント法で学習を行う場合、ある種類のフィンガープリント法により表記された数式の後ろに、他の種類のフィンガープリント法により表記された数式を繋げて用いても良いし、一つの有機化合物に対してそれぞれ複数種類の異なる数式が存在するとして学習させても良い。図6に、型の異なるフィンガープリントを複数用いて分子構造を記述する方法の一例を示す。
フィンガープリントは部分構造の有無を記述する方法であり、分子構造全体の情報は失われる。しかしながら、型の異なるフィンガープリントを複数用いて分子構造を数式化すれば、それぞれのフィンガープリントの型で異なる部分構造が生成され、これらの部分構造の有無の情報から分子構造全体に関わる情報が補完されうる。あるフィンガープリントでは表現しきれない特徴が物性値に大きく影響する場合や、その特徴がある化合物間の物性値差に影響する場合、他のフィンガープリントによってそれが補完されるため、型の異なるフィンガープリントを複数用いて分子構造を記述する方法は有効である。
なお、2種類のフィンガープリント法により表記を行う際は、Atom Pair型と、Circular型を用いることが精度よく物性予測が可能であるため、好ましい構成である。
また、三種類のフィンガープリント法を用いて表記を行う際は、Atom Pair型と、Circular型と、Substructure keys型を用いることが精度よく物性予測が可能であるため、好ましい構成である。
また、Circular型のフィンガープリント法を用いる場合は、半径rは3以上であることが好ましく、5以上であることがさらに好ましい。なお半径rとは、起点となるある元素を0として、その元素から連結して数えた元素の個数である。
なお、用いるフィンガープリント法を選択する際には、先にも述べたように、学習させる各有機化合物の分子構造を表記した際に、各有機化合物の表記が全て異なるものを少なくとも一つ選ぶことが好ましい。
フィンガープリントは、表現するビット長(ビット数)を大きくすることで、学習させる各有機化合物間で完全に表記が一致する記載が生成する可能性を低くすることができるが、ビット長を大きくしすぎてしまうと、計算コストやデータベースの管理コストが大きくなるというトレードオフが生じる。一方、複数のフィンガープリントを同時に用いて表現することで、あるフィンガープリント型で表記が完全一致となる複数の分子構造があっても、異なるフィンガープリント型を組み合わせることで、全体として表記が完全一致が生じない可能性がある。その結果、なるべく小さなビット長でフィンガープリントによる表記が完全一致となる複数の有機化合物が生じない状態を生成できる。また、分子構造の特徴を複数の方法で抽出することになるため、学習効率が良く、過学習になりにくい。生成するフィンガープリントのビット長に特に制限はないが、計算コストや、データベースの管理コストを考慮すると、各分子量が2000程度までの分子であれば、フィンガープリントの型毎にビット長は4096以下、好ましくは2048以下、場合によっては1024以下で、分子間のフィンガープリントが完全一致する状態とならず、かつ、学習効率のよいフィンガープリントを生成することができる。
また、それぞれのフィンガープリント型で生成するフィンガープリントのビット長は、その型の特徴や学習する分子構造の全体を考慮して適宜調整すればよく、統一する必要はない。たとえば、ビット長をAtom Pair型では1024ビット、Circular型では2048ビットで表し、それらを連結するなどとしても良い。
機械学習の手法としては、どのようなものを用いても良いが、ニューラルネットワークを用いることが好ましい。ニューラルネットワークによる学習は、例えば、図7のような構造を構築して行えばよい。プログラム言語には例えばPythonを、機械学習のフレームワークにはChainerなどを使用することができる。予測モデルの妥当性を評価するためには、物性値のデータのうち、一部をテスト用にし、残りを学習用に使用すればよい。
分子構造と関連付けて学習させる物性値としては、例えば、発光スペクトル、半値幅、発光エネルギー、励起スペクトル、吸収スペクトル、透過スペクトル、反射スペクトル、モル吸光係数、励起エネルギー、過渡発光寿命、過渡吸収寿命、S1準位、T1準位、Sn準位、Tn準位、ストークスシフト値、発光量子収率、振動子強度、酸化電位、還元電位、HOMO準位、LUMO準位、ガラス転移点、融点、結晶化温度、分解温度、沸点、昇華温度、キャリア移動度、屈折率、配向パラメータ、質量電荷比およびNMR測定におけるスペクトル、ケミカルシフト値とその元素数もしくはカップリング定数およびESR測定におけるスペクトル、g因子、D値もしくはE値などを挙げることができる。
これらは、測定によって求めたものでも良いし、シミュレーションによって求めたものでも良い。測定対象は、溶液や薄膜、粉末などから適宜選べばよい。ただし、それぞれ同じ測定条件、シミュレーション条件、単位で物性値を求めたものを学習させることが好ましい。条件を統一できない場合は、学習データのいくつか(少なくとも2種類の化合物以上、好ましくは1%以上、より好ましくは3%以上)でそれぞれの測定条件で同一の化合物の物性値を測定またはシミュレーションし、条件違いの測定やシミュレーションにおける値の相関が学習できる様にすることが好ましい。そして、その条件そのものの情報を学習データに同時に組み込むことが好ましい。
学習・予測する物性値は、1種類でも良いし、複数種類でも良い。物性値間に相関がある場合、複数種類の物性値を同時に学習させた方が、学習効率が高くなり、予測精度が高くなるため、好ましい。物性値間に相関がない、または低い場合でも、複数の物性値を同時予測でき、効率的で好ましい。
組み合わせて学習させることが有効である物性値としては、同一または類似の特性を元に決定される物性値が挙げられる。例えば、光学特性に関する物性値や、化学特性、電気特性に関する物性値などに属する物性値の中から適宜組み合わせて学習させると良い。光学特性に関する物性値としては、吸収ピーク、吸収端、モル吸光係数、発光ピーク、発光スペクトルの半値幅、発光量子収率などが挙げられる。例えば、溶液の発光ピークと薄膜の発光ピークや、室温で測定した発光ピークと低温で測定した発光ピーク、シミュレーションで求めたS1準位(最低一重項励起準位)、T1準位(最低三重項励起準位)、Sn準位(より高位の一重項励起準位)、Tn準位(より高位の三重項励起準位)などが挙げられる。これらのなかから選ばれた2以上を組み合わせて学習させることが好ましい。
学習・予測する物性値は、適宜選択すればよいが、有機EL素子用であれば、例えば以下のような測定法やシミュレーションで求めた物性値が好ましい。それぞれの物性値についての説明を行う。
発光スペクトルは、ある固定した波長範囲での波長毎の発光強度を求めて値として学習すればよい。この時、絶対値であっても良いが、最大極大値を規格化しておく方がスペクトルの予測としては好ましい。絶対値を比較したい場合は適宜最大強度や発光量子収率などを並列して記述すれば良い。
溶液、薄膜、粉末などの状態で測定したものがある。溶液の値は、有機EL素子でのドーパントの発光色を予測するのに好ましい。この時、実素子で用いるホストの極性になるべく近い(溶媒と実デバイスでの比誘電率の差が10以内が好ましい、好ましくは絶対値で5以内程度が好ましい)溶剤中で測定することが好ましい。例えば溶剤としては、トルエン、クロロホルム、ジクロロメタンなどが好ましい。溶液の場合、分子間相互作用がない様に、濃度はおおむね10−4〜10−6Mが好ましい。ホストなどの有機物にドープした薄膜でもドーパントの発光色を予測するのに好ましい。この場合、ドープ濃度も素子と同様が好ましく、おおむね0.5w%〜30w%が好ましい。また発光スペクトルには、蛍光スペクトルや燐光スペクトルがある。燐光スペクトルは、イリジウム錯体など重原子を用いたものは脱酸素状態にし室温で測定することができる。そうでない場合は液体窒素や液体ヘリウムなどで低温(100K〜10K)にし、測定することができる。なおスペクトルは蛍光分光光度計で測定することができる。また、半値幅とは、発光強度が極大値の半分の強度となった時のスペクトル幅のことである。
発光エネルギーは、目的にあった値を学習させる。極大値が複数ある場合、例えば有機EL素子でのドーパントの発光色の予測としては、その中で最大強度の値を求めることが好ましい。ホスト材料やキャリア輸送層などのエネルギーとしては、最も短波長側の極大値や、短波長側の立ち上がりの値(最も短波長側の極大値強度の70〜50%のプロットにおける接線とベースラインとの交点の値)でも良い。また、短波長側の立ち上がりの微分が最大となる点において、接線を引いて求めてもよい。
吸収スペクトルや透過スペクトル、反射スペクトルは、ある固定した波長範囲での波長毎の吸光度や吸収率、透過率、反射率を求めて値として学習させればよい。目的によって、絶対値もしくは規格化した値で学習すれば良く、スペクトル形状を比較したい場合は、任意の波長で規格化した値を学習させれば良い。絶対値を比較したい場合は、絶対値のまま学習させる。濃度や膜厚などの条件が統一されていない場合、それら条件と強度の絶対値とを並列に記載することが好ましい。例えば、有機EL素子で光取出し効率の影響などを予測したい場合、薄膜の透過率と膜厚とを並列して学習することが好ましい。また例えば、有機EL素子でのホストからドーパントへのエネルギー移動効率を予測したい場合、強度はドーパントのモル吸光係数を用いることが好ましい。なおスペクトルは吸光光度計で測定することができる。
励起エネルギーは、吸収スペクトルから求めることができる。吸収端の波長や、吸光度の極大値となる波長とその強度や、任意の波長での強度などを適宜学習すれば良い。吸収端の求め方としては、例えば最も長波長側の吸収極大値強度の70〜50%のプロットにおける接線と、ベースラインとの交点の値から求めればよい。また、最も長波長側の吸収極大から吸収が減衰する曲線において、その微分(負の値)が最小となる点において、接線を引いてもよい。
ストークスシフト値は、最大励起波長と最大発光波長との差で求めることができる。最大吸収波長と最大発光波長との差でも良い。例えば、発光材料の場合、ストークスシフト値をエネルギー(eV)で学習させることが好ましい。この値が小さい程、励起から発光までの構造緩和が小さいとされ、発光量子収率が高いと考えられる。
過渡発光寿命は、試料にパルス状の励起光を照射し、発光強度が減衰する時間(寿命)から求めることができる。このとき、ある時間範囲での時間毎の発光強度や、そこから求めた寿命の値を適宜学習すると良い。波形の場合は規格化することが好ましい。また全波長の初期の積算強度を規格化し、各波長の強度は相対値としても良い。例えば、発光材料の場合、早く減衰する程(寿命が早い程)、発光量子収率が高いと考えられる。なおこれは蛍光(発光)寿命測定装置で測定することができる。なお、発光素子の過渡発光寿命を測定する場合、光励起でなく電気励起を行っても良い。すなわち、発光素子にパルス状の電圧を印加し、発光強度が減衰する時間(寿命)を計測しても良い。なお、発光強度が減衰する時間(寿命)の指標としては、通常、発光強度が1/eになるまでの時間を用いることが多い。
S1準位は、吸収スペクトルの吸収端や、長波長側の極大値、励起スペクトルの最大極大値、発光スペクトルの最大極大値、短波長側の立ち上がりの値から求めることができる。T1準位は、過渡吸収測定などで求めた吸収スペクトルの吸収端や、長波長側の極大値、燐光スペクトルの最大極大値、燐光スペクトルの短波長側のピーク波長、短波長側の立ち上がりの値から求めることができる。なお、吸収端や、発光スペクトルの立ち上がりの値の求め方は、上述したとおりである。またS1準位やT1準位はシミュレーションからも求めることができる。例えば量子化学計算プログラムのGaussianなどの密度汎関数法で基底状態(S0)の構造最適化を行った後、時間依存密度汎関数法で励起エネルギーとして求めることができる。同様に、Sn準位(S1より上の一重項の準位)やTn準位(T1より上の三重項の準位)も求めることができる。このとき、遷移確率として振動子強度を同時に求めても良い。例えば、発光材料の場合、振動子強度が高い方が、その準位で発光しやすいと考えられ、好ましい。また、密度汎関数法で求めたS0の構造最適化したポテンシャルエネルギーと、T1の構造最適化したポテンシャルエネルギーとの差を、T1準位としても良い。
発光量子収率は、絶対量子収率測定装置で求めることができる。
酸化電位、還元電位は、サイクリックボルタンメトリー(CV)で測定することができる。HOMO準位とLUMO準位についても、酸化/還元のポテンシャルエネルギー(eV)が分かっている標準サンプル(例えばフェロセン)の酸化還元電位を基準として、CV測定により求めることができる。一方、HOMO準位は固体(薄膜や粉末)状態で大気中光電子分光(PESA)でも測定することができる。この場合、LUMOは吸収スペクトルの吸収端からバンドギャップを求め、PESAで求めたHOMO準位にそのエネルギー値を足すことで求めることができる。例えば、有機EL素子の場合、2分子間にエキサイプレックスが生じた場合の発光エネルギーを見積もるのに、HOMO準位の大きい方(HOMO準位が浅い方)の分子のHOMO準位と、LUMO準位の小さい(LUMO準位の深い方)の他方の分子間のエネルギー差を求める。この時、CVで求めたHOMO準位とLUMO準位とを用いることが好ましい。また量子化学計算プログラムのGaussianなどの密度汎関数法で、HOMO準位とLUMO準位や、HOMO−n準位(HOMOより下の占有軌道の準位)やLUMO+n(LUMOより上の非占有軌道の準位)は求めることができる。
ガラス転移点や融点、結晶化温度は、示差走査熱量測定(DSC)装置で求めることができる。昇温速度は10〜50℃/分で速度を一定にし、測定することが好ましい。分解温度、沸点、昇華温度は、熱重量・示差熱測定(TG−DTA)装置で求めることができる。大気圧や減圧化で測定した結果を適宜用いると良い。減圧下で測定した値は、昇華精製温度や蒸着温度に参考とすることができ、5−20%程度重量が減少した値を用いることが好ましい。昇温速度は10〜50℃/分で速度を一定にし、測定することが好ましい。
キャリア移動度は、過渡光電流を利用したタイム・オブ・フライト(TOF)法により求めることができる。TOF法においては、サンプル膜を電極で挟み、直流電圧を印加した状態でパルス光励起によりキャリアを発生させ、生じたキャリアの走行時間(電流の過渡応答)から移動度を見積もる方法である。この場合、膜厚としては3μm以上が好ましい。また、他の方法として、サンプル膜の電流−電圧特性が空間電荷制限電流(SCLC)に従っている場合は、その電流−電圧特性をSCLCの式でフィッティングすることで、移動度を求めることができる。また、インピーダンス分光測定から得られるコンダクタンスもしくはキャパシタンスの周波数依存特性から、移動度を求める方法も報告されている。いずれの手法においても、ある電圧(電界強度)における移動度を求めることができ、それを物性値として利用することができる。また、移動度の電界強度依存性をプロットし、外挿することで、無電界時の移動度μを求めることができ、これを物性値として利用しても良い。
屈折率や配向パラメータは、分光エリプソメトリ装置で求めることができる。例えば、有機EL素子の場合、可視域の屈折率は低い方が、光取出し効率が向上し、好ましい。また配向パラメータについてはいくつか報告例があるが、例えば、有機EL素子の場合、配向パラメータSがしばしば用いられる。配向パラメータSは、分光エリプソメトリにより光吸収異方性を計測することで算出することができる。蛍光物質の場合、最低一重項励起状態(S1)由来の吸収に相当する波長でSが−0.5に近い方が、基板などの光取出し面に対して遷移双極子モーメントがより水平であると考えられ、光取出し効率が高くなり、好ましい。燐光物質の場合は、最低三重項励起状態(T1)の吸収に着目すればよい。なお、Sが0ではランダム配向、Sが1だと垂直配向である。また、他の配向パラメータとしては、遷移双極子モーメントを基板に対して水平な成分と垂直な成分に分割した際の、垂直成分の占める割合を用いても良い。このパラメータは、フォトルミネッセンス(PL)もしくはエレクトロルミネッセンス(EL)のp偏光強度の角度依存性を訓査し、それをフィッティングすることで求めることができる。
質量電荷比(m/z)はある固定した質量電荷比数の範囲での単位毎の検出強度を求めて値として学習させればよい。目的によって、絶対値もしくは規格化した値で学習すれば良く、スペクトル形状を比較したい場合は、親イオンのm/zなど任意の波長で規格化した値を学習させれば良い。絶対値を比較したい場合は、絶対値のまま学習させる。m/zは、質量分析装置で測定することができ、イオン化法は電子イオン化法や化学イオン化法、電解電離法、高速原子衝撃法、マトリックス支援レーザー脱離イオン化法、エレクトロスプレーイオン化法、大気圧化学イオン化法、誘導結合プラズマ法などがある。この時、分子(親分子)が分解(結合のかい離)してフラグメント(娘イオン)も同時に検出されることがあり、検出されたm/zおよび親イオンとの検出強度比は、その分子の特徴を示すものとなる。たとえば、同じ置換基を持つ分子間では、同じm/zのフラグメントが検出される可能性がある。そのため親イオンと、フラグメントのm/zとその検出強度比を学習させれば、他の化合物のフラグメントのm/zや親イオンとの検出強度比などを予測することが可能となる。なお一般的にはイオン化エネルギーが強いとフラグメントの生成比率が高くなる。
NMR(核磁気共鳴)スペクトルは、ある固定したケミカルシフト範囲でのケミカルシフト値毎のシグナル強度を求めて値として学習すればよい。またピークのケミカルシフト値とその強度の積分値(元素数)、J値(カップリング定数)などをそれぞれ並列して表しても良い。この時、その分子の積分値の和は測定元素の元素数となるように表すのが好ましい。なおNMR測定は、物質の分子構造を原子レベルで解析することができる。たとえば、同じ置換基を持つ分子間では、同様のケミカルシフト値に同様のスペクトルを示しやすい。なおスペクトルはNMR装置で測定することができる。
ESR(電子スピン共鳴)スペクトルは、ある固定した磁場強度範囲や、磁束密度(テスラ)範囲、回転角度での単位毎の検出強度を求めて値として学習すればよい。またg値(g因子)やg値の二乗、スピン量、スピン密度などで表しても良い。なおESR測定は不対電子を含む試料が磁場中において不対電子のスピンの遷移に伴うマイクロ波の吸収による共鳴現象を観測するものである。そのため、ESRは不対電子を持つ常磁性物質の測定に有効である。三重項状態の観測にも用いることができるため、例えば低温(100K〜10K)で励起光を照射しながらESR測定を行えば、三重項励起状態のスピン状態の情報が得られる。このとき、D値(2つの電子スピン間の相互作用の大きさを表す量で)、E値(電子の軌道が軸対称からどれだけずれているかを表す量)で表しても良い。なおスペクトルはESR装置で測定することができる。
学習の段階が終了したら、続いて、学習された結果を元に、入力された対象物質の分子構造から目的とする物性値の予測を行う(S102)。
最後に、予測された物性値を出力する(S103)。
このように本発明の一態様は、様々な物性値を予測させることができ、有機化合物の分子構造を学習させる際にフィンガープリントを複数用いることから、より正確な予測を行うことができる有機化合物の物性予測方法である。
(実施の形態2)
実施の形態2では、本発明の一態様である、有機化合物の物性予測システムについて説明する。
<構成例>
本発明の一態様の物性予測システム10は、入力手段、学習手段、予測手段、出力手段およびデータサーバを少なくとも有する。これらは、各々データのやり取りを行うことができれば一つの装置の中に組み込まれていても良いし、それぞれ異なる装置であっても良いし、一部が同じ装置に組み込まれていても良いし、データサーバがクラウドであっても良いが、これらを総称して物性予測システムと呼ぶものとする。
図8では、本発明の一態様として、入力手段、学習手段、予測手段、および出力手段を有する情報端末と、データサーバから構成される物性予測システムを例に説明を行う。情報端末20は、入力部、学習手段、予測手段および出力部を有し、別に設置されたデータサーバとは、データのやり取りが可能である。
情報端末20は主な構成として、入力部21、演算部22、出力部25を有する。演算部22は、学習手段と、予測手段を同時に担う。また、演算部22は、ニューラルネットワーク回路を有していることが好ましい。データサーバから提供されるデータは、ニューラルネットワーク回路26で学習または予測させるためのデータとなる。当該データの一部を学習済の学習手段に対する検証データおよび教師データとして使用することで、ニューラルネットワーク回路内の重み係数を更新し、学習済の重み係数を生成しておくことができる。これにより、より予測の正確性を向上させることができる。
図8では、入力部21、演算部22、データサーバ30、出力部25の順に信号の流れを矢印で図示している。なお本明細書において信号は、データあるいは情報と適宜読み替えることができる。
データサーバ30は学習する有機化合物の構造と物性値について演算部22の学習手段に提供する。提供する有機化合物の構造は2種類以上のフィンガープリントを用いて表記されたものである。演算部22の学習手段は、ニューラルネットワーク回路を有することが好ましい。
入力部21は、ユーザが情報を入力するための機能を有する。入力部21の具体例としては、キーボード、マウス、タッチパネル、ペンタブレット、マイクあるいはカメラ等あらゆる入力手段を挙げることができる。
入力情報Dinは、入力部21から演算部22に出力されるデータである。入力情報Dinは、ユーザによって入力される情報である。例えば、入力部21がタッチパネルの場合は、タッチパネルの操作による文字入力で得られる情報である。あるいは、入力部21がマイクの場合は、ユーザによる音声入力で得られる情報である。あるいは、入力部21がカメラの場合は、撮像データを画像処理することで得られる情報である。
入力情報Dinは、物性を予測したい有機化合物の構造に関する情報である。構造式や、構造のイメージ、物質名など、フィンガープリント表記以外で入力されたのであれば、適宜変換手段を介してから演算部22における予測手段に入力される。予測手段は、あらかじめ学習手段によって学習された結果を元に、入力された有機化合物の物性に対して予測を行う。
予測を行った結果は、出力部を介して出力される。
なお演算部がニューラルネットワーク回路を有する場合、当該ニューラルネットワーク回路は積和演算処理を実行可能な積和演算回路を有することが好ましい。また、積和演算回路は、重みデータを記憶するための記憶回路を有することが好ましい。記憶回路を構成する記憶素子は、トランジスタおよび容量素子を有し、当該トランジスタは、チャネル形成領域を有する半導体層に酸化物半導体(Oxide Semiconductor)を有するトランジスタ(以下、OSトランジスタ)であることが好ましい。OSトランジスタは、オフ状態時に流れるリーク電流が極めて小さい。そのためOSトランジスタをオフ状態にすることで電荷の保持をできる特性を利用して、データの記憶をすることができる。ニューラルネットワーク回路の構成については、実施の形態3で詳述する。
またこれら複数のフィンガープリント型を用いて連結または並列表記としたフィンガープリントを生成し、機械学習を行い、物性予測ができる制御プログラムおよび制御ソフトが記録された記録媒体も、本発明の一態様の一つである。
(実施の形態3)
本実施の形態では、上記の実施の形態で説明したニューラルネットワーク回路(以下半導体装置という)に用いることが可能な半導体装置の構成例について説明する。
なお、本明細書中において半導体装置とは、半導体特性を利用することで機能しうる装置を指す。つまり半導体特性を利用したトランジスタを有するニューラルネットワーク回路は、半導体装置である。
図9(A)に示すように、ニューラルネットワークNNは入力層IL、出力層OL、中間層(隠れ層)HLによって構成することができる。入力層IL、出力層OL、中間層HLはそれぞれ、1又は複数のニューロン(ユニット)を有する。なお、中間層HLは1層であってもよいし2層以上であってもよい。2層以上の中間層HLを有するニューラルネットワークはDNN(ディープニューラルネットワーク)と呼ぶこともでき、ディープニューラルネットワークを用いた学習は深層学習と呼ぶこともできる。
入力層ILの各ニューロンには入力データが入力され、中間層HLの各ニューロンには前層又は後層のニューロンの出力信号が入力され、出力層OLの各ニューロンには前層のニューロンの出力信号が入力される。なお、各ニューロンは、前後の層の全てのニューロンと結合されていてもよいし(全結合)、一部のニューロンと結合されていてもよい。
図9(B)に、ニューロンによる演算の例を示す。ここでは、ニューロンNと、ニューロンNに信号を出力する前層の2つのニューロンを示している。ニューロンNには、前層のニューロンの出力xと、前層のニューロンの出力xが入力される。そして、ニューロンNにおいて、出力xと重みwの乗算結果(x)と出力xと重みwの乗算結果(x)の総和x+xが計算された後、必要に応じてバイアスbが加算され、値a=x+x+bが得られる。そして、値aは活性化関数hによって変換され、ニューロンNから出力信号y=h(a)が出力される。
このように、ニューロンによる演算には、前層のニューロンの出力と重みの積を足し合わせる演算、すなわち積和演算が含まれる(上記のx+x)。この積和演算は、プログラムを用いてソフトウェア上で行ってもよいし、ハードウェアによって行われてもよい。積和演算をハードウェアによって行う場合は、積和演算回路を用いることができる。この積和演算回路としては、デジタル回路を用いてもよいし、アナログ回路を用いてもよい。積和演算回路にアナログ回路を用いる場合、積和演算回路の回路規模の縮小、又は、メモリへのアクセス回数の減少による処理速度の向上及び消費電力の低減を図ることができる。
積和演算回路は、チャネル形成領域にシリコン(単結晶シリコンなど)を含むトランジスタ(以下、Siトランジスタともいう)によって構成してもよいし、チャネル形成領域に酸化物半導体を含むトランジスタ(以下、OSトランジスタともいう)によって構成してもよい。特に、OSトランジスタはオフ電流が極めて小さいため、積和演算回路のアナログメモリを構成するトランジスタとして好適である。なお、SiトランジスタとOSトランジスタの両方を用いて積和演算回路を構成してもよい。以下、積和演算回路の機能を備えた半導体装置の構成例について説明する。
<半導体装置の構成例>
図10に、ニューラルネットワークの演算を行う機能を有する半導体装置MACの構成例を示す。半導体装置MACは、ニューロン間の結合強度(重み)に対応する第1のデータと、入力データに対応する第2のデータの積和演算を行う機能を有する。なお、第1のデータ及び第2のデータはそれぞれ、アナログデータ又は多値のデータ(離散的なデータ)とすることができる。また、半導体装置MACは、積和演算によって得られたデータを活性化関数によって変換する機能を有する。
半導体装置MACは、セルアレイCA、電流源回路CS、カレントミラー回路CM、回路WDD、回路WLD、回路CLD、オフセット回路OFST、及び活性化関数回路ACTVを有する。
セルアレイCAは、複数のメモリセルMC及び複数のメモリセルMCrefを有する。図10には、セルアレイCAがm行n列(m,nは1以上の整数)のメモリセルMC(MC[1,1]乃至[m,n])と、m個のメモリセルMCref(MCref[1]乃至[m])を有する構成例を示している。メモリセルMCは、第1のデータを格納する機能を有する。また、メモリセルMCrefは、積和演算に用いられる参照データを格納する機能を有する。なお、参照データはアナログデータ又は多値のデータとすることができる。
メモリセルMC[i,j](iは1以上m以下の整数、jは1以上n以下の整数)は、配線WL[i]、配線RW[i]、配線WD[j]、及び配線BL[j]と接続されている。また、メモリセルMCref[i]は、配線WL[i]、配線RW[i]、配線WDref、配線BLrefと接続されている。ここで、メモリセルMC[i,j]と配線BL[j]間を流れる電流をIMC[i,j]と表記し、メモリセルMCref[i]と配線BLref間を流れる電流をIMCref[i]と表記する。
メモリセルMC及びメモリセルMCrefの具体的な構成例を、図11に示す。図11には代表例としてメモリセルMC[1,1]、[2,1]及びメモリセルMCref[1]、[2]を示しているが、他のメモリセルMC及びメモリセルMCrefにも同様の構成を用いることができる。メモリセルMC及びメモリセルMCrefはそれぞれ、トランジスタTr11、Tr12、容量素子C11を有する。ここでは、トランジスタTr11及びトランジスタTr12がnチャネル型のトランジスタである場合について説明する。
メモリセルMCにおいて、トランジスタTr11のゲートは配線WLと接続され、ソース又はドレインの一方はトランジスタTr12のゲート、及び容量素子C11の第1の電極と接続され、ソース又はドレインの他方は配線WDと接続されている。トランジスタTr12のソース又はドレインの一方は配線BLと接続され、ソース又はドレインの他方は配線VRと接続されている。容量素子C11の第2の電極は、配線RWと接続されている。配線VRは、所定の電位を供給する機能を有する配線である。ここでは一例として、配線VRから低電源電位(接地電位など)が供給される場合について説明する。
トランジスタTr11のソース又はドレインの一方、トランジスタTr12のゲート、及び容量素子C11の第1の電極と接続されたノードを、ノードNMとする。また、メモリセルMC[1,1]、[2,1]のノードNMを、それぞれノードNM[1,1]、[2,1]と表記する。
メモリセルMCrefも、メモリセルMCと同様の構成を有する。ただし、メモリセルMCrefは配線WDの代わりに配線WDrefと接続され、配線BLの代わりに配線BLrefと接続されている。また、メモリセルMCref[1]、[2]において、トランジスタTr11のソース又はドレインの一方、トランジスタTr12のゲート、及び容量素子C11の第1の電極と接続されたノードを、それぞれノードNMref[1]、[2]と表記する。
ノードNMとノードNMrefはそれぞれ、メモリセルMCとメモリセルMCrefの保持ノードとして機能する。ノードNMには第1のデータが保持され、ノードNMrefには参照データが保持される。また、配線BL[1]からメモリセルMC[1,1]、[2,1]のトランジスタTr12には、それぞれ電流IMC[1,1]、IMC[2,1]が流れる。また、配線BLrefからメモリセルMCref[1]、[2]のトランジスタTr12には、それぞれ電流IMCref[1]、IMCref[2]が流れる。
トランジスタTr11は、ノードNM又はノードNMrefの電位を保持する機能を有するため、トランジスタTr11のオフ電流は小さいことが好ましい。そのため、トランジスタTr11としてオフ電流が極めて小さいOSトランジスタを用いることが好ましい。これにより、ノードNM又はノードNMrefの電位の変動を抑えることができ、演算精度の向上を図ることができる。また、ノードNM又はノードNMrefの電位をリフレッシュする動作の頻度を低く抑えることが可能となり、消費電力を削減することができる。
トランジスタTr12は特に限定されず、例えばSiトランジスタ又はOSトランジスタなどを用いることができる。トランジスタTr12にOSトランジスタを用いる場合、トランジスタTr11と同じ製造装置を用いて、トランジスタTr12を作製することが可能となり、製造コストを抑制することができる。なお、トランジスタTr12はnチャネル型であってもpチャネル型であってもよい。
電流源回路CSは、配線BL[1]乃至[n]及び配線BLrefと接続されている。電流源回路CSは、配線BL[1]乃至[n]及び配線BLrefに電流を供給する機能を有する。なお、配線BL[1]乃至[n]に供給される電流値と配線BLrefに供給される電流値は異なっていてもよい。ここでは、電流源回路CSから配線BL[1]乃至[n]に供給される電流をI、電流源回路CSから配線BLrefに供給される電流をICrefと表記する。
カレントミラー回路CMは、配線IL[1]乃至[n]及び配線ILrefを有する。配線IL[1]乃至[n]はそれぞれ配線BL[1]乃至[n]と接続され、配線ILrefは、配線BLrefと接続されている。ここでは、配線IL[1]乃至[n]と配線BL[1]乃至[n]の接続箇所をノードNP[1]乃至[n]と表記する。また、配線ILrefと配線BLrefの接続箇所をノードNPrefと表記する。
カレントミラー回路CMは、ノードNPrefの電位に応じた電流ICMを配線ILrefに流す機能と、この電流ICMを配線IL[1]乃至[n]にも流す機能を有する。図10には、配線BLrefから配線ILrefに電流ICMが排出され、配線BL[1]乃至[n]から配線IL[1]乃至[n]に電流ICMが排出される例を示している。また、カレントミラー回路CMから配線BL[1]乃至[n]を介してセルアレイCAに流れる電流を、I[1]乃至[n]と表記する。また、カレントミラー回路CMから配線BLrefを介してセルアレイCAに流れる電流を、IBrefと表記する。
回路WDDは、配線WD[1]乃至[n]及び配線WDrefと接続されている。回路WDDは、メモリセルMCに格納される第1のデータに対応する電位を、配線WD[1]乃至[n]に供給する機能を有する。また、回路WDDは、メモリセルMCrefに格納される参照データに対応する電位を、配線WDrefに供給する機能を有する。回路WLDは、配線WL[1]乃至[m]と接続されている。回路WLDは、データの書き込みを行うメモリセルMC又はメモリセルMCrefを選択するための信号を、配線WL[1]乃至[m]に供給する機能を有する。回路CLDは、配線RW[1]乃至[m]と接続されている。回路CLDは、第2のデータに対応する電位を、配線RW[1]乃至[m]に供給する機能を有する。
オフセット回路OFSTは、配線BL[1]乃至[n]及び配線OL[1]乃至[n]と接続されている。オフセット回路OFSTは、配線BL[1]乃至[n]からオフセット回路OFSTに流れる電流量、及び/又は、配線BL[1]乃至[n]からオフセット回路OFSTに流れる電流の変化量を検出する機能を有する。また、オフセット回路OFSTは、検出結果を配線OL[1]乃至[n]に出力する機能を有する。なお、オフセット回路OFSTは、検出結果に対応する電流を配線OLに出力してもよいし、検出結果に対応する電流を電圧に変換して配線OLに出力してもよい。セルアレイCAとオフセット回路OFSTの間を流れる電流を、Iα[1]乃至[n]と表記する。
オフセット回路OFSTの構成例を図12に示す。図12に示すオフセット回路OFSTは、回路OC[1]乃至[n]を有する。また、回路OC[1]乃至[n]はそれぞれ、トランジスタTr21、トランジスタTr22、トランジスタTr23、容量素子C21、及び抵抗素子R1を有する。各素子の接続関係は図12に示す通りである。なお、容量素子C21の第1の電極及び抵抗素子R1の第1の端子と接続されたノードを、ノードNaとする。また、容量素子C21の第2の電極、トランジスタTr21のソース又はドレインの一方、及びトランジスタTr22のゲートと接続されたノードを、ノードNbとする。
配線VrefLは電位Vrefを供給する機能を有し、配線VaLは電位Vaを供給する機能を有し、配線VbLは電位Vbを供給する機能を有する。また、配線VDDLは電位VDDを供給する機能を有し、配線VSSLは電位VSSを供給する機能を有する。ここでは、電位VDDが高電源電位であり、電位VSSが低電源電位である場合について説明する。また、配線RSTは、トランジスタTr21の導通状態を制御するための電位を供給する機能を有する。トランジスタTr22、トランジスタTr23、配線VDDL、配線VSSL、及び配線VbLによって、ソースフォロワ回路が構成される。
次に、回路OC[1]乃至[n]の動作例を説明する。なお、ここでは代表例として回路OC[1]の動作例を説明するが、回路OC[2]乃至[n]も同様に動作させることができる。まず、配線BL[1]に第1の電流が流れると、ノードNaの電位は、第1の電流と抵抗素子R1の抵抗値に応じた電位となる。また、このときトランジスタTr21はオン状態であり、ノードNbに電位Vaが供給される。その後、トランジスタTr21はオフ状態となる。
次に、配線BL[1]に第2の電流が流れると、ノードNaの電位は、第2の電流と抵抗素子R1の抵抗値に応じた電位に変化する。このときトランジスタTr21はオフ状態であり、ノードNbはフローティング状態となっているため、ノードNaの電位の変化に伴い、ノードNbの電位は容量結合により変化する。ここで、ノードNaの電位の変化をΔVNaとし、容量結合係数を1とすると、ノードNbの電位はVa+ΔVNaとなる。そして、トランジスタTr22のしきい値電圧をVthとすると、配線OL[1]から電位Va+ΔVNa−Vthが出力される。ここで、Va=Vthとすることにより、配線OL[1]から電位ΔVNaを出力することができる。
電位ΔVNaは、第1の電流から第2の電流への変化量、抵抗素子R1、及び電位Vrefに応じて定まる。ここで、抵抗素子R1と電位Vrefは既知であるため、電位ΔVNaから配線BLに流れる電流の変化量を求めることができる。
上記のようにオフセット回路OFSTによって検出された電流量、及び/又は電流の変化量に対応する信号は、配線OL[1]乃至[n]を介して活性化関数回路ACTVに入力される。
活性化関数回路ACTVは、配線OL[1]乃至[n]、及び、配線NIL[1]乃至[n]と接続されている。活性化関数回路ACTVは、オフセット回路OFSTから入力された信号を、あらかじめ定義された活性化関数に従って変換するための演算を行う機能を有する。活性化関数としては、例えば、シグモイド関数、tanh関数、softmax関数、ReLU関数、しきい値関数などを用いることができる。活性化関数回路ACTVによって変換された信号は、出力データとして配線NIL[1]乃至[n]に出力される。
<半導体装置の動作例>
上記の半導体装置MACを用いて、第1のデータと第2のデータの積和演算を行うことができる。以下、積和演算を行う際の半導体装置MACの動作例を説明する。
図13に半導体装置MACの動作例のタイミングチャートを示す。図13には、図11における配線WL[1]、配線WL[2]、配線WD[1]、配線WDref、ノードNM[1,1]、ノードNM[2,1]、ノードNMref[1]、ノードNMref[2]、配線RW[1]、及び配線RW[2]の電位の推移と、電流I[1]−Iα[1]、及び電流IBrefの値の推移を示している。電流I[1]−Iα[1]は、配線BL[1]からメモリセルMC[1,1]、[2,1]に流れる電流の総和に相当する。
なお、ここでは代表例として図11に示すメモリセルMC[1,1]、[2,1]及びメモリセルMCref[1]、[2]に着目して動作を説明するが、他のメモリセルMC及びメモリセルMCrefも同様に動作させることができる。
[第1のデータの格納]
まず、時刻T01−T02において、配線WL[1]の電位がハイレベル(High)となり、配線WD[1]の電位が接地電位(GND)よりもVPR−VW[1,1]大きい電位となり、配線WDrefの電位が接地電位よりもVPR大きい電位となる。また、配線RW[1]、及び配線RW[2]の電位が基準電位(REFP)となる。なお、電位VW[1,1]はメモリセルMC[1,1]に格納される第1のデータに対応する電位である。また、電位VPRは参照データに対応する電位である。これにより、メモリセルMC[1,1]及びメモリセルMCref[1]が有するトランジスタTr11がオン状態となり、ノードNM[1,1]の電位がVPR−VW[1,1]、ノードNMref[1]の電位がVPRとなる。
このとき、配線BL[1]からメモリセルMC[1,1]のトランジスタTr12に流れる電流IMC[1,1],0は、次の式で表すことができる。ここで、kはトランジスタTr12のチャネル長、チャネル幅、移動度、及びゲート絶縁膜の容量などで決まる定数である。また、VthはトランジスタTr12のしきい値電圧である。
Figure 2019048965
また、配線BLrefからメモリセルMCref[1]のトランジスタTr12に流れる電流IMCref[1],0は、次の式で表すことができる。
Figure 2019048965
次に、時刻T02−T03において、配線WL[1]の電位がローレベル(Low)となる。これにより、メモリセルMC[1,1]及びメモリセルMCref[1]が有するトランジスタTr11がオフ状態となり、ノードNM[1,1]及びノードNMref[1]の電位が保持される。
なお、前述の通り、トランジスタTr11としてOSトランジスタを用いることが好ましい。これにより、トランジスタTr11のリーク電流を抑えることができ、ノードNM[1,1]及びノードNMref[1]の電位を正確に保持することができる。
次に、時刻T03−T04において、配線WL[2]の電位がハイレベルとなり、配線WD[1]の電位が接地電位よりもVPR−VW[2,1]大きい電位となり、配線WDrefの電位が接地電位よりもVPR大きい電位となる。なお、電位VW[2,1]はメモリセルMC[2,1]に格納される第1のデータに対応する電位である。これにより、メモリセルMC[2,1]及びメモリセルMCref[2]が有するトランジスタTr11がオン状態となり、ノードNM[1,1]の電位がVPR−VW[2,1]、ノードNMref[1]の電位がVPRとなる。
このとき、配線BL[1]からメモリセルMC[2,1]のトランジスタTr12に流れる電流IMC[2,1],0は、次の式で表すことができる。
Figure 2019048965
また、配線BLrefからメモリセルMCref[2]のトランジスタTr12に流れる電流IMCref[2],0は、次の式で表すことができる。
Figure 2019048965
次に、時刻T04−T05において、配線WL[2]の電位がローレベルとなる。これにより、メモリセルMC[2,1]及びメモリセルMCref[2]が有するトランジスタTr11がオフ状態となり、ノードNM[2,1]及びノードNMref[2]の電位が保持される。
以上の動作により、メモリセルMC[1,1]、[2,1]に第1のデータが格納され、メモリセルMCref[1]、[2]に参照データが格納される。
ここで、時刻T04−T05において、配線BL[1]及び配線BLrefに流れる電流を考える。配線BLrefには、電流源回路CSから電流が供給される。また、配線BLrefを流れる電流は、カレントミラー回路CM、メモリセルMCref[1]、[2]へ排出される。電流源回路CSから配線BLrefに供給される電流をICref、配線BLrefからカレントミラー回路CMへ排出される電流をICM,0とすると、次の式が成り立つ。
Figure 2019048965
配線BL[1]には、電流源回路CSからの電流が供給される。また、配線BL[1]を流れる電流は、カレントミラー回路CM、メモリセルMC[1,1]、[2,1]へ排出される。また、配線BL[1]からオフセット回路OFSTに電流が流れる。電流源回路CSから配線BL[1]に供給される電流をIC,0、配線BL[1]からオフセット回路OFSTに流れる電流をIα,0とすると、次の式が成り立つ。
Figure 2019048965
[第1のデータと第2のデータの積和演算]
次に、時刻T05−T06において、配線RW[1]の電位が基準電位よりもVX[1]大きい電位となる。このとき、メモリセルMC[1,1]、及びメモリセルMCref[1]のそれぞれの容量素子C11には電位VX[1]が供給され、容量結合によりトランジスタTr12のゲートの電位が上昇する。なお、電位Vx[1]はメモリセルMC[1,1]及びメモリセルMCref[1]に供給される第2のデータに対応する電位である。
トランジスタTr12のゲートの電位の変化量は、配線RWの電位の変化量に、メモリセルの構成によって決まる容量結合係数を乗じた値となる。容量結合係数は、容量素子C11の容量、トランジスタTr12のゲート容量、及び寄生容量などによって算出される。以下では便宜上、配線RWの電位の変化量とトランジスタTr12のゲートの電位の変化量が同じ、すなわち容量結合係数が1であるとして説明する。実際には、容量結合係数を考慮して電位Vを決定すればよい。
メモリセルMC[1]及びメモリセルMCref[1]の容量素子C11に電位VX[1]が供給されると、ノードNM[1]及びノードNMref[1]の電位がそれぞれVX[1]上昇する。
ここで、時刻T05−T06において、配線BL[1]からメモリセルMC[1,1]のトランジスタTr12に流れる電流IMC[1,1],1は、次の式で表すことができる。
Figure 2019048965
すなわち、配線RW[1]に電位VX[1]を供給することにより、配線BL[1]からメモリセルMC[1,1]のトランジスタTr12に流れる電流は、ΔIMC[1,1]=IMC[1,1],1−IMC[1,1],0増加する。
また、時刻T05−T06において、配線BLrefからメモリセルMCref[1]のトランジスタTr12に流れる電流IMCref[1],1は、次の式で表すことができる。
Figure 2019048965
すなわち、配線RW[1]に電位VX[1]を供給することにより、配線BLrefからメモリセルMCref[1]のトランジスタTr12に流れる電流は、ΔIMCref[1]=IMCref[1],1−IMCref[1],0増加する。
また、配線BL[1]及び配線BLrefに流れる電流について考える。配線BLrefには、電流源回路CSから電流ICrefが供給される。また、配線BLrefを流れる電流は、カレントミラー回路CM、メモリセルMCref[1]、[2]へ排出される。配線BLrefからカレントミラー回路CMへ排出される電流をICM,1とすると、次の式が成り立つ。
Figure 2019048965
配線BL[1]には、電流源回路CSから電流Iが供給される。また、配線BL[1]を流れる電流は、カレントミラー回路CM、メモリセルMC[1,1]、[2,1]へ排出される。さらに、配線BL[1]からオフセット回路OFSTにも電流が流れる。配線BL[1]からオフセット回路OFSTに流れる電流をIα,1とすると、次の式が成り立つ。
Figure 2019048965
そして、式(E1)乃至式(E10)から、電流Iα,0と電流Iα,1の差(差分電流ΔIα)は次の式で表すことができる。
Figure 2019048965
このように、差分電流ΔIαは、電位VW[1,1]とVX[1]の積に応じた値となる。
その後、時刻T06−T07において、配線RW[1]の電位は接地電位となり、ノードNM[1,1]及びノードNMref[1]の電位は時刻T04−T05と同様になる。
次に、時刻T07−T08において、配線RW[1]の電位が基準電位よりもVX[1]大きい電位となり、配線RW[2]の電位が基準電位よりもVX[2]大きい電位となる。これにより、メモリセルMC[1,1]、及びメモリセルMCref[1]のそれぞれの容量素子C11に電位VX[1]が供給され、容量結合によりノードNM[1,1]及びノードNMref[1]の電位がそれぞれVX[1]上昇する。また、メモリセルMC[2,1]、及びメモリセルMCref[2]のそれぞれの容量素子C11に電位VX[2]が供給され、容量結合によりノードNM[2,1]及びノードNMref[2]の電位がそれぞれVX[2]上昇する。
ここで、時刻T07−T08において、配線BL[1]からメモリセルMC[2,1]のトランジスタTr12に流れる電流IMC[2,1],1は、次の式で表すことができる。
Figure 2019048965
すなわち、配線RW[2]に電位VX[2]を供給することにより、配線BL[1]からメモリセルMC[2,1]のトランジスタTr12に流れる電流は、ΔIMC[2,1]=IMC[2,1],1−IMC[2,1],0増加する。
また、時刻T05−T06において、配線BLrefからメモリセルMCref[2]のトランジスタTr12に流れる電流IMCref[2],1は、次の式で表すことができる。
Figure 2019048965
すなわち、配線RW[2]に電位VX[2]を供給することにより、配線BLrefからメモリセルMCref[2]のトランジスタTr12に流れる電流は、ΔIMCref[2]=IMCref[2],1−IMCref[2],0増加する。
また、配線BL[1]及び配線BLrefに流れる電流について考える。配線BLrefには、電流源回路CSから電流ICrefが供給される。また、配線BLrefを流れる電流は、カレントミラー回路CM、メモリセルMCref[1]、[2]へ排出される。配線BLrefからカレントミラー回路CMへ排出される電流をICM,2とすると、次の式が成り立つ。
Figure 2019048965
配線BL[1]には、電流源回路CSから電流Iが供給される。また、配線BL[1]を流れる電流は、カレントミラー回路CM、メモリセルMC[1,1]、[2,1]へ排出される。さらに、配線BL[1]からオフセット回路OFSTにも電流が流れる。配線BL[1]からオフセット回路OFSTに流れる電流をIα,2とすると、次の式が成り立つ。
Figure 2019048965
そして、式(E1)乃至式(E8)、及び、式(E12)乃至式(E15)から、電流Iα,0と電流Iα,2の差(差分電流ΔIα)は次の式で表すことができる。
Figure 2019048965
このように、差分電流ΔIαは、電位VW[1,1]と電位VX[1]の積と、電位VW[2,1]と電位VX[2]の積と、を足し合わせた結果に応じた値となる。
その後、時刻T08−T09において、配線RW[1]、[2]の電位は接地電位となり、ノードNM[1,1]、[2,1]及びノードNMref[1]、[2]の電位は時刻T04−T05と同様になる。
式(E9)及び式(E16)に示されるように、オフセット回路OFSTに入力される差分電流ΔIαは、第1のデータ(重み)に対応する電位Vと、第2のデータ(入力データ)に対応する電位Vの積を足し合わせた結果に応じた値となる。すなわち、差分電流ΔIαをオフセット回路OFSTで計測することにより、第1のデータと第2のデータの積和演算の結果を得ることができる。
なお、上記では特にメモリセルMC[1,1]、[2,1]及びメモリセルMCref[1]、[2]に着目したが、メモリセルMC及びメモリセルMCrefの数は任意に設定することができる。メモリセルMC及びメモリセルMCrefの行数mを任意の数とした場合の差分電流ΔIαは、次の式で表すことができる。
Figure 2019048965
また、メモリセルMC及びメモリセルMCrefの列数nを増やすことにより、並列して実行される積和演算の数を増やすことができる。
以上のように、半導体装置MACを用いることにより、第1のデータと第2のデータの積和演算を行うことができる。なお、メモリセルMC及びメモリセルMCrefとして図11に示す構成を用いることにより、少ないトランジスタ数で積和演算回路を構成することができる。そのため、半導体装置MACの回路規模の縮小を図ることができる。
半導体装置MACをニューラルネットワークにおける演算に用いる場合、メモリセルMCの行数mは一のニューロンに供給される入力データの数に対応させ、メモリセルMCの列数nはニューロンの数に対応させることができる。例えば、図9(A)に示す中間層HLにおいて半導体装置MACを用いた積和演算を行う場合を考える。このとき、メモリセルMCの行数mは、入力層ILから供給される入力データの数(入力層ILのニューロンの数)に設定し、メモリセルMCの列数nは、中間層HLのニューロンの数に設定することができる。
なお、半導体装置MACを適用するニューラルネットワークの構造は特に限定されない。例えば半導体装置MACは、畳み込みニューラルネットワーク(CNN)、再帰型ニューラルネットワーク(RNN)、オートエンコーダ、ボルツマンマシン(制限ボルツマンマシンを含む)などに用いることもできる。
以上のように、半導体装置MACを用いることにより、ニューラルネットワークの積和演算を行うことができる。さらに、セルアレイCAに図11に示すメモリセルMC及びメモリセルMCrefを用いることにより、演算精度の向上、消費電力の削減、又は回路規模の縮小を図ることが可能な集積回路ICを提供することができる。
本実施例では、有機化合物の物性予測の例を詳しく説明する。本実施例では、有機化合物の分子構造と関連付けて予測させる物性値として、T1準位を選択した。学習に使用するT1準位の値は、低温PL測定で得られた燐光スペクトルにおける短波長側の発光ピーク波長から求めた値である。データの総数は420個あり、学習用に380個、テスト用に40個を使用することで、予測モデルの妥当性を評価した。
分子構造の数式化には、オープンソースのケモインフォマティクスツールキットであるRDKitを利用した。RDKitでは、分子構造のSMILES表記からフィンガープリント法によって数式データへ変換することができる。フィンガープリント法には、Circular型およびAtom Pair型を使用した。
物性予測を行う際の入力値としては、Circular型のみで表記された数式、Atom Pair型単独で表記された数式、さらに、両者を繋げた数式を用いた。Circular型では半径を4に指定し、Atom Pair型ではパス長を30に指定した。各フィンガープリントのビット長は2048とした。なおCircular型の半径や、Atom Pair型のパス長とは、起点となるある元素を0として、その元素から連結して数えた元素の個数である。
なおCircular型単独で表記した場合は、420種類の有機化合物のうち、数式が同一となったものが2組あった。一方Atom Pair型単独、またはCircular型とAtom Pair型とを連結させて表記した場合は、異なる有機化合物間で数式が全て異なり、同一となっていないことを確認した。
機械学習の手法としては、ニューラルネットワークを用いた。プログラム言語にはPythonを、機械学習のフレームワークにはChainerを使用した。ニューラルネットワークの構造は隠れ層を2層とした。各層のニューロンの数は、入力層には2048(Circular型単独又はAtom Pair型単独のビット数)または4096(Circular型とAtom Pair型とを連結させたビット数)、第一隠れ層および第二隠れ層には500、出力層には1とした。隠れ層の活性化関数にはReLU関数を用いた。
上記の条件で機械学習を行い、学習用データとテスト用データに関する平均二乗誤差の推移を学習回数500まで求めた。結果を図14に示す。なお、図14(A)がCircular型のみで表記された数式を用いて学習した結果、図14(B)がAtom Pair型のみで表記された数式を用いて学習した結果、図14(C)がCircular型およびAtom Pair型を連結させて表記した数式を用いて学習した結果である。
上記の結果から、Circular型およびAtom Pair型のフィンガープリント法で表記された数式を連結させて使用した場合には、それぞれを単独で使用した場合よりもテスト用データの平均二乗誤差が減少し、T1準位の予測精度が向上した。
以上から、各フィンガープリントの型で異なる部分構造が生成され、これらの部分構造の有無の情報から分子構造全体に関わる情報が補完されうるため、型の異なるフィンガープリント法を複数用いて分子構造を記述する方法は機械学習を用いた物性予測に有効であることがわかる。
またこの様に、一方のフィンガープリント法で同一の表記となる異なる化合物がある場合に、他のフィンガープリントを連結させることで、結果として生成する数式を異なるものとしやすい。一種類のフィンガープリントの型のみを用いて同一表記の化合物がなくなるまでビット数を大きくするよりも、二種種類以上のフィンガープリントを組み合わせたほうが、生成した数式が同一となりづらく、なるべく小さなビット数で化合物の差異を表現できるため、好ましい。その結果、機械学習での計算負荷を小さく抑えることができる。
T01−T02:時刻、T02−T03:時刻、T03−T04:時刻、T04−T05:時刻、T05−T06:時刻、T06−T07:時刻、T07−T08:時刻、T08−T09:時刻、Tr11:トランジスタ、Tr12:トランジスタ、Tr21:トランジスタ、Tr22:トランジスタ、Tr23:トランジスタ、20:情報端末、21:入力部、22:演算部、25:出力部、30:データサーバ

Claims (34)

  1. 有機化合物の分子構造と物性の相関を学習させる段階と、
    前記学習の結果をもとに対象物質の分子構造から目的とする物性を予測する段階とを有し、
    前記有機化合物の分子構造の表記方法として、複数種類のフィンガープリント法を同時に用いる有機化合物の物性予測方法。
  2. 有機化合物の分子構造と物性の相関を学習させる段階と、
    前記学習の結果をもとに対象物質の分子構造から目的とする物性を予測する段階とを有し、
    前記有機化合物の分子構造の表記方法として、2種類のフィンガープリント法を同時に用いる有機化合物の物性予測方法。
  3. 有機化合物の分子構造と物性の相関を学習させる段階と、
    前記学習の結果を元に対象物質の分子構造から目的とする物性を予測する段階とを有し、
    前記有機化合物の分子構造の表記方法として、3種類のフィンガープリント法を同時に用いる有機化合物の物性予測方法。
  4. 請求項1乃至請求項3のいずれか一項において、
    前記フィンガープリント法としてAtom Pair型、Circular型、Substructure key型およびPath−based型の少なくともいずれか1を含む物性予測方法。
  5. 請求項1乃至請求項3のいずれか一項において、
    前記複数のフィンガープリント法が、Atom Pair型、Circular型、Substructure key型およびPath−based型の中から選ばれる物性予測方法。
  6. 請求項1または請求項2において、
    前記フィンガープリント法としてAtom Pair型およびCircular型を含む物性予測方法。
  7. 請求項1または請求項2において、
    前記フィンガープリント法としてCircular型およびSubstructure key型を含む物性予測方法。
  8. 請求項1または請求項2において、
    前記フィンガープリント法としてCircular型およびPath−based型を含む物性予測方法。
  9. 請求項1または請求項2において、
    前記フィンガープリント法としてAtom Pair型およびSubstructure key型を含む物性予測方法。
  10. 請求項1または請求項2において、
    前記フィンガープリント法としてAtom Pair型およびPath−based型を含む物性予測方法。
  11. 請求項1または請求項3において、
    前記フィンガープリント法として、Atom Pair型、Substructure key型およびCircular型を含む物性予測方法。
  12. 請求項1乃至請求項8および請求項11のいずれか一項において、
    前記フィンガープリント法として前記Circular型が用いられる場合、rが3以上である物性予測方法。
  13. 請求項12において、前記Circular型の前記フィンガープリント法はrが5以上である物性予測方法。
  14. 請求項1乃至請求項13のいずれか一項において、
    前記フィンガープリント法の少なくとも1を用いて学習させる各有機化合物の分子構造を表記した際に、各有機化合物の表記が全て異なる物性予測方法。
  15. 請求項1乃至請求項14のいずれか一項において、
    前記フィンガープリント法の少なくとも1が、予測したい物性を特徴づける構造の情報を表現可能である物性予測方法。
  16. 請求項1乃至請求項15のいずれか一項において、
    前記フィンガープリント法の少なくとも1が、
    置換基、前記置換基の置換位置、官能基、元素数、元素の種類、元素の価数、結合次数および原子座標の少なくとも1を表現可能である物性予測方法。
  17. 請求項1乃至請求項16のいずれか一項において、
    前記物性は、発光スペクトル、半値幅、発光エネルギー、励起スペクトル、吸収スペクトル、透過スペクトル、反射スペクトル、モル吸光係数、励起エネルギー、過渡発光寿命、過渡吸収寿命、S1準位、T1準位、Sn準位、Tn準位、ストークスシフト値、発光量子収率、振動子強度、酸化電位、還元電位、HOMO準位、LUMO準位、ガラス転移点、融点、結晶化温度、分解温度、沸点、昇華温度、キャリア移動度、屈折率、配向パラメータ、質量電荷比、およびNMR測定におけるスペクトル、ケミカルシフト値とその元素数もしくはカップリング定数、およびESR測定におけるスペクトル、g因子、D値もしくはE値のいずれか1または複数である物性予測方法。
  18. 入力手段と
    データサーバと、
    前記データサーバに保存された有機化合物の分子構造と物性の相関を学習する学習手段と、
    前記学習の結果をもとに、前記入力手段から入力された対象物質の分子構造から目的とする物性値を予測する手段と、
    前記予測された物性値を出力する出力手段とを有し、
    前記有機化合物の分子構造の表記方法として、複数種類のフィンガープリント法を同時に用いる有機化合物の物性予測システム。
  19. 入力手段と、
    データサーバと、
    前記データサーバに保存された有機化合物の分子構造と物性の相関を学習する学習手段と、
    前記学習の結果をもとに、前記入力手段から入力された対象物質の分子構造から目的とする物性を予測する手段と、
    前記予測された物性値を出力する出力手段とを有し、
    前記有機化合物の分子構造の表記方法として、2種類のフィンガープリント法を同時に用いる有機化合物の物性予測システム。
  20. 入力手段と、
    データサーバと、
    前記データサーバに保存された有機化合物の分子構造と物性の相関を学習する学習手段と、
    前記学習の結果をもとに、前記入力手段から入力された対象物質の分子構造から目的とする物性値を予測する手段と、
    前記予測された物性値を出力する出力手段とを有し、
    前記有機化合物の分子構造の表記方法として、3種類のフィンガープリント法を同時に用いる有機化合物の物性予測システム。
  21. 請求項18乃至請求項20のいずれか一項において、
    前記フィンガープリント法としてAtom Pair型、Circular型、Substructure key型およびPath−based型の少なくともいずれか1を含む物性予測システム。
  22. 請求項18乃至請求項21のいずれか一項において、
    前記複数のフィンガープリント法が、Atom Pair型、Circular型、Substructure key型およびPath−based型の中から選ばれる物性予測システム。
  23. 請求項18または請求項19において、
    前記フィンガープリント法としてAtom Pair型およびCircular型を含む物性予測システム。
  24. 請求項18または請求項19において、
    前記フィンガープリント法としてCircular型およびSubstructure key型を含む物性予測システム。
  25. 請求項18または請求項19において、
    前記フィンガープリント法としてCircular型およびPath−based型を含む物性予測システム。
  26. 請求項18または請求項19において、
    前記フィンガープリント法としてAtom Pair型およびSubstructure key型を含む物性予測システム。
  27. 請求項18または請求項19において、
    前記フィンガープリント法としてAtom Pair型およびPath−based型を含む物性予測システム。
  28. 請求項18または請求項20において、
    前記フィンガープリント法として、Atom Pair型、Substructure key型およびCircular型を含む物性予測システム。
  29. 請求項18乃至請求項25および請求項28のいずれか一項において、
    前記フィンガープリント法として前記Circular型が用いられる場合、rが3以上である物性予測システム。
  30. 請求項29において、前記Circular型の前記フィンガープリント法はrが5以上である物性予測システム。
  31. 請求項18乃至請求項30のいずれか一項において、
    前記フィンガープリント法の少なくとも1を用いて学習させる各有機化合物の分子構造を表記した際に、各有機化合物の表記が全て異なる物性予測システム。
  32. 請求項1乃至請求項31のいずれか一項において、
    前記フィンガープリント法の少なくとも1が、予測したい物性を特徴づける構造の情報を表現可能である物性予測システム。
  33. 請求項1乃至請求項32のいずれか一項において、
    前記フィンガープリント法の少なくとも1が、
    置換基、前記置換基の置換位置、官能基、元素数、元素の種類、元素の価数、結合次数および原子座標の少なくとも1を表現可能である物性予測システム。
  34. 請求項1乃至請求項33のいずれか一項において、
    前記物性は、発光スペクトル、半値幅、発光エネルギー、励起スペクトル、吸収スペクトル、透過スペクトル、反射スペクトル、モル吸光係数、励起エネルギー、過渡発光寿命、過渡吸収寿命、S1準位、T1準位、Sn準位、Tn準位、ストークスシフト値、発光量子収率、振動子強度、酸化電位、還元電位、HOMO準位、LUMO準位、ガラス転移点、融点、結晶化温度、分解温度、沸点、昇華温度、キャリア移動度、屈折率、配向パラメータ、質量電荷比、およびNMR測定におけるスペクトル、ケミカルシフト値とその元素数もしくはカップリング定数、およびESR測定におけるスペクトル、g因子、D値もしくはE値のいずれか1または複数である物性予測システム。
JP2019540721A 2017-09-06 2018-08-24 物性予測方法および物性予測システム Withdrawn JPWO2019048965A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023084350A JP2023113716A (ja) 2017-09-06 2023-05-23 物性予測方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017171334 2017-09-06
JP2017171334 2017-09-06
PCT/IB2018/056409 WO2019048965A1 (ja) 2017-09-06 2018-08-24 物性予測方法および物性予測システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023084350A Division JP2023113716A (ja) 2017-09-06 2023-05-23 物性予測方法

Publications (1)

Publication Number Publication Date
JPWO2019048965A1 true JPWO2019048965A1 (ja) 2020-10-22

Family

ID=65633653

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019540721A Withdrawn JPWO2019048965A1 (ja) 2017-09-06 2018-08-24 物性予測方法および物性予測システム
JP2023084350A Withdrawn JP2023113716A (ja) 2017-09-06 2023-05-23 物性予測方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023084350A Withdrawn JP2023113716A (ja) 2017-09-06 2023-05-23 物性予測方法

Country Status (5)

Country Link
US (1) US20200349451A1 (ja)
JP (2) JPWO2019048965A1 (ja)
KR (1) KR20200051019A (ja)
CN (1) CN111051876B (ja)
WO (1) WO2019048965A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11380422B2 (en) * 2018-03-26 2022-07-05 Uchicago Argonne, Llc Identification and assignment of rotational spectra using artificial neural networks
JP7349811B2 (ja) * 2019-04-24 2023-09-25 株式会社Preferred Networks 訓練装置、生成装置及びグラフ生成方法
JP7302297B2 (ja) * 2019-05-30 2023-07-04 富士通株式会社 材料特性予測装置、材料特性予測方法、及び材料特性予測プログラム
JP7348488B2 (ja) * 2019-08-07 2023-09-21 横浜ゴム株式会社 物性データ予測方法及び物性データ予測装置
JP7348489B2 (ja) * 2019-08-09 2023-09-21 横浜ゴム株式会社 物性データ予測方法及び装置物性データ予測装置
CN114341861A (zh) 2019-08-29 2022-04-12 株式会社半导体能源研究所 特性预测系统
JP7353874B2 (ja) 2019-09-03 2023-10-02 株式会社日立製作所 材料特性予測装置および材料特性予測方法
JP7218274B2 (ja) * 2019-11-05 2023-02-06 株式会社 ディー・エヌ・エー 化合物の性質を予測するための化合物性質予測装置、化合物性質予測プログラム及び化合物性質予測方法
US20230037015A1 (en) * 2019-12-16 2023-02-02 Nippon Telegraph And Telephone Corporation Material Development Support Apparatus, Material Development Support Method, and Material Development Support Program
CN114868192A (zh) * 2019-12-26 2022-08-05 富士胶片株式会社 信息处理装置、信息处理方法及程序
JP7303765B2 (ja) * 2020-03-09 2023-07-05 株式会社豊田中央研究所 材料設計プログラム
US20210287137A1 (en) * 2020-03-13 2021-09-16 Korea University Research And Business Foundation System for predicting optical properties of molecules based on machine learning and method thereof
JP7453053B2 (ja) * 2020-04-27 2024-03-19 Toyo Tire株式会社 ゴム材料物性予測システム、およびゴム材料物性予測方法
CN111710375B (zh) * 2020-05-13 2023-07-04 中国科学院计算机网络信息中心 一种分子性质预测方法及系统
JP7429436B2 (ja) * 2020-05-25 2024-02-08 国立研究開発法人産業技術総合研究所 物性予測方法及び物性予測装置
CN114254791A (zh) * 2020-09-23 2022-03-29 新智数字科技有限公司 一种烟气含氧量的预测方法及装置
US20220101276A1 (en) * 2020-09-30 2022-03-31 X Development Llc Techniques for predicting the spectra of materials using molecular metadata
CN112185478B (zh) * 2020-10-29 2022-05-31 成都职业技术学院 一种tadf发光分子发光性能的高通量预测方法
CN114093438B (zh) * 2021-10-28 2024-09-24 北京大学 一种基于Bi2O2Se的多模态库网络时序信息处理方法
KR102696205B1 (ko) * 2022-02-18 2024-08-20 국민대학교산학협력단 인공지능 기반의 다중물성 합성 예측 장치 및 방법, 그 방법을 실행하기 위한 프로그램을 기록한 기록매체
JP7557493B2 (ja) * 2022-03-22 2024-09-27 住友化学株式会社 発光素子及びその製造方法、発光性化合物及びその製造方法、組成物及びその製造方法、情報処理方法、情報処理装置、プログラム、発光性化合物の提供方法、並びにデータ生成方法
WO2023224012A1 (ja) * 2022-05-18 2023-11-23 国立研究開発法人産業技術総合研究所 物性予測装置、物性予測方法、及びプログラム
WO2024005068A1 (ja) * 2022-06-30 2024-01-04 コニカミノルタ株式会社 予測装置、予測システムおよび予測プログラム
WO2024025281A1 (ko) * 2022-07-26 2024-02-01 엘지전자 주식회사 인공 지능 장치 및 그의 화학 소재 탐색 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020143476A1 (en) * 2001-01-29 2002-10-03 Agrafiotis Dimitris K. Method, system, and computer program product for analyzing combinatorial libraries
JP2016523375A (ja) * 2013-06-25 2016-08-08 カウンシル オブ サイエンティフィック アンド インダストリアル リサーチ 仮想スクリーニング用の演算による炭素及びプロトンnmr化学シフトベースのバイナリフィンガープリント
JP2017091526A (ja) * 2015-11-04 2017-05-25 三星電子株式会社Samsung Electronics Co.,Ltd. 新規物質探索方法および装置
US20170161635A1 (en) * 2015-12-02 2017-06-08 Preferred Networks, Inc. Generative machine learning systems for drug design

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996032631A1 (en) * 1995-04-13 1996-10-17 Pfizer Inc. Calibration tranfer standards and methods
GB9724784D0 (en) * 1997-11-24 1998-01-21 Biofocus Plc Method of designing chemical substances
US20030069698A1 (en) * 2000-06-14 2003-04-10 Mamoru Uchiyama Method and system for predicting pharmacokinetic properties
EP1167969A2 (en) * 2000-06-14 2002-01-02 Pfizer Inc. Method and system for predicting pharmacokinetic properties
CN101339180B (zh) * 2008-08-14 2012-05-23 南京工业大学 基于支持向量机的有机化合物燃爆特性预测方法
CN101339181B (zh) * 2008-08-14 2011-10-26 南京工业大学 基于遗传算法的有机化合物燃爆特性预测方法
WO2017037568A1 (en) * 2015-08-31 2017-03-09 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device or electronic device including the semiconductor device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020143476A1 (en) * 2001-01-29 2002-10-03 Agrafiotis Dimitris K. Method, system, and computer program product for analyzing combinatorial libraries
JP2016523375A (ja) * 2013-06-25 2016-08-08 カウンシル オブ サイエンティフィック アンド インダストリアル リサーチ 仮想スクリーニング用の演算による炭素及びプロトンnmr化学シフトベースのバイナリフィンガープリント
JP2017091526A (ja) * 2015-11-04 2017-05-25 三星電子株式会社Samsung Electronics Co.,Ltd. 新規物質探索方法および装置
US20170161635A1 (en) * 2015-12-02 2017-06-08 Preferred Networks, Inc. Generative machine learning systems for drug design

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DALKE ANDREW: ""Molecular fingerprints, background"", [ONLINE], JPN6022034614, 1 May 2018 (2018-05-01), ISSN: 0004853920 *
佐藤 寛子: ""化学への機械学習応用"", 人工知能学会誌, vol. 第24巻第6号, JPN6022034613, 1 November 2009 (2009-11-01), JP, pages 804 - 808, ISSN: 0004853922 *
松山 祐輔: ""薬剤活性予測の改良のための化合物フィンガープリントの比較解析"", 情報処理学会 研究報告 バイオ情報学(BIO) 2017−BIO−49 [ONLINE], JPN6022034615, 16 March 2017 (2017-03-16), JP, pages 1 - 7, ISSN: 0005005800 *
清水 隆史: ""Tanimoto係数の性質に基づく化合物の類似度検索の高速化手法"", 情報処理学会研究報告, vol. 第2008巻第15号, JPN6022034616, 3 March 2008 (2008-03-03), JP, pages 47 - 54, ISSN: 0004853921 *
瀧川 一学: ""多数のグラフからの統計的機械学習"", システム/制御/情報, vol. 第60巻第3号, JPN6022034617, 15 March 2016 (2016-03-15), JP, pages 17 - 22, ISSN: 0005005801 *

Also Published As

Publication number Publication date
WO2019048965A1 (ja) 2019-03-14
CN111051876B (zh) 2023-05-09
JP2023113716A (ja) 2023-08-16
US20200349451A1 (en) 2020-11-05
CN111051876A (zh) 2020-04-21
KR20200051019A (ko) 2020-05-12

Similar Documents

Publication Publication Date Title
JPWO2019048965A1 (ja) 物性予測方法および物性予測システム
Gómez-Bombarelli et al. Design of efficient molecular organic light-emitting diodes by a high-throughput virtual screening and experimental approach
Kim et al. Deep-learning-based inverse design model for intelligent discovery of organic molecules
Joung et al. Experimental database of optical properties of organic compounds
Wang et al. An in-memory computing architecture based on two-dimensional semiconductors for multiply-accumulate operations
Knapen et al. Light dark matter in superfluid helium: Detection with multi-excitation production
Pronobis et al. Capturing intensive and extensive DFT/TDDFT molecular properties with machine learning
Kudyshev et al. Rapid classification of quantum sources enabled by machine learning
Bernien et al. Heralded entanglement between solid-state qubits separated by three metres
Qiu et al. Vibrationally resolved fluorescence excited with submolecular precision
Zimmerman et al. Singlet fission in pentacene through multi-exciton quantum states
Bocquillon et al. Coherence and indistinguishability of single electrons emitted by independent sources
Westermayr et al. High-throughput property-driven generative design of functional organic molecules
Kim et al. Retention Secured Nonlinear and Self‐Rectifying Analog Charge Trap Memristor for Energy‐Efficient Neuromorphic Hardware
Kwon et al. Capacitive neural network using charge-stored memory cells for pattern recognition applications
JP2018206376A (ja) 情報検索システム、知的財産情報検索システム、情報検索方法、及び知的財産情報検索方法
Manrique-Yus et al. Euclid-era cosmology for everyone: neural net assisted MCMC sampling for the joint 3× 2 likelihood
Zhao et al. Performance prediction and experimental optimization assisted by machine learning for organic photovoltaics
Katubi et al. Machine learning assisted designing of organic semiconductors for organic solar cells: High-throughput screening and reorganization energy prediction
Salah et al. Selecting an appropriate machine-learning model for perovskite solar cell datasets
Baker et al. Photosynthetic pigment-protein complexes as highly connected networks: implications for robust energy transport
Birschitzky et al. Machine learning for exploring small polaron configurational space
Rhee et al. Probabilistic computing with NbOx metal-insulator transition-based self-oscillatory pbit
Tan et al. Machine learning based charge mobility prediction for organic semiconductors
Belot et al. Machine learning predictions of high-Curie-temperature materials

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210818

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221021

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230307

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20230524