Nothing Special   »   [go: up one dir, main page]

JP6844562B2 - アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム - Google Patents

アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム Download PDF

Info

Publication number
JP6844562B2
JP6844562B2 JP2018045861A JP2018045861A JP6844562B2 JP 6844562 B2 JP6844562 B2 JP 6844562B2 JP 2018045861 A JP2018045861 A JP 2018045861A JP 2018045861 A JP2018045861 A JP 2018045861A JP 6844562 B2 JP6844562 B2 JP 6844562B2
Authority
JP
Japan
Prior art keywords
time
time interval
label
sensor data
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018045861A
Other languages
English (en)
Other versions
JP2019159819A (ja
Inventor
中嶋 宏
宏 中嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2018045861A priority Critical patent/JP6844562B2/ja
Priority to CN201980012349.8A priority patent/CN111712840B/zh
Priority to US16/969,971 priority patent/US12048528B2/en
Priority to PCT/JP2019/010181 priority patent/WO2019176991A1/ja
Publication of JP2019159819A publication Critical patent/JP2019159819A/ja
Application granted granted Critical
Publication of JP6844562B2 publication Critical patent/JP6844562B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/1126Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb using a particular sensing technique
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/167Personality evaluation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D9/00Recording measured values
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Psychiatry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Psychology (AREA)
  • Theoretical Computer Science (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Social Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Educational Technology (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Physiology (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Dentistry (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Fuzzy Systems (AREA)
  • Recording Measured Values (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システムに関する。
従来、様々な場面において、対象のデータにラベルを付与するアノテーション処理が行われる。例えば、動画データの各部分の内容を示すために、当該動画データの各部分にアノテーション処理が行われる場合がある。また、例えば、特許文献1には、加速度センサから得られるセンサデータ、及び当該センサデータに付与され、当該センサデータの表す行動の種類を示すラベルを利用して、ユーザの行動モデルを学習する方法が提案されている。ラベルは、付与される時間区間内におけるデータの何らかの情報を示すものであり、例えば、特許文献1のように、教師あり学習における正解データ(教師データ)等の様々な用途に利用される。
特開2012−248017号公報
従来、センサの出力が時系列に連続的に配列されたセンサデータに対してアノテーションを行う場合、当該センサデータを時間区間で分割し、得られた各時間区間に各ラベルを付与していた。しかしながら、このようなアノテーション方法では、次のような問題点があることを本件発明者は見出した。
すなわち、センサデータでは、センサの出力が連続的に配列されており、ある時間区間に表れるある状態から次の時間区間に表れる他の状態に徐々に移行するため、各時間区間の境界の時刻を正しく決定するのは困難である。また、同様の理由により、各時間区間の境界では、付与するラベルの内容を一意に決定することができない可能性がある。これらの要因により、従来のアノテーション方法では、センサデータに所望の情報を正確に付与することは困難であるという問題点があることを本件発明者は見出した。
例えば、ユーザに装着した加速度センサから得られるセンサデータに、歩行している(歩行状態)、椅子に座っている(座位状態)、椅子から立ち上がった(起立状態)等のユーザの行動状態を示すラベルを付与するケースを想定する。このケースにおいて、歩行状態から座位状態に移行する、座位状態から起立状態に移行する等の行動状態を変更するための動作をユーザがとった場合に、行動状態の切り替わったタイミングが曖昧であるため、当該行動状態が切り替わった時刻を正しく決定することは困難である。また、各行動状態の移行している区間に、移行前の行動状態を示すラベルを付与すればよいのか、移行後の行動状態を示すラベルを付与すればよいのか不明である。そのため、各行動状態の移行している区間に付与するラベルの内容を一意に決定するのは困難である。したがって、このケースにおいて、従来のアノテーション方法では、ユーザの行動状態を示す情報をセンサデータに正確に付与することは困難である。
本発明は、一側面では、このような実情を鑑みてなされたものであり、その目的は、センサデータに所望の情報をより正確に付与することができるアノテーション技術を提供することである。
本発明は、上述した課題を解決するために、以下の構成を採用する。
すなわち、本発明の一側面に係るアノテーション方法では、コンピュータが、センサの出力を時系列に配列したセンサデータを取得するステップと、取得したセンサデータに複数のラベルを付与するステップと、を実行する。前記複数のラベルは、第1のラベル及び第2のラベルを含み、前記第1のラベルは、第1の時間区間に付与され、前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与される。そして、前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定される。
当該アノテーション方法では、センサデータに複数のラベルを付与する際に、第1のラベルが付与される第1の時間区間と、第2のラベルが付与され、第1の時間区間の後にある第2の時間区間との間に、時系列上で部分的に重複する重複区間が設けられる。これにより、第1の時間区間と第2の時間区間との境界に時間的な幅を持たせることができ、第1のラベルにより示される状態から第2のラベルにより示される状態に遷移したタイミングを一点に決定しなくてもよいようになる。すなわち、第1のラベルの状態から第2のラベルの状態に遷移したタイミングが不明である場合に、重複区間内のいずれかの時刻(タイミング)に当該遷移が生じたものとしたり、重複区間そのものを当該遷移の生じている区間として利用したりすることができるようになる。したがって、当該アノテーション方法によれば、状態の遷移の生じている区間を重複区間によって適切に表すことができるようになるため、境界を一点に決定する従来の方法に比べて、センサデータに所望の情報をより正確に付与することができる。
なお、「センサ」は、何らかのデータを時系列に沿って取得可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。「センサ」は、例えば、生体センサ(拍動、体温、筋電、心電、脳波等を測定可能なセンサ)、活動量センサ(振動、加速度等を測定可能なセンサ)、モーションセンサ、カメラ、マイクロフォン、ロードセル等であってよい。
「センサデータ」は、時間軸上にセンサの出力を時系列に沿って配列したものであり、その種類は、センサの種類に応じて適宜決定されてよい。「センサデータ」は、例えば、数値データ、テキストデータ、画像データ、及び音声データの少なくともいずれかであってよい。また、「センサデータ」は、センサの出力が時系列に沿って配列されているため、「時系列データ」とも称されてよい。
「ラベル」は、センサデータにおける対象の時間区間に何らかの情報を付与するものであり、その内容は、実施の形態に応じて適宜決定されてよい。ラベルは、例えば、対象の時間区間のデータの内容、特徴等を示すように設定されてよい。ラベルは、機械学習等の情報処理に利用されてもよい。「ラベル」が教師あり学習に利用可能である場合、当該「ラベル」は、「教師データ」又は「正解データ」とも称されてよい。この場合、ラベルの内容は、教師あり学習により学習器に習得させる推論の正解であってもよい。なお、以下では、複数のラベルが付与されたセンサデータを「ラベル付きセンサデータ」とも称する。
上記一側面に係るアノテーション方法において、前記コンピュータは、前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻を設定し、設定された前記境界時刻の前及び後の少なくとも一方の時刻を含むように、所定の時間幅を有する前記重複区間を設定してもよい。当該方法によれば、暫定的な境界時刻を基準にして、重複区間を簡易に設定することができるようになるため、アノテーションのコストを低減することができる。
上記一側面に係るアノテーション方法において、前記所定の時間幅は、前記第1のラベル及び前記第2のラベルの少なくとも一方の種類に基づいて決定されてよい。当該方法によれば、付与するラベルの種類に基づいて、重複区間を適切に設定することができるようになるため、センサデータに所望の情報をより正確に付与することができる。なお、ラベルの種類に応じた重複区間の時間幅の具体的な値は、実施の形態に応じて適宜決定されてよい。例えば、工場の作業員の「視認」、「把持」、「運搬」及び「調整」の動作をセンサにより監視する場面を想定したとする。この場面では、「視認」の状態から「把持」の状態に遷移するときの方が、「把持」の状態から「運搬」の状態に遷移するときに比べて、通常、当該状態の遷移にかかる時間は長いと想定される。そこで、この場面において、「視認」のラベルを付与する時間区間と「把持」のラベルを付与する時間区間との間の重複区間の時間幅が、「把持」のラベルを付与する時間区間と「運搬」のラベルを付与する時間区間との間の重複区間の時間幅より長くなるように設定されてよい。
上記一側面に係るアノテーション方法において、前記所定の時間幅は、固定値であってよい。当該方法によれば、重複区間を設定するのにかかる計算量を抑えることができるため、アノテーションのコストを低減することができる。
上記一側面に係るアノテーション方法において、前記コンピュータは、時刻の指定をユーザから受け付け、指定された前記時刻を前記境界時刻に設定してもよい。当該方法によれば、重複区間の基準となる境界時刻を簡易な方法で設定することができるため、アノテーションのコストを低減することができる。
上記一側面に係るアノテーション方法において、前記コンピュータは、前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻についての複数の指定を受け付けてもよく、前記複数の指定により与えられた境界時刻の平均及びばらつきの少なくともいずれかに基づいて前記重複区間を設定してもよい。当該方法によれば、複数の指定により与えられた境界時刻の平均及びばらつきの少なくともいずれかに基づいて、重複区間を適切に設定することができるようになるため、センサデータに所望の情報をより正確に付与することができる。
上記一側面に係るアノテーション方法において、前記コンピュータは、前記第1の時間区間と前記第2の時間区間との重複する区間の指定を受け付けてもよく、指定された前記区間を前記重複区間に設定してもよい。当該方法によれば、重複区間を簡易に設定することができるようになるため、アノテーションのコストを低減することができる。
上記一側面に係るアノテーション方法において、前記コンピュータは、前記センサのサンプリング周期に基づいて、前記センサの前記出力をそれぞれサンプルする複数のサンプル点を前記重複区間が含むように、前記重複区間の時間幅を設定してもよい。当該方法によれば、重複区間は、複数のサンプル点を含むように設定される。これによって、重複区間が実質的に一つの時点のみを含むように設定されるのを避けることができ、第1の時間区間と第2の時間区間との境界に確実に時間的な幅を持たせることができる。
上記一側面に係るアノテーション方法において、前記コンピュータは、前記第1の時間区間の前記開始時刻から前記第2の時間区間の前記開始時刻までの区間に、前記第1のラベルとして第1の値を付与してもよく、前記第1の時間区間の前記終了時刻から前記第2の時間区間の前記終了時刻までの区間に、前記第2のラベルとして第2の値を付与してもよく、前記第1の時間区間の前記終了時刻から前記第2の時間区間の前記開始時刻までの区間に、前記第1の値から前記第2の値に遷移するように1又は複数の値を前記重複区間のラベルとして付与してもよい。当該方法によれば、第1のラベルにより示される状態から第2のラベルにより示される状態に遷移している状態を示すラベルを重複区間に付与することにより、センサデータに所望の情報をより正確に付与することができる。なお、重複区間に付与するラベルの内容が、第1のラベル及び第2のラベルの内容と相違する場合、第1のラベル及び第2のラベルと区別して、重複区間に付与するラベルを「第3のラベル」とも称してもよい。
上記一側面に係るアノテーション方法において、前記複数のラベルそれぞれは、当該各ラベルの付与される時間区間内における前記センサデータに対する所定の推論の正解を示すように設定されてもよい。当該方法によれば、教師あり学習に利用可能なラベル付きセンサデータを生成することができる。
上記一側面に係るアノテーション方法において、前記コンピュータは、前記センサデータ及び前記複数のラベルを利用して教師あり学習を実施することで、前記所定の推論を行う能力を有するように構築された学習済みの学習器に対する評価結果を示す評価結果データを取得するステップと、取得した前記評価結果データの示す前記評価結果に基づいて、前記重複区間の時間幅を変更するステップと、を更に実行してもよい。センサデータに各ラベルが適切に付与されている場合には、そのラベル付きセンサデータを利用した教師あり学習により構築された学習済みの学習器による所定の推論を行う能力は高くなる(すなわち、当該学習済みの学習器に対する評価は高くなる)。一方、重複区間の時間幅が正確でない等に起因して、センサデータに適切に各ラベルが付与されていない場合には、そのラベル付きセンサデータを利用した教師あり学習により構築された学習済みの学習器による所定の推論を行う能力は低くなる(すなわち、当該学習済みの学習器に対する評価は低くなる)。当該方法では、重複区間の時間幅を変更することで、各ラベルを付与する時間区間を調整し、センサデータの各時間区間に各ラベルを適切に付与することができるようになる。したがって、当該方法によれば、所定の推論を行う能力の高い学習済みの学習器を構築可能なラベル付きセンサデータを生成することができる。なお、「学習済みの学習器」は、「識別器」又は「分類器」と称されてもよい。
上記一側面に係るアノテーション方法において、前記評価結果は、前記センサデータとは異なる他のセンサデータに対して、前記学習済みの学習器により前記所定の推論を行った際の正答率により表現されてもよく、前記コンピュータは、前記評価結果データにより示される前記正答率が所定の閾値以下である場合に、前記重複区間の時間幅を狭める又は拡げることで、前記重複区間の時間幅を変更してもよい。当該方法によれば、所定の推論を行う能力を一定の水準以上で有する学習済みの学習器を構築可能なラベル付きセンサデータを生成することができる。
なお、上記各形態に係るアノテーション方法の別の形態として、本発明の一側面は、以上の各ステップを実行可能な情報処理装置であってもよいし、プログラムであってもよいし、このようなプログラムを記憶した、コンピュータその他装置、機械等が読み取り可能な記憶媒体であってもよい。ここで、コンピュータ等が読み取り可能な記憶媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。
例えば、本発明の一側面に係るアノテーション装置は、センサの出力を時系列に配列したセンサデータを取得するデータ取得部と、取得したセンサデータに複数のラベルを付与するラベル付与部と、を備える情報処理装置であって、前記複数のラベルは、第1のラベル及び第2のラベルを含み、前記第1のラベルは、第1の時間区間に付与され、前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定される、情報処理装置である。
また、例えば、本発明の一側面に係るアノテーションプログラムは、コンピュータに、センサの出力を時系列に配列したセンサデータを取得するステップと、取得したセンサデータに複数のラベルを付与するステップと、を実行させるためのプログラムであって、前記複数のラベルは、第1のラベル及び第2のラベルを含み、前記第1のラベルは、第1の時間区間に付与され、前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定される、プログラムである。
また、上記センサデータ及び複数のラベルを利用した教師あり学習により構築された学習済みの学習器を利用して、所定の推論を実施するシステム、情報処理装置、情報処理方法、プログラム、及びこのようなプログラムを記憶した、コンピュータその他装置、機械等が読み取り可能な記憶媒体を構成してもよい。
例えば、本発明の一側面に係る識別システムは、工場の作業員の行動状態を監視するセンサの出力を時系列に配列したセンサデータを取得するデータ取得部と、取得した前記センサデータに複数のラベルを付与するラベル付与部であって、当該複数のラベルそれぞれは、当該各ラベルの付与される時間区間内における前記センサデータに表れる前記作業員の行動状態の正解を示すように設定される、ラベル付与部と、前記センサデータ及び前記複数のラベルを利用して教師あり学習を実施することで、前記作業員の行動状態の種別を推定する能力を有するように学習済みの学習器を構築する学習処理部と、前記作業員の行動状態を推定する対象となる対象センサデータを取得する対象データ取得部と、前記対象センサデータを前記学習済みの学習器に入力し、前記学習済みの学習器から出力を得ることで、前記対象センサデータに表れる前記作業員の行動状態を推定する状態推定部と、前記作業員の行動状態を推定した結果を出力する出力部と、を備え、前記複数のラベルは、第1のラベル及び第2のラベルを含み、前記第1のラベルは、第1の時間区間に付与され、前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定される。
また、例えば、本発明の一側面に係る識別システムは、センサの出力を時系列に配列したセンサデータを取得するデータ取得部と、取得した前記センサデータに複数のラベルを付与するラベル付与部であって、当該複数のラベルそれぞれは、当該各ラベルの付与される時間区間内における前記センサデータに対する所定の推論の正解を示すように設定される、ラベル付与部と、前記センサデータ及び前記複数のラベルを利用して教師あり学習を実施することで、前記所定の推論を行う能力を有するように学習済みの学習器を構築する学習処理部と、前記所定の推論を行う対象となる対象センサデータを取得する対象データ取得部と、前記対象センサデータを前記学習済みの学習器に入力し、前記学習済みの学習器から出力を得ることで、前記対象センサデータに対して所定の推論を実施する推論部と、前記所定の推論を実施した結果を出力する出力部と、を備え、前記複数のラベルは、第1のラベル及び第2のラベルを含み、前記第1のラベルは、第1の時間区間に付与され、前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定される。
本発明によれば、センサデータに所望の情報をより正確に付与することができるアノテーション技術を提供することができる。
図1は、本発明が適用される場面の一例を模式的に例示する。 図2は、実施の形態に係るアノテーション装置のハードウェア構成の一例を模式的に例示する。 図3は、実施の形態に係る学習装置のハードウェア構成の一例を模式的に例示する。 図4は、実施の形態に係る識別装置のハードウェア構成の一例を模式的に例示する。 図5は、実施の形態に係るアノテーション装置のソフトウェア構成の一例を模式的に例示する。 図6は、実施の形態に係る学習装置のソフトウェア構成の一例を模式的に例示する。 図7Aは、実施の形態に係る学習装置による学習器の機械学習の過程を模式的に例示する。 図7Bは、実施の形態に係る学習装置による学習済みの学習器の性能評価の過程を模式的に例示する。 図8は、実施の形態に係る識別装置のソフトウェア構成の一例を模式的に例示する。 図9は、実施の形態に係るアノテーション装置の処理手順の一例を例示する。 図10は、第1のラベルを付与する第1の時間区間と第2のラベルを付与する第2の時間区間との関係を模式的に例示する。 図11Aは、重複区間を設定する第1の方法の過程を模式的に例示する。 図11Bは、重複区間を設定する第1の方法の過程を模式的に例示する。 図11Cは、重複区間を設定する第1の方法の過程を模式的に例示する。 図12は、重複区間を設定する第2の方法の一例を模式的に例示する。 図13は、重複区間を設定する第3の方法の一例を模式的に例示する。 図14は、重複区間に設定するラベルの内容の一例を模式的に例示する。 図15は、センサデータに対するアノテーションの一例を模式的に例示する。 図16は、実施の形態に係る学習装置の処理手順の一例を例示する。 図17は、実施の形態に係るアノテーション装置の重複区間の修正に関する処理手順の一例を例示する。 図18は、実施の形態に係る識別装置の処理手順の一例を例示する。 図19は、本発明が適用される他の場面の一例を模式的に例示する。 図20は、他の形態に係る識別装置のソフトウェア構成の一例を模式的に例示する。
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。
§1 適用例
まず、図1を用いて、本発明が適用される場面の一例について説明する。図1は、本実施形態に係る識別システム100の適用場面の一例を模式的に例示する。本実施形態に係る識別システム100は、工場の作業員の行動状態を監視するためのシステムであり、ネットワークを介してそれぞれ接続されるアノテーション装置1、学習装置2、及び識別装置4により構成されている。
アノテーション装置1は、センサの出力を時系列に配列したセンサデータを取得し、取得したセンサデータに複数のラベルを付与する情報処理装置である。センサは、何らかのデータを時系列に沿って取得可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。センサは、例えば、生体センサ(拍動、体温、筋電、心電、脳波等を測定可能なセンサ)、活動量センサ(振動、加速度等を測定可能なセンサ)、モーションセンサ、カメラ、マイクロフォン、ロードセル等であってよい。
また、センサデータは、時間軸上にセンサの出力を時系列に沿って配列したものであり、その種類は、センサの種類に応じて適宜決定されてよい。センサデータは、例えば、数値データ、テキストデータ、画像データ、及び音声データの少なくともいずれかであってよい。センサデータは、センサの出力が時系列に沿って配列されているため、「時系列データ」とも称されてよい。
本実施形態では、工場の作業員の状態を監視するため、カメラ31及び活動量センサ32がセンサの一例として利用される。カメラ31は、公知の撮像装置であってよく、センサデータ122として画像データを生成する。また、活動量センサ32は、例えば、加速度センサであり、作業員の衣服に取り付けられる。活動量センサ32は、センサデータ122として数値データを生成する。カメラ31及び活動量センサ32は、本発明の「工場の作業員の状態を監視するセンサ」の一例である。本実施形態に係るアノテーション装置1は、カメラ31及び活動量センサ32からセンサデータ122を取得する。なお、図1では、簡略化のため、センサデータ122として、活動量センサ32から得られる数値データのみを例示している。本実施形態では、カメラ31から得られる画像データも、活動量センサ32から得られる数値データと同様に取り扱われるものとし、図示を省略する。
次に、本実施形態に係るアノテーション装置1は、取得したセンサデータ122に複数のラベルを付与することで、ラベル付きセンサデータ124を生成する。このとき、センサデータ122に設定される複数の時間区間には、時系列上で互いに隣接する第1の時間区間及び第2の時間区間が含まれる。第2の時間区間は、時系列上で第1の時間区間よりも後に連続するように設定される。また、付与される複数のラベルには、第1のラベル1231及び第2のラベル1232が含まれる。第1のラベル1231は、第1の時間区間に付与され、第2のラベル1232は、第2の時間区間に付与される。
ラベルの付与される各時間区間は、センサデータ122において、開始時刻と終了時刻とによって時系列(時間軸)上で設定される区間である。本実施形態では、第1の時間区間の開始時刻が第2の時間区間の開始時刻よりも前に設定され、かつ第1の時間区間の終了時刻が第2の時間区間の終了時刻よりも前に設定されるのに対して、第1の時間区間の終了時刻は第2の時間区間の開始時刻よりも後に設定される。これによって、本実施形態では、第1の時間区間及び第2の時間区間は、時系列上で部分的に重複する重複区間を有するように設定される。この重複区間は、第1の時間区間及び第2の時間区間それぞれに付与された第1のラベル1231及び第2のラベル1232の両方が付与された時間区間とみなすことができる。また、この重複区間には、第1のラベル1231及び第2のラベル1232とは異なるラベル(例えば、第1のラベル1231から第2のラベル1232に遷移していることを示すラベル)を付与することもできる。
各時間区間に付与される各ラベルは、センサデータにおける対象の時間区間に何らかの情報を付与するものであり、その内容は、実施の形態に応じて適宜決定されてよい。また、各ラベルは、例えば、対象の時間区間のデータの内容、特徴等を示すように設定されてよい。本実施形態では、各ラベルの内容は、当該各ラベルの付与される時間区間内におけるセンサデータ122に対する所定の推論の正解を示すように設定される。具体的には、センサデータ122は、工場の作業員の状態を監視するためのカメラ31及び活動量センサ32から得られるものであるため、各ラベルは、付与される時間区間におけるセンサデータ122に表れる作業員の行動状態の正解を示すように設定される。
したがって、生成されるラベル付きセンサデータ124は、所定の推論の一例として、カメラ及び活動量センサから得られるセンサデータに基づいて作業員の行動状態の種別を推定する能力を学習器に習得させるための教師あり学習に利用可能である。そこで、本実施形態に係る学習装置2は、ラベル付きセンサデータ124をアノテーション装置1から取得して、取得したラベル付きセンサデータ124を利用して学習器の教師あり学習を実施する。これにより、本実施形態に係る学習装置2は、カメラ及び活動量センサから得られるセンサデータに基づいて作業員の行動状態の種別を推定する能力を有するように学習済みの学習器を構築する。
具体的には、学習装置2は、ネットワーク等を介してアノテーション装置1からラベル付きセンサデータ124を取得する。そして、学習装置2は、対象の時間区間におけるセンサデータ122を入力すると、入力したセンサデータ122の時間区間に付与されたラベルに対応する値を出力するように学習器(後述するニューラルネットワーク5)を学習させる。これにより、学習装置2は、ラベル付きセンサデータ124を利用して、カメラ及び活動量センサから得られるデータに基づいて作業員の行動状態の種別を推定する学習済みの学習器を構築する。
そして、本実施形態に係る識別装置4は、この学習済みの学習器を利用して、作業員の行動状態の推定を行う。すなわち、本実施形態に係る識別装置4は、カメラ31及び活動量センサ32から作業員の行動状態を推定する対象となる対象センサデータを取得する。続いて、識別装置4は、対象センサデータを学習済みの学習器に入力し、当該学習済みの学習器から出力を得ることで、当該対象センサデータに表れる作業員の行動状態を推定する。そして、識別装置4は、作業員の行動状態を推定した結果を出力する。
以上のとおり、本実施形態に係るアノテーション方法では、センサデータ122に複数のラベルを付与する際に、第1のラベル1231が付与される第1の時間区間と第2のラベル1232が付与される第2の時間区間との間に、時系列上で部分的に重複する重複区間が設けられる。これにより、第1の時間区間と第2の時間区間との境界に時間的な幅を持たせることができ、第1のラベル1231により示される状態から第2のラベル1232により示される状態に遷移したタイミングを一点に決定しなくてもよいようになる。すなわち、第1のラベル1231により示される状態から第2のラベル1232により示される状態への遷移が図1に示される重複区間内のいずれかの時刻に生じたものとしたり、重複区間により当該遷移の生じている区間を表したりすることができるようになる。
したがって、本実施形態に係るアノテーション方法によれば、第1の時間区間と第2の時間区間との間に設定した重複区間により、第1のラベル1231により示される状態から第2のラベル1232により示される状態への遷移が生じている区間を適切に表すことができる。そのため、時間区間の境界を一点に決定する従来の方法に比べて、センサデータ122に所望の情報をより正確に付与することができる。
また、従来の方法において、各時間区間の境界時刻を誤った時刻に設定してしまったり、ある状態から他の状態に移行している区間にいずれかの状態を示すラベルを付与してしまったりすることに起因して、センサデータに付与した情報が正確ではないと、ラベルを利用する場面で様々な悪影響を及ぼす可能性がある。例えば、上記のケースにより得られたラベル付きセンサデータを利用して、センサデータに対してユーザの行動状態を推定する推論を行う能力を学習器に獲得させる教師あり学習を実施する場面を想定する。この場合、まだ歩行状態である時刻であるにも関わらず当該時刻を次の行動状態に遷移する境界時刻として設定してしまったり、歩行状態から座位状態に移行している区間に「歩行状態」を示すラベルを付与したりする等によって、ユーザの行動状態を正確に反映していないラベル付けが行われてしまう可能性がある。ユーザの行動状態を正確に反映してラベル付けが行われていないと、少なくとも部分的にラベルがユーザの行動状態を正しく示していないことになる。これにより、この部分のラベルを正解データ(教師データ)として利用した場合に、誤った学習を実施してしまうことになり、教師あり学習により構築される学習済みの学習器の性能(すなわち、推論の能力)が低減してしまう可能性がある。
これに対して、本実施形態によれば、正解データを含む所望の情報をセンサデータ122により正確に付与することができる。そのため、このラベル付きセンサデータ124を利用して教師あり学習を実施することで、比較的に推論の能力の高い学習済みの学習器を構築することができるようになる。例えば、教師あり学習にラベル付きセンサデータ124を利用する学習装置2では、カメラ及び活動量センサから得られるデータに基づいて作業員の行動状態の種別を推定する能力のより高い学習済みの学習器を構築することができるようになる。これにより、識別装置4は、作業員の行動状態を高い精度で推定することができるようになる。
§2 構成例
[ハードウェア構成]
<アノテーション装置>
次に、図2を用いて、本実施形態に係るアノテーション装置1のハードウェア構成の一例について説明する。図2は、本実施形態に係るアノテーション装置1のハードウェア構成の一例を模式的に例示する。
図2に示されるとおり、本実施形態に係るアノテーション装置1は、制御部11、記憶部12、通信インタフェース13、外部インタフェース14、入力装置15、出力装置16、及びドライブ17が電気的に接続されたコンピュータである。なお、図2では、通信インタフェース及び外部インタフェースをそれぞれ「通信I/F」及び「外部I/F」と記載している。
制御部11は、ハードウェアプロセッサであるCPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、プログラム及び各種データに基づいて情報処理を実行するように構成される。記憶部12は、メモリの一例であり、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。本実施形態では、記憶部12は、アノテーションプログラム121、センサデータ122、ラベルデータ123等の各種情報を記憶する。
アノテーションプログラム121は、センサデータ122を取得し、取得したセンサデータ122のアノテーションを行う後述の情報処理(図9、図17)をアノテーション装置1に実行させるためのプログラムであり、当該情報処理の一連の命令を含む。ラベルデータ123は、センサデータ122に付与された複数のラベルを管理するためのデータである。ラベル付きセンサデータ124は、センサデータ122及びラベルデータ123により構成される。詳細は後述する。
通信インタフェース13は、例えば、有線LAN(Local Area Network)モジュール、無線LANモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。アノテーション装置1は、この通信インタフェース13によって、ネットワークを介したデータ通信を学習装置2と行うことができる。なお、学習装置2との間のネットワークの種類は、例えば、インターネット、無線通信網、移動通信網、電話網、専用網等から適宜選択されてよい。
外部インタフェース14は、例えば、USB(Universal Serial Bus)ポート、専用ポート等であり、外部装置と接続するためのインタフェースである。外部インタフェース14の種類及び数は、接続される外部装置の種類及び数に応じて適宜選択されてよい。本実施形態では、アノテーション装置1は、外部インタフェース14を介して、カメラ31及び活動量センサ32に接続される。
カメラ31及び活動量センサ32は、本発明の「センサ」の一例である。工場の作業員の状態を監視するため、例えば、カメラ31は、作業員を撮影可能な場所に配置され、活動量センサ32は、作業員の衣服に取り付けられる。なお、カメラ31及び活動量センサ32が通信インタフェースを備える場合、アノテーション装置1は、外部インタフェース14ではなく、通信インタフェース13を介して、カメラ31及び活動量センサ32に接続されてよい。
入力装置15は、例えば、マウス、キーボード等の入力を行うための装置である。また、出力装置16は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。センサデータ122に対するラベルの付与は、装置により自動的に行われてもよいし、ユーザが装置を操作することにより行われてもよい。ユーザによりラベルの付与が行われる場合には、当該ユーザは、入力装置15及び出力装置16を利用して、アノテーション装置1を操作することで、センサデータ122にラベルを付与することができる。
ドライブ17は、例えば、CDドライブ、DVDドライブ等であり、記憶媒体91に記憶されたプログラムを読み込むためのドライブ装置である。ドライブ17の種類は、記憶媒体91の種類に応じて適宜選択されてよい。上記アノテーションプログラム121及びセンサデータ122のうちの少なくともいずれかは、この記憶媒体91に記憶されていてもよい。
記憶媒体91は、コンピュータその他装置、機械等が、記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。アノテーション装置1は、この記憶媒体91から、上記アノテーションプログラム121及びセンサデータ122のうちの少なくともいずれかを取得してもよい。
ここで、図2では、記憶媒体91の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体91の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。
なお、アノテーション装置1の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部11は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、FPGA(field-programmable gate array)、DSP(digital signal processor)等で構成されてよい。記憶部12は、制御部11に含まれるRAM及びROMにより構成されてもよい。通信インタフェース13、外部インタフェース14、入力装置15及び出力装置16の少なくともいずれかは省略されてもよい。アノテーション装置1は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、アノテーション装置1は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、PC(Personal Computer)等であってもよい。
<学習装置>
次に、図3を用いて、本実施形態に係る学習装置2のハードウェア構成の一例について説明する。図3は、本実施形態に係る学習装置2のハードウェア構成の一例を模式的に例示する。
図3に示されるとおり、本実施形態に係る学習装置2は、制御部21、記憶部22、通信インタフェース23、入力装置24、出力装置25、及びドライブ26が電気的に接続されたコンピュータである。なお、図3では、図2と同様に、通信インタフェースを「通信I/F」と記載している。
制御部21〜ドライブ26及び記憶媒体92はそれぞれ、上記アノテーション装置1の制御部11〜通信インタフェース13、入力装置15〜ドライブ17及び記憶媒体91と同様の構成を有している。制御部21は、ハードウェアプロセッサであるCPU、RAM、ROM等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部22は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。記憶部22は、学習プログラム221、ラベル付きセンサデータ124、学習結果データ222、評価用データセット223、評価結果データ224等の各種情報を記憶する。
学習プログラム221は、ラベル付きセンサデータ124を利用して、所定の推論を行う能力を学習器に習得させるための後述の教師あり学習の情報処理(図16)を学習装置2に実行させるためのプログラムであり、当該情報処理の一連の命令を含む。学習結果データ222は、当該教師あり学習により構築された学習済みの学習器の設定を行うためのデータである。評価用データセット223は、当該教師あり学習により構築された学習済みの学習器の有する推論の能力を評価するためのデータセットである。評価結果データ224は、評価用データセット223を利用して当該学習済みの学習器の有する推論を行う能力を評価した結果を示す。詳細は後述する。
通信インタフェース23は、例えば、有線LANモジュール、無線LANモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。学習装置2は、この通信インタフェース23によって、ネットワークを介したデータ通信をアノテーション装置1と行うことができる。
入力装置24は、例えば、マウス、キーボード等の入力を行うための装置である。また、出力装置25は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。オペレータは、入力装置24及び出力装置25を介して、学習装置2を操作することができる。
ドライブ26は、例えば、CDドライブ、DVDドライブ等であり、記憶媒体92に記憶されたプログラムを読み込むためのドライブ装置である。ドライブ26の種類は、記憶媒体92の種類に応じて適宜選択されてよい。上記学習プログラム221、ラベル付きセンサデータ124、及び評価用データセット223の少なくとも一つは、この記憶媒体92に記憶されていてもよい。
記憶媒体92は、コンピュータその他装置、機械等が、記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。学習装置2は、この記憶媒体92から、上記学習プログラム221、ラベル付きセンサデータ124、及び評価用データセット223の少なくとも一つを取得してもよい。
ここで、図3では、図2と同様に、記憶媒体92の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体92の種類は、上記記憶媒体91と同様に、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。
なお、学習装置2の具体的なハードウェア構成に関して、上記アノテーション装置1と同様に、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。また、学習装置2は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、PC等であってもよい。
<識別装置>
次に、図4を用いて、本実施形態に係る識別装置4のハードウェア構成の一例について説明する。図4は、本実施形態に係る識別装置4のハードウェア構成の一例を模式的に例示する。
図4に示されるとおり、本実施形態に係る識別装置4は、制御部41、記憶部42、通信インタフェース43、外部インタフェース44、入力装置45、出力装置46、及びドライブ47が電気的に接続されたコンピュータである。なお、図4では、図2と同様に、通信インタフェース及び外部インタフェースをそれぞれ「通信I/F」及び「外部I/F」と記載している。
制御部41〜ドライブ47及び記憶媒体94はそれぞれ、上記アノテーション装置1の制御部11〜ドライブ17及び記憶媒体91と同様の構成を有している。制御部41は、ハードウェアプロセッサであるCPU、RAM、ROM等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部42は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成され、識別プログラム421、学習結果データ222等の各種情報を記憶する。識別プログラム421は、学習装置2により構築された学習済みの学習器を利用して、作業員の行動状態を推定するための後述の情報処理(図18)を識別装置4に実行させるプログラムであり、当該情報処理の一連の命令を含む。詳細は後述する。
通信インタフェース43は、例えば、有線LANモジュール、無線LANモジュール等であり、アノテーション装置1及び学習装置2とネットワークを介したデータ通信を行うのに利用される。外部インタフェース44は、例えば、USBポート、専用ポート等であり、カメラ31及び活動量センサ32に接続するのに利用される。入力装置45は、例えば、マウス、キーボード等の入力を行うための装置である。また、出力装置46は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。ユーザは、入力装置45及び出力装置46を介して、識別装置4を操作することができる。
ドライブ47は、例えば、CDドライブ、DVDドライブ等であり、記憶媒体94に記憶されたプログラムを読み込むためのドライブ装置である。ドライブ47の種類は、記憶媒体94の種類に応じて適宜選択されてよい。上記識別プログラム421及び学習結果データ222の少なくとも一つは、この記憶媒体94に記憶されていてもよい。記憶媒体94は、コンピュータその他装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。識別装置4は、この記憶媒体94から、上記識別プログラム421及び学習結果データ222の少なくとも一つを取得してもよい。ここで、図4では、図2及び図3と同様に、記憶媒体94の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体94の種類は、上記と同様に、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。
なお、識別装置4の具体的なハードウェア構成に関して、上記アノテーション装置1及び学習装置2と同様に、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。また、識別装置4は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、PC等であってもよい。
[ソフトウェア構成]
<アノテーション装置>
次に、図5を用いて、本実施形態に係るアノテーション装置1のソフトウェア構成の一例を説明する。図5は、本実施形態に係るアノテーション装置1のソフトウェア構成の一例を模式的に例示する。
アノテーション装置1の制御部11は、記憶部12に記憶されたアノテーションプログラム121をRAMに展開する。そして、制御部11は、RAMに展開されたアノテーションプログラム121をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図5に示されるとおり、本実施形態に係るアノテーション装置1は、データ取得部111、ラベル付与部112、及び区間修正部113をソフトウェアモジュールとして備えるコンピュータとして構成される。すなわち、本実施形態では、各ソフトウェアモジュールは、制御部11(CPU)により実現される。
データ取得部111は、センサ(本実施形態では、カメラ31、活動量センサ32)の出力が時系列に配列されたセンサデータ122を取得する。ラベル付与部112は、取得したセンサデータ122に複数のラベルを付与する。このとき、ラベル付与部112は、センサデータ122の少なくとも一部において、それぞれラベルが付与され、時系列(時間軸)上で連続する2つの時間区間の間に、時系列(時間軸)上で部分的に重複する重複区間を設ける。
具体的には、付与される複数のラベルには、上記第1のラベル1231及び第2のラベル1232が含まれる。ラベル付与部112は、第1のラベル1231を付与する第1の時間区間、及び時系列上で第1の時間区間よりも後に隣接し、第2のラベル1232を付与する第2の時間区間を次のように設定する。
すなわち、ラベル付与部112は、各ラベルを付与する各時間区間をセンサデータ122に設定する際に、第1の時間区間の開始時刻を第2の時間区間の開始時刻よりも前に設定し、かつ第1の時間区間の終了時刻を第2の時間区間の終了時刻よりも前に設定する。一方、ラベル付与部112は、第1の時間区間の終了時刻を第2の時間区間の開始時刻よりも後に設定する。これにより、ラベル付与部112は、互いに隣接する第1の時間区間及び第2の時間区間の間に、時系列上で部分的に重複する重複区間が設けられるように、第1の時間区間及び第2の時間区間を設定する。ラベル付与部112は、このようにラベル付けを行った結果をラベルデータ123として保存する。
なお、各時間区間に付与する各ラベルの内容は、実施の形態に応じて適宜決定されてよい。本実施形態では、ラベル付与部112は、各ラベルの付与される時間区間内におけるセンサデータ122に対する所定の推論の正解を示すように、各ラベルの内容を設定する。そのため、各ラベルは、「教師データ」又は「正解データ」とも称されてよい。
本実施形態では、センサデータ122は、工場の作業員の状態を監視するためのカメラ31及び活動量センサ32から得られるため、ラベル付与部112は、付与される時間区間における作業員の行動状態を示すように、各ラベルの内容を設定することができる。これにより、ラベル付与部112は、所定の推論の一例として、カメラ及び活動量センサから得られるデータに基づいて作業員の行動状態を推定する能力を学習器に習得させるための教師あり学習に利用可能なラベル付きセンサデータ124を生成することができる。
区間修正部113は、所定の推論を行う能力を有するように構築された学習済み学習器に対する評価結果を示す評価結果データ224を取得する。そして、区間修正部113は、取得した評価結果データにより示される評価結果に基づいて、重複区間の時間幅の変更を行う。重複区間の時間幅を変更した場合には、区間修正部113は、変更内容をラベルデータ123に反映する。
<学習装置>
次に、図6を用いて、本実施形態に係る学習装置2のソフトウェア構成の一例を説明する。図6は、本実施形態に係る学習装置2のソフトウェア構成の一例を模式的に例示する。
学習装置2の制御部21は、記憶部22に記憶された学習プログラム221をRAMに展開する。そして、制御部21は、RAMに展開された学習プログラム221をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図6に示されるとおり、本実施形態に係る学習装置2は、学習データ取得部211、学習処理部212、及び性能評価部213をソフトウェアモジュールとして備えるコンピュータとして構成される。すなわち、本実施形態では、各ソフトウェアモジュールは、制御部21(CPU)により実現される。
学習データ取得部211は、機械学習に利用する学習用データセット125を取得する。学習処理部212は、学習用データセット125を利用して、ニューラルネットワーク5の教師あり学習を実施する。これにより、学習処理部212は、所定の推論を行う能力を習得した学習済みのニューラルネットワーク5を構築する。ニューラルネットワーク5は、「学習器」の一例である。性能評価部213は、評価用データセット223を利用して、構築した学習済みのニューラルネットワーク5の性能を評価し、その評価結果を評価結果データ224として保存する。
(学習過程)
ここで、図7Aを更に用いて、学習処理部212による教師あり学習の過程について説明する。図7Aは、本実施形態に係る学習処理部212によるニューラルネットワーク5の教師あり学習の過程を模式的に例示する。
まず、教師あり学習に利用される学習用データセット125について説明する。学習用データセット125は、センサデータ1251及びラベル1252の対で構成され、ラベル付きセンサデータ124から生成される。具体的には、ラベルを付与した時間区間単位でラベル付きセンサデータ124を抽出することで、学習用データセット125を生成することができる。すなわち、センサデータ1251は、対象の時間区間で特定されるセンサデータ122の部分であり、ラベル1252は、その時間区間に割り当てられているラベルである。
次に、教師あり学習により所定の推論を行う能力を習得させる学習モデルであるニューラルネットワーク5について説明する。本実施形態に係るニューラルネットワーク5は、いわゆる多層構造のニューラルネットワークであり、入力側から順に、入力層51、中間層(隠れ層)52、及び出力層53を備えている。ただし、ニューラルネットワーク5の層の数は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。
各層51〜53は、1又は複数のニューロン(ノード)を備えている。各層51〜53に含まれるニューロンの個数は、実施の形態に応じて適宜設定されてよい。例えば、入力層51のニューロンの数は、センサデータ1251に応じて適宜設定されてよい。また、出力層51のニューロンの数は、ラベル1252の種別の数に応じて設定されてよい。
隣接する層のニューロン同士は適宜結合され、各結合には重み(結合荷重)が設定されている。図7Aの例では、各ニューロンは、隣接する層の全てのニューロンと結合されている。しかしながら、ニューロンの結合は、このような例に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。
各ニューロンには閾値が設定されており、基本的には、各入力と各重みとの積の和が閾値を超えているか否かによって各ニューロンの出力が決定される。学習処理部212は、各学習用データセット125のセンサデータ1251を入力層51に入力すると、入力したセンサデータ1251に関連付けられたラベル1252に対応する値を出力層53から出力するニューラルネットワーク5を構築する。そして、学習処理部212は、構築したニューラルネットワーク5の構成(例えば、ニューラルネットワークの層数、各層におけるニューロンの個数、ニューロン同士の結合関係、各ニューロンの伝達関数)、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報を学習結果データ222として記憶部22に保存する。
(評価過程)
次に、図7Bを更に用いて、性能評価部213による学習済みのニューラルネットワーク5に対する性能評価の過程について説明する。図7Bは、本実施形態に係る性能評価部213による学習済みのニューラルネットワーク5に対する性能評価の過程を模式的に例示する。
学習済みのニューラルネットワーク5の性能評価には、評価用データセット223が利用される。評価用データセット223は、学習用データセット125と同様に、センサデータ2231及びラベル2232の対で構成される。評価用データセット223のセンサデータ2231は、本発明の「センサデータとは異なる他のセンサデータ」の一例である。
この評価用データセット223は、実施の形態に応じて適宜生成されてよい。例えば、評価用データセット223は、ラベル付きセンサデータ124のうち、上記学習用データセット125として利用した部分以外の他の部分から生成されてよい。この場合、評価用データセット223は、上記学習用データセット125と同様の方法で生成することができる。また、例えば、評価用データセット223は、カメラ及び活動量センサから得られたセンサデータにオペレータが適宜ラベル付けすることで生成されてもよい。
性能評価部213は、評価用データセット223のセンサデータ2231を学習済みのニューラルネットワーク5の入力層51に入力し、当該学習済みニューラルネットワーク5の演算処理を実行することで、出力層53から出力値を得る。この出力値は、学習済みのニューラルネットワーク5によりセンサデータ2231に対して所定の推論を行った結果を示す。
そこで、性能評価部213は、得られた出力値と入力したセンサデータ2231に関連付けられたラベル2232とを比較することで、学習済みのニューラルネットワーク5によるセンサデータ2231に対する所定の推論が正しいか否かを判定する。これにより、本実施形態に係る性能評価部213は、学習済みのニューラルネットワーク5によりセンサデータ2231に対して所定の推論を行った際の正答率で表現される評価結果を得ることができる。性能評価部213は、得られた評価結果の情報を評価結果データ224として記憶部22に保存する。
なお、この正答率は、評価に利用した評価用データセット223のうち、学習済みのニューラルネットワーク5による所定の推論が正しかった評価用データセット223の割合である。反対に、評価に利用した評価用データセット223のうち、学習済みのニューラルネットワーク5による所定の推論が誤った評価用データセット223の割合を「誤答率」と称することができる。この誤答率は、正答率と表裏一体の関係にある。そのため、本実施形態では、評価結果を誤答率で表現することは、評価結果を正答率で表現することと同じことであるとする。
<識別装置>
次に、図8を用いて、本実施形態に係る識別装置4のソフトウェア構成の一例を説明する。図8は、本実施形態に係る識別装置4のソフトウェア構成の一例を模式的に例示する。
識別装置4の制御部41は、記憶部42に記憶された識別プログラム421をRAMに展開する。そして、制御部41は、RAMに展開された識別プログラム421をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図8に示されるとおり、本実施形態に係る識別装置4は、対象データ取得部411、状態推定部412、及び出力部413をソフトウェアモジュールとして備えるコンピュータとして構成される。
対象データ取得部411は、作業員の行動状態を推定する対象となる対象センサデータ422を取得する。状態推定部412は、学習済みのニューラルネットワーク5を含んでいる。具体的には、状態推定部412は、学習結果データ222を参照して、作業員の行動状態の推定に利用する学習済みのニューラルネットワーク5の設定を行う。次に、状態推定部412は、学習済みのニューラルネットワーク5に対象センサデータ422を入力し、学習済みのニューラルネットワーク5の演算処理を実施することで、当該学習済みのニューラルネットワーク5から出力値を得る。そして、状態推定部412は、当該学習済みのニューラルネットワーク5から得られた出力値に基づいて、対象センサデータ422に表れる作業員の行動状態を推定する。出力部413は、状態推定部412により作業員の行動状態を推定した結果を出力する。
<その他>
アノテーション装置1、学習装置2、及び識別装置4の各ソフトウェアモジュールに関しては後述する動作例で詳細に説明する。なお、本実施形態では、アノテーション装置1、学習装置2、及び識別装置4の各ソフトウェアモジュールがいずれも汎用のCPUによって実現される例について説明している。しかしながら、以上の各ソフトウェアモジュールの一部又は全部が、1又は複数の専用のプロセッサにより実現されてもよい。また、アノテーション装置1、学習装置2、及び識別装置4それぞれのソフトウェア構成に関して、実施形態に応じて、適宜、ソフトウェアモジュールの省略、置換及び追加が行われてもよい。
§3 動作例
[アノテーション処理]
次に、図9を用いて、アノテーション装置1によるアノテーション処理について説明する。図9は、アノテーション装置1によるアノテーション処理の手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は、本発明の「アノテーション方法」の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
(ステップS101)
ステップS101では、制御部11は、データ取得部111として動作し、センサの出力が時系列に配列されたセンサデータ122を取得する。センサデータ122を取得すると、次のステップS102に処理を進める。
本実施形態では、カメラ31及び活動量センサ32がセンサとしてアノテーション装置1に接続されている。そのため、制御部11は、カメラ31及び活動量センサ32からセンサデータ122を直接取得してもよい。また、制御部11は、センサから直接ではなく、他の情報処理装置、記憶媒体等を経由して間接的にセンサデータ122を取得してもよい。センサデータ122を取得する過程は、実施の形態に応じて適宜決定されてよい。
また、センサデータ122は、センサの出力信号そのものであってもよいし、センサの出力信号に対して何らかの情報処理を適用することで得られたものであってもよい。センサデータの内容は、ラベルを付与可能であれば、特に限定されなくてもよい。本実施形態では、制御部11は、カメラ31及び活動量センサ32から、画像データ及び数値データをセンサデータ122として取得することができる。
(ステップS102及びS103)
ステップS102では、制御部11は、ラベル付与部112として動作し、取得したセンサデータ122に複数の時間区間を設定する。次のステップS103では、制御部11は、設定した各時間区間に1又は複数のラベルを付与する。これにより、制御部11は、センサデータ122に複数のラベルを付与する。
ここで、図10を更に用いて、ラベルを付与する方法について説明する。図10は、第1のラベル1231を付与する第1の時間区間と第2のラベル1232を付与する第2の時間区間との関係を模式的に例示する。本実施形態では、制御部11は、センサデータ122の少なくとも一部において、時系列(時間軸)上で連続する2つの時間区間の間に、時系列(時間軸)上で部分的に重複する重複区間が設けられるように、第1のラベル1231及び第2のラベル1232を含む複数のラベルを付与する。
具体的には、制御部11は、第1のラベル1231が付与される第1の時間区間と、時系列上で第1の時間区間よりも後ろに隣接し、第2のラベル1232が付与される第2の時間区間とを次のように設定する。すなわち、図10に例示されるとおり、制御部11は、各ラベルを付与する各時間区間をセンサデータ122に設定する際に、第1の時間区間の開始時刻を第2の時間区間の開始時刻よりも前に設定し、かつ第1の時間区間の終了時刻を第2の時間区間の終了時刻よりも前に設定する。一方、制御部11は、第1の時間区間の終了時刻を第2の時間区間の開始時刻よりも後に設定する。これにより、制御部11は、時系列(時間軸)上で連続する第1の時間区間及び第2の時間区間の間に、第2の時間区間の開始時刻から第1の時間区間の終了時刻までの間の時間区間として、時系列上で部分的に重複する重複区間を設定する。
各時間区間の開始時刻及び終了時刻を決定する方法は、実施の形態に応じて適宜選択されてよい。例えば、各時間区間の開始時刻及び終了時刻は、入力装置15を介して、オペレータ等のユーザにより指定されてもよい。また、例えば、各時間区間の開始時刻及び終了時刻は、センサデータ122を適宜解析することで決定されてもよいし、センサデータ122を得たセンサとは異なる他のセンサの出力に基づいて決定されてもよい。一例として、作業員が対象物を把持したことを示すラベルを付与する時間区間を設定する場面を想定する。この場面において、制御部11は、カメラ31から得られるセンサデータ122(画像データ)を画像解析することで、当該時間区間の開始時刻を決定してもよい。その他、制御部11は、対象物に取り付けられた圧力センサの出力に基づいて、当該時間区間の開始時刻を決定してもよい。
各時間区間の開始時刻及び終了時刻を先に決定した場合には、制御部11は、決定した第2の時間区間の開始時刻を重複区間の開始時刻に設定し、決定した第1の時間区間の終了時刻を重複区間の終了時刻に設定してもよい。一方、後述する設定方法等により、重複区間の範囲を先に決定した場合には、制御部11は、決定した重複区間の開始時刻を第2の時間区間の開始時刻に設定し、決定した重複区間の終了時刻を第1の時間区間の終了時刻に設定してもよい。
なお、「第1」及び「第2」の名称は、時系列上の相対的な位置関係を示すに過ぎない。図10の例において、第1のラベル1231が付与される第1の時間区間は、この第1の時間区間よりも時系列上で前にある時間区間との間の関係で、第2のラベルが付与される第2の時間区間として取り扱われてもよい。同様に、第2のラベル1232が付与される第2の時間区間は、この第2の時間区間よりも時系列上で後にある時間区間との間の関係で、第1のラベルが付与される第1の時間区間として取り扱われてもよい。
また、重複区間の時間幅は、実施の形態に応じて適宜決定されてよい。例えば、カメラ31、活動量センサ32等のセンサの出力がデジタル信号処理される場合、図10に例示されるように、サンプリング周期毎にセンサの出力をサンプルすることでセンサデータ122が得られる。この場合、制御部11は、センサのサンプリング周期に基づいて、センサの出力をそれぞれサンプルする複数のサンプル点を重複区間が含むように、重複区間の時間幅を設定してもよい。すなわち、制御部11は、サンプリング周期の2倍以上になるように重複区間の時間幅を設定してもよい。これにより、重複区間が実質的に一つの時点のみを含むように設定されるのを避けることができ、第1の時間区間と第2の時間区間との境界に確実に時間的な幅を持たせることができる。図10の例では、制御部11は、6つのサンプル点を含むように重複区間を設定している。
また、重複区間を設定する(すなわち、重複区間の範囲を決定する)方法は、実施の形態に応じて適宜選択されてよい。例えば、制御部11は、重複区間の開始時刻及び終了時刻の入力をオペレータから受け付けることで、重複区間の範囲を決定してもよい。本実施形態では、以下の3つの方法により、重複区間の範囲を決定することができる。
(A−1)第1の方法
まず、図11A〜図11Cを更に用いて、重複区間を設定するための第1の方法について説明する。図11A〜図11Cは、重複区間を設定する第1の方法の過程を模式的に例示する。第1の方法では、制御部11は、暫定的な境界時刻に基づいて、重複区間の範囲を決定する。
具体的には、図11Aに例示されるとおり、制御部11は、第1の時間区間の開始時刻と第2の時間区間の終了時刻との間に、第1の時間区間と第2の時間区間とを暫定的に区分する境界時刻を設定する。境界時刻を設定する方法は、実施の形態に応じて適宜選択されてよい。例えば、制御部11は、入力装置15を介して時刻の指定をユーザから受け付け、指定された時刻を境界時刻に設定してもよい。境界時刻の指定は、数値の入力により行われてもよいし、タイムライン上の位置の指定により行われてもよい。また、例えば、境界時刻は、上記開始時刻及び終了時刻と同様に、センサデータ122を適宜解析することで設定されてもよいし、センサデータ122を得たセンサとは異なる他のセンサの出力に基づいて設定されてもよい。
続いて、図11Bに例示されるとおり、制御部11は、設定された暫定的な境界時刻の前及び後の少なくとも一方の時刻を含むように、所定の時間幅を有する重複区間を設定する。これにより、制御部11は、重複区間の範囲を決定することができる。なお、図11Bの例では、制御部11は、境界時刻の前後両方の時刻を含むように重複区間を設定している。しかしながら、境界時刻に基づく重複区間の設定方法は、このような例に限定されなくてもよく、制御部11は、境界時刻の前後いずれか一方の時刻のみを含むように重複区間を設定してもよい。
重複区間の所定の時間幅は、実施の形態に応じて適宜決定されてよい。例えば、所定の時間幅は、固定値であってもよい。固定値は、アノテーションプログラム121内に予め与えられていてもよいし、オペレータ等のユーザの入力により与えられてもよい。この場合、制御部11は、センサデータ122において、暫定的な境界時刻を基準に、与えられた固定値の時間幅を有する重複区間を設定してもよい。これにより、ステップS102において重複区間を設定するのにかかる計算量を抑えることができる。
また、例えば、所定の時間幅は、第1のラベル1231及び第2のラベル1232の少なくとも一方の種類に基づいて決定されてよい。この場合、アノテーション装置1は、ラベルの種類と設定する時間幅の値との対応関係を示す対応情報を記憶部12に保持していてもよい。そして、制御部11は、対応情報を参照し、第1の時間区間に付与する第1のラベル1231及び第2の時間区間に付与する第2のラベル1232の少なくとも一方の種類に対応する値の時間幅を有する重複区間を、暫定的な境界時刻を基準に設定してもよい。これにより、付与するラベルの種類に基づいて、重複区間の時間幅を適切に設定することができるため、センサデータ122に所望の情報をより正確に付与することができる。
なお、ラベルの種類に応じた重複区間の時間幅の具体的な値は、実施の形態に応じて適宜決定されてよい。例えば、本実施形態において、工場の作業員の「視認」、「把持」、「運搬」及び「調整」の動作をカメラ31及び活動量センサ32により監視する場面を想定したとする。この場合、「視認」の状態から「把持」の状態に遷移するときの方が、「把持」の状態から「運搬」の状態に遷移するときに比べて、通常、当該状態の遷移にかかる時間は長いと想定される。そこで、上記対応情報において、「視認」及び「把持」に対応する時間幅の値が、「把持」及び「運搬」に対応する時間幅の値よりも大きくなるように設定されていてもよい。
最後に、図11Cに示されるとおり、制御部11は、重複区間の終了時刻を第1の時間区間の終了時刻に設定し、第1の時間区間の開始時刻と重複区間の終了時刻との間の範囲を第1の時間区間の範囲に設定する。また、制御部11は、重複区間の開始時刻を第2の時間区間の開始時刻に設定し、重複区間の開始時刻と第2の時間区間の終了時刻との間の範囲を第2の時間区間の範囲に設定する。これにより、制御部11は、互いの間に重複区間を有するように、第1の時間区間及び第2の時間区間を設定することができる。
なお、第1の時間区間の開始時刻及び第2の時間区間の終了時刻は、上記のとおり、適宜決定されてよい。また、図11A〜図11Cに示される第1の時間区間が、当該第1の時間区間よりも前の時間区間との関係で、第2の時間区間として取り扱われる場合、制御部11は、その前の時間区間との関係で設定された重複区間の開始時刻を、第1の時間区間の開始時刻に設定してもよい。同様に、図11A〜図11Cに示される第2の時間区間が、当該第2の時間区間よりも後の時間区間との関係で、第1の時間区間として取り扱われる場合、制御部11は、その後の時間区間との関係で設定された重複区間の終了時刻を、第2の時間区間の終了時刻に設定してもよい。以下の第2及び第3の方法でも同様である。
(A−2)第2の方法
次に、図12を更に用いて、重複区間を設定するための第2の方法について説明する。図12は、重複区間を設定する第2の方法の一例を模式的に例示する。第2の方法では、境界時刻についての複数の指定のゆらぎを利用して、重複区間の範囲を決定する。
具体的には、制御部11は、第1の時間区間と第2の時間区間とを暫定的に区分する境界時刻についての複数の指定を受け付ける。第1の方法と同様に、制御部11は、入力装置15を介して境界時刻の指定をユーザから受け付けてもよい。また、境界時刻の指定は、数値の入力により行われてもよいし、タイムライン上の位置の指定により行われてもよい。このとき、制御部11は、一人のユーザから境界時刻の複数の指定を受け付けてもよいし、一人のユーザからは一つの指定しか受け付けないようにしてもよい。境界時刻の複数の指定を受け付ける方法は、実施の形態に応じて適宜決定されてよい。
続いて、制御部11は、複数の指定により与えられた境界時刻の平均及びばらつきの少なくともいずれかを算出し、算出した平均及びばらつきの少なくともいずれかに基づいて重複区間を設定する。ばらつきは、分散、標準偏差等により与えられてよい。例えば、制御部11は、算出した境界時刻の平均の時刻を、重複区間の基準(例えば、中央の時刻等)に設定してもよい。また、制御部11は、算出した分散又は標準偏差のn倍の値(nは、任意の数字)を重複区間の時間幅に設定してもよい。これにより、複数の指定により与えられた境界時刻の平均及びばらつきに基づいて、重複区間の範囲を決定することができる。重複区間の範囲を決定した後、制御部11は、上記第1の方法と同様の方法により、第1の時間区間及び第2の時間区間それぞれの範囲を決定することができる。この第2の方法によれば、境界時刻についての複数の指定のゆらぎを利用して、重複区間を適切に設定することができるため、センサデータ122に所望の情報をより正確に付与することができる。
なお、平均及びばらつきのいずれか一方を利用しない場合、利用しない方の値で特定される重複区間の属性は、適宜決定されてよい。例えば、平均を利用しない場合、制御部11は、複数の指定により与えられた境界時刻のいずれか一つを重複区間の基準(例えば、中央の時刻、開始時刻、終了時刻等)に設定してもよい。また、例えば、ばらつきを利用しない場合、制御部11は、上記第1の方法と同様の方法で、重複区間の時間幅の値を決定してもよい。
(A−3)第3の方法
次に、図13を更に用いて、重複区間を設定するための第3の方法について説明する。図13は、重複区間を設定する第3の方法の一例を模式的に例示する。第3の方法では、重複区間の範囲の指定を直接受け付ける。
具体的には、制御部11は、第1の時間区間と第2の時間区間との重複する区間の指定を受け付ける。そして、制御部11は、指定された区間を重複区間に設定する。重複区間を設定した後、制御部11は、上記第1の方法と同様の方法により、第1の時間区間及び第2の時間区間それぞれの範囲を決定することができる。この第3の方法によれば、重複区間を簡易に設定することができるようになるため、ステップS102の処理にかかる計算量を抑えることができる。
なお、重複区間の指定を受け付ける方法は、実施の形態に応じて適宜決定されてよい。例えば、制御部11は、第1の時間区間及び第2の時間区間それぞれの範囲を表示するためのタイムラインを出力装置16(例えば、ディスプレイ)に出力し、第1の時間区間と第2の時間区間との重複する区間の指定を当該タイムライン上で受け付けてもよい。この場合、オペレータ等のユーザは、入力装置15を操作することで、タイムライン上で重複区間の範囲を指定することができる。
(B)ラベルの内容
次に、付与するラベルの内容について説明する。付与するラベルの内容は、実施の形態に応じて適宜決定されてよい。本実施形態では、制御部11は、各ラベルの付与される時間区間内におけるセンサデータ122に対する所定の推論の正解を示すように、各ラベルの内容を設定する。具体的には、センサデータ122は、工場の作業員の状態を監視するためのカメラ31及び活動量センサ32から得られる。そのため、制御部11は、対応する各時間区間内に表れる作業員の行動状態を示すように各ラベルの内容を設定してもよい。これにより、所定の推論を行う能力を学習器に習得させるための教師あり学習に利用可能なラベル付きセンサデータ124を生成することができる。所定の推論の一例として、カメラ及び活動量センサから得られるデータに基づいて作業員の行動状態を推定する能力が挙げられる。
なお、ラベルの内容を決定する方法は、実施の形態に応じて適宜選択されてよい。例えば、制御部11は、付与するラベルの候補の一覧を出力装置16(例えば、ディスプレイ)に出力し、各時間区間に付与するラベルの選択を受け付けてもよい。この場合、ユーザは、入力装置15を操作して、所望のラベルを一覧から選択することで、対象の時間区間に付与するラベルの内容を決定することができる。また、例えば、ラベルの内容は、センサデータ122の対応する時間区間の部分を適宜解析することで決定されてもよいし、センサデータ122を得たセンサとは異なる他のセンサの出力に基づいて決定されてもよい。例えば、制御部11は、センサデータからラベルの内容を決定する能力を機械学習により習得済みの識別器を利用して、センサデータ122に付与するラベルの内容を決定してもよい。
また、ラベルのデータ形式は、実施の形態に応じて適宜決定されてよい。ラベルの内容は、例えば、数値、テキスト、画像、及び音声の少なくともいずれかにより指定されてよい。具体例として、センサデータ122の各時間区間には、工場の作業員の「視認」、「把持」、「運搬」、「調整」等の行動状態を示すテキストがラベルとして付与されてもよい。また、その他の具体例として、センサデータ122の各時間区間には、工場の作業員の視野方向(角度)、手の位置、対象物の位置等を示す数値がラベルとして付与されてもよい。
また、重複区間には、第1のラベル1231及び第2のラベル1232とは異なるラベルを付与してもよい。例えば、重複区間には、第1のラベル1231により示される状態から第2のラベル1232により示される状態に遷移していることを示すラベルが付与されてもよい。また、例えば、ラベルの内容が数値により指定される場合には、重複区間には、第1のラベル1231の値から第2のラベル1232の値に遷移するような1又は複数の値がラベルとして付与されてもよい。
図14は、重複区間に設定するラベルの内容の一例を模式的に例示する。この場合、制御部11は、第1の時間区間の開始時刻から第2の時間区間の開始時刻までの区間に、第1のラベル1231として第1の値を付与する。また、制御部11は、第1の時間区間の終了時刻から第2の時間区間の終了時刻までの区間に、第2のラベル1232として第2の値を付与する。そして、制御部11は、第1の時間区間の終了時刻から第2の時間区間の開始時刻までの重複区間に、第1の値から第2の値に遷移するように1又は複数の値をラベルとして付与する。
重複区間に付与されるラベルの値は、第1の値から第2の値までの間の値である。図14で例示されるように、第1の値が第2の値よりも小さく、重複区間に複数の値をラベルとして付与する場合には、制御部11は、重複区間の開始時刻から終了時刻にかけて単調増加するように、重複区間に付与する複数の値を選択してよい。一方、第1の値が第2の値よりも大きく、重複区間に複数の値をラベルとして付与する場合には、制御部11は、重複区間の開始時刻から終了時刻にかけて単調減少するように、重複区間に付与する複数の値を選択してもよい。
(C)その他
以上により、制御部11は、互いに部分的に重複する第1の時間区間及び第2の時間区間を含む複数の時間区間をセンサデータ122に設定し、設定した各時間区間に各ラベルを付与することができる。センサデータ122に複数のラベルを付与すると、制御部11は、次のステップS104に処理を進める。
図15は、上記の処理により、工場の作業員の行動状態を示すラベルをセンサデータ122に付与した例を模式的に例示する。図15で例示されるセンサデータ122には、4つの時間区間T1〜T4が設定されており、設定された各時間区間T1〜T4には、「視認」、「把持」、「運搬」及び「調整」を示すラベル(テキスト)L1〜L4がそれぞれ付与されている。「視認」は、作業員が対象物を視覚で確認している状態を示す。「把持」は、作業員が対象物を手で持っている状態を示す。「運搬」は、作業員が対象物を手で運んでいる状態を示す。「調整」は、作業員が対象物の位置を調節している等のその他の行動を行っている状態を示す。
図15の例において、「視認」ラベルL1の付与された時間区間T1と「把持」ラベルL2の付与された時間区間T2との間の関係では、時間区間T1が第1の時間区間に相当し、時間区間T2が上記第2の時間区間に相当する。「視認」ラベルL1が第1のラベル1231に相当し、「把持」ラベルL2が第2のラベル1232に相当する。同様に、「把持」ラベルL2の付与された時間区間T2と「運搬」ラベルL3の付与された時間区間T3との間の関係では、時間区間T2が第1の時間区間に相当し、時間区間T3が上記第2の時間区間に相当する。「把持」ラベルL2が第1のラベル1231に相当し、「運搬」ラベルL3が第2のラベル1232に相当する。また、「運搬」ラベルL3の付与された時間区間T3と「調整」ラベルL4の付与された時間区間T4との間の関係では、時間区間T3が第1の時間区間に相当し、時間区間T4が上記第2の時間区間に相当する。「運搬」ラベルL3が第1のラベル1231に相当し、「調整」ラベルL4が第2のラベル1232に相当する。
また、図15の例では、時系列(時間軸)上で連続する2つの時間区間(T1、T2)、(T2、T3)、及び(T3、T4)それぞれの間に設定される重複区間の時間幅は、各時間区間に付与されるラベルの種類に応じて決定されている。具体的には、「視認」の状態から「把持」の状態に遷移するときの方が、「把持」の状態から「運搬」の状態に遷移するときに比べて、通常、当該状態の遷移にかかる時間は長いと想定される。そこで、図15の例では、時間区間(T1、T2)の間の重複区間の時間幅は、時間区間(T2、T3)の間の重複区間よりも長くなるように設定されている。また、「運搬」の状態から「調整」の状態に遷移するときの方が、「把持」の状態から「運搬」の状態に遷移するときに比べて、通常、当該状態の遷移にかかる時間は長いと想定される。そこで、図15の例では、時間区間(T3、T4)の間の重複区間の時間幅は、時間区間(T2、T3)の間の重複区間よりも長くなるように設定されている。このように、時系列上で複数の重複区間が設けられているとき、各重複区間の時間幅は、各重複区間を構成する少なくとも2つの時間区間に付与された少なくとも2つのラベルの種類に応じて異なるように決定されてよい。
なお、図15の例では、センサデータ122の複数の隣接する時間区間それぞれの間に重複区間が設けられている。しかしながら、重複区間の設定される部分は、このような例に限られなくてもよい。重複区間は、センサデータ122に設定する複数の隣接する時間区間のうちの少なくとも一部に設けられればよい。すなわち、センサデータ122には、隣接する時間区間の間に重複区間の設けられていない部分が存在してもよい。重複区間の設けられていない部分では、隣接する時間区間は、従来と同様に、境界時刻によって区切られてよい。
(ステップS104)
ステップS104では、制御部11は、ラベル付与部112として動作し、上記ステップS102及びS103によりラベル付けを行った結果をラベルデータ123として記憶部12に保存する。これにより、制御部11は、本動作例に係るアノテーション処理、換言すると、ラベル付きセンサデータ124の生成処理を終了する。
なお、制御部11は、上記ステップS104の処理が完了した後に、任意のタイミングで、NAS(Network Attached Storage)、学習装置2等の他の情報処理装置にネットワークを介して、生成したラベル付きセンサデータ124を転送してもよい。また、制御部11は、ドライブ17を介して記憶媒体に、生成したラベル付きセンサデータ124を転送してもよい。そして、転送が完了した後、制御部11は、生成したラベル付きセンサデータ124を記憶部12から削除してもよい。
[学習処理]
次に、図16を用いて、学習装置2の動作例を説明する。図16は、学習装置2の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
(ステップS201)
ステップS201では、制御部21は、学習データ取得部211として動作し、ニューラルネットワーク5の教師あり学習に利用する学習用データセット125を取得する。学習用データセット125は、センサデータ1251及びラベル1252の対で構成され、ラベル付きセンサデータ124から生成される。
学習用データセット125は、適宜取得されてよい。例えば、制御部21は、ネットワークを介して、アノテーション装置1、NAS等から、又はドライブ26を介して記憶媒体からラベル付きセンサデータ124を取得してもよい。そして、制御部21は、ラベルを付与した時間区間単位でラベル付きセンサデータ124を抽出することで、学習用データセット125を生成してもよい。これにより、制御部21は、学習用データセット125を取得することができる。
また、例えば、学習用データセット125の生成は、学習装置2以外の他の情報処理装置により行われてもよい。この場合、制御部21は、ネットワーク、記憶媒体等を介して、他の情報処理装置により生成された学習用データセット125を取得することができる。取得する学習用データセット125の件数は、ニューラルネットワーク5の教師あり学習を実施可能な程度に適宜決定されてよい。学習用データセット125を取得すると、制御部21は、次のステップS202に処理を進める。
なお、ラベル付きセンサデータ124から学習用データセット125を生成する際に、重複区間の取り扱いは、実施の形態に応じて適宜決定されてよい。例えば、重複区間の部分は破棄されてもよい。すなわち、ラベル付きセンサデータ124において、第1の時間区間の開始時刻から第2の時間区間の開始時刻までの区間と第1の時間区間の終了時刻から第2の時間区間の終了時刻までの区間とを抽出することで、それぞれの区間に対応する学習用データセット125が生成されてもよい。
また、例えば、重複区間の部分は、第1の時間区間及び第2の時間区間の両部分に組み込まれてもよい。すなわち、ラベル付きセンサデータ124において、第1の時間区間の開始時刻から終了時刻までの区間と第2の時間区間の開始時刻から終了時刻までの区間とを抽出することで、それぞれの区間に対応する学習用データセット125が生成されてもよい。
また、例えば、重複区間に、第1のラベル1231及び第2のラベル1232とは異なるラベルが付与されている場合、ラベル付きセンサデータ124において、第2の時間区間の開始時刻から第1の時間区間の終了時刻までの重複区間を抽出することで、重複区間に対応する学習用データセット125が生成されてもよい。この場合、ラベル付きセンサデータ124において、第1の時間区間の開始時刻から第2の時間区間の開始時刻までの区間と第1の時間区間の終了時刻から第2の時間区間の終了時刻までの区間とを抽出することで、それぞれの区間に対応する学習用データセット125が生成されてもよい。
(ステップS202)
ステップS202では、制御部21は、学習処理部212として動作し、取得した学習用データセット125を利用して、センサデータ1251を入力すると、ラベル1252に対応する出力値を出力するように、ニューラルネットワーク5の教師あり学習を実施する。
具体的には、まず、制御部21は、学習処理を行う対象となるニューラルネットワーク5を用意する。用意するニューラルネットワーク5の構成、各ニューロン間の結合の重みの初期値、及び各ニューロンの閾値の初期値は、テンプレートにより与えられてもよいし、オペレータの入力により与えられてもよい。また、再学習を行う場合には、制御部21は、再学習を行う対象となる学習結果データ222に基づいて、ニューラルネットワーク5を用意してもよい。
次に、制御部21は、ステップS201で取得した学習用データセット125のセンサデータ1251を入力データ(訓練データ)として利用し、ラベル1252を教師データ(正解データ)として利用して、ニューラルネットワーク5の学習処理を実施する。このニューラルネットワーク5の学習処理には、確率的勾配降下法等の公知の学習方法が用いられてもよい。
例えば、制御部21は、ニューラルネットワーク5の入力層51にセンサデータ1251を入力する。そして、制御部21は、入力側から順に、各層51〜53に含まれる各ニューロンの発火判定を行う。これにより、制御部21は、ニューラルネットワーク5の出力層53から出力値を得る。次に、制御部21は、出力層53から得た出力値とラベル1252に対応する値との誤差を算出する。続いて、制御部21は、誤差逆伝搬(Back propagation)法により、算出した出力値の誤差を用いて、各ニューロン間の結合の重み及び各ニューロンの閾値それぞれの誤差を算出する。そして、制御部21は、算出した各誤差に基づいて、各ニューロン間の結合の重み及び各ニューロンの閾値それぞれの値の更新を行う。
制御部21は、各件の学習用データセット125について、ニューラルネットワーク5から出力される出力値がラベル1252に対応する値と一致するまで、この一連の処理を繰り返す。これにより、制御部21は、センサデータ1251を入力するとラベル1252に対応する出力値を出力する学習済みのニューラルネットワーク5を構築することができる。
この教師あり学習により、ニューラルネットワーク5には、所定の推論を行う能力を習得させることができる。本実施形態では、上記アノテーション処理において、各ラベルの内容は、対応する各時間区間内に表れる作業員の行動状態を示すように設定される。そのため、本ステップS202の処理により、カメラ及び活動量センサから得られるデータに基づいて作業員の行動状態の種別を推定する能力を習得した学習済みのニューラルネットワーク5を構築することができる。ニューラルネットワーク5の学習処理が完了すると、制御部21は、次のステップS203に処理を進める。
(ステップS203)
ステップS203では、制御部21は、学習処理部212として動作し、構築したニューラルネットワーク5の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報を学習結果データ222として記憶部22に保存する。学習結果データ222の保存が完了すると、制御部21は、次のステップS204に処理を進める。
(ステップS204)
ステップS204では、制御部21は、性能評価部213として動作し、評価用データセット223を取得する。そして、制御部21は、取得した評価用データセット223を利用して、構築した学習済みのニューラルネットワーク5の性能を評価する。
評価用データセット223は、学習用データセット125と同様に、センサデータ2231及びラベル2232の対で構成される。この評価用データセット223は、実施の形態に応じて適宜生成されてよい。例えば、ラベル付きセンサデータ124のうち、上記学習用データセット125として利用した部分以外の他の部分から生成されてよい。この場合、評価用データセット223は、上記学習用データセット125と同様の方法で生成することができる。
また、例えば、カメラ及び活動量センサを用意し、用意したカメラ及び活動量センサにより、工場の作業員を様々な条件で観察する。そして、得られたセンサデータに、作業員の行動状態を示すラベルを付与することで、評価用データセット223を生成することができる。このとき、センサデータは、上記ステップS101と同様の方法により得ることができる。また、センサデータに設定する各時間区間の範囲は、上記ステップS102と同様の方法により決定することができる。更に、センサデータに付与するラベルの内容は、上記ステップS103と同様の方法により決定することができる。
なお、上記のような評価用データセット223の生成は、学習装置2により行われてもよいし、学習装置2以外の他の情報処理装置により行われてもよい。例えば、制御部21は、オペレータ等による入力装置24の操作に従って、評価用データセット223を手動的に生成してもよいし、プログラムの処理に従って、評価用データセット223を自動的に生成してもよい。これにより、制御部21は、評価用データセット223を取得することができる。また、他の情報処理装置が評価用データセット223を生成する場合、制御部21は、ネットワーク、記憶媒体等を介して、他の情報処理装置により生成された評価用データセット223を取得することができる。なお、取得する評価用データセット223の件数は、ニューラルネットワーク5の性能を評価可能な程度に適宜決定されてよい。
次に、制御部21は、ステップS202により構築した学習済みのニューラルネットワーク5の入力層51に、取得した評価用データセット223のセンサデータ2231を入力する。そして、制御部21は、学習済みのニューラルネットワーク5の演算処理、換言すると、入力側から順に、各層51〜53に含まれる各ニューロンの発火判定を行う。これにより、制御部21は、学習済みのニューラルネットワーク5の出力層53から出力値を得る。この出力値は、学習済みのニューラルネットワーク5によりセンサデータ2231に対して所定の推論を行った結果を示す。本実施形態では、この出力値は、センサデータ2231に表れる作業員の行動状態を推定した結果を示し得る。
そこで、制御部21は、得られた出力値と入力したセンサデータ2231に関連付けられた、すなわち、入力したセンサデータ2231と対のラベル2232とを比較する。そして、制御部21は、当該比較の結果に基づいて、学習済みのニューラルネットワーク5によるセンサデータ2231に対する所定の推論が正しいか否かを判定する。
出力値とラベル2232の値とが一致している場合、制御部21は、学習済みのニューラルネットワーク5によるセンサデータ2231に対する所定の推論が正しいと判定する。一方、出力値とラベル2232の値とが一致していない場合、制御部21は、学習済みのニューラルネットワーク5によるセンサデータ2231に対する所定の推論が正しくないと判定する。
取得した全ての評価用データセット223に対してこの一連の処理を実行することで、制御部21は、学習済みのニューラルネットワーク5によりセンサデータ2231に対して所定の推論を行った際の正答率を評価結果として算出することができる。所定の推論を行う能力を有するように構築された学習済みのニューラルネットワーク5に対する評価結果を得た後、制御部21は、次のステップS205に処理を進める。
(ステップS205)
ステップS205では、制御部21は、性能評価部213として動作し、ステップS204により得られた評価結果の情報を評価結果データ224として記憶部22に保存する。これにより、制御部21は、本動作例に係る処理手順を終了する。
なお、制御部21は、任意のタイミングで、上記処理手順で生成した学習結果データ222及び評価結果データ224を他の情報処理装置に送信してもよい。例えば、制御部21は、ネットワーク、記憶媒体等を介して、生成した学習結果データ222を、工場の作業員の行動状態を推定するための他の情報処理装置に送信してもよい。この他の情報処理装置では、学習装置2から取得した学習結果データ222により、カメラ及び活動量センサから得られるデータに基づいて作業員の行動状態を推定する能力を習得した学習済みのニューラルネットワーク5が利用可能となる。また、例えば、制御部21は、ネットワーク、記憶媒体等を介して、生成した評価結果データ224を、アノテーション装置1、NAS等に送信してもよい。アノテーション装置1は、評価結果データ224を、以下の重複区間の修正処理に利用することができる。
[重複区間の修正]
次に、図17を用いて、アノテーション装置1による重複区間の修正処理について説明する。図17は、アノテーション装置1による重複区間の修正に関する処理手順の一例を例示するフローチャートである。なお、上記アノテーション処理を含め、以下で説明する処理手順は、本発明の「アノテーション方法」の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
(ステップS301)
ステップS301では、制御部11は、区間修正部113として動作し、評価結果データ224を取得する。評価結果データ224は、ラベル付きセンサデータ124を利用して教師あり学習を実施することで、所定の推論を行う能力を有するように構築された学習済みのニューラルネットワーク5に対する評価結果を示す。評価結果データ224を取得する方法は、実施の形態に応じて適宜選択されてよい。例えば、制御部11は、ネットワーク、記憶媒体等を介して、学習装置2、NAS等から評価結果データ224を取得してもよい。評価結果データ224を取得すると、制御部11は、次のステップS302に処理を進める。
(ステップS302)
ステップS302では、制御部11は、区間修正部113として動作し、取得した評価結果データ224により示される評価結果に基づいて、上記ステップS102で設定した重複区間の時間幅を変更する。
本実施形態では、評価結果データ224により示される評価結果は、学習済みのニューラルネットワーク5によりセンサデータ2231に対して所定の推論を行った際の正答率により表現され得る。そこで、制御部11は、評価結果データ224により示される正答率が所定の閾値以下である場合に、重複区間の時間幅を狭める又は拡げることで、重複区間の時間幅を変更してもよい。なお、評価結果に基づいて重複区間の時間幅を変更する方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。
(ステップS303)
ステップS303では、制御部11は、区間修正部113として動作し、ステップS302により重複区間の時間幅を変更した場合に、当該変更内容をラベルデータ123に反映する。これにより、制御部11は、本動作例に係る重複区間の修正処理を終了する。
なお、制御部11は、ネットワーク、記憶媒体等を介して、重複区間の時間幅を変更した後のラベル付きセンサデータ124を学習装置2に送信してもよい。学習装置2は、重複区間の時間幅を変更した後のラベル付きセンサデータ124から生成される学習用データセット125を利用して、ニューラルネットワーク5の教師あり学習を再度実施してもよい。更に、学習装置2は、再度構築したニューラルネットワーク5に対する評価を行い、評価結果データ224を再度生成してもよい。そして、制御部11は、再度生成された評価結果データ224を取得し、重複区間の時間幅の変更処理を再度実行してもよい。このように、学習装置2によるニューラルネットワーク5の学習処理及び評価処理とアノテーション装置1による重複区間の修正処理とは交互に繰り返し実行されてもよい。
この繰り返し処理を実行する過程で、制御部11は、上記ステップS302において、重複区間の時間幅を狭めるか拡げるかを適宜決定してよい。例えば、ステップS302の処理を最初に実行する場合、制御部11は、重複区間の時間幅を狭めるか拡げるかのいずれを選択してもよい。また、2度目以降の処理では、制御部11は、その前に実行した重複区間の時間幅の変更とその変更後の一連の処理により得られた評価結果とに基づいて、重複区間の時間幅を狭めるか拡げるかを適宜決定してもよい。例えば、その前に実行したステップS302の処理で重複区間の時間幅を狭めた結果、その変更後の一連の処理により得られた評価結果が悪化した(例えば、正答率が低下した)とする。この場合、制御部11は、重複区間の時間幅を拡げることで、重複区間の時間幅を変更してもよい。一方、評価結果が好転した(例えば、正答率が向上した)場合には、制御部11は、重複区間の時間幅を更に狭めることで、重複区間の時間幅を変更してもよい。
[識別処理]
次に、図18を用いて、識別装置4により作業員の行動状態を推定する処理について説明する。図18は、本実施形態に係る識別装置4の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
(ステップS401)
ステップS401では、制御部41は、対象データ取得部411として動作し、作業員の行動状態を推定する対象となる対象センサデータ422を取得する。対象センサデータ422を取得すると、次のステップS402に処理を進める。
本実施形態では、カメラ31及び活動量センサ32が、作業員の行動状態を監視するセンサとして識別装置4に接続されている。そのため、制御部41は、カメラ31及び活動量センサ32から対象センサデータ422を直接取得してもよい。また、制御部41は、センサから直接ではなく、他の情報処理装置、記憶媒体等を経由して間接的に対象センサデータ422を取得してもよい。対象センサデータ422を取得する過程は、実施の形態に応じて適宜決定されてよい。
(ステップS402)
ステップS402では、制御部41は、状態推定部412として動作し、学習結果データ222を参照して、作業員の行動状態の推定に利用する学習済みのニューラルネットワーク5の設定を行う。次に、制御部41は、学習済みのニューラルネットワーク5に対象センサデータ422を入力し、学習済みのニューラルネットワーク5の演算処理を実行する。これにより、制御部41は、対象センサデータ422に表れる作業員の行動状態を推定した結果に対応する出力値を学習済みのニューラルネットワーク5から取得する。
具体的には、制御部41は、学習済みのニューラルネットワーク5の入力層51に対象センサデータ422を入力し、入力側から順に、各層に含まれる各ニューロンの発火判定を行う。これにより、制御部41は、対象センサデータ422に対して作業員の行動状態を推定した結果に対応する出力値を学習済みのニューラルネットワーク5の出力層53から取得する。
なお、上記学習装置2では、学習済みのニューラルネットワーク5の出力値がそのまま作業員の行動状態を示すように学習処理が行われてもよい。この場合、制御部41は、学習済みのニューラルネットワーク5から出力値を得ることで、作業員の行動状態を特定することができる。また、識別装置4は、学習済みのニューラルネットワーク5の出力値と作業員の行動状態とを対応付けたテーブル形式等の参照情報(不図示)を記憶部42に保持していてもよい。この場合、制御部41は、この参照情報を参照することで、学習済みのニューラルネットワーク5から得た出力値に対応する作業員の行動状態を特定することができる。これにより、作業員の行動状態を推定すると、制御部41は、次のステップS403に処理を進める。
(ステップS403)
ステップS403では、制御部41は、出力部413として動作し、ステップS402により作業員の行動状態を推定した結果を出力する。これにより、制御部41は、本動作例に係る処理手順を終了する。
なお、出力方法及び出力内容は、実施の形態に応じて適宜決定されてよい。例えば、制御部41は、作業員の理想的な行動状態を示す行動情報(不図示)を記憶部42に保持してもよい。この場合、制御部41は、ステップS402により推定した結果と行動情報により示される理想的な行動状態とを照合することで、識別装置4に接続されるカメラ31及び活動量センサ32により監視している作業員の行動状態が理想的であるか否かを判定してもよい。そして、ステップS402により推定した結果が行動情報に示される理想的な行動状態と一致しない、すなわち、作業員の行動状態が理想的ではない場合、制御部41は、出力装置46等を介して、行動状態を修正する指示を出力してもよい。一方で、ステップS402により推定した結果が行動情報に示される理想的な行動状態と一致する、すなわち、作業員の行動状態が理想的である場合には、制御部41は、作業員自身、作業員を監督する監督者等にそのことを知らせるための出力を行ってもよいし、本ステップS403による出力処理を省略してもよい。
また、例えば、識別装置4は、複数の作業員の行動状態を推定してもよい。この場合、識別装置4は、ステップS402で推定した各作業員の行動状態と行動情報により示される理想的な行動状態との差分が閾値より大きい時間区間が存在するか否かを判定してもよい。そして、各作業員の行動状態と理想的な行動状態との差分が閾値より大きい時間区間が存在する場合には、制御部41は、出力装置46等を介して、その時間区間の工程を改善する指示を出力してもよい。このとき、制御部41は、その時間区間内において最も多かった行動状態を正解行動に設定し、設定した正解行動を行うように指示を出力してもよい。また、制御部41は、作業工程の中でその時間区間が存在している位置を出力してもよい。一方で、そのような時間区間が存在しない場合には、制御部41は、本ステップS403による出力処理を省略してもよい。
[特徴]
以上のように、本実施形態に係るアノテーション装置1は、上記ステップS102により、第1のラベル1231が付与される第1の時間区間と第2のラベル1232が付与される第2の時間区間との間に、時系列上で部分的に重複する重複区間を設ける。これにより、第1の時間区間と第2の時間区間との境界に時間的な幅を持たせ、第1のラベル1231により示される状態から第2のラベル1232により示される状態に遷移したタイミングを一点に決定するのを避けることができる。すなわち、第1のラベル1231により示される状態から第2のラベル1232により示される状態への遷移が重複区間内のいずれかの時刻に生じたものとしたり、重複区間により当該遷移の生じている区間を表したりすることができるようになる。
したがって、本実施形態によれば、第1の時間区間と第2の時間区間との間に設定した重複区間により、第1のラベル1231により示される状態から第2のラベル1232により示される状態への遷移が生じている区間を適切に表すことができる。そのため、時間区間の境界を一点に決定する従来の方法に比べて、センサデータ122に所望の情報をより正確に付与することができる。また、得られたラベル付きセンサデータ124から生成される学習用データセット125を利用する学習装置2では、上記ステップS201〜S203の処理により、カメラ及び活動量センサから得られるデータに基づいて作業員の行動状態の種別を推定する能力のより高い学習済みの学習器を構築することができる。
また、本実施形態では、学習装置2によるニューラルネットワーク5の学習処理及び評価処理とアノテーション装置1による重複区間の修正処理とを交互に繰り返し実行することができる。この繰り返し処理を実行する過程で、上記ステップS302の処理により、学習済みのニューラルネットワーク5に対する評価結果が好転するように、重複区間の時間幅を調整することができる。そのため、本実施形態によれば、所定の推論を行う能力を一定の水準以上で有する学習済みのニューラルネットワーク5を構築可能なラベル付きセンサデータ124を生成することができる。これにより、学習済みのニューラルネットワーク5を利用する識別装置4では、一定の水準以上の性能で所定の推論を実施することができる。上記実施形態では、識別装置4は、ステップS402における作業員の行動状態を精度よく推定することができる。
§4 変形例
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。
<4.1>
上記実施形態では、識別システム100は、アノテーション装置1、学習装置2、及び識別装置4の3つの装置により構成されている。しかしながら、識別システム100の構成は、このような例に限定されなくてもよい。例えば、アノテーション装置1、学習装置2、及び識別装置4は、一体のコンピュータで構成されてもよい。また、例えば、アノテーション装置1、学習装置2、及び識別装置4から選択された2つの装置が、一体のコンピュータで構成されてもよい。
<4.2>
上記実施形態では、アノテーション装置1は、工場の作業員の状態を監視するカメラ31及び活動量センサ32から得られるセンサデータ122にラベル付け(アノテーション)を行っている。しかしながら、上記アノテーション装置1の適用可能な場面は、このような例に限られなくてもよい。
また、上記実施形態では、各ラベルの内容は、当該各ラベルの付与される時間区間内におけるセンサデータ122に対する所定の推論の正解を示すように設定される。しかしながら、各ラベルの内容は、このような例に限られなくてもよく、アノテーション装置1の適用場面に応じて適宜決定されてよい。
更に、上記実施形態では、センサデータ122は、作業員の行動状態を監視するセンサから取得されている。しかしながら、センサデータを取得する対象は、作業員に限られなくてもよく、例えば、作業員以外の人物であってもよいし、人物以外の対象物(例えば、ロボット等の機械)であってもよい。加えて、センサデータを取得する対象の数は、一つに限られなくてもよく、二つ以上(例えば、対象の人物及び機械)であってもよい。
図19は、本発明が適用される他の場面の一例を模式的に例示する。図19は、運転手Dの行動状態を推定する場面を例示している。図19に示される識別システム100Aは、上記実施形態に係るセンサデータ122を、運転手Dを監視するセンサから得られるセンサデータに置き換える点を除き、上記識別システム100と同様に構成されてよい。また、識別装置4Aは、対象の車両に設置される点を除き、上記識別装置4と同様に構成されてよい。学習済みのニューラルネットワークは、例えば、入力された対象センサデータに応じて、運転手Dの状態を推定した結果に対応する出力値を出力するように構成される。この識別システム100Aによれば、車両に乗車した運転手Dの状態を監視することができる。
なお、識別装置4Aは、上記ステップS402において、運転手Dの状態を推定する。これにより、識別装置4Aは、上記ステップS403において、運転手Dの状態に応じた車両の制御を行ってもよい。例えば、運転手Dが車両を手動で運転している際に、運転手Dが運転に適していない状態にあると推定した場合には、識別装置4Aは、運転を止めるように警告を出力してもよい。また、車両が、運転手Dの運転操作に依らない自動運転モードを実施可能である場合には、運転手Dが運転に適していない状態にあると推定したときに、識別装置4Aは、手動運転モードから自動運転モードに車両の動作モードを切り替えたり、自動運転モードから手動運転モードへの切り替えを禁止したりしてもよい。
また、図19の例では、運転手Dを監視するセンサの一例として、カメラ31が車内に設置されている。しかしながら、運転手Dを監視するセンサは、このようなカメラに限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、運転手Dを監視するセンサとして、上記活動量センサ32の他、脳波センサ、脈拍センサ等の生体センサが用いられてもよい。
また、上記実施形態及び図19の例では、工場の作業員、自動車の運転手等の人物の行動状態を推定する場面に本発明が適用されている。しかしながら、本発明が適用される場面は、このような人物の行動状態を推定する場面に限られなくてもよい。本発明は、センサデータに対して所定の推論を実施するあらゆる場面に適用可能である。
この場合、センサデータ122及びラベルデータ123の内容を適宜変更することで、上記実施形態に係るアノテーション装置1及び学習装置2をそのまま利用することができる。すなわち、アノテーション装置1は、上記ステップS103において、各ラベルの付与される時間区間内におけるセンサデータに対する所定の推論の正解を示すように当該各ラベルの内容を設定する。また、学習装置2は、上記ステップS202において、センサデータ及び複数のラベルを利用して教師あり学習を実施することで、センサデータに含まれる特徴を識別する等の所定の推論を行う能力を獲得した学習済みの学習器を構築する。更に、識別装置4は、学習装置2により構築された学習済みの学習器を利用して、所定の推論を実施する。
図20は、本変形例に係る識別装置4Bのソフトウェア構成の一例を模式的に例示する。識別装置4Bのハードウェア構成及び処理手順は、上記実施形態に係る識別装置4のハードウェア構成及び処理手順と同様であってよい。すなわち、識別装置4Bの制御部41は、上記ステップS401において、対象データ取得部411Bとして動作し、所定の推論を行う対象となる対象センサデータ422Bを取得する。次に、制御部41は、上記ステップS402において、学習結果データ222Bを参照して、学習済みのニューラルネットワーク5Bを設定する。学習結果データ222Bは、上記所定の推論を行う能力を学習器に習得させるための教師あり学習を学習装置2が実施することで生成される。制御部41は、対象センサデータ422Bを学習済みのニューラルネットワーク5Bに入力し、学習済みのニューラルネットワーク5Bの演算処理を実施することで、対象センサデータ422Bに対して所定の推論を行った結果に対応する出力値を当該学習済みのニューラルネットワーク5Bから得る。これにより、制御部41は、対象センサデータ422Bに対して所定の推論を実施する。そして、制御部41は、上記ステップS403において、出力部413として動作し、所定の推論を実施した結果を出力する。なお、実施する推論の種類は、実施の形態に応じて適宜決定されてよい。例えば、センサデータが音声データである場合には、所定の推論は、音声認識であってもよい。
<4.3>
上記実施形態では、アノテーション装置1は、センサデータ122について、カメラ31から得られる画像データを、活動量センサ32から得られる数値データと同様に取り扱っている。しかしながら、複数種類のデータをセンサデータ122として取得する場合、各種データ間で取り扱いが相違していてもよい。例えば、上記ステップS102及びS103において、制御部11は、カメラ31から得られる画像データと活動量センサ32から得られる数値データとで、異なるラベル付けを行ってもよい。
<4.4>
上記実施形態では、評価結果データ224により示される評価結果は、学習済みのニューラルネットワーク5によりセンサデータ2231に対して所定の推論を行った際の正答率により表現され得る。しかしながら、評価結果の表現方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。
また、上記実施形態では、評価結果データ224は、学習装置2により生成されている。しかしながら、この評価結果データ224は、学習装置2以外の他の情報処理装置により生成されてよい。すなわち、ニューラルネットワーク5の学習処理(ステップS201〜S203)と評価処理(ステップS204及びS205)とはそれぞれ異なるコンピュータにより実行されてよい。
<4.5>
上記実施形態では、学習器の一例として、ニューラルネットワーク(ニューラルネットワーク5)を利用している。しかしながら、上記実施形態に利用可能な学習器の種類は、ニューラルネットワークに限られなくてよい。例えば、上記実施形態では、線形回帰モデル、サポートベクタマシン等を学習器として用いてもよい。
1…アノテーション装置、
11…制御部、12…記憶部、13…通信インタフェース、
14…外部インタフェース、15…入力装置、
16…出力装置、17…ドライブ、
111…データ取得部、112…ラベル付与部、
113…区間修正部、
121…アノテーションプログラム、
122…センサデータ、123…ラベルデータ、
1231…第1のラベル、1232…第2のラベル、
124…ラベル付きセンサデータ、
125…学習用データセット、
1251…センサデータ、1252…ラベル、
2…学習装置、
21…制御部、22…記憶部、23…通信インタフェース、
24…入力装置、25…出力装置、26…ドライブ、
211…学習データ取得部、212…学習処理部、
213…性能評価部、
221…学習プログラム、222…学習結果データ、
223…評価用データセット、224…評価結果データ、
31…カメラ、32…活動量センサ、
4…識別装置、
41…制御装置、42…記憶部、43…通信インタフェース、
44…外部インタフェース、45…入力装置、
46…出力装置、47…ドライブ、
411…対象データ取得部、412…状態推定部、413…出力部、
421…識別プログラム、
5…ニューラルネットワーク(学習器)、
51…入力層、52…中間層(隠れ層)、53…出力層、
91…記憶媒体、92…記憶媒体

Claims (16)

  1. コンピュータが、
    センサの出力を時系列に配列したセンサデータを取得するステップと、
    取得したセンサデータに複数のラベルを付与するステップと、
    を実行するアノテーション方法であって、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記コンピュータは、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻を設定し、
    設定された前記境界時刻の前及び後の少なくとも一方の時刻を含むように、所定の時間幅を有する前記重複区間を設定する、
    アノテーション方法。
  2. 前記所定の時間幅は、前記第1のラベル及び前記第2のラベルの少なくとも一方の種類に基づいて決定される、
    請求項1に記載のアノテーション方法。
  3. 前記所定の時間幅は、固定値である、
    請求項1に記載のアノテーション方法。
  4. 前記コンピュータは、時刻の指定をユーザから受け付け、指定された前記時刻を前記境界時刻に設定する、
    請求項1から3のいずれか1項に記載のアノテーション方法。
  5. コンピュータが、
    センサの出力を時系列に配列したセンサデータを取得するステップと、
    取得したセンサデータに複数のラベルを付与するステップと、
    を実行するアノテーション方法であって、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記コンピュータは、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻についての複数の指定を受け付け、
    前記複数の指定により与えられた境界時刻の平均及びばらつきの少なくともいずれかに基づいて前記重複区間を設定する、
    アノテーション方法。
  6. 前記コンピュータは、前記センサのサンプリング周期に基づいて、前記センサの前記出力をそれぞれサンプルする複数のサンプル点を前記重複区間が含むように、前記重複区間の時間幅を設定する、
    請求項1からのいずれか1項に記載のアノテーション方法。
  7. 前記コンピュータは、
    前記第1の時間区間の前記開始時刻から前記第2の時間区間の前記開始時刻までの区間に、前記第1のラベルとして第1の値を付与し、
    前記第1の時間区間の前記終了時刻から前記第2の時間区間の前記終了時刻までの区間に、前記第2のラベルとして第2の値を付与し、
    前記第1の時間区間の前記終了時刻から前記第2の時間区間の前記開始時刻までの区間に、前記第1の値から前記第2の値に遷移するように1又は複数の値を前記重複区間のラベルとして付与する、
    請求項1からのいずれか1項に記載のアノテーション方法。
  8. 前記複数のラベルそれぞれは、当該各ラベルの付与される時間区間内における前記センサデータに対する所定の推論の正解を示すように設定され、
    前記コンピュータが、
    前記センサデータ及び前記複数のラベルを利用して教師あり学習を実施することで、前記所定の推論を行う能力を有するように構築された学習済みの学習器に対する評価結果を示す評価結果データを取得するステップと、
    取得した前記評価結果データの示す前記評価結果に基づいて、前記重複区間の時間幅を変更するステップと、
    を更に実行する、
    請求項1からのいずれか1項に記載のアノテーション方法。
  9. 前記評価結果は、前記センサデータとは異なる他のセンサデータに対して、前記学習済みの学習器により前記所定の推論を行った際の正答率により表現され、
    前記コンピュータは、前記評価結果データにより示される前記正答率が所定の閾値以下である場合に、前記重複区間の時間幅を狭める又は拡げることで、前記重複区間の時間幅を変更する、
    請求項に記載のアノテーション方法。
  10. センサの出力を時系列に配列したセンサデータを取得するデータ取得部と、
    取得したセンサデータに複数のラベルを付与するラベル付与部と、
    を備え、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記ラベル付与部は、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻を設定し、
    設定された前記境界時刻の前及び後の少なくとも一方の時刻を含むように、所定の時間幅を有する前記重複区間を設定する、
    アノテーション装置。
  11. センサの出力を時系列に配列したセンサデータを取得するデータ取得部と、
    取得したセンサデータに複数のラベルを付与するラベル付与部と、
    を備え、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記ラベル付与部は、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻についての複数の指定を受け付け、
    前記複数の指定により与えられた境界時刻の平均及びばらつきの少なくともいずれかに基づいて前記重複区間を設定する、
    アノテーション装置。
  12. コンピュータに、
    センサの出力を時系列に配列したセンサデータを取得するステップと、
    取得したセンサデータに複数のラベルを付与するステップと、
    を実行させるためのアノテーションプログラムであって、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記コンピュータに、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻を設定させ、
    設定された前記境界時刻の前及び後の少なくとも一方の時刻を含むように、所定の時間幅を有する前記重複区間を設定させる、
    アノテーションプログラム。
  13. コンピュータに、
    センサの出力を時系列に配列したセンサデータを取得するステップと、
    取得したセンサデータに複数のラベルを付与するステップと、
    を実行させるためのアノテーションプログラムであって、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記コンピュータに、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻についての複数の指定を受け付けさせ、
    前記複数の指定により与えられた境界時刻の平均及びばらつきの少なくともいずれかに基づいて前記重複区間を設定させる、
    アノテーションプログラム。
  14. 工場の作業員の行動状態を監視するセンサの出力を時系列に配列したセンサデータを取得するデータ取得部と、
    取得した前記センサデータに複数のラベルを付与するラベル付与部であって、当該複数のラベルそれぞれは、当該各ラベルの付与される時間区間内における前記センサデータに表れる前記作業員の行動状態の正解を示すように設定される、ラベル付与部と、
    前記センサデータ及び前記複数のラベルを利用して教師あり学習を実施することで、前記作業員の行動状態の種別を推定する能力を有するように学習済みの学習器を構築する学習処理部と、
    前記作業員の行動状態を推定する対象となる対象センサデータを取得する対象データ取得部と、
    前記対象センサデータを前記学習済みの学習器に入力し、前記学習済みの学習器から出力を得ることで、前記対象センサデータに表れる前記作業員の行動状態を推定する状態推定部と、
    前記作業員の行動状態を推定した結果を出力する出力部と、
    を備え、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定される、
    識別システム。
  15. センサの出力を時系列に配列したセンサデータを取得するデータ取得部と、
    取得した前記センサデータに複数のラベルを付与するラベル付与部であって、当該複数のラベルそれぞれは、当該各ラベルの付与される時間区間内における前記センサデータに対する所定の推論の正解を示すように設定される、ラベル付与部と、
    前記センサデータ及び前記複数のラベルを利用して教師あり学習を実施することで、前記所定の推論を行う能力を有するように学習済みの学習器を構築する学習処理部と、
    前記所定の推論を行う対象となる対象センサデータを取得する対象データ取得部と、
    前記対象センサデータを前記学習済みの学習器に入力し、前記学習済みの学習器から出力を得ることで、前記対象センサデータに対して所定の推論を実施する推論部と、
    前記所定の推論を実施した結果を出力する出力部と、
    を備え、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記ラベル付与部は、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻を設定し、
    設定された前記境界時刻の前及び後の少なくとも一方の時刻を含むように、所定の時間幅を有する前記重複区間を設定する、
    識別システム。
  16. センサの出力を時系列に配列したセンサデータを取得するデータ取得部と、
    取得した前記センサデータに複数のラベルを付与するラベル付与部であって、当該複数のラベルそれぞれは、当該各ラベルの付与される時間区間内における前記センサデータに対する所定の推論の正解を示すように設定される、ラベル付与部と、
    前記センサデータ及び前記複数のラベルを利用して教師あり学習を実施することで、前記所定の推論を行う能力を有するように学習済みの学習器を構築する学習処理部と、
    前記所定の推論を行う対象となる対象センサデータを取得する対象データ取得部と、
    前記対象センサデータを前記学習済みの学習器に入力し、前記学習済みの学習器から出力を得ることで、前記対象センサデータに対して所定の推論を実施する推論部と、
    前記所定の推論を実施した結果を出力する出力部と、
    を備え、
    前記複数のラベルは、第1のラベル及び第2のラベルを含み、
    前記第1のラベルは、第1の時間区間に付与され、
    前記第2のラベルは、前記時系列上で前記第1の時間区間よりも後にある第2の時間区間に付与され、
    前記第1の時間区間の開始時刻が前記第2の時間区間の開始時刻よりも前であり、かつ前記第1の時間区間の終了時刻が前記第2の時間区間の終了時刻よりも前であるのに対して、前記第1の時間区間の前記終了時刻が前記第2の時間区間の開始時刻よりも後であることで、前記第1の時間区間及び前記第2の時間区間は、前記時系列上で部分的に重複する重複区間を有するように設定され、
    前記ラベル付与部は、
    前記第1の時間区間と前記第2の時間区間とを暫定的に区分する境界時刻についての複数の指定を受け付け、
    前記複数の指定により与えられた境界時刻の平均及びばらつきの少なくともいずれかに基づいて前記重複区間を設定する、
    識別システム。

JP2018045861A 2018-03-13 2018-03-13 アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム Active JP6844562B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018045861A JP6844562B2 (ja) 2018-03-13 2018-03-13 アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム
CN201980012349.8A CN111712840B (zh) 2018-03-13 2019-03-13 注释方法、注释装置、存储介质以及识别系统
US16/969,971 US12048528B2 (en) 2018-03-13 2019-03-13 Annotation method, annotation device, storage medium, and identification system
PCT/JP2019/010181 WO2019176991A1 (ja) 2018-03-13 2019-03-13 アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018045861A JP6844562B2 (ja) 2018-03-13 2018-03-13 アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム

Publications (2)

Publication Number Publication Date
JP2019159819A JP2019159819A (ja) 2019-09-19
JP6844562B2 true JP6844562B2 (ja) 2021-03-17

Family

ID=67907154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018045861A Active JP6844562B2 (ja) 2018-03-13 2018-03-13 アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム

Country Status (4)

Country Link
US (1) US12048528B2 (ja)
JP (1) JP6844562B2 (ja)
CN (1) CN111712840B (ja)
WO (1) WO2019176991A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11430312B2 (en) * 2018-07-05 2022-08-30 Movidius Limited Video surveillance with neural networks
JP7259322B2 (ja) * 2018-12-26 2023-04-18 富士通株式会社 情報処理装置、学習モデル生成プログラム及び学習モデル生成方法
CN112084166A (zh) * 2019-06-13 2020-12-15 上海杰之能软件科技有限公司 样本数据的建立、数据模型的训练方法及装置、终端
JP6779411B1 (ja) * 2019-11-19 2020-11-04 三菱電機株式会社 教師データ生成装置、教師データ生成方法、教師データ生成プログラムおよび記憶媒体
JP2021125183A (ja) * 2020-02-10 2021-08-30 オムロン株式会社 作業負荷分析装置、作業負荷分析方法、プログラム
DE112021001435T5 (de) * 2020-03-05 2023-01-12 Fanuc Corporation Maschinen-Lern-Vorrichtung
JP7293156B2 (ja) * 2020-03-13 2023-06-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US11410443B2 (en) * 2020-03-13 2022-08-09 Nec Corporation Labelling training method and system for implementing the same
WO2021193099A1 (ja) 2020-03-26 2021-09-30 ソニーセミコンダクタソリューションズ株式会社 情報処理装置、情報処理方法、及びプログラム
JP7528706B2 (ja) 2020-10-14 2024-08-06 住友電気工業株式会社 学習モデル生成装置、学習モデル、行動認識装置、学習データ生成装置、及び、学習データ生成方法
JP2022089591A (ja) * 2020-12-04 2022-06-16 株式会社東芝 学習装置、分析装置、学習方法、プログラム、及び記憶媒体
JP7576015B2 (ja) * 2020-12-18 2024-10-30 アクタピオ,インコーポレイテッド 情報処理装置、情報処理方法および情報処理プログラム
CN113592981B (zh) * 2021-07-01 2022-10-11 北京百度网讯科技有限公司 图片标注方法、装置、电子设备和存储介质
WO2023188264A1 (ja) * 2022-03-31 2023-10-05 日本電気株式会社 情報処理システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7111009B1 (en) * 1997-03-14 2006-09-19 Microsoft Corporation Interactive playlist generation using annotations
JP2007142750A (ja) * 2005-11-17 2007-06-07 National Agency For The Advancement Of Sports & Health 映像閲覧システム、コンピュータ端末並びにプログラム
JP5301310B2 (ja) * 2009-02-17 2013-09-25 株式会社日立製作所 異常検知方法及び異常検知システム
JP2010207488A (ja) * 2009-03-12 2010-09-24 Gifu Univ 行動解析装置及びプログラム
JP5544508B2 (ja) * 2009-03-27 2014-07-09 株式会社国際電気通信基礎技術研究所 行動識別システム
JP5520886B2 (ja) 2011-05-27 2014-06-11 日本電信電話株式会社 行動モデル学習装置、方法、及びプログラム
JP6458155B2 (ja) * 2015-08-31 2019-01-23 株式会社日立製作所 情報処理装置及び情報処理方法
JP2017228091A (ja) * 2016-06-22 2017-12-28 日本電信電話株式会社 歩行状態学習方法、歩行状態推定方法、路面状況理解方法、装置、及びプログラム
CN107689027A (zh) * 2016-08-04 2018-02-13 松下电器(美国)知识产权公司 注释赋予方法、注释赋予系统以及存储有程序的记录介质

Also Published As

Publication number Publication date
CN111712840B (zh) 2023-11-03
WO2019176991A1 (ja) 2019-09-19
JP2019159819A (ja) 2019-09-19
CN111712840A (zh) 2020-09-25
US12048528B2 (en) 2024-07-30
US20200397346A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
JP6844562B2 (ja) アノテーション方法、アノテーション装置、アノテーションプログラム及び識別システム
KR101908680B1 (ko) 약한 지도 학습 기반의 기계 학습 방법 및 그 장치
CN112673378B (zh) 推断器生成装置、监视装置、推断器生成方法以及推断器生成程序
US20180174062A1 (en) Root cause analysis for sequences of datacenter states
JP6911498B2 (ja) 学習装置、学習方法、及び学習プログラム
EP2977936A2 (en) Neural network training method and apparatus, and data processing apparatus
JP5889019B2 (ja) ラベル付加装置、ラベル付加方法及びプログラム
CN109120462A (zh) 机会网络链路的预测方法、装置及可读存储介质
JP2019159961A (ja) 検査システム、画像識別システム、識別システム、識別器生成システム、及び学習データ生成装置
JP2018147474A (ja) 学習装置、学習結果利用装置、学習方法及び学習プログラム
JP7131393B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2014228991A (ja) 情報処理装置および方法、並びにプログラム
JP7006296B2 (ja) 学習プログラム、学習方法および学習装置
WO2020217371A1 (ja) 学習システム、データ生成装置、データ生成方法、及びデータ生成プログラム
JP6278517B2 (ja) データ解析装置及びプログラム
KR20190140546A (ko) 영상 기반 힘 예측 시스템 및 그 방법
JP2010061323A (ja) 作業評価値予測方法、プログラム及びシステム
CN115018077A (zh) 贝叶斯网络的结构学习方法、装置及电子设备
US20220351533A1 (en) Methods and systems for the automated quality assurance of annotated images
CN109598347A (zh) 用于确定因果关系的方法、系统和计算机程序产品
JP7526591B2 (ja) 音響認識システム、音響認識方法
JP6826389B2 (ja) 推定装置、推定方法、及び推定プログラム
WO2023188160A1 (ja) 入力支援装置、入力支援方法、及び非一時的なコンピュータ可読媒体
JP7581979B2 (ja) 推論装置、モデル生成装置、推論方法、及び推論プログラム
JP7343032B2 (ja) 学習装置、学習方法および学習プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210208

R150 Certificate of patent or registration of utility model

Ref document number: 6844562

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150