Nothing Special   »   [go: up one dir, main page]

JP7309811B2 - データ注釈方法、装置、電子機器および記憶媒体 - Google Patents

データ注釈方法、装置、電子機器および記憶媒体 Download PDF

Info

Publication number
JP7309811B2
JP7309811B2 JP2021181414A JP2021181414A JP7309811B2 JP 7309811 B2 JP7309811 B2 JP 7309811B2 JP 2021181414 A JP2021181414 A JP 2021181414A JP 2021181414 A JP2021181414 A JP 2021181414A JP 7309811 B2 JP7309811 B2 JP 7309811B2
Authority
JP
Japan
Prior art keywords
annotation
data
column
attribute
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021181414A
Other languages
English (en)
Other versions
JP2022091686A (ja
Inventor
雪 ▲楊▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022091686A publication Critical patent/JP2022091686A/ja
Application granted granted Critical
Publication of JP7309811B2 publication Critical patent/JP7309811B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Image Analysis (AREA)
  • Facsimiles In General (AREA)

Description

本願はデータ処理技術分野に関し、特に、人工知能技術におけるデータ注釈(アノテーション)技術に関するものである。
人工知能技術の発展および業務シナリオでのその応用が増えていることに伴い、特定のシナリオでのモデル訓練が必要となることが多く、それに応じて、訓練によって精度が高く汎化性能の強いモデルが得られるように、当該シナリオでの大量のサンプルデータに対して注釈する必要があり、データ注釈に対するニーズが高まっている。通常、様々な垂直型シナリオデータに対する注釈ニーズを満足するためには、それぞれの注釈ツールによりそれぞれのタイプのデータを注釈する必要がある場合が多い。
本願の実施例はデータ注釈方法、装置、電子機器および記憶媒体を提供することで、データ注釈のメンテナンスコストおよび使用コストを削減し、データ注釈の汎用性および効率性を向上する。
第1の態様によれば、本願の実施例はデータ注釈方法を提供し、当該方法は、
データ注釈要素および注釈操作行列が含まれるデータ注釈因子を確定することと、
前記データ注釈要素に応じて注釈待ちデータを取得することと、
前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことと、を含む。
第2の態様によれば、本願の実施例はデータ注釈装置を提供し、当該装置は、
データ注釈要素および注釈操作行列が含まれる注釈因子を確定することに用いられるデータ注釈因子確定モジュールと、
前記データ注釈要素に応じて注釈待ちデータを取得することに用いられる注釈待ちデータ取得モジュールと、
前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことに用いられる注釈待ちデータ注釈モジュールと、を備える。
第3の態様によれば、本願の実施例は、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されるメモリと、を備える電子機器であって、
前記メモリには前記少なくとも1つのプロセッサに実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサに実行されることで、第1の態様の実施例に提供されるデータ注釈方法を前記少なくとも1つのプロセッサに実行させることができる電子機器を提供する。
第4の態様によれば、本願の実施例は、第1の態様の実施例に提供されるデータ注釈方法をコンピュータに実行させるためのコンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体をさらに提供する。
第5の態様によれば、本願の実施例は、コンピュータプログラムが含まれ、前記コンピュータプログラムがプロセッサに実行されると、第1の態様の実施例に提供されるデータ注釈方法を実現するコンピュータプログラム製品をさらに提供する。
本願の実施例は、データ注釈要素および注釈操作行列などのデータ注釈因子を確定した後、データ注釈要素に応じて注釈待ちデータを取得し、注釈操作行列に応じて注釈待ちデータに対して注釈を行うことで、従来のデータ注釈方法において存在するメンテナンスコスト及び使用コストが高く、汎用性が低く、効率性が低い等の問題を解決するので、データ注釈のメンテナンスコストおよび使用コストを削減し、データ注釈の汎用性および効率性を向上させる。
なお、この部分の説明内容は、本開示の実施例の鍵又は重要な構成を明示することを意図するものではなく、本開示の範囲を限定することを意図するものでもないことを理解すべきである。本開示の別の構成については、以下の明細書を通して容易に理解されるであろう。
図面は、本技術案がよりよく理解されるように提供され、本願を限定するものではない。
本願の実施例に提供されるデータ注釈方法のフロー図である。 本願の実施例に提供されるデータ注釈方法のフロー図である。 本願の実施例に提供されるデータ注釈因子の配置インターフェースの効果の概略図である。 本願の実施例に提供されるテキスト抽出応用シナリオに適用されるデータ注釈因子の配置インターフェースの効果の概略図である。 本願の実施例に提供される注釈操作行列を配置するインターフェースの効果の概略図である。 本願の実施例に提供されるデータ識別シナリオにおいてオーディオデータに対して注釈を行うインターフェースの効果の概略図である。 本願の実施例に提供されるデータ注釈装置の構造図である。 本願の実施例のデータ注釈方法を実現するための電子機器の構造概略図である。
以下、図面を参照しながら、本願の例示的な実施例について説明する。この内容には、理解に寄与するための本願の実施例の様々な詳細が含まれているが、単なる例示的なものと見なされるべきである。したがって、当業者であれば、本願の範囲および精神から逸脱することなく、本明細書に記載の実施例に対して様々な変更および修正を実行することができることを認識すべきである。同様に、明瞭且つ簡潔にさせるために、以下の説明では公知の機能と構造についての説明を省略する。
既存の様々なデータ注釈ツールは、通常カスタム化注釈ツールであり、単一シナリオの注釈ニーズのみを満たすことができる。例えば、音声、ビデオおよびテキストタイプのデータに対する注釈ニーズは、主に様々な垂直型の注釈ツールによって実現され、一般的な垂直型注釈ツールには、音声転写ツール、画像注釈ツール、ビデオ注釈ツールおよびテキスト抽出ツールがある。ここで、音声転写ツールは、主に長い音声と短い音声との切り分け及び転写に適用され、いわゆる転写とは、非テキストデータをテキストデータに識別することである。画像注釈ツールは、主に画像のうちのいくつかの具体的な物体対象に対して注釈すること、例えば、画像のうちの障害物等を注釈することに適用される。ビデオ注釈ツールは、主にビデオの重要なセグメントの抽出、ビデオコンテンツの転写等に適用される。テキスト抽出ツールは、主に神経言語プログラミング(Neuro-Linguistic Programming、NLP)のキーワード抽出等に適用される。
既存の様々な注釈ツールは、種々雑多であり、そのメンテナンスコスト及び使用コストはいずれも高い。加えて、やや複雑な複合注釈シナリオは、単一の注釈ツールによって良好にサポートされず、注釈待ちデータを分割し、分割されたデータに対して直列に注釈を行ってからその結果を合併しなければならない。これから分かるように、既存の注釈ツールによるデータ注釈方法は、汎用性が低く、注釈のプロセスを間違いなく延長し、注釈の効率低下に繋がる。
一例において、図1は本願の実施例に提供されるデータ注釈方法のフロー図であり、本実施例は、各種タイプのデータを統合されたデータ注釈方法により注釈を行う場合に適用可能であり、当該方法は、データ注釈装置に実行可能であり、当該装置は、ソフトウェア及び/又はハードウェアの形態で実現可能であり、通常電子機器に集積可能である。当該電子機器は、コンピュータ機器などであってもよい。これに対応し、図1に示すように、当該方法は、以下の操作を含む。
S110において、データ注釈要素および注釈操作行列が含まれるデータ注釈因子を確定する。
ここで、データ注釈因子は、注釈待ちデータに対して注釈を行う関連因子であってもよい。好ましくは、データ注釈因子は、データ注釈要素および注釈操作行列を含んでもよいが、これに限定されるものではない。ここで、データ注釈要素は、データタイプに応じて注釈待ちデータを確定できるように、注釈できるデータタイプを限定することに用いられてもよい。注釈操作行列は、注釈待ちデータに対して注釈を行うことに用いられてもよい。
本願の実施例において、データに対して注釈を行う前に、まず、データ注釈要素および注釈操作行列などのデータ注釈因子を確定する必要がある。
S120において、前記データ注釈要素に応じて注釈待ちデータを取得する。
ここで、注釈待ちデータは、注釈ニーズのあるデータであってもよい。好ましくは、注釈待ちデータのデータタイプは、オーディオデータ、ビデオデータ、ピクチャデータ、テキストデータおよびウェブページデータ等を含んでもよいが、これに限定されるものではない。即ち、注釈ニーズのあるいずれのデータタイプであってもよく、注釈待ちデータの具体的ななデータタイプは、本願の実施例によって限定されるものではない。
これに対応し、データ注釈要素が確定された後、データ注釈要素に応じて注釈待ちデータを取得することができる。例示的に、注釈待ちデータのデータタイプに応じてデータ注釈要素の要素タイプからマッチングする要素タイプを確定し、さらにマッチングする要素タイプに応じて対応する注釈待ちデータを取得することができる。
S130において、前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行う。
本願の実施例において、注釈待ちデータが取得された後、注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことができる。なお、注釈操作行列は、注釈待ちデータの具体的な注釈属性を限定してもよく、例示的に、注釈操作行列の行要素によって注釈待ちデータのうちのそれぞれの注釈データを確定し、行列の列要素に対する注釈動作によってそれぞれの注釈データの具体的な注釈属性を確定してもよい。例えば、列要素によってそれぞれの注釈データに対応する注釈番号およびデータの開始及び終了位置等を確定してもよい。
これから分かるように、注釈操作行列によって注釈ニーズのあるすべてのデータタイプに対して対応する注釈属性を設置することで、その注釈ニーズを満たすことを実現できる。なお、本願の実施例に提供されるデータ注釈方法は、1セットの注釈ツールに適用可能であり、即ち、本願の実施例に提供されるデータ注釈方法を使用すれば、1セットの注釈ツールによってあらゆるデータタイプのデータ注釈タスクを実現可能であり、汎用性がより高く、データ注釈のメンテナンスコストおよび使用コストを削減し、注釈待ちデータを分割し、分割されたデータに対して直列に注釈を行ってからその結果を合併する必要がないので、同時にデータ注釈の効率を大幅に向上できる。
本願の実施例は、データ注釈要素および注釈操作行列などのデータ注釈因子を確定した後、データ注釈要素に応じて注釈待ちデータを取得し、注釈操作行列に応じて注釈待ちデータに対して注釈を行うことで、従来のデータ注釈方法において存在するメンテナンスコスト及び使用コストが高く、汎用性が低く、効率性が低い等の問題を解決するので、データ注釈のメンテナンスコストおよび使用コストを削減し、データ注釈の汎用性および効率性を向上させる。
一例において、図2は本願の実施例に提供されるデータ注釈方法のフロー図であり、本願の実施例は、上記の各実施例の技術案に基づいて最適化し改良したものであり、データ注釈因子を確定すること、前記データ注釈要素に応じて注釈待ちデータを取得すること、前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことという様々な具体的かつ選択可能な実現形態を提供する。
図2に示すようなデータ注釈方法は、以下のことを含む。
S210において、前記データ注釈要素の要素タイプを確定する。
ここで、前記要素タイプは、オーディオデータ要素、ビデオデータ要素、ピクチャデータ要素、テキストデータ要素およびウェブページデータ要素等を含んでもよいが、これに限定されるものではない。
ここで、オーディオデータ要素は、オーディオデータタイプを表してもよく、ビデオデータ要素は、ビデオデータタイプを表してもよく、ピクチャデータ要素は、ピクチャデータタイプを表してもよく、テキストデータ要素は、テキストデータタイプを表してもよく、ウェブページデータ要素は、ウェブページデータタイプを表してもよく、データ注釈要素の要素タイプは、上述したタイプ以外、注釈ニーズのあるその他のデータタイプであってもよく、本願の実施例はこれを限定するものではない。
本願の実施例において、データ注釈要素を確定する場合、具体的に、データ注釈要素に対応する要素タイプを確定してもよい。データ注釈ツールの汎用性を考慮して、注釈ニーズのあるすべてのデータタイプを要素タイプとすることを考慮してもよい。また、要素タイプは、実際のニーズに応じて更新可能であり、即ち、新規のデータタイプに注釈ニーズがあった場合、当該データタイプに対応する要素タイプをデータ注釈要素として更新することができる。これから分かるように、データ注釈要素を確定することでデータ注釈方法の汎用性を向上できる。
S220において、前記注釈操作行列の行要素の行数量および列要素の列数量を確定する。
ここで、前記注釈操作行列の行要素は、前記注釈待ちデータを確定することに用いられ、前記注釈操作行列の列要素は、前記注釈待ちデータにマッチングする注釈属性を確定することに用いられる。注釈属性は、ノイズ判定、データタイトル又はデータの開始及び終了位置等の注釈待ちデータに対して注釈する具体的なコンテンツであり、いずれの注釈ニーズであっても対応する注釈属性が形成可能であり、注釈属性の具体的なコンテンツは、本願の実施例によって限定されるものではない。
なお、注釈操作行列は行要素および列要素を含んでもよいことが理解されるであろう。これにより、注釈操作行列を確定する場合、注釈操作行列の行要素の行数量および列要素の列数量を確定してもよい。行数量を設置することで注釈待ちデータのデータ数量を限定してもよく、列数量を設置することで注釈待ちデータの注釈属性の数量を限定してもよい。
図3は、本願の実施例に提供されるデータ注釈因子の配置インターフェースの効果の概略図である。例示的な一例において、図3示すように、データ注釈因子の配置インターフェースによってデータ注釈要素および注釈操作行列を配置することで、データ注釈因子を確定することができる。例えば、データ注釈要素の要素タイプをオーディオデータ要素、ビデオデータ要素、ピクチャデータ要素、テキストデータ要素およびウェブページデータ要素に確定してもよく、注釈操作行列の行数量、列数量および行列コンテンツ等に対して設置してもよい。それ以外、注釈操作行列の行列間の関係を設置することで、注釈操作行列を確定する段階で行列間の制約関係を制限してもよい。
S230において、前記データ注釈要素の要素タイプに応じて目標要素タイプを確定する。
ここで、目標要素タイプは、注釈待ちデータに対応する要素タイプであってもよい。
データ注釈要素および注釈操作行列が含まれるデータ注釈因子が確定された後、データ注釈要素の要素タイプに応じて目標要素タイプを確定することができる。例示的に、注釈待ちデータをテキストデータと仮定すると、目標要素タイプはテキストデータ要素となる。それに対応して、図2に示すように、「テキスト」を目標要素タイプに選択できる。
S240において、前記目標要素タイプに応じて前記注釈待ちデータを取得する。
これに対応して、目標要素タイプが確定された後、目標要素タイプに応じて注釈待ちデータを取得することができる。例示的に、データファイルを導入する方法で注釈待ちデータを取得してもよく、又は、データを直接入力するなどの方法で注釈待ちデータを取得してもよく、注釈待ちデータを取得できれば、注釈待ちデータの取得方法は、本願の実施例によって限定されるものではない。
上述した技術案において、すべての要素タイプから目標要素タイプを確定し、目標要素タイプに応じて注釈ニーズのある注釈待ちデータを確定することで、いずれのタイプのデータの注釈ニーズも満たすことができる。
S250において、前記注釈待ちデータに応じて前記注釈操作行列における各行要素に対応する注釈待ちサブデータおよび各列要素に対応する注釈属性を確定する。
ここで、注釈待ちサブデータは、注釈待ちデータのうちの一部の注釈データであってもよい。例示的に、注釈待ちデータを5枚のピクチャと仮定すると、各1枚のピクチャを1つの注釈待ちサブデータとすることができる。注釈待ちデータが10つの短いテキストからなる一段落のテキストであると仮定する場合、各1つのテキストを1つの注釈待ちサブデータとすることができる。注釈待ちサブデータの具体的なデータコンテンツは本願の実施例によって限定されるものではない。
S260において、前記注釈操作行列の行要素と各前記注釈待ちサブデータとのマッピング関係を構築する。
本願の実施例において、注釈操作行列に応じて注釈待ちデータに対して注釈を行う場合、まず、注釈待ちデータに応じて注釈操作行列のそれぞれの行要素に対応する注釈待ちサブデータおよびそれぞれの列要素に対応する注釈属性を確定してもよい。それと同時に、それぞれの行要素に対応する注釈待ちサブデータが確定された後、行要素と各注釈待ちサブデータとのマッピング関係を構築してもよく、なお、当該マッピング関係は、デフォルト対応関係であってもよいことが理解されるであろう。
例示的に、注釈待ちデータが5つの短いテキストからなるテキスト段落であれば、5つの行要素を確定し、それぞれの行要素に1つの短いテキストを対応させて1つの注釈待ちサブデータとすることができ、これに対応して、それぞれの注釈待ちサブデータとそれぞれの行要素との間にマッピング関係が存在する。同時に、複数の列要素を確定してもよく、それぞれの列要素に対応する注釈属性を確定してもよい。例えば、第1の列要素の注釈属性が番号、即ち、各短いテキストに対して順番に番号を付けたものであり、第2の列要素の注釈属性がデータ切り取りコンテンツ、即ち、短いテキストから切り取った重要なテキストデータコンテンツなどである。
S270において、行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築する。
好ましくは、前記属性制約関係は、デフォルト対応関係、包含関係、被包含関係、相互排他関係および連動関係を含む。ここで、デフォルト対応関係は、行列における行要素と列要素との対応関係であり、当該対応関係は、具体的な行列要素に具現化され、例えば、第1の行第2の列の行列要素の場合、対応するものは第1の行の行要素と第2の列の列要素とのデフォルト対応関係である。包含関係は、そのうちの1つの要素が他の1つの要素を含むことであってもよく、例えば、第2の列の列要素と第1の列の列要素との間に、第1の列の列要素は第2の列の列要素を含むという包含関係が存在し、それは、第1の列の列要素のデータに必ず第2の列の列要素のデータが含まれることを意味する。例示的に、第1の列の列要素に対応する注釈属性は障害物であり、第2の列の列要素に対応する注釈属性は街灯である場合、障害物に街灯が含まれることを表す。それに対応して、被包含関係は、そのうちの1つの要素が他の1つの要素に含まれることであってもよく、例えば、第2の列の列要素と第1の列の列要素との間に、第1の列の列要素が第2の列の列要素に含まれるという被包含関係が存在し、これは、第2の列の列要素のデータに必ず第1の列の列要素のデータが含まれることを意味する。相互排他関係は、そのうちの1つの要素と他の1つの要素とが相互に排他的であってもよい。例えば、第2の列の列要素と第1の列の列要素との間に、相互排他関係が存在し、第1の列の列要素のデータと第2の列の列要素のデータとは相互に排他的であることを表す。例示的に、第1の列の列要素に対応する注釈属性が黒色であり、第2の列の列要素に対応する注釈属性が白色である場合、黒色と白色とは相互に排他的で異なるカラーであることが明らかである。連動関係は、各要素同士が関連的な関係である。例えば、第2の列の列要素と第1の列の列要素と第3の列の列要素との間に連動関係が存在し、第1の列の列要素のデータと第2の列の列要素のデータとの間が相互に関連づけており、且つ、第1の列の列要素のデータと第3の列の列要素のデータとの間が相互に関連づけていることを表す。例示的に、第1の列の列要素に対応する注釈属性が効果であり、第2の列の列要素に対応する注釈属性がカラーである場合、第3の列の列要素に対応する注釈属性がカテゴリであり、カラーと効果との間、および、カラーとカテゴリとの間にいずれも関連関係が存在することを表す。
本願の実施例において、注釈操作行列が確定された後、さらに注釈操作行列における行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築し、属性制約関係によって要素間の関係を配置してもよく、これにより、多様化しているデータ注釈のニーズをより一層満たすことができる。なお、各要素の間には、属性制約関係が存在してもよく、属性制約関係が存在しなくてもよく、具体的には、実際のニーズに応じて設定することができ、本願の実施例はこれを限定するものではない。なお、データ注釈の難易度の上昇、又は、データ注釈の品質の低下を回避するために、通常、属性制約関係の設置が複雑すぎるのは不適当であることが理解されるであろう。
S280において、各前記列要素に対応する注釈属性および前記属性制約関係に応じて各前記注釈待ちサブデータに対して注釈を行う。
これに対応して、それぞれの行要素に対応する注釈待ちサブデータ、それぞれの列要素に対応する注釈属性および各要素間の属性制約関係が確定された後、各列要素に対応する注釈属性および属性制約関係に応じて各行要素に対応する注釈待ちサブデータに対して注釈を行うことができる。
これから分かるように、上述した技術案は、それぞれの行要素に対応する注釈待ちサブデータ、それぞれの列要素に対応する注釈属性および各要素間の属性制約関係を確定し、各列要素に対応する注釈属性および属性制約関係に応じて各行要素に対応する注釈待ちサブデータに対して注釈を行うことで、多様化しているデータ注釈のニーズをより一層満たすことができる。
本願の好ましい実施例において、前記データ注釈方法は、データクレンジングシナリオに適用される。前記注釈操作行列の行数量は第1の数量、前記注釈操作行列の列数量は第2の数量であり、前記注釈操作行列における各列要素に対応する注釈属性を確定することは、第1の列要素の注釈属性をデータフィルタリングに確定することと、第2の列要素の注釈属性をフィルタリングタイプに確定することと、を含んでもよく、行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築することは、前記行要素と前記列要素とのデフォルト対応関係を構築することを含んでもよい。
ここで、第1の数量は1であってもよく、第2の数量はnであってもよく、nは、数量をランダムに設置してもよいことを表し、通常、nは、1以上でなければならない。第1の列要素は第1の列の列要素であってもよく、第2の列要素は第2の列の列要素であってもよい。
好ましくは、本願の実施例に提供されるデータ注釈方法は、データクレンジングシナリオに適用されてもよい。データクレンジングは、データに対してクレンジング処理を行うことである。なお、いずれのタイプのデータにもデータクレンジングのニーズ、例えば、ノイズクレンジング、高精細度ビデオクレンジング、テキストコンテンツのコンプライアンスクレンジング等のデータクレンジング操作が存在することが理解されるであろう。いわゆるノイズクレンジングは、ノイズのあるデータを削除することであり、高精細度ビデオクレンジングは、高精細度でないビデオデータを削除することであり、テキストコンテンツのコンプライアンスクレンジングは、例えば、敏感な語彙又は異常な語彙等を削除することであってもよい。データクレンジングの具体的なクレンジング手段およびクレンジングコンテンツは、本願の実施例によって限定されるものではない。
データクレンジングシナリオに対して、注釈操作行列の行数量を1とし、列数量をnとしてもよい。好ましくは、さらに、列のタイトルを設置して判断の根拠とし、行要素は1つの注釈待ちサブデータに対応し、注釈待ちサブデータに対してデータクレンジングを行うことで、データ注釈操作を完成できる。各列要素に対応する注釈属性は、クレンジングニーズに応じて定義されたクレンジング待ちの選択肢コンテンツであってもよい。例示的に、第1の列要素の注釈属性をデータフィルタリング、例えば、ノイズフィルタリングなどに確定してもよく、さらに、データフィルタリングの注釈属性の選択方法を設置してもよい。例えば、ノイズフィルタリングの注釈属性を単一選択形態とし、選択肢は具体的にノイズ無しおよびノイズありを含む。ノイズ無しを選択するとノイズ無しのデータをクレンジングすることを表し、ノイズありを選択するとノイズありのデータをクレンジングすることを表す。また、さらに、第2の列要素の注釈属性をフィルタリングタイプ、例えば騒音タイプ等に確定してもよい。好ましくは、騒音タイプは、男声タイプ、女声タイプおよび混ぜ声タイプ等を含んでもよいが、これに限定されるものではない。それに対応して、属性制約関係に対して特殊なニーズがなければ、行要素と列要素とのデフォルト対応関係のみを構築してもよい。これから分かるように、データフィルタリングおよびフィルタリングタイプ等の注釈属性を確定することで、様々なデータクレンジングシナリオにおけるデータ注釈ニーズを満たすことができる。
本願の好ましい実施例において、前記データ注釈方法は、データ切り取りシナリオに適用され、前記注釈操作行列の行数量は第3の数量、前記注釈操作行列の列数量は第2の数量であり、前記注釈操作行列における各列要素に対応する注釈属性を確定することは、第1の列要素の注釈属性をデータ番号に確定することと、第2の列要素の注釈属性をデータの目標セグメントに確定することと、第3の列要素の注釈属性をデータタイトルに確定することと、第4の列要素の注釈属性をデータセグメント時間長に確定することと、第5の列要素の注釈属性をデータ審査意見に確定することと、を含んでもよく、行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築することは、前記行要素と前記列要素とのデフォルト対応関係を構築することを含んでもよい。
ここで、第3の数量は0であってもよく、行数量が無制限に増加できることを表す。データ番号は、注釈待ちサブデータの注釈番号を表してもよく、データの目標セグメントは、注釈待ちサブデータのうちのいくつかのセグメント、例えば、精彩なセグメント等であってもよい。データタイトルは、注釈待ちサブデータに対応するデータタイトル、例えば、ビデオタイトル又はオーディオタイトル等であってもよい。データセグメント時間長は、注釈待ちサブデータに対応するセグメント時間長、例えば、ビデオセグメント時間長又はオーディオセグメント時間長等であってもよい。データ審査意見は、注釈待ちサブデータに対応する審査意見等であってもよい。第3の列要素は第3の列の列要素であってもよく、第4の列要素は第4の列の列要素であってもよく、第5の列要素は第5の列の列要素であってもよい。
好ましくは、本願の実施例に提供されるデータ注釈方法は、データ切り取りシナリオに適用されてもよい。データ切り取りは、データに対して切り取り処理を行うことである。なお、いずれのタイプのデータにもデータ切り取りのニーズ、例えば、オーディオ、テキスト、ビデオ又は選択したピクチャ等を切り取りするデータ切り取り操作が存在することが理解されるであろう。データ切り取りの具体的な切り取り手段及び切り取りコンテンツは、本願の実施例によって限定されるものではない。
データ切り取りシナリオに対して、注釈操作行列の行数量を0とし、列数量をnとしてもよい。好ましくは、各行要素は1つの注釈待ちサブデータに対応し、それぞれの注釈待ちサブデータに対してデータ切り取りすることで、データ注釈操作を完成できる。各列要素に対応する注釈属性は、切り取りニーズに応じて定義された切取待ちの選択肢コンテンツであってもよい。例示的に、第1の列要素の注釈属性をデータ番号に確定し、例えば、各注釈待ちサブデータを1から次第に増加するように順序付けてもよい。さらに、第2の列要素の注釈属性をデータの目標セグメントに確定してもよく、即ち、各注釈待ちサブデータに対してデータセグメントを切り取り、例えば、ビデオのうちの素敵なセグメント等を切り取りしてもよい。さらに、第3の列要素の注釈属性をデータタイトルに確定し、即ち、各注釈待ちサブデータのデータ注釈に対して命名注釈を行ってもよい。さらに、第4の列要素の注釈属性をデータセグメント時間長に確定し、即ち、注釈各データの目標セグメントに対応するセグメント時間長に確定してもよい。さらに、第5の列要素の注釈属性をデータ審査意見に確定し、即ち、各データの目標セグメントに対してユーザから提示された審査意見を注釈してもよい。それに対応して、属性制約関係に対して特殊なニーズがなければ、行要素と列要素とのデフォルト対応関係のみを構築してもよい。これから分かるように、データ番号、データの目標セグメント、データタイトル、データセグメント時間長およびデータ審査意見等の注釈属性を確定することで、様々なデータ切り取りシナリオにおけるデータ注釈ニーズを満たすことができる。
本願の好ましい実施例において、前記データ注釈方法は、データ抽出シナリオに適用され、前記注釈操作行列の行数量は第3の数量、前記注釈操作行列の列数量は第2の数量であり、前記注釈操作行列における各列要素に対応する注釈属性を確定することは、第1の列要素の注釈属性をデータ番号に確定することと、第2の列要素の注釈属性をデータ開始及び終了位置に確定することと、第3の列要素の注釈属性をデータ抽出コンテンツに確定することと、第4の列要素の注釈属性をデータ抽出タイプに確定することと、第5の列要素の注釈属性をデータ抽出カラーに確定することと、を含んでもよく、行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築することは、前記行要素と前記列要素とのデフォルト対応関係を構築することと、目標列要素間の連動関係を構築することと、を含んでもよい。
ここで、データ開始及び終了位置は、注釈待ちデータにおける注釈待ちサブデータの開始及び終了位置を表してもよい。データ抽出コンテンツは、注釈待ちサブデータから抽出されたデータコンテンツであってもよい。データ抽出タイプは、各データ抽出コンテンツに対応するタイプであってもよい。好ましくは、データ抽出タイプは、複数種の分類タイプを含んてもよく、本願の実施例はこれを限定するものではない。データ抽出カラーは、データに対応するカラー、例えば、データ自体のカラー又は背景カラー等であってもよく、データ抽出カラーの具体的なカラータイプおよびコンテンツは、本願の実施例によって限定されるものではない。目標列要素は、連動関係を確立する必要がある列要素であってもよく、注釈操作行列における目標列要素の具体的な位置は、本願実施例によって限定するものではない。
好ましくは、本願の実施例に提供されるデータ注釈方法は、データ抽出シナリオに適用されてもよい。データ抽出は、データに対して抽出処理を行うことである。なお、いずれのタイプのデータにもデータ抽出のニーズ、例えば、オーディオ、テキスト、ビデオ又は選択したピクチャ等を抽出するデータ抽出操作が存在することが理解されるであろう。データ抽出の具体的な抽出手段および抽出コンテンツは、本願の実施例によって限定されるものではない。
データ抽出シナリオに対して、注釈操作行列の行数量を0とし、列数量をnとしてもよい。好ましくは、各行要素は1つの注釈待ちサブデータに対応し、それぞれの注釈待ちサブデータに対してデータ抽出を行うことで、データ注釈操作を完成できる。各列要素に対応する注釈属性は、抽出ニーズに応じて定義された抽出待ちの選択肢コンテンツであってもよい。図4は、本願の実施例に提供されるテキスト抽出応用シナリオに適用されるデータ注釈インターフェースの効果の概略図である。例示的に、第1の列要素の注釈属性をデータ番号、例えば、図4に示すような「X抽出1」および「X抽出2」等の様式のデータ番号に確定してもよい。さらに、第2の列要素の注釈属性をデータ開始及び終了位置に確定してもよく、例えば、図4に示すように、開始及び終了位置(即ち、データ開始及び終了位置)は数字の様式に命名してもよく、具体的なデータコンテンツ等であってもよい。さらに、第3の列要素の注釈属性をデータ抽出コンテンツ、例えば、図4に示すような切り取りコンテンツに確定してもよく、注釈待ちサブデータのうちの特定データに対して抽出を行ってもよい。さらに、第4の列要素の注釈属性をデータ抽出タイプに確定してもよく、例えば、図4に示すように、データ抽出タイプはブランド、カテゴリおよび効果などのサブカテゴリを含んでもよい。さらに、第5の列要素の注釈属性をデータ抽出カラーに確定してもよく、例えば、図4に示すように、切り取りコンテンツの背景カラーに対して抽出してもよい。これに対応して、さらに、属性制約関係に対する特殊なニーズに応じて、行要素と列要素との属性制約関係を構築してもよい。例えば、図4に示すように、行要素と列要素とのデフォルト対応関係を構築し、第4の列の列要素および第5の列の列要素を目標列要素とすることで、第4の列の列要素と第5の列の列要素との連動関係を構築してもよい。これから分かるように、データ番号、データ開始及び終了位置、データ抽出コンテンツ、データ抽出タイプおよびデータ抽出カラー等の注釈属性を確定することで、様々なデータ抽出シナリオにおけるデータ注釈ニーズを満たすことができる。
本願の好ましい実施例において、前記データ注釈方法は、データ識別シナリオに適用され、前記注釈操作行列の行数量は第3の数量、前記注釈操作行列の列数量は第2の数量であり、前記注釈操作行列における各列要素に対応する注釈属性を確定することは、第1の列要素の注釈属性をデータ番号に確定することと、第2の列要素の注釈属性をデータ開始及び終了時間に確定することと、第3の列要素の注釈属性をデータ識別コンテンツに確定することと、第4の列要素の注釈属性をデータ素セグメント時間長に確定することと、第5の列要素の注釈属性をデータキャラクタに確定することと、を含んでもよく、行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築することは、前記行要素と前記列要素とのデフォルト対応関係を構築することを含んでもよい。
ここで、データ開始及び終了時間は、注釈待ちデータにおける注釈待ちサブデータの開始及び終了時間を表してもよい。データ識別コンテンツは、注釈待ちサブデータを識別し得られたコンテンツ、例えば、ビデオ、オーディオ又は画像等を識別して得られた識別コンテンツ等であってもよい。データキャラクタは、注釈待ちサブデータに含まれているキャラクタコンテンツであってもよい。例えば、注釈待ちサブデータがオーディオデータであれば、データキャラクタは、男、女等のキャラクタを含んでもよい。
好ましくは、本願の実施例に提供されるデータ注釈方法は、データ識別シナリオに適用されてもよい。データ識別は、データに対して識別処理を行うことである。なお、一部タイプのデータにデータ識別のニーズ、例えば、オーディオ、テキスト、ビデオ又は選択したピクチャ等に対するデータ識別操作が存在してもよいことが理解されるであろう。ここで、オーディオには、主に、音声を文字に転換する識別、注釈ニーズが存在し、テキストには、主に、具体的な文字注釈ニーズ、例えば、品詞注釈又は分詞処理等のニーズが存在する。ビデオには、主に、ビデオのうちの画像又はオーディオに対する識別、注釈ニーズが存在する。ピクチャには、主に、ピクチャのうちの対象に対する識別、注釈のニーズが存在する。データ識別の具体的な識別手段および識別コンテンツは本願の実施例によって限定されるものではない。
データ識別シナリオに対して、注釈操作行列の行数量を0とし、列数量をnとしてもよい。好ましくは、注釈操作行列の各行要素は1つの注釈待ちサブデータに対応し、それぞれの注釈待ちサブデータに対してデータ識別を行うことで、データ注釈操作を完成できる。各列要素に対応する注釈属性は識別ニーズに応じて定義された識別待ちの選択肢コンテンツであってもよい。図5は本願の実施例に提供される注釈操作行列の配置インターフェースの効果の概略図である。例えば、図5に示すように、「番号、開始及び終了時間、転写コンテンツ、セグメント時間長およびキャラクタ」等の列要素は、注釈操作行列の各列要素に対応する注釈属性を表す。それ以外、さらに、各注釈属性に対して、その他の情報を設置してもよく、例えば、選択肢を単一選択又は複数行に設定し、キャラクタの設置は男又は女等を選択してもよい。例示的に、第1の列要素の注釈属性をデータ番号に確定してもよく、例えば、図5に示すデータ番号を「シーケンス(sequence)」の様式で設置してもよい。さらに、第2の列要素の注釈属性をデータ開始及び終了時間に確定してもよく、例えば、図5に示すように、注釈待ちデータがオーディオデータであれば、開始及び終了時間は主に注釈待ちオーディオデータに対して音声セグメント化操作を行うことに用いられる。さらに、第3の列要素の注釈属性をデータ識別コンテンツに確定してもよく、例えば、図5に示す転写コンテンツのように、注釈待ちサブデータを複数行テキストに識別してもよい。さらに、第4の列要素の注釈属性をデータセグメント時間長に確定してもよく、例えば、図5に示すように、データセグメント時間長を間隔秒数として設置してもよい。さらに、第5の列要素の注釈属性をデータキャラクタに確定してもよく、例えば、図5に示すように、注釈待ちデータがオーディオデータであれば、データキャラクタを男キャラクタ又は女キャラクタの単一選択に設置してもよい。それに対応して、属性制約関係に対して特殊なニーズがなければ、行要素と列要素とのデフォルト対応関係のみを構築してもよい。図6は本願の実施例に提供されるデータ識別シナリオにおいてオーディオデータに対して注釈を行うインターフェースの効果の概略図であり、ここで、図6に示すデータ注釈結果は、図5に示す注釈操作行列で1つのオーディオデータに対して注釈を行った最終的な結果である。図6に示すように、注釈操作行列に応じて、データ番号、データ開始及び終了時間、データ識別コンテンツ、データセグメント時間長およびデータキャラクタ等の注釈属性を確定することで、データ抽出シナリオにおいて多様化しているデータ注釈ニーズを満たすことができる。
上述した技術案は、異なるデータ注釈シナリオにおいて、確定されたデータ注釈要素により注釈待ちデータを取得し、確定された注釈操作行列により注釈待ちデータに対して注釈を行うことで、統合された注釈ツールにより各種タイプのデータに対して注釈を行うことを実現し、データ注釈のメンテナンスコストおよび使用コストを削減し、データ注釈の汎用性および効率性を向上させた。
一例において、図7は本願の実施例に提供されるデータ注釈装置の構造図であり、本願の実施例は各種タイプのデータに対して統合されたデータ注釈方法により注釈を行う場合に適用可能であり、当該装置はソフトウェア及び/又はハードウェアによって実現し、具体的に電子機器に配置されている。当該電子機器はコンピュータ機器等であってもよい。
図7に示すようなデータ注釈装置300は、
データ注釈要素および注釈操作行列が含まれるデータ注釈因子を確定することに用いられるデータ注釈因子確定モジュール310と、
前記データ注釈要素に応じて注釈待ちデータを取得することに用いられる注釈待ちデータ取得モジュール320と、
前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことに用いられる注釈待ちデータ注釈モジュール330と、を備える。
好ましくは、データ注釈因子確定モジュール310は、具体的に、前記データ注釈要素の要素タイプを確定することと、前記注釈操作行列の行要素の行数量と列要素の列数量を確定することとに用いられる。ここで、前記要素タイプがオーディオデータ要素、ビデオデータ要素、ピクチャデータ要素、テキストデータ要素およびウェブページデータ要素を含み、前記注釈操作行列の行要素が前記注釈待ちデータを確定することに用いられ、前記注釈操作行列の列要素が前記注釈待ちデータにマッチングする注釈属性を確定することに用いられる。
好ましくは、注釈待ちデータ取得モジュール320は、具体的に、前記データ注釈要素の要素タイプに応じて目標要素タイプを確定すること、前記目標要素タイプに応じて前記注釈待ちデータを取得すること、に用いられる。
好ましくは、注釈待ちデータ注釈モジュール330は、具体的に、前記注釈待ちデータに応じて前記注釈操作行列における各行要素に対応する注釈待ちサブデータおよび各列要素に対応する注釈属性を確定することと、前記注釈操作行列の行要素と各前記注釈待ちサブデータとのマッピング関係を構築することと、行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築することと、各前記列要素に対応する注釈属性および前記属性制約関係に応じて各前記注釈待ちサブデータに対して注釈を行うことと、に用いられ、前記属性制約関係は、デフォルト対応関係、包含関係、被包含関係、相互排他関係および連動関係を含む。
好ましくは、前記データ注釈装置はデータクレンジングシナリオに適用され、前記注釈操作行列の行数量は第1の数量、前記注釈操作行列の列数量は第2の数量であり、注釈待ちデータ注釈モジュール330は、具体的に、第1の列要素の注釈属性をデータフィルタリングに確定すること、第2の列要素の注釈属性をフィルタリングタイプに確定すること、前記行要素と前記列要素とのデフォルト対応関係を構築すること、に用いられる。
好ましくは、前記データ注釈装置はデータ切り取りシナリオに適用され、前記注釈操作行列の行数量は第3の数量、前記注釈操作行列の列数量は第2の数量であり、注釈待ちデータ注釈モジュール330は、具体的に、第1の列要素の注釈属性をデータ番号に確定すること、第2の列要素の注釈属性をデータの目標セグメントに確定すること、第3の列要素の注釈属性をデータタイトルに確定すること、第4の列要素の注釈属性をデータセグメント時間長に確定すること、第5の列要素の注釈属性をデータ審査意見に確定すること、前記行要素と前記列要素とのデフォルト対応関係を構築すること、に用いられる。
好ましくは、前記データ注釈装置はデータ抽出シナリオに適用され、前記注釈操作行列の行数量は第3の数量、前記注釈操作行列の列数量は第2の数量であり、注釈待ちデータ注釈モジュールは、具体的に、第1の列要素の注釈属性をデータ番号に確定すること、第2の列要素の注釈属性をデータ開始及び終了位置に確定すること、第3の列要素の注釈属性をデータ抽出コンテンツに確定すること、第4の列要素の注釈属性をデータ抽出タイプに確定すること、第5の列要素の注釈属性をデータ抽出カラーに確定すること、前記行要素と前記列要素とのデフォルト対応関係を構築すること、目標列要素間の連動関係を構築すること、に用いられる。
好ましくは、前記データ注釈装置はデータ識別シナリオに適用され、前記注釈操作行列の行数量は第3の数量、前記注釈操作行列の列数量は第2の数量であり、注釈待ちデータ注釈モジュール330は、具体的に、第1の列要素の注釈属性をデータ番号に確定すること、第2の列要素の注釈属性をデータ開始及び終了時間に確定すること、第3の列要素の注釈属性をデータ識別コンテンツに確定すること、第4の列要素の注釈属性をデータセグメント時間長に確定すること、第5の列要素の注釈属性をデータキャラクタに確定すること、前記行要素と前記列要素とのデフォルト対応関係を構築すること、に用いられる。
上述データ注釈装置は、本願のいずれの実施例で提供されるデータ注釈方法もを実行可能であり、実行する方法に相応する機能モジュールおよび有利な効果を有している。本実施例で詳細な説明を省略した技術的詳細については、本願のいずれかの実施例で提供されるデータ注釈方法を参照すればよい。
上記で紹介したデータ注釈装置は、本願の実施例におけるデータ注釈方法を実行できる装置であることから、当業者は、本願の実施例にて紹介したデータ注釈方法に基づき、本実施例のデータ注釈装置の具体的な実施形態およびその様々な変化態様を把握できるため、本明細書では、当該データ注釈装置がどのように本願の実施例におけるデータ注釈方法を実現するかについての詳細な紹介を省略する。当業者が本願の実施例におけるデータ注釈方法を実施するために使用する装置であれば、いずれも本願の保護しようとする範囲に属する。
一例において、本開示は、電子機器、可読記憶媒体およびコンピュータプログラム製品をさらに提供する。
図8は本開示の実施例の例示的な電子機器400の概略ブロック図を示す。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータおよびその他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを意図している。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス及びその他の類似的なコンピューティングデバイスなどの様々な形態のモバイルデバイスを表してもよい。本明細書に記載の構成要素、それらの接続及び関係、ならびにそれらの機能は、単に例示的なものであり、本明細書に記載及び/又は要求される本開示の実現を制限することを意図するものではない。
図8に示すように、デバイス400はコンピューティングユニット401を備え、読取専用メモリ(Read-Only Memory、ROM)402に記憶されるコンピュータプログラム又は記憶ユニット408からランダムアクセスメモリ(Random Access Memory、RAM)403にアップロードされるコンピュータプログラムに応じて、様々な適切な動作及び処理を実行することができる。RAM403には、デバイス400の操作に必要な様々なプログラムおよびデータが記憶されてもよい。コンピューティングユニット401、ROM402およびRAM403は、バス40を通じて互いに接続されている。入力/出力(I/O)インターフェース405もバス404に接続されている。
デバイス400内の複数の構成要素は、I/Oインターフェース405に接続され、例えば、キーボード、マウスなどの入力ユニット406と、例えば、様々なタイプのディスプレイ、スピーカなどの出力ユニット407と、例えば、磁気ディスク、光ディスクなどの記憶ユニット408と、例えば、ネットワークカード、モデム、無線通信送受信機などの通信ユニット409と、を備える。通信ユニット409は、デバイス400がインターネットなどのコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して別のデバイスと情報およびデータを交換することを可能にする。
コンピューティングユニット401は様々な処理およびコンピューティング機能を有する汎用及び/又は特定用途向け処理コンポーネントであってもよい。コンピューティングユニット401のいくつかの例には、中央処理ユニット(Central Processing Unit、CPU)、グラフィックスプロセッサ(Graphics Processing Unit、GPU)、様々な特定用途向けの人工知能(Artificial Intelligence、AI)コンピューティングチップ、機械学習モデルアルゴリズムを実行する様々なコンピューティングユニット、デジタル信号処理装置(Digital Signal Processing、DSP)、および任意の適切なプロセッサ、コントローラ、マイクロコントローラなどが含まれるが、これらに限定されない。コンピューティングユニット401は、上述した様々な方法および処理、例えば、データ注釈方法を実行する。例えば、いくつかの実施例において、データ注釈方法は、例えば、記憶ユニット408などの機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムによって実現可能である。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ROM402及び/又は通信ユニット409を介してデバイス400にアップロード及び/又はインストールされ得る。コンピュータプログラムがRAM403にアップロードされ、コンピューティングユニット401に実行されると、上述したデータ注釈方法の1つ又は複数のステップが実行されることになる。好ましくは、別の実施例において、コンピューティングユニット401は、他の任意の適切な形態で(例えば、ファームウェアによって)データ注釈方法を実行するように構成される。
本明細書に記載のシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array、FPGA)、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、特定用途向け標準製品(Application Specific Standard Product、ASSP)、組み込みシステムオンチップ(System-On-a-Chip、SOC)、複雑なプログラマブル・ロジック・デバイス(Complex Programmable Logic Device、CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせによって実現可能である。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施され、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行及び/又は解釈可能であり、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置および少なくとも1つの出力装置からデータおよび命令を受信し、データおよび命令を当該記憶システム、当該少なくとも1つの入力装置、および当該少なくとも1つの出力装置に伝送することができる。
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせでプログラミングできる。これらのプログラムコードは、汎用コンピュータ、特定用途向けコンピュータ又はその他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されることで、プログラムコードがプロセッサ又はコントローラによって実行される場合、フロー図及び/又はブロック図に規定される機能/操作が実施される。プログラムコードは、全部マシンで実施されてもよく、一部がマシンで実施されてもよく、独立したパッケージソフトウェアとして部分的にマシンで実行および部分的にリモートマシンで実行、又は、全部リモートマシン又はサーバで実行されてもよい。
本開示の文脈において、機械可読媒体は、命令実行システム、装置又はデバイスに使用され、又は、命令実行システム、装置又はデバイスと組み合わせて使用されるプログラムが含まれ、又は、記憶される有形媒体でもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体でもよい。機械可読媒体は、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又はデバイス、又は上述した内容の任意の適切な組み合わせを含んでもよいが、これに限定されるものではない。機械可読記憶媒体のより具体的な例には、1つ又は複数のケーブルに基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、消去可能プログラマブル読取専用メモリ(Erasable Programmable Read Only Memory、EPROM又はフラッシュメモリ)、光ファイバ、コンパクトディスクによる読み出し専用メモリ(Compact Disc Read Only Memory、CD-ROM)、光学記憶装置、磁気記憶装置、又は上述した内容の任意の適切な組み合わせが含まれる。
本明細書に記載のシステム及び技術は、ユーザとの相互作用を提供するために、ユーザに情報を表示するための表示装置、例えば、陰極線管(Cathode Ray Tube、CRT)又は液晶ディスプレイ(Liquid Crystal Display、LCD)モニタと、キーボードおよびポインティングデバイス(Pointing device)、例えば、マウス又はトラックボールと、を有するコンピュータで実施されてもよく、ユーザは、当該キーボード及び当該ポインティングデバイスを介してコンピュータに入力を提供してもよい。ユーザとの相互作用を提供するために、その他のタイプの装置を使用してもよく、例えば、ユーザに提供されるフィードバックは、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックの任意の形態の感覚フィードバックであってもよく、任意の形態(音声入力、触覚入力、触覚入力を含む)でユーザからの入力を受信してもよい。
本明細書に記載のシステムおよび技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとして)、又は、ミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又は、フロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィックスユーザインターフェース、又は、ネットワークブラウザを有するユーザコンピュータ、ユーザは当該グラフィックスユーザインターフェース又は当該ネットワークブラウザを介して本明細書に記載のシステムおよび技術の実施形態と相互作用してもよい)、又は、これらのバックエンド構成要素、ミドルウェア構成要素、又は、フロントエンド構成要素の任意の組み合わせを含むコンピューティングシステムで実施されてもよい。システムの構成要素は、任意の形態又は媒体によるデジタルデータ通信(例えば、通信ネットワーク)によって相互接続されてもよい。通信ネットワークの例には、ローカルエリアネットワーク(Local Area Network、LAN)、ワイドエリアネットワーク(Wide Area Network、WAN)、ブロックチェーンネットワーク(Blockchain Network)およびインターネットが含まれる。
コンピュータシステムは、クライアントおよびサーバを含んでもよい。クライアントとサーバは、通常互いに遠く離れており、通常通信ネットワークを介して相互作用を実行する。それぞれのコンピュータで運転され、互いにクライアント―サーバ関係を有するコンピュータプログラムによってクライアントとサーバの関係を生成する。サーバは、クラウドコンピューティングサーバ又はクラウドホストとも呼ばれるクラウドサーバでもよいが、これはクラウドコンピューティングサービスシステムにおける1つのホスト製品として、従来の物理ホストとVPSサービスに存在する、管理の難易度が高く、業務の拡張性が弱いという欠点を解決した。
本願の実施例は、データ注釈要素および注釈操作行列などのデータ注釈因子を確定した後、データ注釈要素に応じて注釈待ちデータを取得し、注釈操作行列に応じて注釈待ちデータに対して注釈を行うことで、従来のデータ注釈方法において存在するメンテナンスコスト及び使用コストが高く、汎用性が低く、効率性が低い等の問題を解決するので、データ注釈のメンテナンスコストおよび使用コストを削減し、データ注釈の汎用性および効率性を向上させる。
なお、上記の様々な形態のプロセスを使用して、ステップの並べ替え、追加又は削除ができる。例えば、本発明の開示に記載される各ステップは、並行的に実行してもよく、順次的に実行してもよく、異なる順序で実行してもよく、本開示に開示される技術案で要望される結果が達成できるものであれば、本明細書において、これらを限定するものではないことを理解すべきである。
上述した具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件およびその他の要因に従って様々な修正、組み合わせ、下位の組み合わせ及び代替を実行できることを了承すべきである。本開示の精神と原則の範囲内で行われるいわゆる修正、同等な置換および改良等は、すべて本開示の保護範囲に含まれるべきである。

Claims (11)

  1. コンピュータによって実行されるデータ注釈方法であって、
    データ注釈要素および注釈操作行列が含まれるデータ注釈因子を確定することと、
    前記データ注釈要素に応じて注釈待ちデータを取得することと、
    前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことと、を含み、
    前記データ注釈要素に応じて注釈待ちデータを取得することは、
    前記データ注釈要素の要素タイプに応じて目標要素タイプを確定することと、
    前記目標要素タイプに応じて前記注釈待ちデータを取得することと、を含む
    データ注釈方法。
  2. データ注釈因子を確定することは、
    前記データ注釈要素の要素タイプを確定することと、
    前記注釈操作行列の行要素の行数量と列要素の列数量を確定することと、を含み、
    前記要素タイプは、オーディオデータ要素、ビデオデータ要素、ピクチャデータ要素、テキストデータ要素およびウェブページデータ要素を含み、
    前記注釈操作行列の行要素が前記注釈待ちデータを確定することに用いられ、
    前記注釈操作行列の列要素が前記注釈待ちデータにマッチングする注釈属性を確定することに用いられる、
    請求項1に記載のデータ注釈方法。
  3. 前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことは、
    前記注釈待ちデータに応じて前記注釈操作行列における各行要素に対応する注釈待ちサブデータおよび各列要素に対応する注釈属性を確定することと、
    前記注釈操作行列の行要素と各前記注釈待ちサブデータとのマッピング関係を構築することと、
    行要素と列要素との間、行要素と行要素との間、又は列要素と列要素との間の属性制約関係を構築することと、
    各前記列要素に対応する注釈属性および前記属性制約関係に応じて各前記注釈待ちサブデータに対して注釈を行うことと、を含み、
    前記属性制約関係は、対応関係、包含関係、被包含関係、相互排他関係および連動関係を含む、
    請求項1に記載のデータ注釈方法。
  4. データクレンジングシナリオに適用され、
    前記注釈操作行列の行数量を第1の数量、前記注釈操作行列の列数量を第2の数量とする場合
    前記注釈操作行列における各列要素に対応する注釈属性を確定することは、
    第1の列要素の注釈属性をデータフィルタリングに確定することと、
    第2の列要素の注釈属性をフィルタリングタイプに確定することと、を含み、
    行要素と列要素との間の属性制約関係を構築することは、
    前記行要素と前記列要素との対応関係を構築することを含む、
    請求項に記載のデータ注釈方法。
  5. データ切り取りシナリオに適用され、
    前記注釈操作行列の行数量を第3の数量、前記注釈操作行列の列数量を第2の数量とする場合、
    前記注釈操作行列における各列要素に対応する注釈属性を確定することは、
    第1の列要素の注釈属性をデータ番号に確定することと、
    第2の列要素の注釈属性を、注釈待ちサブデータのうちのいくつかのセグメントであるデータの目標セグメントに確定することと、
    第3の列要素の注釈属性をデータタイトルに確定することと、
    第4の列要素の注釈属性をデータセグメント時間長に確定することと、を含み、
    行要素と列要素との間の属性制約関係を構築することは、
    前記行要素と前記列要素との対応関係を構築することを含む、
    請求項に記載のデータ注釈方法。
  6. データ抽出シナリオに適用され、
    前記注釈操作行列の行数量を第3の数量、前記注釈操作行列の列数量を第2の数量とする場合、
    前記注釈操作行列における各列要素に対応する注釈属性を確定することは、
    第1の列要素の注釈属性をデータ番号に確定することと、
    第2の列要素の注釈属性をデータ開始及び終了位置に確定することと、
    第3の列要素の注釈属性を、注釈待ちサブデータから抽出されたデータコンテンツであるデータ抽出コンテンツに確定することと、
    第4の列要素の注釈属性を、各前記データ抽出コンテンツに対応するタイプであるデータ抽出タイプに確定することと、
    第5の列要素の注釈属性を、データ自体のカラー又は背景カラーであるデータ抽出カラーに確定することと、を含み、
    行要素と列要素との間の属性制約関係を構築することは、
    前記行要素と前記列要素との対応関係を構築することを含み
    列要素と列要素との間の属性制約関係を構築することは、
    目標列要素間の連動関係を構築することを含む、
    請求項に記載のデータ注釈方法。
  7. データ識別シナリオに適用され、
    前記注釈操作行列の行数量を第3の数量、前記注釈操作行列の列数量を第2の数量とする場合、
    前記注釈操作行列における各列要素に対応する注釈属性を確定することは、
    第1の列要素の注釈属性をデータ番号に確定することと、
    第2の列要素の注釈属性をデータ開始及び終了時間に確定することと、
    第3の列要素の注釈属性を、注釈待ちサブデータを識別し得られたコンテンツであるデータ識別コンテンツに確定することと、
    第4の列要素の注釈属性をデータセグメント時間長に確定することと、
    第5の列要素の注釈属性を、注釈待ちサブデータに含まれているキャラクタコンテンツであるデータキャラクタに確定することと、を含み、
    行要素と列要素との間の属性制約関係を構築することは、
    前記行要素と前記列要素との対応関係を構築することを含む、
    請求項に記載のデータ注釈方法。
  8. データ注釈要素および注釈操作行列が含まれるデータ注釈因子を確定することに用いられるデータ注釈因子確定モジュールと、
    前記データ注釈要素に応じて注釈待ちデータを取得することに用いられる注釈待ちデータ取得モジュールと、
    前記注釈操作行列に応じて前記注釈待ちデータに対して注釈を行うことに用いられる注釈待ちデータ注釈モジュールと、を備え
    前記データ注釈要素に応じて注釈待ちデータを取得することは、
    前記データ注釈要素の要素タイプに応じて目標要素タイプを確定することと、
    前記目標要素タイプに応じて前記注釈待ちデータを取得することと、を含む
    データ注釈装置。
  9. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されるメモリと、を備え、
    前記メモリに、前記少なくとも1つのプロセッサに実行可能な命令が記憶され、
    前記命令は、前記少なくとも1つのプロセッサが請求項1~のいずれか1項に記載のデータ注釈方法を実行可能であるように、前記少なくとも1つのプロセッサに実行される、
    電子機器。
  10. 請求項1~のいずれか1項に記載のデータ注釈方法をコンピュータに実行させるためのコンピュータ命令が記憶されている、
    非一時的なコンピュータ可読記憶媒体。
  11. プロセッサによって実行されると、請求項1~のいずれか1項に記載のデータ注釈方法を実現する、コンピュータプログラム。
JP2021181414A 2020-12-09 2021-11-05 データ注釈方法、装置、電子機器および記憶媒体 Active JP7309811B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011449187.5 2020-12-09
CN202011449187.5A CN112528610B (zh) 2020-12-09 2020-12-09 一种数据标注方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
JP2022091686A JP2022091686A (ja) 2022-06-21
JP7309811B2 true JP7309811B2 (ja) 2023-07-18

Family

ID=74998711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021181414A Active JP7309811B2 (ja) 2020-12-09 2021-11-05 データ注釈方法、装置、電子機器および記憶媒体

Country Status (5)

Country Link
US (1) US20220019592A1 (ja)
EP (1) EP3961433A3 (ja)
JP (1) JP7309811B2 (ja)
KR (1) KR20210125448A (ja)
CN (1) CN112528610B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157170B (zh) * 2021-03-25 2022-09-20 北京百度网讯科技有限公司 数据的标注方法和装置
CN113449142A (zh) * 2021-06-30 2021-09-28 北京百度网讯科技有限公司 信息处理方法及装置、电子设备、存储介质及产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180211273A1 (en) 2017-01-24 2018-07-26 Ranjan Dutta Database conditional field access
JP2019046108A (ja) 2017-08-31 2019-03-22 大日本印刷株式会社 管理装置、制御方法及びプログラム
JP2020101968A (ja) 2018-12-21 2020-07-02 株式会社 日立産業制御ソリューションズ マルチラベルデータ学習支援装置、マルチラベルデータ学習支援方法およびマルチラベルデータ学習支援プログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020019837A1 (en) * 2000-08-11 2002-02-14 Balnaves James A. Method for annotating statistics onto hypertext documents
JP3557162B2 (ja) * 2000-09-07 2004-08-25 株式会社東芝 データ抽出方法、データ抽出装置および記録媒体
US20040260717A1 (en) * 2003-06-20 2004-12-23 International Business Machines Corporation Universal annotation server and interface
JP2006048286A (ja) * 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
US20150033109A1 (en) * 2013-07-26 2015-01-29 Alex Marek Presenting mutlimedia objects with annotations
JP6582530B2 (ja) * 2015-05-11 2019-10-02 富士通株式会社 支援プログラム、支援方法および支援装置
US11151100B2 (en) * 2016-10-17 2021-10-19 Sap Se Performing data quality functions using annotations
US11036725B2 (en) * 2017-08-14 2021-06-15 Science Applications International Corporation System and method for computerized data processing, analysis and display
US10521734B2 (en) * 2018-04-20 2019-12-31 Sas Institute Inc. Machine learning predictive labeling system
US11556710B2 (en) * 2018-05-11 2023-01-17 International Business Machines Corporation Processing entity groups to generate analytics
CN110866936B (zh) * 2018-08-07 2023-05-23 创新先进技术有限公司 视频标注方法、跟踪方法、装置、计算机设备及存储介质
CN109785942A (zh) * 2019-01-24 2019-05-21 邃蓝智能科技(上海)有限公司 一种医疗影像数据的快速辅助标注及存储方法和系统
CN110598743A (zh) * 2019-08-12 2019-12-20 北京三快在线科技有限公司 一种目标对象的标注方法和装置
CN110750965B (zh) * 2019-09-16 2023-06-30 平安科技(深圳)有限公司 英文文本序列标注方法、系统及计算机设备
CN111598120A (zh) * 2020-03-31 2020-08-28 宁波吉利汽车研究开发有限公司 数据标注方法、设备及装置
CN111488925B (zh) * 2020-04-07 2023-10-20 北京百度网讯科技有限公司 一种数据标注方法、装置、电子设备及存储介质
CN111524503B (zh) * 2020-04-15 2023-01-17 上海明略人工智能(集团)有限公司 音频数据的处理方法、装置、音频识别设备和存储介质
CN111695053A (zh) * 2020-06-12 2020-09-22 上海智臻智能网络科技股份有限公司 序列标注方法、数据处理设备、可读存储介质
CN111754978B (zh) * 2020-06-15 2023-04-18 北京百度网讯科技有限公司 韵律层级标注方法、装置、设备和存储介质
CN111860304B (zh) * 2020-07-17 2024-04-30 北京百度网讯科技有限公司 一种图像标注方法、电子装置、设备及存储介质
US20220405295A1 (en) * 2021-06-17 2022-12-22 Sap Se Metadata integration based on scope function definition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180211273A1 (en) 2017-01-24 2018-07-26 Ranjan Dutta Database conditional field access
JP2019046108A (ja) 2017-08-31 2019-03-22 大日本印刷株式会社 管理装置、制御方法及びプログラム
JP2020101968A (ja) 2018-12-21 2020-07-02 株式会社 日立産業制御ソリューションズ マルチラベルデータ学習支援装置、マルチラベルデータ学習支援方法およびマルチラベルデータ学習支援プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIUBIMOV, N et al.,"Introducing Label Studio, a swiss army knife of data labeling",Towards Data Science [online],2020年01月28日,[retrieved on 2022.12.01], Retrieved from the Internet: <URL: https://towardsdatascience.com/introducing-label-studio-a-swiss-army-knife-of-data-labeling-140c1be92881>

Also Published As

Publication number Publication date
EP3961433A3 (en) 2022-03-30
US20220019592A1 (en) 2022-01-20
CN112528610A (zh) 2021-03-19
KR20210125448A (ko) 2021-10-18
EP3961433A2 (en) 2022-03-02
CN112528610B (zh) 2023-11-14
JP2022091686A (ja) 2022-06-21

Similar Documents

Publication Publication Date Title
CN108628830B (zh) 一种语义识别的方法和装置
WO2024098623A1 (zh) 跨媒体检索及模型训练方法、装置、设备、菜谱检索系统
JP7309811B2 (ja) データ注釈方法、装置、電子機器および記憶媒体
CN118070072A (zh) 基于人工智能的问题处理方法、装置、设备及存储介质
JP2023002690A (ja) セマンティックス認識方法、装置、電子機器及び記憶媒体
JP2024502400A (ja) グラフ・ニューラル・ネットワークを用いたポータブル・ドキュメント・フォーマットの表形式データの自動描写及び抽出
CN112582073B (zh) 医疗信息获取方法、装置、电子设备和介质
CN110807097A (zh) 分析数据的方法和装置
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN117992569A (zh) 基于生成式大模型生成文档的方法、装置、设备及介质
CN115186738B (zh) 模型训练方法、装置和存储介质
CN113360672B (zh) 用于生成知识图谱的方法、装置、设备、介质和产品
CN114627343A (zh) 深度学习模型的训练方法、图像处理方法、装置及设备
JP2022068146A (ja) データ注釈方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN110795424B (zh) 特征工程变量数据请求处理方法、装置及电子设备
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN114490969A (zh) 基于表格的问答方法、装置以及电子设备
CN113138760A (zh) 一种页面生成方法、装置、电子设备和介质
CN112560466A (zh) 链接实体关联方法、装置、电子设备和存储介质
CN112527290A (zh) 基于生物特征信息搭建页面的方法和装置
CN113360712B (zh) 视频表示的生成方法、装置和电子设备
CN117171429B (zh) 热点内容处理方法、装置、电子设备及介质
CN112560462B (zh) 事件抽取服务的生成方法、装置、服务器以及介质
CN115982358B (zh) 文档拆分方法、装置、终端设备和计算机可读存储介质
CN115471840B (zh) 生成、模型的训练、识别方法、装置、电子设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230705

R150 Certificate of patent or registration of utility model

Ref document number: 7309811

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150