JP6701206B2 - ユーザーエクスペリエンスを向上させるためにあいまいな表現を弁別すること - Google Patents
ユーザーエクスペリエンスを向上させるためにあいまいな表現を弁別すること Download PDFInfo
- Publication number
- JP6701206B2 JP6701206B2 JP2017535358A JP2017535358A JP6701206B2 JP 6701206 B2 JP6701206 B2 JP 6701206B2 JP 2017535358 A JP2017535358 A JP 2017535358A JP 2017535358 A JP2017535358 A JP 2017535358A JP 6701206 B2 JP6701206 B2 JP 6701206B2
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- hypothesis
- natural language
- domain
- responses
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 title claims description 156
- 230000004044 response Effects 0.000 claims description 107
- 230000003993 interaction Effects 0.000 claims description 98
- 238000000034 method Methods 0.000 claims description 53
- 230000009471 action Effects 0.000 claims description 20
- 230000002452 interceptive effect Effects 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000010801 machine learning Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003490 calendering Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3349—Reuse of stored results of previous queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
コンテキスト情報を使用することによって自然言語表現からの対話仮説セットを作成するステップであって、対話仮説セットが少なくとも2つの対話仮説を有する、作成するステップと、対話仮説セットのための複数の対話応答を生成するステップと、複数の対話応答を複数のログ記録された対話応答と比較するステップと、複数の対話応答のうちの少なくとも1つが、ログ記録された対話応答のうちの少なくとも1つに一致するかどうかを判断するステップと、複数の対話応答のうちの少なくとも1つが、ログ記録された対話応答のうちの少なくとも1つに一致すると判断されたとき、少なくとも1つのログ記録された対話応答に一致する少なくとも1つの対話応答に対応する対話仮説セット中の2つの対話仮説のうちの少なくとも1つにラベルを付けるステップとを含む。さらなる例では、複数のログ記録された対話応答は、自然言語表現から生成された複数の応答を含む。さらなる例では、対話仮説セットを作成するステップは、自然言語表現から少なくとも1つの特徴を抽出するステップと、少なくとも2つの対話仮説を生成するステップであって、対話仮説セットの各対話仮説が、少なくとも1つの抽出された特徴を有する異なる自然言語表現を含む、生成するステップとを含む。さらなる例では、少なくとも1つのログ記録された対話応答に一致する少なくとも1つの対話応答に対応する対話仮説セット中の2つの対話仮説のうちの少なくとも1つにラベルを付けるステップは、少なくとも1つの抽出された特徴を有する自然言語表現が、関連する応答を生成するために使用され得ることを示す。
Claims (21)
- 少なくとも1つのプロセッサと、
少なくとも1つのプロセッサに、あいまいな要求を弁別するための方法を実施させるプログラムを記憶したメモリと
を含むシステムであって、前記方法は、
自然言語表現を受けるステップであって、前記自然言語表現は、テキストの単語、用語、および句のうちの少なくとも1つを含む、ステップと、
対話仮説セットを、前記自然言語表現から、コンテキスト情報を使用することによって作成するステップであって、前記対話仮説セットが、第1ドメインに対応する第1対話仮説と、第2ドメインに対応する第2対話仮説とを含む、ステップと、
第1ドメインエンジンコンポーネントおよび第2ドメインエンジンコンポーネントから、前記対話仮説セットのための複数の対話応答を生成するステップと、
機械学習技法により、前記第1ドメインエンジンコンポーネントおよび第2ドメインエンジンコンポーネントを、前記複数の前記対話応答の分析に基づいてランク付けするステップと、
最も高くランク付けされたドメインエンジンコンポーネントを用いてアクションを実施するステップと
を含む、システム。 - 請求項1に記載のシステムであって、前記自然言語表現は、音声言語入力およびテキスト入力のうちの少なくとも1つである、システム。
- 請求項1または2に記載のシステムであって、前記コンテキスト情報は、前に受けた自然言語表現から抽出された情報と、前に受けた自然言語表現に対する応答と、クライアントコンテキストと、ナレッジコンテンツとのうちの少なくとも1つを含む、システム。
- 請求項3に記載のシステムであって、前記前に受けた自然言語表現から抽出された前記情報は、少なくとも、ドメイン予測と、意図予測と、スロットタイプとを含む、システム。
- 請求項1から4のいずれか一項に記載のシステムであって、前記対話仮説セットを作成するステップは、
少なくとも1つの特徴を前記自然言語表現から抽出するステップと、
少なくとも2つの対話仮説を生成するステップであって、前記対話仮説セットの各対話仮説は、少なくとも1つの抽出された特徴を含む異なる自然言語表現を含む、ステップと
を含む、システム。 - 請求項1から5のいずれか一項に記載のシステムであって、前記対話仮説セットのための複数の対話応答を生成するステップは、前記対話仮説セットの各対話仮説について複数の応答を生成するステップを含む、システム。
- 請求項1から6のいずれか一項に記載のシステムであって、前記対話仮説セットのための複数の対話応答を生成するステップは、対話仮説をWebバックエンドエンジンに送るステップと、対話仮説をドメイン固有コンポーネントに送るステップとのうちの少なくとも1つを含む、システム。
- 請求項1から7のいずれか一項に記載のシステムであって、ランク付けする前記ステップは、
特徴を、前記対話仮説セット中の対話仮説から抽出するステップと、
抽出された前記特徴のためのスコアを計算するステップであって、計算された前記スコアは前記対話仮説セット内の対話仮説ランクを示す、ステップと
を含む、システム。 - 請求項1から8のいずれか一項に記載のシステムであって、ランク付けする前記ステップは、前記複数の前記対話応答を複数のログ記録された対話応答と比較するステップをさらに含む、システム。
- 請求項1から9のいずれか一項に記載のシステムであって、最も高くランク付けされたドメインエンジンコンポーネントを用いてアクションを実施するステップは、
最も高くランク付けされた対話仮説を用いて結果についてウェブバックエンドエンジンに問い合わせるステップと、
前記結果をクライアントコンピューティングデバイスのユーザに送るステップと
を含む、システム。
- 少なくとも1つのプロセッサに、対話コンポーネントをトレーニングしてあいまいな要求を弁別するための方法を実施させるプログラムであって、前記方法は、
自然言語表現を受けるステップであって、前記自然言語表現は、テキストの単語、用語、および句のうちの少なくとも1つを含む、ステップと、
対話仮説セットを、前記自然言語表現から、コンテキスト情報を使用することによって作成するステップであって、前記対話仮説セットが、第1ドメインに対応する第1対話仮説と、第2ドメインに対応する第2対話仮説とを含む、ステップと、
第1ドメインエンジンコンポーネントおよび第2ドメインエンジンコンポーネントから、前記対話仮説セットのための複数の対話応答を生成するステップと、
機械学習技法により、前記第1ドメインエンジンコンポーネントおよび第2ドメインエンジンコンポーネントを、前記複数の前記対話応答の分析に基づいてランク付けするステップと、
最も高くランク付けされたドメインエンジンコンポーネントを用いてアクションを実施するステップと
を含む、プログラム。 - 請求項11に記載のプログラムであって、前記方法は、前記複数の対話応答を複数のログ記録された対話応答と比較するステップをさらに含み、複数のログ記録された対話応答は、前記自然言語表現から生成された複数の応答を含む、プログラム。
- 請求項11または12に記載のプログラムであって、前記対話仮説セットを作成するステップは、
少なくとも1つの特徴を前記自然言語表現から抽出するステップと、
少なくとも2つの対話仮説を生成するステップであって、前記対話仮説セットの各対話仮説は、少なくとも1つの抽出された特徴を含む異なる自然言語表現を含む、ステップと
を含む、プログラム。 - 請求項12に記載のプログラムであって、前記方法は、
前記複数の対話応答のうちの少なくとも1つが前記ログ記録された対話応答のうちの少なくとも1つと一致するかを判定するステップと、
前記対話仮説セット内の少なくとも1つの対話仮説であって、前記少なくとも1つのログ記録された対話応答と一致する前記少なくとも1つの対話応答に対応する前記少なくとも1つの対話仮説をラベル付けするステップと
をさらに含む、プログラム。 - 請求項11から14のいずれか一項に記載のプログラムを含む1つまたは複数のコンピュータ可読記憶媒体。
- コンピュータが実行する方法であって、
自然言語表現を受けるステップであって、前記自然言語表現は、テキストの単語、用語、および句のうちの少なくとも1つを含む、ステップと、
対話仮説セットを、前記自然言語表現から、コンテキスト情報を使用することによって作成するステップであって、前記対話仮説セットが、第1ドメインに対応する第1対話仮説と、第2ドメインに対応する第2対話仮説とを含む、ステップと、
第1ドメインエンジンコンポーネントおよび第2ドメインエンジンコンポーネントから、前記対話仮説セットのための複数の対話応答を生成するステップと、
機械学習技法により、前記第1ドメインエンジンコンポーネントおよび第2ドメインエンジンコンポーネントを、前記複数の前記対話応答の分析に基づいてランク付けするステップと、
最も高くランク付けされたドメインエンジンコンポーネントを用いてアクションを実施するステップと
を含む方法。 - 請求項16に記載のコンピュータが実行する方法であって、前記自然言語表現は、音声言語入力およびテキスト入力のうちの少なくとも1つである、方法。
- 請求項16または17に記載のコンピュータが実行する方法であって、前記コンテキスト情報は、前に受けた自然言語表現から抽出された情報と、前に受けた自然言語表現に対する応答と、クライアントコンテキストと、ナレッジコンテンツとのうちの少なくとも1つを含む、方法。
- 請求項18に記載のコンピュータが実行する方法であって、前記前に受けた自然言語表現から抽出された前記情報は、少なくとも、ドメイン予測と、意図予測と、スロットタイプとを含む、方法。
- 請求項16から19のいずれか一項に記載のコンピュータが実行する方法であって、前記対話仮説セットを作成するステップは、
少なくとも1つの特徴を前記自然言語表現から抽出するステップと、
少なくとも2つの対話仮説を生成するステップであって、前記対話仮説セットの各対話仮説は、少なくとも1つの抽出された特徴を含む異なる自然言語表現を含む、ステップと
を含む、方法。 - 請求項16から20のいずれか一項に記載のコンピュータが実行する方法であって、前記対話仮説セットのための複数の対話応答を生成するステップは、前記対話仮説セットの各対話仮説について複数の応答を生成するステップを含む、方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/586,395 US9836452B2 (en) | 2014-12-30 | 2014-12-30 | Discriminating ambiguous expressions to enhance user experience |
US14/586,395 | 2014-12-30 | ||
PCT/US2015/067238 WO2016109307A2 (en) | 2014-12-30 | 2015-12-22 | Discriminating ambiguous expressions to enhance user experience |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018506113A JP2018506113A (ja) | 2018-03-01 |
JP2018506113A5 JP2018506113A5 (ja) | 2019-01-31 |
JP6701206B2 true JP6701206B2 (ja) | 2020-05-27 |
Family
ID=55073177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017535358A Active JP6701206B2 (ja) | 2014-12-30 | 2015-12-22 | ユーザーエクスペリエンスを向上させるためにあいまいな表現を弁別すること |
Country Status (11)
Country | Link |
---|---|
US (2) | US9836452B2 (ja) |
EP (1) | EP3241125A2 (ja) |
JP (1) | JP6701206B2 (ja) |
KR (1) | KR102602475B1 (ja) |
CN (1) | CN107111611A (ja) |
AU (2) | AU2015374382B2 (ja) |
BR (1) | BR112017010222A2 (ja) |
CA (1) | CA2968016C (ja) |
MX (1) | MX367096B (ja) |
RU (1) | RU2017122991A (ja) |
WO (1) | WO2016109307A2 (ja) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9690776B2 (en) | 2014-12-01 | 2017-06-27 | Microsoft Technology Licensing, Llc | Contextual language understanding for multi-turn language tasks |
US9836452B2 (en) | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
JP2016189128A (ja) * | 2015-03-30 | 2016-11-04 | ファナック株式会社 | プログラム中のあいまい検索機能を備えた数値制御装置 |
US10418032B1 (en) * | 2015-04-10 | 2019-09-17 | Soundhound, Inc. | System and methods for a virtual assistant to manage and use context in a natural language dialog |
US10372755B2 (en) * | 2015-09-23 | 2019-08-06 | Motorola Solutions, Inc. | Apparatus, system, and method for responding to a user-initiated query with a context-based response |
US10262062B2 (en) * | 2015-12-21 | 2019-04-16 | Adobe Inc. | Natural language system question classifier, semantic representations, and logical form templates |
US11017767B2 (en) * | 2016-03-29 | 2021-05-25 | Microsoft Technology Licensing, Llc | Hierarchical attention for spoken dialogue state tracking |
US9858265B1 (en) * | 2016-06-08 | 2018-01-02 | Rovi Guides, Inc. | Systems and methods for determining context switching in conversation |
US10223067B2 (en) * | 2016-07-15 | 2019-03-05 | Microsoft Technology Licensing, Llc | Leveraging environmental context for enhanced communication throughput |
US10573299B2 (en) * | 2016-08-19 | 2020-02-25 | Panasonic Avionics Corporation | Digital assistant and associated methods for a transportation vehicle |
US10102200B2 (en) | 2016-08-25 | 2018-10-16 | International Business Machines Corporation | Predicate parses using semantic knowledge |
US20180090141A1 (en) * | 2016-09-29 | 2018-03-29 | Microsoft Technology Licensing, Llc | Conversational interactions using superbots |
US10437841B2 (en) * | 2016-10-10 | 2019-10-08 | Microsoft Technology Licensing, Llc | Digital assistant extension automatic ranking and selection |
US10446144B2 (en) | 2016-11-21 | 2019-10-15 | Google Llc | Providing prompt in an automated dialog session based on selected content of prior automated dialog session |
EP3561643B1 (en) * | 2017-01-20 | 2023-07-19 | Huawei Technologies Co., Ltd. | Method and terminal for implementing voice control |
US10860628B2 (en) * | 2017-02-16 | 2020-12-08 | Google Llc | Streaming real-time dialog management |
US20180253638A1 (en) * | 2017-03-02 | 2018-09-06 | Accenture Global Solutions Limited | Artificial Intelligence Digital Agent |
US10372824B2 (en) | 2017-05-15 | 2019-08-06 | International Business Machines Corporation | Disambiguating concepts in natural language |
US11043205B1 (en) * | 2017-06-27 | 2021-06-22 | Amazon Technologies, Inc. | Scoring of natural language processing hypotheses |
US10446147B1 (en) * | 2017-06-27 | 2019-10-15 | Amazon Technologies, Inc. | Contextual voice user interface |
EP3451189B1 (en) * | 2017-08-30 | 2020-12-02 | Deutsche Telekom AG | A system and method for user query recognition |
CN117112761A (zh) * | 2017-09-05 | 2023-11-24 | 声音猎手公司 | 域间通过语法槽的分类 |
JP6857581B2 (ja) * | 2017-09-13 | 2021-04-14 | 株式会社日立製作所 | 成長型対話装置 |
US11113608B2 (en) | 2017-10-30 | 2021-09-07 | Accenture Global Solutions Limited | Hybrid bot framework for enterprises |
US10713300B2 (en) * | 2017-11-03 | 2020-07-14 | Google Llc | Using distributed state machines for human-to-computer dialogs with automated assistants to protect private data |
KR101970899B1 (ko) | 2017-11-27 | 2019-04-24 | 주식회사 머니브레인 | 문맥 기반으로 음성 인식의 성능을 향상하기 위한 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
KR101959292B1 (ko) | 2017-12-08 | 2019-03-18 | 주식회사 머니브레인 | 문맥 기반으로 음성 인식의 성능을 향상하기 위한 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
JP2019106054A (ja) * | 2017-12-13 | 2019-06-27 | 株式会社東芝 | 対話システム |
US10741176B2 (en) | 2018-01-31 | 2020-08-11 | International Business Machines Corporation | Customizing responses to users in automated dialogue systems |
US10430447B2 (en) | 2018-01-31 | 2019-10-01 | International Business Machines Corporation | Predicting intent of a user from anomalous profile data |
US10231285B1 (en) * | 2018-03-12 | 2019-03-12 | International Business Machines Corporation | Cognitive massage dynamic response optimization |
US11568863B1 (en) * | 2018-03-23 | 2023-01-31 | Amazon Technologies, Inc. | Skill shortlister for natural language processing |
US10929601B1 (en) * | 2018-03-23 | 2021-02-23 | Amazon Technologies, Inc. | Question answering for a multi-modal system |
US11010436B1 (en) | 2018-04-20 | 2021-05-18 | Facebook, Inc. | Engaging users by personalized composing-content recommendation |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US11145300B2 (en) | 2018-05-07 | 2021-10-12 | Google Llc | Activation of remote devices in a networked system |
US10956462B1 (en) * | 2018-06-21 | 2021-03-23 | Amazon Technologies, Inc. | System answering of user inputs |
US11868728B1 (en) * | 2018-09-19 | 2024-01-09 | Amazon Technologies, Inc. | Multi-domain skills |
CN109325234B (zh) * | 2018-10-10 | 2023-06-20 | 深圳前海微众银行股份有限公司 | 语句处理方法、设备及计算机可读存储介质 |
CN111566727B (zh) * | 2018-10-25 | 2023-09-01 | 微软技术许可有限责任公司 | 全双工语音对话中的多阶段响应 |
KR20200055836A (ko) * | 2018-11-12 | 2020-05-22 | 삼성전자주식회사 | 데이터 분류 방법 및 장치, 분류기의 학습 방법 및 장치 |
CN109712619B (zh) * | 2018-12-24 | 2020-12-11 | 出门问问信息科技有限公司 | 一种解耦对话假设并执行的方法、装置及语音交互系统 |
US10943588B2 (en) * | 2019-01-03 | 2021-03-09 | International Business Machines Corporation | Methods and systems for managing voice response systems based on references to previous responses |
CN111552784A (zh) * | 2019-02-12 | 2020-08-18 | 厦门邑通软件科技有限公司 | 一种基于abc沟通法则的人机对话方法 |
US11194796B2 (en) * | 2019-02-14 | 2021-12-07 | Microsoft Technology Licensing, Llc | Intuitive voice search |
CN110188182B (zh) * | 2019-05-31 | 2023-10-27 | 中国科学院深圳先进技术研究院 | 模型训练方法、对话生成方法、装置、设备及介质 |
US11302330B2 (en) * | 2019-06-03 | 2022-04-12 | Microsoft Technology Licensing, Llc | Clarifying questions for rewriting ambiguous user utterance |
US11256868B2 (en) * | 2019-06-03 | 2022-02-22 | Microsoft Technology Licensing, Llc | Architecture for resolving ambiguous user utterance |
US12038953B2 (en) | 2019-06-27 | 2024-07-16 | Sony Group Corporation | Information processing apparatus and information processing method |
US11328711B2 (en) * | 2019-07-05 | 2022-05-10 | Korea Electronics Technology Institute | User adaptive conversation apparatus and method based on monitoring of emotional and ethical states |
US20210064658A1 (en) * | 2019-09-04 | 2021-03-04 | International Business Machines Corporation | Geofencing queries based on query intent and result semantics |
KR20210036169A (ko) | 2019-09-25 | 2021-04-02 | 현대자동차주식회사 | 대화 시스템, 대화 처리 방법, 번역 장치 및 번역 방법 |
US10841251B1 (en) * | 2020-02-11 | 2020-11-17 | Moveworks, Inc. | Multi-domain chatbot |
US10798031B1 (en) | 2020-04-13 | 2020-10-06 | Moveworks, Inc. | Generic disambiguation |
US11250853B2 (en) | 2020-04-30 | 2022-02-15 | Robert Bosch Gmbh | Sarcasm-sensitive spoken dialog system |
US11508372B1 (en) * | 2020-06-18 | 2022-11-22 | Amazon Technologies, Inc. | Natural language input routing |
US10818293B1 (en) | 2020-07-14 | 2020-10-27 | Drift.com, Inc. | Selecting a response in a multi-turn interaction between a user and a conversational bot |
CN112000787B (zh) * | 2020-08-17 | 2021-05-14 | 上海小鹏汽车科技有限公司 | 语音交互方法、服务器和语音交互系统 |
CN111985249B (zh) * | 2020-09-03 | 2024-10-08 | 贝壳技术有限公司 | 语义分析方法、装置、计算机可读存储介质及电子设备 |
KR102339794B1 (ko) | 2020-12-04 | 2021-12-16 | 주식회사 애자일소다 | 질의 응답 서비스 장치 및 방법 |
KR20220094400A (ko) * | 2020-12-29 | 2022-07-06 | 현대자동차주식회사 | 대화 시스템, 그를 가지는 차량 및 대화 시스템의 제어 방법 |
US11977852B2 (en) * | 2022-01-12 | 2024-05-07 | Bank Of America Corporation | Anaphoric reference resolution using natural language processing and machine learning |
US20230328810A1 (en) * | 2022-04-06 | 2023-10-12 | Theatro Labs, Inc. | Target disambiguation in a computer mediated communication system |
US20240161737A1 (en) * | 2022-11-15 | 2024-05-16 | Soundhound, Inc. | Real-time natural language processing and fulfillment |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5519608A (en) * | 1993-06-24 | 1996-05-21 | Xerox Corporation | Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation |
US6272488B1 (en) | 1998-04-01 | 2001-08-07 | International Business Machines Corporation | Managing results of federated searches across heterogeneous datastores with a federated collection object |
US6266668B1 (en) | 1998-08-04 | 2001-07-24 | Dryken Technologies, Inc. | System and method for dynamic data-mining and on-line communication of customized information |
US6745177B2 (en) | 1999-04-09 | 2004-06-01 | Metro One Telecommunications, Inc. | Method and system for retrieving data from multiple data sources using a search routing database |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US20030214523A1 (en) * | 2002-05-16 | 2003-11-20 | Kuansan Wang | Method and apparatus for decoding ambiguous input using anti-entities |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US20050004905A1 (en) | 2003-03-03 | 2005-01-06 | Scott Dresden | Search engine with neural network weighting based on parametric user data |
US8301436B2 (en) | 2003-05-29 | 2012-10-30 | Microsoft Corporation | Semantic object synchronous understanding for highly interactive interface |
US7373351B2 (en) | 2003-08-18 | 2008-05-13 | Sap Ag | Generic search engine framework |
US20050149496A1 (en) | 2003-12-22 | 2005-07-07 | Verity, Inc. | System and method for dynamic context-sensitive federated search of multiple information repositories |
KR100612839B1 (ko) * | 2004-02-18 | 2006-08-18 | 삼성전자주식회사 | 도메인 기반 대화 음성인식방법 및 장치 |
US7921091B2 (en) | 2004-12-16 | 2011-04-05 | At&T Intellectual Property Ii, L.P. | System and method for providing a natural language interface to a database |
US8214310B2 (en) | 2005-05-18 | 2012-07-03 | International Business Machines Corporation | Cross descriptor learning system, method and program product therefor |
US8041570B2 (en) * | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7590541B2 (en) | 2005-09-30 | 2009-09-15 | Rockwell Automation Technologies, Inc. | HMI presentation layer configuration system |
US7783620B1 (en) | 2007-06-29 | 2010-08-24 | Emc Corporation | Relevancy scoring using query structure and data structure for federated search |
US9063975B2 (en) * | 2013-03-15 | 2015-06-23 | International Business Machines Corporation | Results of question and answer systems |
GB0800925D0 (en) * | 2008-01-18 | 2008-02-27 | Akuwudike Ugochukwu | A web-based natural language communications system and method |
US8180754B1 (en) | 2008-04-01 | 2012-05-15 | Dranias Development Llc | Semantic neural network for aggregating query searches |
US10025855B2 (en) | 2008-07-28 | 2018-07-17 | Excalibur Ip, Llc | Federated community search |
US9978365B2 (en) * | 2008-10-31 | 2018-05-22 | Nokia Technologies Oy | Method and system for providing a voice interface |
US8140328B2 (en) | 2008-12-01 | 2012-03-20 | At&T Intellectual Property I, L.P. | User intention based on N-best list of recognition hypotheses for utterances in a dialog |
US8275788B2 (en) * | 2009-11-17 | 2012-09-25 | Glace Holding Llc | System and methods for accessing web pages using natural language |
US9495460B2 (en) | 2009-05-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Merging search results |
JP5379627B2 (ja) * | 2009-09-29 | 2013-12-25 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 検索制御装置、検索制御方法、及びプログラム |
US8756233B2 (en) * | 2010-04-16 | 2014-06-17 | Video Semantics | Semantic segmentation and tagging engine |
GB201010545D0 (en) * | 2010-06-23 | 2010-08-11 | Rolls Royce Plc | Entity recognition |
US8812321B2 (en) * | 2010-09-30 | 2014-08-19 | At&T Intellectual Property I, L.P. | System and method for combining speech recognition outputs from a plurality of domain-specific speech recognizers via machine learning |
US9760566B2 (en) * | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
KR20140014200A (ko) * | 2011-03-31 | 2014-02-05 | 마이크로소프트 코포레이션 | 구어체 대화 학습 및 정정 |
US9842168B2 (en) * | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9064006B2 (en) * | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
CA2747153A1 (en) * | 2011-07-19 | 2013-01-19 | Suleman Kaheer | Natural language processing dialog system for obtaining goods, services or information |
AU2012232977A1 (en) * | 2011-09-30 | 2013-04-18 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US8645361B2 (en) | 2012-01-20 | 2014-02-04 | Microsoft Corporation | Using popular queries to decide when to federate queries |
US20140006012A1 (en) | 2012-07-02 | 2014-01-02 | Microsoft Corporation | Learning-Based Processing of Natural Language Questions |
US9465833B2 (en) * | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
US10282419B2 (en) * | 2012-12-12 | 2019-05-07 | Nuance Communications, Inc. | Multi-domain natural language processing architecture |
US10235358B2 (en) | 2013-02-21 | 2019-03-19 | Microsoft Technology Licensing, Llc | Exploiting structured content for unsupervised natural language semantic parsing |
US9582608B2 (en) * | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US9336485B2 (en) | 2013-06-11 | 2016-05-10 | International Business Machines Corporation | Determining answers in a question/answer system when answer is not contained in corpus |
JP5734354B2 (ja) * | 2013-06-26 | 2015-06-17 | ファナック株式会社 | 工具クランプ装置 |
US9275115B2 (en) * | 2013-07-16 | 2016-03-01 | International Business Machines Corporation | Correlating corpus/corpora value from answered questions |
US9524289B2 (en) * | 2014-02-24 | 2016-12-20 | Nuance Communications, Inc. | Automated text annotation for construction of natural language understanding grammars |
US9836452B2 (en) | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
-
2014
- 2014-12-30 US US14/586,395 patent/US9836452B2/en active Active
-
2015
- 2015-12-22 AU AU2015374382A patent/AU2015374382B2/en active Active
- 2015-12-22 KR KR1020177018038A patent/KR102602475B1/ko active IP Right Grant
- 2015-12-22 MX MX2017008583A patent/MX367096B/es active IP Right Grant
- 2015-12-22 CN CN201580070449.8A patent/CN107111611A/zh active Pending
- 2015-12-22 RU RU2017122991A patent/RU2017122991A/ru not_active Application Discontinuation
- 2015-12-22 BR BR112017010222A patent/BR112017010222A2/pt not_active Application Discontinuation
- 2015-12-22 EP EP15821005.4A patent/EP3241125A2/en not_active Withdrawn
- 2015-12-22 WO PCT/US2015/067238 patent/WO2016109307A2/en active Application Filing
- 2015-12-22 JP JP2017535358A patent/JP6701206B2/ja active Active
- 2015-12-22 CA CA2968016A patent/CA2968016C/en active Active
-
2017
- 2017-12-04 US US15/830,767 patent/US11386268B2/en active Active
-
2020
- 2020-11-11 AU AU2020267218A patent/AU2020267218B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180089167A1 (en) | 2018-03-29 |
JP2018506113A (ja) | 2018-03-01 |
CA2968016A1 (en) | 2016-07-07 |
US20160188565A1 (en) | 2016-06-30 |
KR20170099917A (ko) | 2017-09-01 |
CN107111611A (zh) | 2017-08-29 |
CA2968016C (en) | 2023-01-24 |
WO2016109307A3 (en) | 2016-10-06 |
US11386268B2 (en) | 2022-07-12 |
AU2015374382B2 (en) | 2020-08-13 |
AU2015374382A1 (en) | 2017-05-25 |
AU2020267218A1 (en) | 2020-12-10 |
RU2017122991A3 (ja) | 2019-07-17 |
US9836452B2 (en) | 2017-12-05 |
RU2017122991A (ru) | 2018-12-29 |
EP3241125A2 (en) | 2017-11-08 |
WO2016109307A2 (en) | 2016-07-07 |
AU2020267218B2 (en) | 2021-12-09 |
KR102602475B1 (ko) | 2023-11-14 |
BR112017010222A2 (pt) | 2017-12-26 |
MX2017008583A (es) | 2017-11-15 |
MX367096B (es) | 2019-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6701206B2 (ja) | ユーザーエクスペリエンスを向上させるためにあいまいな表現を弁別すること | |
US10007660B2 (en) | Contextual language understanding for multi-turn language tasks | |
JP6727212B2 (ja) | 不完全自然言語クエリを理解するための方法 | |
JP6667504B2 (ja) | オーファン発話検出システム及び方法 | |
CN108369580B (zh) | 针对屏幕上项目选择的基于语言和域独立模型的方法 | |
WO2018118546A1 (en) | Systems and methods for an emotionally intelligent chat bot | |
WO2018039049A1 (en) | Multi-turn cross-domain natural language understanding systems, building platforms, and methods | |
TW202307644A (zh) | 用於助理系統的主動監聽 | |
WO2022099566A1 (en) | Knowledge injection model for generative commonsense reasoning | |
US20240321269A1 (en) | Generating Contextual Responses for Out-of-coverage Requests for Assistant Systems | |
US11900926B2 (en) | Dynamic expansion of acronyms in audio content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181213 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6701206 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |