JP6103766B2 - 行動プロセス抽出方法及び行動プロセス抽出装置 - Google Patents
行動プロセス抽出方法及び行動プロセス抽出装置 Download PDFInfo
- Publication number
- JP6103766B2 JP6103766B2 JP2013146836A JP2013146836A JP6103766B2 JP 6103766 B2 JP6103766 B2 JP 6103766B2 JP 2013146836 A JP2013146836 A JP 2013146836A JP 2013146836 A JP2013146836 A JP 2013146836A JP 6103766 B2 JP6103766 B2 JP 6103766B2
- Authority
- JP
- Japan
- Prior art keywords
- behavior
- action
- data set
- feature word
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
予めいくつかの状況を想定し、人手で行動プロセスをモデル化した技術としてタスクオントロジ(非特許文献1)が挙げられる。タスクオントロジは、ユーザが実世界で認識する問題(タスク)に対して、どのような行動プロセスで解決していくかを示した知識ベースである。「移動」「食事」「遊ぶ」「買い物」「宿泊」「旅行」という6つの状況において、起こり得る問題を洗い出し、それぞれの問題を解決する行動プロセスを人手で記述している。
料理レシピサイトのように、行動のプロセスが順に追って明確に書かれている形式化された文書を対象とし、大量の行動プロセスを自動的に生成する技術としてPerkowitzmらの手法(非特許文献2)が挙げられる。しかし、シンプルなテキスト解析で行動プロセスを生成しているための、「step1, step2…」といったように、形式的に書かれた料理レシピなどの文書にした対応しておらず、抽出可能な行動プロセスは限定的である。
大量かつ多様な人間の行動プロセスを抽出するためには、形式化された文書だけでなく、個人が実世界においてどのような行動をとったかが記述された非構造な文書(blogやTwitter、質問応答サイトなど)から行動プロセスを抽出する技術が必要である。アプローチとしては、Nguyenらのように言語的な手がかりを利用した手法(非特許文献3)や、倉島らの相関の高いイベントや行動・主観をマイニングする技術(非特許文献4)が挙げられる。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る行動プロセス抽出方法を実現する装置の機能ブロック図である。図1において、状況を特徴付ける特徴語抽出部10及び行動プロセス生成部20は、例えば、CPU、メモリ、ハードディスクを備える計算機に備えられる。また、図1において、入力部31及び出力部32が備えられる。入力部31は、ユーザによるキーワードWの入力を受け付け、またweb(図示せず)から送られるデータを入力するためのものである。出力部32は、特徴語抽出部10及び行動プロセス生成部20による処理結果を表示し、さらに特徴語抽出部10及び行動プロセス生成部20による処理結果を出力するためのものである。なお、実施形態では、テキストファイルやDBに格納する形で出力しているが、出力はテキストやDBに限定されるものではない。
図2は、文書集合からの特徴語抽出部10の動作を示すフローチャートである。まず、キーワードWが入力されると(ステップST2a)、特徴語抽出部10は、解析対象のデータを読み込み(ステップST2b)、本文に任意のキーワードWを含む記事のみを解析対象として絞り込む(ステップST2c)。また、特徴語抽出部10は、blog記事を書いた著者のidと本文、投稿時刻を取得する(ステップST2d)。
図3は、特徴語集合から行動プロセスを生成する行動プロセス生成部20の動作を示すフローチャートである。
行動プロセスを示すグラフを利用することにより、人が今度とる行動や思考を推定することや、行動プロセスを利用したナビゲーションや失敗の回避、マニュアルの自動作成、行動拡張や新しい方法の発見等のサービスに応用可能である。
先の第1の実施形態では、状況と関連性の無い行動プロセスも多数出力されることがある。
図5は、フィルタリング機能41の動作を示すフローチャートである。
c2.文書集合全体よりもクラスタ内の文書集合に偏って出現する行動パターンは、クラスタが対応する状況に依存している。
なお、この発明は上記各実施形態に限定されるものではない。例えば、特徴語抽出部10に特徴語抽出機能11の他に、特徴語選択機能12を備えるようにし、行動プロセス生成部20に動作抽出機能21の他に、前後関係算出機能22を備える例について説明したが、例えば、特徴語抽出部10に特徴語抽出機能11を備え、行動プロセス生成部20に動作抽出機能21及び、前後関係算出機能22を備えるものであってもよい。また、例えば、特徴語抽出部10に特徴語抽出機能11及び特徴語選択機能12を備え、行動プロセス生成部20に動作抽出機能21を備えるものであってもよい。
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
Claims (10)
- プロセッサを備える行動プロセス抽出装置が実行する行動プロセス抽出方法であって、
前記行動プロセス抽出装置が、自然言語で記述されたデータ集合から、入力されたキーワードまたは前記データ集合に含まれるキーワードについて、状況を特徴付ける特徴語の集合を抽出する第1のステップと、
前記行動プロセス抽出装置が、前記抽出した特徴語の集合と前記キーワードとの共起度を算出し、前記共起度に基づいて前記抽出した特徴語の集合の中から該当する特徴語を選択する第2のステップと、
前記行動プロセス抽出装置が、前記データ集合の中から、前記選択した特徴語に対する動作を表現する語を抽出することで前記キーワードに対する複数の行動プロセスを生成し、これらの行動プロセスが前記データ集合中に先に出現する確率に基づいて当該複数の行動プロセスの前後関係を決定する第3のステップと
を備えることを特徴とする行動プロセス抽出方法。 - 前記行動プロセス抽出装置が実行する前記第2のステップは、前記抽出した特徴語の集合と前記キーワードとの共起度を算出し、前記共起度が予め定めた閾値または統計に基づく算出値より低い特徴語をノイズとしてフィルタリングすることを特徴とする請求項1記載の行動プロセス抽出方法。
- プロセッサを備える行動プロセス抽出装置が実行する行動プロセス抽出方法であって、
前記行動プロセス抽出装置が、自然言語で記述されたデータ集合から、入力されたキーワードまたは前記データ集合に含まれるキーワードについて、状況を特徴付ける特徴語の集合を抽出する第1のステップと、
前記行動プロセス抽出装置が、前記データ集合の中から、各特徴語に対する動作を表現する語を抽出する第2のステップと、
前記行動プロセス抽出装置が、前記第2のステップで抽出された動作と特徴語とからなる行動の組について、前記データ集合の中で先に出現する確率を算出し、算出結果に基づいて行動間の前後関係を決定することにより行動プロセスを抽出する第3のステップと
を備えることを特徴とする行動プロセス抽出方法。 - プロセッサを備える行動プロセス抽出装置が実行する行動プロセス抽出方法であって、
前記行動プロセス抽出装置が、自然言語で記述されたデータ集合から、入力されたキーワードまたは前記データ集合に含まれるキーワードについて、状況を特徴付ける特徴語の集合を抽出する第1のステップと、
前記行動プロセス抽出装置が、前記抽出した特徴語の集合と前記キーワードとの共起度を算出し、前記共起度に基づいて前記抽出した特徴語の集合の中から該当する特徴語を選択する第2のステップと、
前記行動プロセス抽出装置が、前記データ集合の中から、前記選択した特徴語に対する動作を表現する語を抽出する第3のステップと、
前記行動プロセス抽出装置が、前記第3のステップで抽出された動作と特徴語とからなる行動の組について、前記データ集合の中で先に出現する確率を算出し、算出結果に基づいて行動間の前後関係を決定することにより行動プロセスを抽出する第4のステップと
を備えることを特徴とする行動プロセス抽出方法。 - 前記行動プロセス抽出装置が実行する前記第2のステップは、前記抽出した特徴語の集合と前記キーワードとの共起度を算出し、前記共起度が予め定めた閾値または統計に基づく算出値より低い特徴語をノイズとしてフィルタリングすることを特徴とする請求項4記載の行動プロセス抽出方法。
- 自然言語で記述されたデータ集合から、入力されたキーワードまたは前記データ集合に含まれるキーワードについて、状況を特徴付ける特徴語の集合を抽出する特徴語抽出手段と、
前記抽出した特徴語の集合と前記キーワードとの共起度を算出し、前記共起度に基づいて前記抽出した特徴語の集合の中から該当する特徴語を選択する特徴語選択手段と、
前記データ集合の中から、前記選択した特徴語に対する動作を表現する語を抽出することで前記キーワードに対する複数の行動プロセスを生成し、これらの行動プロセスが前記データ集合中に先に出現する確率に基づいて当該複数の行動プロセスの前後関係を決定する行動プロセス生成手段と
を備えることを特徴とする行動プロセス抽出装置。 - 自然言語で記述されたデータ集合から、入力されたキーワードまたは前記データ集合に含まれるキーワードについて、状況を特徴付ける特徴語の集合を抽出する特徴語抽出手段と、
前記データ集合の中から、各特徴語に対する動作を表現する語を抽出する動作抽出手段と、
前記動作抽出手段で抽出された動作と特徴語とからなる行動の組について、前記データ集合の中で先に出現する確率を算出し、算出結果に基づいて行動間の前後関係を決定することにより行動プロセスを抽出する前後関係算出手段とを備えることを特徴とする行動プロセス抽出装置。 - 自然言語で記述されたデータ集合から、入力されたキーワードまたは前記データ集合に含まれるキーワードについて、状況を特徴付ける特徴語の集合を抽出する特徴語抽出手段と、
前記抽出した特徴語の集合と前記キーワードとの共起度を算出し、前記共起度に基づいて前記抽出した特徴語の集合の中から該当する特徴語を選択する特徴語選択手段と、
前記データ集合の中から、前記選択した特徴語に対する動作を表現する語を抽出する動作抽出手段と、
前記動作抽出手段で抽出された動作と特徴語とからなる行動の組について、前記データ集合の中で先に出現する確率を算出し、算出結果に基づいて行動間の前後関係を決定することにより行動プロセスを抽出する前後関係算出手段とを備えることを特徴とする行動プロセス抽出装置。 - 前記行動プロセス抽出装置が、前記抽出される行動プロセスについて、前記データ集合中で起こり得る確率を算出し、前記起こり得る確率が予め定めた閾値または統計に基づく算出値より低い行動プロセスをノイズとして除去するステップを含むことを特徴とする請求項1から5のいずれか1項に記載の行動プロセス抽出方法。
- 前記抽出される行動プロセスについて、前記データ集合中で起こり得る確率を算出し、前記起こり得る確率が予め定めた閾値または統計に基づく算出値より低い行動プロセスをノイズとして除去するフィルタリング手段を備えることを特徴とする請求項6から8のいずれか1項に記載の行動プロセス抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013146836A JP6103766B2 (ja) | 2013-05-17 | 2013-07-12 | 行動プロセス抽出方法及び行動プロセス抽出装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013105414 | 2013-05-17 | ||
JP2013105414 | 2013-05-17 | ||
JP2013146836A JP6103766B2 (ja) | 2013-05-17 | 2013-07-12 | 行動プロセス抽出方法及び行動プロセス抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014241122A JP2014241122A (ja) | 2014-12-25 |
JP6103766B2 true JP6103766B2 (ja) | 2017-03-29 |
Family
ID=52140322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013146836A Active JP6103766B2 (ja) | 2013-05-17 | 2013-07-12 | 行動プロセス抽出方法及び行動プロセス抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6103766B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6838510B2 (ja) * | 2017-07-03 | 2021-03-03 | 富士通株式会社 | 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム |
JP2020187419A (ja) | 2019-05-10 | 2020-11-19 | 富士通株式会社 | エンティティリンキング方法、情報処理装置およびエンティティリンキングプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5417273B2 (ja) * | 2010-07-14 | 2014-02-12 | 日本電信電話株式会社 | 行動予測装置及びそのプログラム |
JP5768492B2 (ja) * | 2011-05-18 | 2015-08-26 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
-
2013
- 2013-07-12 JP JP2013146836A patent/JP6103766B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014241122A (ja) | 2014-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bansal et al. | How well can text-to-image generative models understand ethical natural language interventions? | |
US10565313B2 (en) | Automatic semantic rating and abstraction of literature | |
JP5717858B2 (ja) | テキストセットの照合 | |
CN109690529B (zh) | 按事件将文档编译到时间线中 | |
Tajbakhsh et al. | Microblogging hash tag recommendation system based on semantic TF-IDF: Twitter use case | |
KR101897080B1 (ko) | 의료 기록 문서에서의 의료 단어의 연관 규칙 생성 방법 및 그 장치 | |
Singh et al. | Sentiment analysis of Twitter data using TF-IDF and machine learning techniques | |
JP6524790B2 (ja) | 情報処理装置及び情報処理プログラム | |
JPWO2012127968A1 (ja) | イベント分析装置、イベント分析方法、およびプログラム | |
Almazrouei et al. | AlGhafa Evaluation Benchmark for Arabic Language Models | |
JP6103766B2 (ja) | 行動プロセス抽出方法及び行動プロセス抽出装置 | |
JP5224532B2 (ja) | 評判情報分類装置及びプログラム | |
JP6250833B2 (ja) | 文書検索システム、ディベートシステム、文書検索プログラム | |
JP2019128925A (ja) | 事象提示システムおよび事象提示装置 | |
Samah et al. | Aspect-Based Classification and Visualization of Twitter Sentiment Analysis Towards Online Food Delivery Services in Malaysia | |
JP6509590B2 (ja) | 商品に対するユーザの感情分析装置及びプログラム | |
CN112507214B (zh) | 基于用户名的数据处理方法、装置、设备及介质 | |
CN107590163B (zh) | 文本特征选择的方法、装置和系统 | |
CN112989020B (zh) | 信息处理方法、装置和计算机可读存储介质 | |
CN115525161A (zh) | 词条获取方法、装置及电子设备 | |
JP2022137569A (ja) | 情報管理システム | |
Weerasundara et al. | Comparative analysis of named entity recognition in the dungeons and dragons domain | |
Lee | Use-centric mining of customer reviews | |
Kiomourtzis et al. | NOMAD: Linguistic Resources and Tools Aimed at Policy Formulation and Validation. | |
Huynh et al. | Vietnamese short text classification via distributed computation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160705 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6103766 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |