Nothing Special   »   [go: up one dir, main page]

自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
複数文質問を対象とした抽出型および生成型要約
石垣 達也 東京工業大学科学技術創成研究院未来産業技術研究所">高村 大也奥村 学
著者情報
ジャーナル フリー

2019 年 26 巻 1 号 p. 37-58

詳細
抄録

インターネット上のコミュニティ QA サイトや学会での質疑応答の場面などにおいて,人々は多くの質問を投げかける.このような場面で用いられる質問には,核となる質問に加え補足的な情報をも付与され,要旨の把握が難しくなることもある.補足的な情報は正確な回答を得るには必要であるが,質問の要旨を素早く把握したいといった状況においては必ずしも必要でない.そこで本稿では,新たなテキスト要約課題として,複数文から構成される質問テキストを単一質問文に要約する“質問要約”を提案する.本研究ではまず,コミュニティ質問応答サイトに投稿される質問から質問テキスト-要約対を獲得し,必要な要約手法について抽出型および生成型の観点から分析を行う.また,獲得した質問テキスト-要約対を学習データとして抽出型および生成型の要約モデルを構築し,性能を比較する.分析より,抽出型要約手法では要約できない質問テキストの存在を確認した.また要約モデルの比較実験から,従来の要約課題で強いベースライン手法として知られるリード文よりも,先頭の疑問文を規則を用いて同定し抽出するリード疑問文ベースラインがより良い性能を示すこと,生成型手法であるエンコーダ・デコーダモデルに基づく要約手法が,ROUGE による自動評価,人間による評価において良い性能を示すことなどの知見を得た.また,入力中の出現単語を出力に含めるコピー機構を持つエンコーダ・デコーダモデルは,さらに良い性能を示した.

著者関連情報
© 2019 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top