WO2024070616A1

WO2024070616A1 - 医療画像解析装置、医療画像解析方法及びプログラム

Info

Publication number: WO2024070616A1
Application number: PCT/JP2023/032971
Authority: WO
Inventors: 太郎初谷; 晶路一ノ瀬
Original assignee: 富士フイルム株式会社
Priority date: 2022-09-28
Filing date: 2023-09-11
Publication date: 2024-04-04

Abstract

キー画像の作成元の医療画像において医師が意図した関心領域を特定する医療画像解析装置、医療画像解析方法及びプログラムを提供する。少なくとも１つのプロセッサと、少なくとも１つのプロセッサに実行させるための命令を記憶する少なくとも１つのメモリと、を備え、少なくとも１つのプロセッサは、医療画像から作成されたキー画像であって、関心領域を含むキー画像を取得し、キー画像を解析してキー画像の作成元の医療画像との紐付け情報を抽出し、紐付け情報に基づいて医療画像の関心領域を特定する医療画像解析装置によって上記課題を解決する。

Description

医療画像解析装置、医療画像解析方法及びプログラム

　本発明は医療画像解析装置、医療画像解析方法及びプログラムに係り、特にキー画像を学習モデルの学習に活用する技術に関する。

　病院には、医師が医療画像を読影した際に作成したキー画像が大量に存在する。キー画像とは、関心領域を指し示す代表画像である。関心領域は、例えば病変である。元画像がＣＴ画像及びＭＲＩ画像等の３次元医療画像である場合は、キー画像として、関心領域のスライスを保存するケース、スライスをさらにクロップして保存するケース、及び関心領域に対して矩形又は矢印等のアノテーションを付けて保存するケースがある。

　このキー画像は、作成時に元画像との位置関係が失われているケース、及び作成時にアノテーションの追加等によって画像情報に欠損が生じているケースが存在する。

　特許文献１には、キー画像を取得し、キー画像と平行な断面画像を取得し、補足画像を生成する技術が開示されている。また、特許文献２には、キー画像を解析し、医用画像とアノテーション画像に分離し、医用画像に対応する医用画像情報を取得する技術が開示されている。

特開２０２０－２８５８３号公報特開２０１５－１５６８９８号公報

　深層学習モデルを学習するには大量のデータを必要とするため、このキー画像を活用することが考えられる。しかしながら、キー画像が元画像のどの位置と対応しているかわからない、例えばどのスライスのどの位置から作成されたのかが不明であるという課題があった。また、キー画像にアノテーションがないケース、及びキー画像に矢印でしかアノテーションがないケースなどでは、医師が意図した関心領域がコンピュータには判別できないという課題がある。

　本発明はこのような事情に鑑みてなされたもので、キー画像の作成元の医療画像において医師が意図した関心領域を特定する医療画像解析装置、医療画像解析方法及びプログラムを提供することを目的とする。

　上記目的を達成するために、本開示の第１態様に係る医療画像解析装置は、少なくとも１つのプロセッサと、少なくとも１つのプロセッサに実行させるための命令を記憶する少なくとも１つのメモリと、を備え、少なくとも１つのプロセッサは、医療画像から作成されたキー画像であって、関心領域を含むキー画像を取得し、キー画像を解析してキー画像の作成元の医療画像との紐付け情報を抽出し、紐付け情報に基づいて医療画像の関心領域を特定する医療画像解析装置である。本態様によれば、キー画像の作成元の医療画像において医師が意図した関心領域を特定することができるので、関心領域が特定された医療画像を、医療画像から関心領域を推定する学習モデルの学習データに活用することができる。

　本開示の第２態様に係る医療画像解析装置は、第１態様に係る医療画像解析装置において、少なくとも１つのプロセッサは、キー画像から関心領域を推定し、推定した関心領域を医療画像に付加することが好ましい。

　本開示の第３態様に係る医療画像解析装置は、第１態様又は第２態様に係る医療画像解析装置において、キー画像は、関心領域を示すアノテーションを含み、少なくとも１つのプロセッサは、アノテーションを医療画像に付加し、付加したアノテーションに基づいて医療画像の関心領域を特定することが好ましい。

　本開示の第４態様に係る医療画像解析装置は、第３態様に係る医療画像解析装置において、少なくとも１つのプロセッサは、キー画像からアノテーションを検出することが好ましい。

　本開示の第５態様に係る医療画像解析装置は、第１態様から第４態様のいずれかに係る医療画像解析装置において、医療画像は、２次元静止画像、３次元静止画像、及び動画像のうちの少なくとも１つを含むことが好ましい。

　本開示の第６態様に係る医療画像解析装置は、第１態様から第５態様のいずれかに係る医療画像解析装置において、キー画像は、医療画像から作成されたボリュームレンダリングの結果であることが好ましい。

　本開示の第７態様に係る医療画像解析装置は、第１態様から第６態様のいずれかに係る医療画像解析装置において、少なくとも１つのプロセッサは、文字認識によってキー画像内の文字を解析して紐付け情報を抽出し、紐付け情報は、キー画像のウィンドウ幅、ウィンドウレベル、スライス番号、及びシリーズ番号のうちの少なくとも１つを含むことが好ましい。

　本開示の第８態様に係る医療画像解析装置は、第１態様から第７態様のいずれかに係る医療画像解析装置において、少なくとも１つのプロセッサは、キー画像を画像認識して紐付け情報を抽出し、紐付け情報は、キー画像のウィンドウ幅、ウィンドウレベル、及びアノテーションのうちの少なくとも１つを含むことが好ましい。

　本開示の第９態様に係る医療画像解析装置は、第１態様から第８態様のいずれかに係る医療画像解析装置において、少なくとも１つのプロセッサは、医療画像とキー画像との位置合わせの結果から紐付け情報を抽出することが好ましい。

　本開示の第１０態様に係る医療画像解析装置は、第１態様から第９態様のいずれかに係る医療画像解析装置において、少なくとも１つのプロセッサは、紐付け情報に基づいて医療画像におけるキー画像の対応する位置を推定することが好ましい。

　本開示の第１１態様に係る医療画像解析装置は、第１態様から第１０態様のいずれかに係る医療画像解析装置において、関心領域は、マスク、バウンディングボックス、及びヒートマップのうちの少なくとも１つであることが好ましい。

　本開示の第１２態様に係る医療画像解析装置は、第１態様から第１１態様のいずれかに係る医療画像解析装置において、医療画像は、ＤＩＣＯＭ（Digital imaging and communications in medicine）画像であることが好ましい。

　上記目的を達成するために、本開示の第１３態様に係る医療画像解析方法は、医療画像から作成されたキー画像であって、関心領域を含むキー画像を取得することと、キー画像を解析してキー画像の作成元の医療画像との紐付け情報を抽出することと、紐付け情報に基づいて医療画像の関心領域を特定することと、を含む医療画像解析方法である。本態様によれば、キー画像の作成元の医療画像において医師が意図した関心領域を特定することができるので、医療画像を学習モデルの学習データに活用することができる。

　上記目的を達成するために、本開示の第１４態様に係るプログラムは、第１３態様の医療画像解析方法をコンピュータに実行させるプログラムである。第１４態様に係るプログラムを記憶したＣＤ－ＲＯＭ（Compact Disk-Read Only Memory）等の非一時的かつコンピュータ読取可能な記録媒体も本開示に含まれる。

　本発明によれば、キー画像の作成元の医療画像において医師が意図した関心領域を特定することができる。

図１は、医療画像解析システムの全体構成図である。図２は、医療画像解析装置の電気的構成を示すブロック図である。図３は、医療画像解析装置の機能構成を示すブロック図である。図４は、第１の実施形態に係る医療画像解析方法を示すフローチャートである。図５は、キー画像とキー画像の作成元の医療画像とを示す図である。図６は、第２の実施形態に係る医療画像解析方法を示すフローチャートである。図７は、キー画像の一例を示す図である。図８は、第３の実施形態に係る医療画像解析方法を示すフローチャートである。

　以下、添付図面に従って本発明の好ましい実施形態について詳説する。

　＜医療画像解析システム＞
　本実施形態に係る医療画像解析システムは、医師が作成したキー画像から、作成元の医療画像の関心領域を特定するシステムである。関心領域が特定された作成元の医療画像は、学習モデルの学習データとして活用することができる。

　図１は、医療画像解析システム１０の全体構成図である。図１に示すように、医療画像解析システム１０は、医療画像検査機器１２と、医療画像データベース１４と、ユーザ端末装置１６と、読影レポートデータベース１８と、医療画像解析装置２０と、を備えて構成される。

　医療画像検査機器１２と、医療画像データベース１４と、ユーザ端末装置１６と、読影レポートデータベース１８と、医療画像解析装置２０とは、ネットワーク２２を介してそれぞれデータを送受信可能に接続される。ネットワーク２２は、医療機関内の各種機器を通信接続する有線、又は無線のＬＡＮ（Local Area Network）を含む。ネットワーク２２は、複数の医療機関のＬＡＮ同士を接続するＷＡＮ（Wide Area Network）を含んでもよい。

　医療画像検査機器１２は、被検体の検査対象部位を撮像し、医療画像を生成する撮影装置である。医療画像検査機器１２の例として、Ｘ線撮影装置、ＣＴ（Computed Tomography）装置、ＭＲＩ（Magnetic Resonance Imaging）装置、ＰＥＴ（Positron Emission Tomography）装置、超音波装置、平面Ｘ線検出器を用いたＣＲ（Computed Radiography）装置、及び内視鏡装置が挙げられる。

　医療画像データベース１４は、医療画像検査機器１２によって撮影された医療画像を管理するデータベースである。医療画像データベース１４は、医療画像を保存するための大容量ストレージ装置を備えるコンピュータが適用される。コンピュータには、データベース管理システムの機能を提供するソフトウェアが組み込まれる。

　医療画像は、Ｘ線撮影装置、ＣＴ装置、ＭＲＩ装置等によって撮影された２次元静止画像又は３次元静止画像であってもよいし、内視鏡装置によって撮影された動画像であってもよい。

　医療画像のフォーマットは、Ｄｉｃｏｍ（Digital Imaging and COmmunications in Medicine）規格を適用可能である。医療画像は、Ｄｉｃｏｍ規格において規定された付帯情報（Ｄｉｃｏｍタグ情報）が付加されてもよい。なお、本明細書における画像という用語には、写真等の画像自身の意味の他に、画像を表す信号である画像データの意味が含まれる。

　ユーザ端末装置１６は、医師が読影レポートを作成、及び閲覧するための端末機器である。ユーザ端末装置１６は、例えばパーソナルコンピュータが適用される。ユーザ端末装置１６は、ワークステーションであってもよいし、タブレット端末であってもよい。ユーザ端末装置１６は、入力装置１６Ａ及びディスプレイ１６Ｂを備える。医師は、入力装置１６Ａを使用して医療画像の表示の指示を入力する。ユーザ端末装置１６は、医療画像をディスプレイ１６Ｂに表示させる。さらに、医師は、ディスプレイ１６Ｂに表示された医療画像を読影し、入力装置１６Ａを使用して医療画像からキー画像を作成し、読影結果である所見文を入力することで、読影レポートを作成する。

　キー画像は、医師の情報が入力された画像である。キー画像は、患者及び撮影日時レベルでは作成元の医療画像と紐付けられている画像であるが、作成元の医療画像との位置関係の情報が失われた画像である。キー画像は、作成元の医療画像からビットマップ等の画像に変換することで作成元の医療画像から情報量が落ちた画像であってもよいし、情報量が落ちない画像に変換された画像であってもよい。キー画像は、元の医療画像の画像情報のうち、アノテーションが付加された位置の画像情報が失われた画像であってもよい。キー画像は、医療画像から作成されたボリュームレンダリングの結果であってもよい。

　キー画像は、医師が関心を持った関心領域を含む。キー画像は、関心領域を示すアノテーションを含んでもよい。キー画像のアノテーションは、円、矩形、矢印、線分、点、及びスクリブルのうちの少なくとも１つであってもよい。

　キー画像は、文字情報を含んでもよい。文字情報は、キー画像のウィンドウ幅、ウィンドウレベル、スライス番号、及びシリーズ番号のうちの少なくとも１つを含んでもよい。

　読影レポートデータベース１８は、ユーザ端末装置１６においてユーザが生成した読影レポートを管理するデータベースである。読影レポートは、キー画像を含む。読影レポートデータベース１８は、読影レポート保存するための大容量ストレージ装置を備えるコンピュータが適用される。コンピュータには、データベース管理システムの機能を提供するソフトウェアが組み込まれる。医療画像データベース１４と読影レポートデータベース１８とは、１つのコンピュータで構成されてもよい。

　医療画像解析装置２０は、医療画像の関心領域を特定する装置である。医療画像解析装置２０は、パーソナルコンピュータ、又はワークステーション（「コンピュータ」の一例）を適用可能である。図２は、医療画像解析装置２０の電気的構成を示すブロック図である。図２に示すように、医療画像解析装置２０は、プロセッサ２０Ａと、メモリ２０Ｂと、通信インターフェース２０Ｃと、を備える。

　プロセッサ２０Ａは、メモリ２０Ｂに記憶された命令を実行する。プロセッサ２０Ａのハードウェア的な構造は、次に示すような各種のプロセッサ（processor）である。各種のプロセッサには、ソフトウェア（プログラム）を実行して各種の機能部として作用する汎用的なプロセッサであるＣＰＵ（Central Processing Unit）、画像処理に特化したプロセッサであるＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）等の製造後に回路構成を変更可能なプロセッサであるＰＬＤ（Programmable Logic Device）、ＡＳＩＣ（Application Specific Integrated Circuit）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。

　１つの処理部は、これら各種のプロセッサのうちの１つで構成されていてもよいし、同種又は異種の２つ以上のプロセッサ（例えば、複数のＦＰＧＡ、又はＣＰＵとＦＰＧＡの組み合わせ、あるいはＣＰＵとＧＰＵの組み合わせ）で構成されてもよい。また、複数の機能部を１つのプロセッサで構成してもよい。複数の機能部を１つのプロセッサで構成する例としては、第１に、クライアント又はサーバ等のコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組合せで１つのプロセッサを構成し、このプロセッサが複数の機能部として作用させる形態がある。第２に、ＳｏＣ（System On Chip）等に代表されるように、複数の機能部を含むシステム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の機能部は、ハードウェア的な構造として、上記各種のプロセッサを１つ以上用いて構成される。

　さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路（circuitry）である。

　メモリ２０Ｂは、プロセッサ２０Ａに実行させるための命令を記憶する。メモリ２０Ｂは、不図示のＲＡＭ（Random Access Memory）、及びＲＯＭ（Read Only Memory）を含む。プロセッサ２０Ａは、ＲＡＭを作業領域とし、ＲＯＭに記憶された後述する医療画像解析プログラムを含む各種のプログラム及びパラメータを使用してソフトウェアを実行し、かつＲＯＭ等に記憶されたパラメータを使用することで、医療画像解析装置２０の各種の処理を実行する。

　通信インターフェース２０Ｃは、所定のプロトコルに従って、ネットワーク２２を介した医療画像検査機器１２、医療画像データベース１４、ユーザ端末装置１６、及び読影レポートデータベース１８との通信を制御する。

　医療画像解析装置２０は、インターネットを介して複数の医療機関からアクセス可能なクラウドサーバであってもよい。医療画像解析装置２０で行う処理は、課金制、又は固定料金制のクラウドサービスであってもよい。

　〔医療画像解析装置としての機能構成〕
　図３は、医療画像解析装置２０の機能構成を示すブロック図である。医療画像解析装置２０の各機能は、プロセッサ２０Ａがメモリ２０Ｂに記憶されたプログラムを実行することで具現化される。図３に示すように、医療画像解析装置２０は、キー画像取得部３２と、紐付け情報抽出部３４と、関心領域特定部４２と、出力部４８と、を備える。

　キー画像取得部３２は、読影レポートデータベース１８から関心領域を含むキー画像を取得する。

　紐付け情報抽出部３４は、キー画像を解析してキー画像の作成元の医療画像との紐付け情報を抽出する。すなわち、紐付け情報とは、キー画像とキー画像の作成元の医療画像とを紐付けるための情報である。紐付け情報は、例えば、被写体とは別にキー画像に写り込んだ情報である。紐付け情報は、例えば、キー画像の作成元の医療画像のシリーズ番号、スライス番号、ウィンドウ幅、ウィンドウレベル、及びアノテーションのうちの少なくとも１つを含む。紐付け情報は、キー画像とキー画像の作成元の医療画像との位置合わせの結果であってもよい。紐付け情報抽出部３４は、文字認識部３６と、画像認識部３８と、位置合わせ結果取得部４０と、を含む。

　文字認識部３６は、ＯＣＲ（Optical Character Recognition）等の既知の手法の文字認識によってキー画像内の文字を解析して紐付け情報を抽出する。文字認識部３６によって抽出する紐付け情報は、キー画像のウィンドウ幅、ウィンドウレベル、スライス番号、及びシリーズ番号のうちの少なくとも１つを含んでもよい。

　画像認識部３８は、キー画像を画像認識して紐付け情報を抽出する。画像認識部３８が抽出する紐付け情報は、キー画像のウィンドウ幅、ウィンドウレベル、及びアノテーションのうちの少なくとも１つを含んでもよい。画像認識部３８は、画像認識モデル３８Ａを備える。キー画像のウィンドウ幅、又はウィンドウレベルを抽出する画像認識モデル３８Ａは、畳み込みニューラルネットワーク（ＣＮＮ：Convolution Neural Network）を用いた分類モデル、又は回帰モデルである。また、キー画像のアノテーションを認識する画像認識モデル３８Ａは、畳み込みニューラルネットワークが適用されたセグメンテーションモデル、又は検出モデルである。画像認識部３８は、分類モデル、回帰モデル、セグメンテーションモデル、及び検出モデルのうちの複数の画像認識モデル３８Ａを備えてもよい。画像認識モデル３８Ａは、メモリ２０Ｂに記憶される。

　また、画像認識部３８は、キー画像に付加されたアノテーションを検出する。画像認識部３８が検出するアノテーションは、円、矩形、矢印、線分、点、及びスクリブルのうちの少なくとも１つを含んでもよい。

　位置合わせ結果取得部４０は、後述する位置合わせ部４４によるキー画像と医療画像との位置合わせの結果を取得する。

　関心領域特定部４２は、紐付け情報抽出部３４が抽出した紐付け情報に基づいて関心領域を特定する。関心領域特定部４２は、紐付け情報を用いて、例えば、まずキー画像の作成元の医療画像のうちキー画像に対応する位置を推定し、次に医療画像の関心領域を特定する。

　関心領域特定部４２は、２次元画像から関心領域を特定してもよいし、３次元画像から関心領域を特定してもよい。特定される関心領域は、２次元の領域であってもよいし、３次元の領域であってもよい。

　関心領域特定部４２は、関心領域推定モデル４２Ａと、位置合わせ部４４と、アノテーション付加部４６と、を含む。関心領域推定モデル４２Ａは、画像を入力として与えると入力された画像内の関心領域の位置を出力する深層学習モデルである。関心領域推定モデル４２Ａは、ＣＮＮが適用された学習済みモデルであってもよい。関心領域推定モデル４２Ａは、メモリ２０Ｂに記憶される。

　位置合わせ部４４は、キー画像とキー画像の作成元の医療画像との位置合わせを行う。キー画像とキー画像の作成元の医療画像と位置合わせとは、臓器等の同じ被写体を示す両画像のそれぞれの画素を対応付けることをいう。位置合わせ部４４によるキー画像と医療画像との位置合わせの結果とは、キー画像の画素と医療画像の画素との対応関係を含む。アノテーション付加部４６は、キー画像の作成元の医療画像にアノテーションを付加する。

　出力部４８は、関心領域特定部４２によって特定された関心領域を出力し、不図示の学習用データベースに記録する。出力する関心領域は、キー画像の作成元の医療画像に付与されたマスク、バウンディングボックス、及びヒートマップのうちの少なくとも１つであってもよい。

　＜医療画像解析方法：第１の実施形態＞
　図４は、医療画像解析装置２０を用いた第１の実施形態に係る医療画像解析方法を示すフローチャートである。医療画像解析方法は、キー画像の作成元の医療画像の関心領域を特定する方法である。医療画像解析方法は、プロセッサ２０Ａがメモリ２０Ｂに記憶された医療画像解析プログラムを実行することで実現される。医療画像解析成プログラムは、コンピュータが読み取り可能な非一時的記憶媒体によって提供されてもよいし、インターネットを介して提供されてもよい。

　ステップＳ１では、キー画像取得部３２は、読影レポートデータベース１８からキー画像を取得する。キー画像取得部３２は、ネットワーク２２を介して読影レポートデータベース１８以外からキー画像を取得してもよい。紐付け情報抽出部３４は、取得したキー画像を画像解析し、キー画像からキー画像の作成元の医療画像と紐付けるのに必要な紐付け情報を抽出する。画像解析とは、文字認識、及び画像認識を含む。

　続くステップＳ２では、関心領域特定部４２は、ステップＳ１で抽出した紐付け情報に基づいて、キー画像の作成元の医療画像の関心領域を特定する。

　図５は、キー画像とキー画像の作成元の医療画像とを示す図である。図５に示すキー画像ＩＫ１は、２次元の画像である。キー画像ＩＫ１は、「２０２２０９０８」、「ＳＥ：２」、「圧縮・診断記録画像」、及び「ＩＭ：８」の文字情報を含む。文字認識部３６は、これらの文字を認識し、紐付け情報としてキー画像ＩＫ１のウィンドウ幅、ウィンドウレベル、スライス番号、及びシリーズ番号のうちの少なくとも１つを抽出する。

　また、キー画像ＩＫ１は、矢印のアノテーションＡＮ１を含む。画像認識部３８は、キー画像ＩＫ１を画像認識し、紐付け情報としてアノテーションＡＮ１を抽出する。画像認識部３８は、キー画像ＩＫ１を画像認識し、紐付け情報としてスライス番号、シリーズ番号、ウィンドウ幅、及びウィンドウレベルのうちの少なくとも１つを抽出してもよい。

　図５に示す医療画像ＩＤは、キー画像ＩＫ１の作成元の３次元の画像であって、関心領域特定部４２によって特定された関心領域に矩形のアノテーションＡＮ２が付加された画像である。

　図５に示す拡大画像ＩＺは、医療画像ＩＤのアノテーションＡＮ２が付加された領域を拡大した画像である。また、図５に示すコロナル画像ＩＣは、医療画像ＩＤのアノテーションＡＮ２が付加された領域を含むコロナル断面の画像である。このように、キー画像の作成元の３次元の医療画像の関心領域を特定することで、医療画像の関心領域を３次元的に特定することができる。これにより、関心領域を含む様々な形式の画像を作成できるので、関心領域が特定された医療画像を、画像から関心領域を抽出する学習モデルの学習データとして活用することができる。

　＜医療画像解析方法：第２の実施形態＞
　図６は、第２の実施形態に係る医療画像解析方法を示すフローチャートである。

　ステップＳ１１は、第１の実施形態のステップＳ１と同様である。ここでは、画像認識部３８は、画像認識モデル３８Ａによりキー画像から紐付け情報を抽出する。また、文字認識部３６は、ＯＣＲによりキー画像から紐付け情報を抽出する。

　ステップＳ１２では、ステップＳ１１で取得したキー画像にアノテーションが付加されている場合、画像認識部３８はキー画像からアノテーションを検出する。

　ステップＳ１３では、関心領域特定部４２は、ステップＳ１１で抽出した紐付け情報のうちのスライス番号に基づいて、作成元の医療画像のスライス画像であって、キー画像と同じ位置のスライス画像を特定する。ステップＳ１１において、スライス番号を抽出できなかった場合は、既知の方法でキー画像と同じ位置のスライス画像を特定する。

　ステップＳ１４では、位置合わせ部４４は、キー画像とステップＳ１３で特定したスライス画像との位置合わせを行う。キー画像は、作成元の医療画像のスライス画像からクロップ、又は回転されている場合があるので、位置合わせが必要なケースがある。図７は、キー画像の一例を示す図である。図７に示すキー画像ＩＫ２は、アノテーションがなく、クロップされたキー画像である。

　ステップＳ１５では、ステップＳ１１で取得したキー画像にアノテーションが付加されている場合、アノテーション付加部４６は、ステップＳ１３で特定したスライス画像にアノテーションを付加する。アノテーション付加部４６は、ステップＳ１４での位置合わせにより、キー画像のアノテーションの位置と同じスライス画像の位置にアノテーションを付加することができる。

　ステップＳ１６では、関心領域特定部４２は、ステップＳ１５で付加したアノテーションに基づいてスライス画像の関心領域を特定する。ここでは、関心領域特定部４２は、関心領域推定モデル４２Ａを用いて関心領域を特定する。関心領域を特定した結果は、マスク、バウンディングボックス、及びヒートマップのうちの少なくとも１つであってもよい。出力部４８は、特定された関心領域を出力する。

　このように、キー画像のアノテーションをキー画像の作成元のスライス画像に付加し、これに基づいて関心領域を推定することで、スライス画像の関心領域を特定することができる。したがって、作成元の医療画像の関心領域を特定することができる。

　ここでは、ステップＳ１１で取得したキー画像にアノテーションが付加されている場合について説明したが、関心領域推定モデル４２Ａは、アノテーションが含まれないキー画像から関心領域を推定することも可能である。

　＜医療画像解析方法：第３の実施形態＞
　図８は、第３の実施形態に係る医療画像解析方法を示すフローチャートである。

　ステップＳ２１は、第２の実施形態のステップＳ１１と同様である。また、ステップＳ２２は、第２の実施形態のステップＳ１２と同様である。

　ステップＳ２３では、関心領域特定部４２は、ステップＳ２１で取得したキー画像の関心領域を特定する。ここでは、関心領域特定部４２は、関心領域推定モデル４２Ａを用いて関心領域を特定する。

　ステップＳ２４は、第２の実施形態のステップＳ１３と同様である。また、ステップＳ２５は、第２の実施形態のステップＳ１４と同様である。

　ステップＳ２６では、関心領域特定部４２は、ステップＳ２３で特定したキー画像の関心領域を、ステップＳ２４で特定されたスライス画像に付加し、付加した関心領域をスライス画像の関心領域として特定する。関心領域特定部４２は、ステップＳ２５での位置合わせにより、キー画像の関心領域の位置と同じスライス画像の位置に関心領域を付加することができる。

　以上のように、キー画像内で特定した関心領域を医療画像に付加することで、医療画像の関心領域を特定してもよい。

　＜対応する位置の推定方法：第４の実施形態＞
　関心領域特定部４２は、紐付け情報に基づいてキー画像の作成元の医療画像におけるキー画像の対応する位置を推定する。ここでは、対応する位置の推定方法について説明する。

　関心領域特定部４２は、紐付け情報抽出部３４によってキー画像から紐付け情報としてシリーズ番号が抽出できた場合、キー画像の作成元の医療画像のシリーズを特定する。シリーズ番号が抽出できない場合は、関心領域特定部４２は、すべてのシリーズを検索してキー画像の作成元の医療画像のシリーズを特定する。

　関心領域特定部４２は、紐付け情報抽出部３４によってキー画像からスライス番号が抽出できた場合、作成元の医療画像のスライス位置を特定する。キー画像からスライス番号が抽出できない場合は、関心領域特定部４２は、すべてのスライスを検索して作成元の医療画像のスライス位置を特定する。

　関心領域特定部４２は、キー画像からウィンドウレベルとウィンドウ幅とを推定する。関心領域特定部４２は、ＣＮＮが適用された不図示のウィンドウレベル／ウィンドウ幅推定モデルを使用して、キー画像からウィンドウレベルとウィンドウ幅とを推定してもよい。

　位置合わせ部４４は、キー画像の作成元の画像を、関心領域特定部４２が推定したウィンドウレベルとウィンドウ幅とを用いて正規化する。最後に、位置合わせ部４４は、一般的な非剛体位置合わせの技術を用いて、対応する位置を推定する。非剛体位置合わせの技術は、回転、平行移動、及び拡大縮小を含む。

　＜関心領域推定モデルの学習方法：第５の実施形態＞
　関心領域特定部は、関心領域推定モデル４２Ａを用いて関心領域を推定している。ここでは、関心領域推定モデル４２Ａの学習方法について説明する。

　まず、ユーザが、関心領域の位置が既知の医療画像を用意し、この医療画像から学習用医療画像を作成する。

　学習用医療画像は、例えば、医療画像の関心領域の周辺の領域をクロップした画像である。学習用医療画像は、医療画像の関心領域に対して矩形を付与した画像であってもよい。キー画像作成時には、関心領域の大きさに対して大きめの矩形を付与されることが多いため、矩形の大きさはこれに倣うことが好ましい。学習用医療画像は、医療画像の関心領域に対して矢印を付与した画像であってもよい。学習用医療画像は、キー画像のように２次元の画像であってもよい。

　作成した学習用医療画像から、元の医療画像の関心領域を推定する、すなわち逆問題を解くようなモデルを学習する。これにより、関心領域推定モデル４２Ａを作成することができる。

　すなわち、関心領域推定モデル４２Ａは、学習用医療画像と学習用医療画像の元に画像の関心領域とをセットとする学習用の学習データセットにより機械学習が行われたものである。関心領域推定モデル４２Ａは、クロップされた画像、矩形が付与された画像、及び矢印が付与された画像を入力として与えると、入力された画像の関心領域を出力する。

　このように学習された関心領域推定モデル４２Ａによって、キー画像の作成元の医療画像、及びキー画像から関心領域を推定することができる。

　医療画像解析方法によれば、キー画像を画像認識技術で解析し、作成元の医療画像と対応する位置を推定し、解析結果と作成元の医療画像の解析によって医師が意図した関心領域を特定するようにしたので、関心領域が特定された医療画像を、医療画像から関心領域を推定する学習モデルの学習データに活用することができる。

　＜その他＞
　本実施形態に係る画像解析方法は、医療画像以外にも適用可能である。例えば、交通、電気、ガス、及び水道等の社会的インフラ設備の元画像から作成された関心領域の診断画像を取得し、診断画像の作成元の画像の関心領域を特定する技術に適用することができる。

　本発明の技術的範囲は、上記の実施形態に記載の範囲には限定されない。各実施形態における構成等は、本発明の趣旨を逸脱しない範囲で、各実施形態間で適宜組み合わせることができる。

１０…医療画像解析システム
１２…医療画像検査機器
１４…医療画像データベース
１６…ユーザ端末装置
１６Ａ…入力装置
１６Ｂ…ディスプレイ
１８…読影レポートデータベース
２０…医療画像解析装置
２０Ａ…プロセッサ
２０Ｂ…メモリ
２０Ｃ…通信インターフェース
２２…ネットワーク
３２…キー画像取得部
３４…情報抽出部
３６…文字認識部
３８…画像認識部
３８Ａ…画像認識モデル
４０…結果取得部
４２…関心領域特定部
４２Ａ…関心領域推定モデル
４４…位置合わせ部
４６…アノテーション付加部
４８…出力部
ＡＮ１…アノテーション
ＡＮ２…アノテーション
ＩＣ…コロナル画像
ＩＤ…医療画像
ＩＫ１…キー画像
ＩＫ２…キー画像
ＩＺ…拡大画像
Ｓ１～Ｓ２、Ｓ１１～Ｓ１６、Ｓ２１～Ｓ２６…医療画像解析方法のステップ

Claims

　少なくとも１つのプロセッサと、
　前記少なくとも１つのプロセッサに実行させるための命令を記憶する少なくとも１つのメモリと、
　を備え、
　前記少なくとも１つのプロセッサは、
　医療画像から作成されたキー画像であって、関心領域を含むキー画像を取得し、
　前記キー画像を解析して前記キー画像の作成元の医療画像との紐付け情報を抽出し、
　前記紐付け情報に基づいて前記医療画像の前記関心領域を特定する、
　医療画像解析装置。
　前記少なくとも１つのプロセッサは、
　前記キー画像から前記関心領域を推定し、
　前記推定した前記関心領域を前記医療画像に付加する、
　請求項１に記載の医療画像解析装置。
　前記キー画像は、前記関心領域を示すアノテーションを含み、
　前記少なくとも１つのプロセッサは、
　前記アノテーションを前記医療画像に付加し、
　前記付加したアノテーションに基づいて前記医療画像の前記関心領域を特定する、
　請求項１に記載の医療画像解析装置。
　前記少なくとも１つのプロセッサは、
　前記キー画像からアノテーションを検出する、
　請求項３に記載の医療画像解析装置。
　前記医療画像は、２次元静止画像、３次元静止画像、及び動画像のうちの少なくとも１つを含む、
　請求項１に記載の医療画像解析装置。
　前記キー画像は、前記医療画像から作成されたボリュームレンダリングの結果である、
　請求項１に記載の医療画像解析装置。
　前記少なくとも１つのプロセッサは、
　文字認識によって前記キー画像内の文字を解析して前記紐付け情報を抽出し、
　前記紐付け情報は、前記キー画像のウィンドウ幅、ウィンドウレベル、スライス番号、及びシリーズ番号のうちの少なくとも１つを含む、
　請求項１に記載の医療画像解析装置。
　前記少なくとも１つのプロセッサは、
　前記キー画像を画像認識して前記紐付け情報を抽出し、
　前記紐付け情報は、前記キー画像のウィンドウ幅、ウィンドウレベル、及びアノテーションのうちの少なくとも１つを含む、
　請求項１に記載の医療画像解析装置。
　前記少なくとも１つのプロセッサは、
　前記医療画像と前記キー画像との位置合わせの結果から前記紐付け情報を抽出する、
　請求項１に記載の医療画像解析装置。
　前記少なくとも１つのプロセッサは、
　前記紐付け情報に基づいて前記医療画像における前記キー画像の対応する位置を推定する、
　請求項１に記載の医療画像解析装置。
　前記関心領域は、マスク、バウンディングボックス、及びヒートマップのうちの少なくとも１つである、
　請求項１に記載の医療画像解析装置。
　前記医療画像は、ＤＩＣＯＭ（Digital imaging and communications in medicine）画像である、
　請求項１から１１のいずれか１項に記載の医療画像解析装置。
　医療画像から作成されたキー画像であって、関心領域を含むキー画像を取得することと、
　前記キー画像を解析して前記キー画像の作成元の医療画像との紐付け情報を抽出することと、
　前記紐付け情報に基づいて前記医療画像の前記関心領域を特定することと、
　を含む医療画像解析方法。
　請求項１３に記載の医療画像解析方法をコンピュータに実行させるプログラム。
　非一時的かつコンピュータ読取可能な記録媒体であって、請求項１４に記載のプログラムが記録された記録媒体。