JP2024534035A

JP2024534035A - 発見プラットフォーム

Info

Publication number: JP2024534035A
Application number: JP2024508966A
Authority: JP
Inventors: パオロカサーレフランチェスコ; ベレケットマイケル; アルバートマシュー
Original assignee: インシトロインコーポレイテッド
Priority date: 2021-08-16
Filing date: 2022-08-16
Publication date: 2024-09-18
Also published as: US20240274254A1; EP4388549A1; CA3228785A1; IL310877A; KR20240068638A; WO2023023507A1; AU2022328586A1; US20230360758A1; US12002559B2; US20240274255A1

Abstract

本開示は発見プラットフォームに関するのであり、これには、弱い又は未知の遺伝的駆動因子を伴う複雑な疾患等の着目表現型について研究するために医用画像データを用いるための機械学習手法が含まれる。表現型との関係で着目コバリアントを識別する例示的な方法は次のステップを含む：臨床被験者群から取得された共変量クラスについてのコバリアント情報及び表現型に関する対応する表現型画像データを受信するステップと；表現型画像データを訓練済み教師なし機械学習モデル内へと入力して潜在空間内で複数の埋め込みを取得するステップであって、各埋め込みは表現型画像データにて反映されている表現型状態に対応する、ステップと；臨床被験者群についてのコバリアント情報、複数の埋め込み、及び１つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントと表現型状態との間の関連を決定して、着目コバリアントを識別するステップ。【選択図】図１

Description

概して本開示は発見プラットフォームに関するのであり、より具体的には、弱い又は未知の遺伝的駆動因子を伴う複雑な疾患等の着目表現型について研究するために医用画像データを用いるための機械学習手法に関する。

関連出願の相互参照

本願は、２０２１年８月１６日に出願された米国仮特許出願第６３／２３３，７０７号の優先権の利益を主張するのであり、その内容の全体が参照によって取り込まれる。

人間を悩ます多くの疾患は、部分的には遺伝子によって左右される。具体的には、１つ以上の遺伝的バリアント又は変異体を有する個体は、疾患について発病し易かったり或いはその発病後に病勢進展がより速まり得る。特に、複数の遺伝的バリアントによって影響を受けることのある疾患については、特定の遺伝的背景を有する対象者に疾患がもたらされ得る原因となる具体的な因子を識別すること並びに発症後その対象者においてその疾患が進行していくこととなろう様相を予測することが困難であると認識されている。また、他の点を除いて疾患をもち得る対象者での軽微な遺伝的バリアントによって、効果面及び安全性面の両方に関して、所定の治療的介入に対して欠く対象者がどの程度良好な応答を示すかに影響がもたらされ得る。したがって、特定の遺伝的バリアントが疾患の発生及び進行にどのように影響するかについての理解、転じては候補治療が疾患の退行又は臨床対象者における有害反応に関してどのように影響するかについての理解が欠けると、効果的な薬剤の開発に関しての相当の障害となり得る。

組織病理画像のコンピュータ分析における近時の進展により、特定の疾患を患っている様々な人間の対象にて発現されている疾患表現型についてより理解が深まった。対象者の遺伝的バリアントについての、また、疾患感受性リスクにどのような影響を複数の遺伝的バリアントが与え得るかについてのコンピュータ分析における近時の進展により、特定の疾患の精密な遺伝的根拠について理解がより良くなった。されども、これらのタイプの進展をより良く活用していくための余地は残っており、疾患標的を識別したり、疾患の発現や人間の対象における疾患進行の様相を予測したり、異なる遺伝的背景を有する対象者間での治療的候補に対しての起こり得る応答を予測したり、特定の治療を受けるべき適切な患者コホートを識別したり、結果を最適化するために臨床試験を一般的に設計するための活用をなし得る。

表現型との関係で着目コバリアントを識別する例示的な方法は次のステップを含む：臨床被験者群から取得された共変量クラスについてのコバリアント情報及び表現型に関する対応する表現型データを受信するステップと；表現型データを訓練済み教師なし機械学習モデル内へと入力して潜在空間内で複数の埋め込みを取得するステップであって、各埋め込みは表現型データにて反映されている表現型状態に対応する、ステップと；臨床被験者群についてのコバリアント情報、複数の埋め込み、及び１つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントと表現型との間の関連を決定して、着目コバリアントを識別するステップ。

一部の実施形態では、前記表現型は着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、又はリピドミクスを含む。

一部の実施形態では、前記表現型データは医用画像データ、組織病理データ、臨床バイオマーカデータ、又はゲノミックバイオマーカデータを含む。

一部の実施形態では、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える。

一部の実施形態では、各候補コバリアント（covariant）と前記表現型との間の前記関連（association）を決定することは次のステップを含む：前記複数の埋め込みの各埋め込みを線形回帰モデル内へと入力して、複数の埋め込みの各埋め込みについて予測連続スコアを受信して、複数の連続スコアを取得するステップと、前記複数の予測連続スコアを、前記臨床被験者群によって発現されている候補コバリアントと関連付ける（例えば、関連について試す）ステップと、前記表現型と前記候補コバリアントとの間の相関メトリックを、前記関連に基づいて、決定するステップであって、前記相関メトリックは前記候補コバリアントが前記表現型に対して及ぼすインパクトについて示す、ステップ。

一部の実施形態では、前記候補コバリアントと前記表現型との間の前記関連を決定することは次のステップを含む：前記複数の埋め込みを前記複数の候補コバリアントの各候補コバリアントと関連付けて、前記複数の候補コバリアントのサブセットを識別するステップと、前記サブセット内の各候補コバリアントを前記表現型と関連付けて、前記少なくとも１つの着目コバリアントを識別するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記少なくとも１つの着目遺伝的バリアントに基づいて、前記表現型を表す複数のシミュレーション画像を生成するステップと、ディスプレイ上に複数のシミュレーション画像を表示するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記少なくとも１つの着目遺伝的バリアント（variant）と前記表現型との間の関係（relationship）を識別するステップ。

一部の実施形態では、前記関係は因果関係である。

一部の実施形態では、方法はさらに次のステップを含む：前記関係に基づいて新規被験者について診断を提供するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関係に基づいて治療を開発するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関係に基づいて治療を施す、調整する、又は適用するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関係に基づいて医学的提案を提供するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップ。

一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である。

着目疾患との関係で少なくとも１つの着目遺伝的バリアントを識別する例示的な方法は次のステップを含む：臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みの各埋め込みを訓練済み線形回帰モデル内へと入力して、前記複数の埋め込みの各埋め込みについて予測連続医療診断スコアを受信して、複数の予測医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記複数の予測連続医療診断スコアを、複数の医用画像の取得元の臨床被験者群によって発現されている複数の候補遺伝的バリアントの各候補遺伝的バリアントと、関連付けるステップと、前記着目疾患と各候補遺伝的バリアントとの間の相関メトリックを前記関連に基づいて決定し、前記少なくとも１つの着目遺伝的バリアントを前記複数の候補遺伝的バリアントから識別するステップであって、前記相関メトリックは前記候補遺伝的バリアントが前記着目疾患に対して及ぼすインパクトについて示す、ステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記相関メトリックを所定の閾値と比較するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記比較に基づいて、前記着目遺伝的バリアントと前記着目疾患との間の関係を識別するステップ。

一部の実施形態では、前記関係は因果関係である。

一部の実施形態では、方法はさらに次のステップを含む：前記関係に基づいて新規被験者にて前記着目疾患を診断するステップ。

一部の実施形態では、前記複数の医用画像は生検画像を備える。

一部の実施形態では、前記生検画像は１つ以上の臨床試験に対応する。

一部の実施形態では、方法はさらに次のステップを含む：前記複数の画像の医用画像を複数の画像タイルに分割するステップと、前記複数の画像タイルの各画像タイルを前記教師なし機械学習モデル内へと入力して、各画像タイルについてタイル埋め込みを受信して、複数のタイル埋め込みを取得するステップと、前記タイル埋め込みを集約して前記複数の埋め込みの埋め込みを取得するステップ。

一部の実施形態では、前記タイル埋め込みを集約するステップは前記タイル埋め込みを平均化するステップを含む。

一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。

一部の実施形態では、前記対照モデルはSimCLRモデルである。

一部の実施形態では、前記訓練済み教師なし機械学習モデルは少なくとも部分的には前記複数の医用画像に基づいて訓練されている。

一部の実施形態では、前記教師なし機械学習モデルは前記複数の医用画像に基づいて微調整されている。

一部の実施形態では、前記線形回帰モデルは線形混合モデルである。

一部の実施形態では、前記訓練済み線形回帰モデルは前記複数の埋め込み及び前記複数の埋め込みに対応する複数の割り当て済み医療診断スコアに基づいて適合化される。

一部の実施形態では、前記複数の割り当て済み医療診断スコアは１人以上の医師によって提供される。

一部の実施形態では、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される。

一部の実施形態では、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアとされる。

一部の実施形態では、前記複数の予測医療診断スコアは、臨床試験中の別個の測定での予測医療診断スコアの差として取得された疾患進行を含む。

一部の実施形態では、前記複数の予測医療診断スコアは、前記臨床試験中に取得された別個の測定を反映する予測医療診断スコア間の差として算出された疾患進行スコアを含む。

一部の実施形態では、前記複数の予測医療診断スコアは、前記臨床試験中に各個人について取得された別個の測定を反映する予測医療診断スコアについて訓練された線形モデルによって決定された勾配として取得された疾患進行スコアを含む。

一部の実施形態では、前記バリアント特有モデルは線形モデルである。

一部の実施形態では、前記バリアント特有モデルは、前記複数の予測医療診断スコアと前記候補遺伝的バリアントについて示す複数の値とに基づいて適合化される。

一部の実施形態では、前記相関メトリックを決定するステップは、前記バリアント特有モデルに基づいてＰ値を決定するステップを含む。

着目疾患との関係で少なくとも１つの着目遺伝的バリアントを識別する例示的な方法は次のステップを含む：臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、前記複数の候補遺伝的バリアントについてのサブセットを識別するステップであって、前記複数の遺伝的バリアントのサブセットは前記複数の医用画像にて反映されている組織学的特徴と関連付けられている、ステップと、前記複数の候補遺伝的バリアントの前記サブセットの各候補遺伝的バリアントを前記着目疾患と関連付けて少なくとも１つの着目遺伝的バリアントを前記サブセットから識別するステップとを含む、方法。

一部の実施形態では、方法はさらに次のステップを含む：前記少なくとも１つの着目遺伝的バリアントに基づいて、前記着目疾患を表す複数のシミュレーション画像を生成するステップと、ディスプレイ上に複数のシミュレーション画像を表示するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記少なくとも１つの着目遺伝的バリアントと前記着目疾患との間の関係を識別するステップ。

一部の実施形態では、前記関係は因果関係である。

一部の実施形態では、前記複数の埋め込みを前記複数の遺伝的バリアントの各遺伝的バリアントと関連付けて前記複数の遺伝的バリアントについての前記サブセットを識別するステップは：埋め込みを受信し及び前記候補遺伝的バリアントの値を出力するように構成されたバリアント特有モデルを、前記複数の候補遺伝的バリアントの候補遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントを前記サブセット内に含めるべきかを決定するステップ。

一部の実施形態では、バリアント特有モデルを評価することは次のステップを含む：前記バリアント特有モデルに基づいて相関メトリックを算出するステップと、前記相関メトリックを所定の閾値と比較するステップ。

一部の実施形態では、前記相関メトリックは前記バリアント特有モデルと関連付けられているＰ値である。

一部の実施形態では、前記複数の遺伝的バリアントの前記サブセットの各遺伝的バリアントを前記着目疾患と関連付けて前記少なくとも１つの着目遺伝的バリアントを識別するステップは：前記遺伝的バリアントについて示す値を受信し及び前記着目疾患に関する医療診断スコアを出力するように構成されたバリアント特有モデルを、前記サブセット内の遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントが前記少なくとも１つの着目遺伝的バリアントであるかを決定するステップ。

一部の実施形態では、前記相関メトリックは前記バリアント特有スコア予測モデルと関連付けられているＰ値である。

着目疾患の進行に関して治療を評価する例示的な方法は次のステップを含む：プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ画像と、前記プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ画像とを取得するステップと、前記複数のベースラインプラセボ画像及び前記複数のフォローアッププラセボ画像に基づいて複数のプラセボ進行埋め込みを取得するステップと、前記治療群に前記治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像と、前記治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療画像とを取得するステップと、前記複数のベースライン治療画像及び前記複数のフォローアップ治療画像に基づいて複数の治療進行埋め込みを取得するステップと、前記複数の治療進行埋め込みに基づいて患者が前記プラセボ又は前記治療を受けたのかを決定するための分類モデルを生成するステップであって、前記分類モデルの出力は薬物反応組織学的表現型（ＤＲＰ）について示す、ステップと、前記分類モデルに基づいて、前記治療と前記着目疾患の前記進行との間の相関メトリックを決定するステップ。

一部の実施形態では、前記相関メトリックはＰ値である。

一部の実施形態では、方法はさらに次のステップを含む：前記比較に基づいて、前記治療と前記着目疾患の進行との間の関連を識別するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関連に基づいて前記治療を新規被験者について処方するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関連に基づいて前記治療を施すステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関連に基づいて前記治療を調整するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関連に基づいて医学的提案を提供するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関連に基づいてレポートを生成するステップ。

一部の実施形態では、前記複数のプラセボ進行埋め込みを取得するステップは：前記複数のベースラインプラセボ画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースラインプラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアッププラセボ埋め込みを取得するステップと、前記複数のベースラインプラセボ埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアッププラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ埋め込みと前記複数の予測フォローアッププラセボ埋め込みとの間の差を算出することによって前記複数のプラセボ進行埋め込みを決定するステップ。

一部の実施形態では、前記複数の治療進行埋め込みを取得するステップは：前記複数のベースライン治療画像を前記訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン治療埋め込みを取得するステップと、前記複数のフォローアップ治療画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ治療埋め込みを取得するステップと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ治療埋め込みを取得するステップと、前記複数のフォローアップ治療埋め込みと前記複数の予測フォローアップ治療埋め込みとの間の差を算出することによって前記複数の治療進行埋め込みを決定するステップ。

一部の実施形態では、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている。

一部の実施形態では、前記訓練済み線形モデルは線形混合モデルである。

一部の実施形態では、前記プラセボ群は第１のプラセボ群であり、前記線形モデルは前記第１のプラセボ群とは異なる第２のプラセボ群からの画像データを用いて訓練されている。

一部の実施形態では、前記分類モデルは、入力進行埋め込みを受信し、また、前記プラセボ又は前記治療を患者が受けたのかを示す分類結果を出力するように構成されている。

一部の実施形態では、前記複数のベースラインプラセボ画像、前記複数のフォローアッププラセボ画像、前記複数のベースライン治療画像、及び前記複数のフォローアップ治療画像は、生検画像である。

治療についての薬物反応組織学的表現型（ＤＲＰ）との関係で着目コバリアントを識別する例示的な方法は次のステップを含む：臨床被験者群から取得された共変量クラスについてのコバリアント情報を受信するステップと、前記臨床被験者群から複数のベースライン画像及び複数のフォローアップ画像を受信するステップと、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて複数の進行埋め込みを取得するステップと、前記複数の進行埋め込みを訓練済み分類モデル内へと入力して前記臨床被験者群のＤＲＰ値について示す複数の分類結果を取得するステップと、前記臨床被験者群についての前記コバリアント情報、前記複数の分類結果、及び１つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントと前記ＤＲＰ値との間の関連を決定して、前記着目コバリアントを識別するステップ。

一部の実施形態では、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える。

一部の実施形態では、前記複数の候補コバリアントは複数の候補遺伝子を備える。

一部の実施形態では、方法はさらに次のステップを含む：前記識別された着目コバリアントに基づいて新規被験者にて着目疾患を診断するステップを含む、方法。

一部の実施形態では、方法はさらに次のステップを含む：前記識別された着目コバリアントに基づいて治療を開発するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記識別された着目コバリアントに基づいて前記治療を施す、調整する、又は適用するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記識別された着目コバリアントに基づいて医学的提案を提供するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記識別された着目コバリアントに基づいて生物学的標的を識別するステップ。

一部の実施形態では、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて前記複数の進行埋め込みを取得するステップは次のステップを含む：前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップ。

一部の実施形態では、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている。

一部の実施形態では、前記着目コバリアントを識別するステップは：前記複数の候補コバリアントの候補コバリアントについて：前記臨床被験者群のＤＲＰ値及び前記コバリアント情報に基づいたモデルを生成するステップと、前記モデルに基づいて相関メトリックを決定するステップ。

一部の実施形態では、前記相関メトリックはＰ値である。

一部の実施形態では、方法はさらに次のステップを含む：前記相関メトリックを所定の閾値に対して比較して前記候補コバリアントが前記着目コバリアントであるかを決定するステップ。

着目疾患の進行に関して治療を評価する例示的な方法は次のステップを含む：医用画像を取得するステップであって、該医用画像は：（ａ）プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ画像と、（ｂ）前記プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ画像と、（ｃ）治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療画像と、（ｄ）前記治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療画像とを備える、ステップと、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するステップであって、各埋め込みは前記医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを訓練済み線形回帰モデル内へと入力して複数の予測連続医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア及び複数の治療進行スコアを決定するステップと、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップと、前記複数の疾患進行スコアと前記治療との間の相関メトリックを前記関連に基づいて決定するステップ。

一部の実施形態では、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは：前記（ａ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得することと、前記（ｂ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得することと、前記（ｃ）を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得することと、前記（ｄ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得することとを含む。

一部の実施形態では、前記複数の埋め込みを前記訓練済み線形回帰モデル内へと入力するステップは：前記複数のベースラインプラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のベースラインプラセボスコアを取得することと、前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアッププラセボスコアを取得することと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して複数のベースライン治療スコアを取得することと、前記複数のフォローアップ治療埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアップ治療スコアを取得することとを含む。

一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは：前記複数のベースラインプラセボスコアと前記複数のフォローアッププラセボスコアとの間の差を決定して前記複数のプラセボ進行スコアを決定することと、前記複数のベースライン治療スコアと前記複数のフォローアップ治療スコアとの間の差を決定して前記複数の治療進行スコアを決定することとを含む、方法。

一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは：前記プラセボ群内の各被験者について、前記プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、前記治療群内の各被験者について、前記治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む。

一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む。

一部の実施形態では、前記相関メトリックはモデルのＰ値である。

一部の実施形態では、方法はさらに次のステップを含む：前記比較に基づいて、前記治療と前記着目疾患との間の関連を識別するステップ。

一部の実施形態では、方法はさらに次のステップを含む：前記関連に基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。

一部の実施形態では、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化される。

着目患者サブグループを識別する例示的な方法は次のステップを含む：臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップと、前記複数の埋め込みをクラスタリングして１つ以上の埋め込みクラスタを生成するステップと、前記１つ以上の埋め込みクラスタに対応する１つ以上の患者サブグループを識別するステップと、前記１つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するステップ。

一部の実施形態では、前記コバリアントは着目治療であり、また、前記着目患者サブグループは前記着目治療が相当なインパクトを及ぼすサブグループである。

一部の実施形態では、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、前記患者サブグループ内の患者が前記着目治療を受けたかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。

一部の実施形態では、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む。

一部の実施形態では、前記相関メトリックはＰ値である。

一部の実施形態では、前記生成されたモデルは前記患者サブグループ内の被験者の疾患進行値によって訓練される。

一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者の医療診断スコアを含む。

一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者の進行スコアを含む。

一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者のＤＲＰ値を含む。

一部の実施形態では、前記コバリアントは着目疾患の進行であり、また、前記着目患者サブグループは前記着目疾患の前記進行と有意な関連を有するサブグループである。

一部の実施形態では、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、患者が前記患者サブグループに属するかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。

一部の実施形態では、前記相関メトリックはＰ値である。

一部の実施形態では、前記生成されたモデルは前記臨床被験者群の疾患進行値によって訓練される。

一部の実施形態では、前記疾患進行値は、前記患者サブグループ内の被験者の医療診断スコア、前記患者サブグループ内の被験者の進行スコア、又は前記患者サブグループ内の被験者のＤＲＰ値を含む。

一部の実施形態では、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである。

一部の実施形態では、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。

一部の実施形態では、前記相関メトリックはＰ値である。

着目疾患との関係で少なくとも１つの着目生物学的標的を識別する例示的な方法は次のステップを含む：臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを複数の候補生物学的標的の各候補生物学的標的と関連付けて、前記複数の候補生物学的標的についてのサブセットを識別するステップであって、前記複数の生物学的標的のサブセットは前記複数の医用画像にて反映されている表現型特性と関連付けられている、ステップと、前記複数の候補生物学的標的の前記サブセットの各候補生物学的標的を前記着目疾患と関連付けて前記着目疾患の発病又はその進行に関して機能的インパクトを及ぼす少なくとも１つの着目生物学的標的を前記サブセットから識別するステップと、調節する生物学的標的を識別するステップであって、前記調節は、前記着目疾患に関しての前記少なくとも１つの生物学的標的の機能的インパクトに関して変更、オフセット、緩和、補足や補完するように設計されている、ステップ。

例示的なシステムは：１つ以上のプロセッサと、メモリと、１つ以上のプログラムとを備えるのであって、前記１つ以上のプログラムは前記メモリ内に記憶されており且つ前記１つ以上のプロセッサによって実行されるように構成されており、前記１つ以上のプログラムは上述された方法のいずれかを行うための命令を含む。

例示的な非一時的コンピュータ可読記憶媒体は１つ以上のプログラムを記憶するのであって、該１つ以上のプログラムは命令を備えるのであり、該命令は電子装置の１つ以上のプロセッサによって実行されると該電子装置に上述された方法のいずれかを行わせる。

特許又は出願のファイルは、少なくとも１つのカラーで表された図面を含む。

カラー図面を伴うこの特許又は特許出願公報のコピーは、請求及び必要費用の支払いがなされたらば、当局から提供される。

いくつかの実施形態による、例示的な発見プラットフォームのアーキテクチャについて示す図である。いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的な方法について示す図である。いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。いくつかの実施形態による、例示的な教師なし機械学習モデルについて示す図である。いくつかの実施形態による、例示的な対照学習アルゴリズムの訓練のためのデータアーキテクチャについて示す図である。いくつかの実施形態による、医療診断スコアを予測するための例示的な線形回帰モデルの適合化について示す図である。いくつかの実施形態による、医療診断スコアを予測するための例示的なバリアント特有モデルの適合化について示す図である。いくつかの実施形態による、着目疾患との関係で少なくとも１つの着目遺伝的バリアントを識別するための例示的な処理について示す図である。いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。いくつかの実施形態による、例示的な線形回帰モデルの適合化について示す図である。いくつかの実施形態による、例示的なＧＡＮモデルについて示す図である。いくつかの実施形態による、予測されたシミュレーション画像の生成について示す図である。図１２Ａは、いくつかの実施形態による、増大する線維症スコアを可視化するための予測画像タイルについての例示的なセット及び３つのシミュレーション画像を伴う例示的なシリーズについて示す図である。図１２Ｂは、いくつかの実施形態による、増大するＰＮＰＬＡ３タイルスコアを可視化するための予測画像タイルについての例示的なセット及び３つのシミュレーション画像を伴う例示的なシリーズについて示す図である。いくつかの実施形態による、様々なスコアと関連付けられている組織学的効果を可視化するための予測シミュレーション画像の例示的なシリーズについて示す図である。いくつかの実施形態による、医療診断スコアを予測するように構成された様々な線形モデルの性能について示す図である。図１５Ａは、いくつかの実施形態による、研究、サイト、及び病理スコア効果を伴うバリアントコンポーネントモデルについて示す図である。図１５Ｂは、いくつかの実施形態による、サイト及び研究影響について調整がなされる埋め込みについての例示的な全ゲノム的関連研究（ＧＷＡＳ、genome-wide association study）について示す図である。図１５Ｃは、いくつかの実施形態による、例示的な全フェノーム的関連研究（ＰｈｅＷＡＳ、phenome-wide association study）について示す図である。いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な方法について示す図である。いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な処理について示す図である。いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。いくつかの実施形態による、線形モデルについての例示的な訓練処理について示す図である。いくつかの実施形態による、治療についての薬物反応組織学的表現型（ＤＲＰ、Drug Response histological Phenotype）との関係で着目コバリアントを識別する例示的な方法について示す図である。いくつかの実施形態による、治療についての薬物反応表現型（ＤＲＰ、Drug Response Phenotype）との関係で着目コバリアントを識別する例示的な方法について示す図である。いくつかの実施形態による、着目疾患の進行との関係で治療を評価するための例示的な方法について示す図である。いくつかの実施形態による、着目疾患の進行との関係で治療を評価するための例示的な方法について示す図である。いくつかの実施形態による、着目患者サブグループを識別するための例示的な方法について示す図である。いくつかの実施形態による、３つの患者クラスタについて示す図である。図２６Ａは、いくつかの実施形態による、例示的な縦型の表現分析について示す図である。図２６Ｂは、いくつかの実施形態による、例示的な遺伝子関連研究について示す図である。いくつかの実施形態による、ＤＲＰと発現との間の関連についての研究について示す図である。いくつかの実施形態による、ｚスコアの比較について示す図である。いくつかの実施形態による、例示的な電子装置について示す概略図である。

以下の詳細な説明は、当業者が様々な実施形態をもたらし並びにこれらを使用することを可能とするために提示されている。具体的な送致、手法、及び用途は、例示的に示されているに過ぎない。開示の例に対しての様々な改変は当業者にとっては明らかであり、本発明の精神及び範囲から逸脱することなく本明細書にて画定した一般原理を他の例や用途に適用できる。したがって、様々な実施形態は、本明細書にて説明及び示された例に限定されることは意図されておらず、むしろ特許請求の範囲と整合する範囲を与えられるべきである。

本明細書にて、発見プラットフォームを提供することに向けられた方法、システム、電子機器、非一時的記憶媒体、及び装置が開示される。発見プラットフォームは多遺伝子疾患等の複雑な疾患に適用でき、標的識別や臨床試験間分析を可能としたり解釈容易性を向上させたりすることができる。発見プラットフォームは弱い類いの又は未知の遺伝的駆動因子に適用できる。例えば、ＮＡＳＨは未知の遺伝的アーキテクチャを伴う疾患である。一部の実施形態では、発見プラットフォームは、着目遺伝的バリアントとＮＡＳＨ等の着目疾患との間の関係（例えば、因果関係）を識別できる。識別された関係は、新規被験者において着目疾患が発生する尤度について決定するために用いることができ、特定の症状又は他の疾患関連因子の存在をもとに新規被験者に疾患があるかをより高い信頼度を伴って診断できる。また、新規被験者にて遺伝的バリアントが識別された場合、着目疾患についての診断又は予後診断を適宜提供でき、これには疾患がどのように進行することが期待され得るかについての予後診断が含まれ得る。例えば、ＮＡＳＨについて着目遺伝的バリアントが発見された場合、新規被験者についてゲノム検査を行ってバリアントを検出できる。バリアントが存在する場合、システムは、疾患の発現を予測でき、診断を提供でき、及び／又は新規被験者においてどのように疾患が進行するかについて予後診断を提供できる。

一部の実施形態では、発見プラットフォームは複数の段階を備えることができる。第１段階では、例示的なシステム（例えば、１つ以上の電子装置）は、着目疾患等の着目表現型に関する医用画像データに基づいて、埋め込みを生成する。埋め込みとは、変数からベクトル（数値アレイ）への写像である。上述のように、埋め込みが指すのは、医用画像データにて反映されている着目疾患との関係での表現型状態についてのベクトル発現である。埋め込みは、医用画像データのリッチなセマンティック情報（例えば、画像内にて反映されている組織の微細構造の特徴）を捕捉する一方で、下流側の分析に関して関連性を有さない情報（例えば、画像の向き）は排する。例示的な実装例では、着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）であり、また、医用画像はいくつかの臨床試験からのヘマトキシリン・エオジン（Ｈ＆Ｅ、hematoxylin & eosin）染色肝生検からのものである。結果として得られる教師なしでの埋め込みは、標的識別や臨床試験間分析を可能にし、また、上述のように解釈容易性を向上させ得る。

一部の実施形態では、システムは、医用画像データを対照学習アルゴリズム等に入力することによって埋め込みを生成する。対照学習モデルは、画像データから埋め込みを抽出できるのであり、また、上述のように、埋め込みはさもなければそのようなデータに割り当てられ得る生物学的エンドポイント又はラベル（例えば、着目疾患の進行）に関して線形的に予測できる。適した対照学習モデルは、同じサンプル画像の異なる増強結果からの埋め込みの間の類似性を最大化し、且つ、異なるサンプル画像の埋め込み間の類似性を最小化するように訓練される。例えば、モデルは、回転、反転、クロッピング、及び色ジッタリングに関して不変となる埋め込みを画像から抽出できる。

一部の実施形態では、埋め込みに関しては、下流側の分析に用いられる前に平均アグレゲーション及び／又は正規化をなすことができる。一部の実施形態では、埋め込みの正規化は分散安定化変換を行うことを伴い、これによってラベルの生物学的エンドポイントを線形的に予測するその能力が向上し得る。本明細書では、正規化によって、埋め込みに基づいて適合化された線形予測モデルの性能を向上させ得る。一部の実施形態では、正規化済みの埋め込みを用いて適合化された線形モデルは、教師あり機械学習モデルと同様の又はそれより優位な予測能力を有するのであり、また、後述のように生成及び適用に関してより演算的に効率的である。

第２段階では、システムは、例えば１つ以上の線形回帰モデルを用いて、埋め込みについての統計分析を行う。画像データではなく埋め込みを用いて統計分析をなすことによって、いくつかの技術的利点がもたらされる。第１に、埋め込みは、画像データのリッチなセマンティック情報（例えば、画像内にて反映されている組織の微細構造の特徴）を捕捉する一方で、下流側の分析に関して関連性を有さない情報（例えば、画像の向き）は排する。さらに、埋め込みは、それ自体が表す画像データよりも相当に小さなサイズのものとなっている。例示的な実装例では、埋め込みは2048次元のベクトルとすることができる一方で、対応する医用画像は膨大な画素数に対応するデータを含んでいる（例えば、数万画素、数十万画素、数百万画素等）。

さらに、埋め込みによれば、システムは、入力として埋め込みを受信し及び予測を出力するように構成された線形回帰モデルを生成（例えば、適合化）することができる。一部の実施形態では、線形回帰モデルは線形混合モデルであり、これらは治療及び潜在的な共変量効果を含む表現型的バリエーションについての埋め込みについての統計分析のための柔軟な枠組みをもたらす。本明細書にて説明されるように、埋め込みに基づいて生成されている線形モデルは、教師あり機械学習モデル（例えば、画像データを受信するように構成されたニューラルネットワーク）と同様の又はそれより優位な予測力を提供できるのであり、また、教師あり機械学習モデルよりも訓練及び適用に関してより演算的に効率的である。

一部の実施形態では、発見プラットフォームの第２段階は、着目疾患について示す連続スコア等の医用画像についての細かい粒度のラベルを取得するために埋め込みを用いることを伴う。例えば、線形モデルは、埋め込みと該埋め込みに関連付けられている病理学者によって割り当てられた離散的医療診断スコアとに基づいて、生成（例えば、適合化）されることができる。そして、モデルは、埋め込みに適用されて、連続医療診断スコアを予測することができる。

予測連続スコア（predicted continuous score）は、病理学者によって割り当てられた離散スコアに対して強力な利点を有している。具体的には、予測スコア（predicted score）は、連続的な値をとるのであり、故に病理学者によって割り当てられた離散スコアよりもニュアンスが多く捕捉されることとなる。埋め込み（及び画像データ）に連続的スコアを割り当てる能力の結果、より高い精密性及び下流側の分析における向上した統計能力がもたらされるのであり、例えば示される疾患状態の各々と遺伝的バリアントとの間により緊密な関連を取得し得る。例えば、ＮＡＳＨ及び肝線維症の重症度は病理学者によってNASH CRN及びIshakステージ序数スコアによって組織学的に評価されるのであって、例えば次のものがある：Ishak線維症スコア（０～６）、脂肪症スコア（０～３）、小葉内炎症スコア（０～～３）、及びバルーニングスコア（０～２）。これらのメトリックの量的分析は、その手法の疾患分類が解像度の低さ故に困難を含む。線形モデルに関しては訓練をなして、画像データ（例えば、Ｈ＆Ｅ肝生検画像データ）から病理スコアについて予測をもたらし得る連続スコアを生成できる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析及び遺伝関連研究について促進し得る。

一部の実施形態では、システムは、候補遺伝的バリアントと着目疾患との間での関連検定を行う。各医用画像（例えば、組織学画像）は、撮像元の人間対象からの関連遺伝子を伴う。関連検定は、候補遺伝的バリアントと着目疾患について示す連続スコアとに基づいて線形モデルを生成することを伴う。システムは、全ての着目候補遺伝的バリアント（例えば、100,000種、100万種、1,000万種等のバリアント）についてバリアント特有モデル（例えば、100,000種、100万種、1,000万種等のモデル）を生成できる。各モデルを評価して、各候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定して、１つ以上の着目遺伝的バリアントを識別できる。

一部の実施形態では、システムは、複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、埋め込みと有意な関連を有する候補遺伝的バリアントについてのサブセットを識別する。候補遺伝的バリアント（candidate genetic variant）と埋め込みとの間の関連について評価することによって、システムは、画像内にて反映されている組織学的差異と関連付けられている候補遺伝的バリアントについてのサブセットを識別する。一部の実施形態では、システムは、各候補バリアント（candidate variant）についてバリアント特有モデルを生成することによって関連検定を行うのであって、これは埋め込みを受信し及び候補遺伝的バリアントの値を出力するように構成されている。そして、バリアント特有モデルは評価されて、各候補遺伝的バリアントと埋め込みとの間に有意な関連があるかについて決定される（例えば、バリアント特有モデルと関連付けられているＰ値に基づいて）。システムは、全ての候補遺伝的バリアント（例えば、100,000種、100万種、1,000万種等のバリアント）についてバリアント特有モデル（例えば、100,000種、100万種、1,000万種等のモデル）を生成して、候補遺伝的バリアントについてのサブセットを識別できる。さらに、システムは、サブセット内の各候補遺伝的バリアントを着目疾患と関連付けて、少なくとも１つの着目遺伝的バリアントを識別できる。一部の実施形態では、システムは、サブセット内の候補遺伝的バリアントについてバリアント特有スコア予測モデルを生成できるのであって、これは候補遺伝的バリアントについて示す値を受信し及び着目疾患に関する医療診断スコアを出力するように構成されている（例えば、上述の連続スコアに基づいて）。そして、モデルについては評価して、候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定する。

第２段階では、他の関連検定手順を実施できる。一部の実施形態では、関連検定は次のものに基づき得る：出力が埋め込みであり入力が共変量である単変量線形モデル、出力が埋め込みであり入力が共変量である多変量線形モデル、又は出力が共変量であり入力が埋め込みである線形モデル。また、関連検定手順は、線形混合モデルやロジステイック回帰等の線形モデルの拡張や非線形モデル（例えば、ランダムフォレストやＳＶＭ等）に基づいていることもできる。関連検定手順の適用によって、各埋め込み次元と検査されたあらゆる共変量との間での、又は、全体としての埋め込み次元の全てと検査されたあらゆる共変量との間での関連についてのＰ値をもたらし得る。多重仮説検定手順（例えば、Bonferroni型やBenjamini Hochberg型）を通じて決定される統計的に有意な関連によれば、高コンテンツ表現型データセット（例えば、医用画像データ）におけるバリエーションと関連付けられている因子をもたらし得る。

第３段階においてシステムは、識別済み着目ジェネリック等の識別済み着目コバリアントの組織学的効果を説明するために画像に関して可視化をなすか可視化を支援できる。一部の実施形態では、システムは、線形モデルを用いて測定エンドポイントについて予測し得る生検画像タイルを識別する。線形補間によって複数の埋め込みを生成して、着目疾患の進行を表すことができる。埋め込みを、疾患の表現型状態を表す一連の画像に変換することができる。一連の画像はアニメーションとして表示でき、関連する組織学的な変化について可視化表示を提供できるのであり、これによらずにしては病理スコアについての関連研究によって検出ができない場合がある。可視化によって、モデル及び組織学的な変化に基づいての仮説の生成に用いられる特徴の解釈が支援され得る。したがって、システムは、第２段階では疾患ラベルと関連付けられていないバリアントを発見でき、また、第３段階では新規の可視化ツールによってそれらの効果を特徴付けることができる。

一部の実施形態では、シミュレーション画像の形式での予測画像は、訓練済み敵対的生成ネットワーク（ＧＡＮ）モデルの生成器コンポーネントによって生成される。生成器は、埋め込み（例えば、画像タイル埋め込み）に条件付けられたシミュレーション画像を生成でき、他の特徴を一定に保ちつつ表現型に沿った補間を可能とできる。例えば、生成器は、（条件としての）埋め込みｘ及び標準的な正規分布からサンプリングされたノイズベクトルｕを受信し、並びに、シミュレーション画像を出力するように構成されていることができる。１つの例示的な実装例では、埋め込みｘは２０４８次元の埋め込みであり、ノイズベクトルｕは標準的な正規分布からサンプリングされた５１２次元のベクトルである。

一部の実施形態では、予測画像は、各画像の予測スコア及び／又はそのような画像の埋め込みとの関係で生成された予測特徴に基づいてランキングされた実際の医用画像から選択されることができる。可視化される画像は、ランキングされた画像の一部又は全部とされ得る。例えば、ランキングの上位Ｎ件の画像を表示できる。別の例を挙げるに、上位Ｎ件及び下位Ｍ件の画像を表示できる。ランキングに基づいて代替的な画像サブセットを選択することもできる。

本明細書にて説明される実施形態は、単に例示的なものにすぎず、また、発見プラットフォームは任意の着目表現型と共変量との間の関連を発見するために活用できる。本明細書にて説明される一部の例について述べるに：表現型データには医用画像が含まれ；着目表現型は着目疾患（例えば、ＮＡＳＨ）であり、これは医療診断スコア（例えば、線維症スコア）によって表されることができ；着目共変量は着目遺伝的バリアントである。もっとも、本明細書にて説明される手法は別の着目表現型と別の共変量との間の関連を発見することに関して活用することもできるということに留意されたい。例示的な表現型データとしては次のものが含まれるがこれらには限定されないのであり、また、他の列挙が限定的であるとも示唆はされない：生体医用画像（例えば、ＭＲＩ、Ｘ線、ＣＴスキャン）、病理組織学データ（例えば、Ｈ＆Ｅ染色、トリクローム染色）等の生検試料から生成された医用画像、臨床バイオマーカデータ（例えば、プロテオミクスやｃｆＤＮＡを含む血液検査測定値、認知／精神評価スコア、マイクロバイオーム評価等）、及びゲノムバイオマーカデータ（例えば、バルクＲＮＡ－ｓｅｑ、メチル化データ、ゲノム配列データ、エピジェネティック配列データ等）。例示的な表現型としては次のものが含まれるがこれらには限定されないのであり、また、他の列挙が限定的であるとも示唆はされない：着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、トランスクリプトミクス、又はリピドミクス等。例示的な共変量としては次のものが含まれるがこれらには限定されないのであり、また、他の列挙が限定的であるとも示唆はされない：人口統計情報（例えば、年齢や性別）、臨床共変量（例えば、疾患状態、臨床スコア又は血液バイオマーカ）、ゲノムデータ（例えば、遺伝子データ、発現データ、メチル化データ、等）等。

一部の実施形態では、識別済みの関係は、バイオマーカや疾患介入用の標的の識別に関して用いられ得る。例えば、発病又は進行との関係で因果関係にあると識別された特定の遺伝的バリアントに関しては、治療的介入に関してそれらが適するかをさらに評価できる。また、遺伝的バリアントが着目疾患に対して及ぼす機能的インパクトを考慮して、治療的介入のための追加的な生物学的標的を識別することができる。そのような生物学的標的は、例えば、着目遺伝的バリアントが所在する遺伝子によって転写されるたんぱく質の場合がある。そのような生物学的標的は、着目疾患の少なくとも１つの遺伝的バリアントの機能的インパクトに関して変更、オフセット、緩和、補足や補完するものと見込まれている他の遺伝子、たんぱく質、又は代謝産物を含み得る。一部の実施形態では、識別済みの関係は、治療を開発するために用いられ得る。例えば、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療のインパクトを、候補治療に関しての変更型又は類似型の開発に際して、考慮できる。以前施された候補治療の効果に関しての縦型の及びクロスセクショナル型のデータの双方は、着目疾患の予測状態又は進行と比較でき、量的観点から、着目疾患の状態又は進行に関して着目遺伝的バリアントがどの程度まで以前施された候補治療のインパクトに影響を与えるかを決定できる。そのような候補治療に関しての変更型又は類似型については、疾患及びその被験者群との関係での遺伝的バリアントのインパクトを考慮して、強化された治療的効果又は減じられた有害副作用を有するように選択できる。また、遺伝的バリアントを反映している疾患モデルは、治療的候補をスクリーニングするために用いられ得る。例えば、ゲノム特徴との関連付けの場合、統計的に有意な関連付けは新規な候補薬剤標的又は人間の疾患に関与する主要経路の発見につながり得る。同様に、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療（candidate therapies）のインパクト（疾患状態に対しての有害なインパクト又は副作用を含む）は、組合せ型治療の開発に用いられ得る。したがって、本明細書にて説明される手法は、異なる遺伝的背景を有する被験者間で治療的候補（therapeutic candidates）に対しての起こるであろう応答を予測するために、特定の治療を受けるべき適切な患者コホートを識別するために、及び結果を最適化するために臨床試験を一般的に設計するために用いることができる。

発見プラットフォームは、治療を選択的に施し、調整し、又は適用するために用いられ得る。一部の実施形態では、識別済みの関係は医学的提案を提供するために用いられ得る。医学的提案は、患者に対しての治療及び／若しくは療法の提案、並びに／又は、支援をもらうために医療専門家に連絡せよとの指示を含み得る。一部の実施形態では、識別済みの関係に基づいてレポートが生成され得る。人口統計及び臨床的な特徴と関連付けられている場合、有意な関連は、新たな関連付けの発見につながったり（例えば、性別、年齢、コレステロール水準等との関連）、及び／又は、データセット内のテクニカルバイアス（例えば、特定の臨床センタとの関連）の探知につながり得る。

一部の実施形態では、識別済みの関係（relationship）は、着目疾患の治療のための生物学的標的（例えば、薬剤標的）を識別するために用いられ得る。一旦、遺伝的バリアントが特定の疾患と関連付けられている（associated）ものとして識別されたらば、遺伝的バリアントは該疾患の治療のための標的（例えば、薬剤標的）として用いられ得る。一部の実施形態では、疾患と相関付けられている（correlated）遺伝的バリアントについては研究して、遺伝子機能や疾患病理（例えば、遺伝子型／表現型相関）についてさらなる理解を得る、及び／又は患者における疾患の治療のための遺伝的バリアントの治療的ターゲティングの有望性を査定する。例えば、遺伝的バリアントは機能喪失バリアントたり得るのであり、これは遺伝的バリアントを構成する遺伝子の発現の欠如故に疾患病理を付与する。一部の実施形態では、遺伝的バリアント遺伝子型との相関する疾患表現型に対しての様々な薬剤の効果を評価するために薬剤スクリーニングがなされる。一部の実施形態では、疾患治療用薬剤は、該薬剤による治療後の疾患表現型の緩和に基づいて選択される。一部の実施形態では、遺伝的バリアントはＮＡＳＨ疾患と相関付けられている。一部の実施形態では、ＮＡＳＨ疾患と相関付けられている遺伝的バリアントはＮＡＳＨ疾患治療用の薬剤標的である。生物学的標的は関連付けられている遺伝的バリアントそれ自体とされ得るも、標的は次のものをも含み得る：（ａ）バリアントを含む遺伝子によって転写されるたんぱく質又は代謝産物、（ｂ）バリアントによって惹起された不足をオフセット／補うことができるたんぱく質又は代謝産物、（ｃ）バリアント及びその機能的インパクトの逆作動薬である遺伝子、たんぱく質又は代謝産物等。

以下の説明では、例示的方法、パラメータ、及びこれらに類することについて記載されている。もっとも、そのような説明は、本開示の範囲の限定として意図されるものではなく、代わりに、例示的実施形態の説明として提供されることを認識されたい。

以下の説明は、用語「第１」、「第２」等を使用して、種々の要素を説明するが、これらの要素は、用語によって限定されるべきではない。これらの用語は、１つの要素を別の要素から区別するためにのみ用いられているにすぎない。例えば、第１のグラフィカル表現は、種々の説明される実施形態の範囲から逸脱することなく、第２のグラフィカル表現と称され得るのであり、同様に、第２のグラフィカル表現は、第１のグラフィカル表現と称され得る。第１のグラフィカル表現及び第２のグラフィカル表現は両方ともグラフィカル表現であるも、それらは同一グラフィカル表現ではない。

本明細書の種々の説明される実施形態の説明において使用される用語は、特定の実施形態を説明する目的のためのものにすぎず、限定することは意図されていない。種々の説明される実施形態の説明および添付の請求項において使用されるように、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈によってそうでないことが明確に示されない限り、複数形形態も同様に含むように意図される。また、用語「及び／又は」は、本明細書に使用されるように、関連付けられる列挙されたアイテムのうちの１つ以上のあらゆる可能性として考えられる組み合わせを指し、包含することを理解されたい。さらに、「ｉｎｃｌｕｄｅｓ（～を含む）」、「ｉｎｃｌｕｄｉｎｇ（～を含む）」、「ｃｏｍｐｒｉｓｅｓ（～を備える）」及び／又は「ｃｏｍｐｒｉｓｉｎｇ（～を備える）」との語は、本明細書において使用されるとき、述べられた特徴、整数、ステップ、動作、要素、及び／又は構成要素の存在を規定するが、１つ以上の他の特徴、整数、ステップ、動作、要素、構成要素、及び／又はその群の存在または追加を除外しないことを理解されたい。

「ｉｆ（～の場合）」との語は、随意的には、文脈に応じて、「ｗｈｅｎ（～のとき）」または「ｕｐｏｎ（～に応じて）」若しくは「ｉｎｒｅｓｐｏｎｓｅｔｏｄｅｔｅｒｍｉｎｉｎｇ（～を決定することに応答して）」又は「ｉｎｒｅｓｐｏｎｓｅｔｏｄｅｔｅｃｔｉｎｇ（～を検出することに応答して）」を意味するように解釈される。同様に、「ｉｆｉｔｉｓｄｅｔｅｒｍｉｎｅｄ（～であることが決定される場合）」又は「ｉｆ［ａｓｔａｔｅｄｃｏｎｄｉｔｉｏｎｏｒｅｖｅｎｔ］ｉｓｄｅｔｅｃｔｅｄ（［述べられた条件または事象］が検出される場合）」は、随意的には、文脈に応じて、「ｕｐｏｎｄｅｔｅｒｍｉｎｉｎｇ（～を決定することに応じて）」又は「ｉｎｒｅｓｐｏｎｓｅｔｏｄｅｔｅｒｍｉｎｉｎｇ（～を決定することに応答して）」若しくは「ｕｐｏｎｄｅｔｅｃｔｉｎｇ［ｔｈｅｓｔａｔｅｄｃｏｎｄｉｔｉｏｎｏｒｅｖｅｎｔ］（［述べられた条件または事象］を検出することに応じて）」又は「ｉｎｒｅｓｐｏｎｓｅｔｏｄｅｔｅｃｔｉｎｇ［ｔｈｅｓｔａｔｅｄｃｏｎｄｉｔｉｏｎｏｒｅｖｅｎｔ］（［述べられた条件または事象］を検出することに応答して）」を意味するように解釈される。

図１はいくつかの実施形態による、例示的な発見プラットフォームのアーキテクチャについて示す。ステージ1では、例示的なシステム（例えば、１つ以上の電子装置）は、着目疾患等の着目表現型に関する医用画像データに基づいて、埋め込みを生成する。埋め込みとは、医用画像データにて反映されている着目疾患との関係での表現型状態についてのベクトル表現である。埋め込みは、医用画像データのリッチなセマンティック情報（例えば、画像内にて反映されている組織の微細構造の特徴）を捕捉する一方で、下流側の分析に関して関連性を有さない情報（例えば、画像の向き）は排する。図１に示されるように、４つの医用画像102a, 102b, 102c, 102dは４つの埋め込みに変換できるのであり、これらは埋め込み空間１０６においてそれぞれ４つのポイント104a, 104b, 104c, 104dとして各々表されるのであり、該空間は本明細書では交換可能な態様で潜在空間１０６とも称される。示されている例では、着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）であり、また、医用画像はいくつかの臨床試験からのＨ＆Ｅ染色肝生検からのものである。結果として得られる教師なしでの埋め込みは、標的識別や臨床試験間分析を可能にし、また、上述のように解釈容易性を向上させ得る。

一部の実施形態では、システムは、医用画像データを対照学習アルゴリズム等に入力することによって埋め込み（例えば、ポイント104a-104dによって表される埋め込み）を生成する。対照学習モデルは、画像データから埋め込みを抽出できるのであって、上述のように埋め込みはさもなければそのようなデータに割り当てられ得る生物学的エンドポイント又はラベル（例えば、着目疾患の進行）に関して線形的に予測できる。適した対照学習モデルは、同じサンプル画像の異なる増強結果からの埋め込みの間の類似性を最大化し、且つ、異なるサンプル画像の埋め込み間の類似性を最小化するように訓練される。例えば、モデルは、回転、反転、クロッピング、色ジッタリング、又は他の画像オーグメンテーション、又はこれらの組み合わせに関して不変となる埋め込みを画像から抽出できる。

一部の実施形態では、埋め込みに関しては、下流側の分析に用いられる前に平均アグレゲーション及び／又は正規化をなすことができる（例えば、ステージ２）。一部の実施形態では、埋め込みの正規化は分散安定化変換を行うことを伴うのであり、単純な回帰ベースド分析を下流側にて適用することが可能となる。本明細書では、正規化によって、埋め込みに基づいて適合化された線形予測モデルの性能を向上させ得る。一部の実施形態では、正規化済みの埋め込みを用いて適合化された線形モデルは、教師あり機械学習モデルと同様の又はそれより優位な予測能力を有するのであり、また、後述のように生成及び適用に関してより演算的に効率的である。

一部の実施形態では、予測画像は着目共変量決定のために識別され得る。一部の実施形態では、予測特徴は組織病理データにてタイルレベルで生成され得る。これは様々な手法を用いて達成され得る。例えば、平均アグレゲーションタイル埋め込みを取得して生検埋め込みを生成できる。生検埋め込みから共変量を予測できるように、このデータを用いて線形モデルを適合化させることができる。また、タイル埋め込みに線形モデルを適用して、タイルレベルスコアを生成できる。別の例を挙げるに、機械学習モデルの複数インスタンスをタイル埋め込みに直接的に適合化させることができる。例えば、各タイルについてスコア及び重みの両方を予測するモデルに関して適合化をなし得るのであり、そしてスコアに関して加重平均がとられる。スコア及び重みの両方は、２次元の予測特徴と看做され得る。

一部の実施形態では、予測画像はそれらの画像と関連付けられている予測特徴に基づいて識別され得る。例えば、最高の又は最低の予測スコアを有するタイルを解析して予測画像を識別できる。別の例を挙げるに、着目条件を定義できる（例えば、高い線維症スコア対低い線維症スコア、第１の遺伝シーケンス対第２の遺伝シーケンス、及びこれらに類する事項）。第１の着目条件との関係での所与のタイルの特徴の確率（例えば、Ｐ（タイル特徴｜条件１））及び第２の着目条件との関係での所与のタイルの特徴の確率（例えば、Ｐ（タイル特徴｜条件２））についてのモデルに関して適合化をなし得る。そして、タイル画像を可視化できる（例えば、ユーザインタフェース上でのレンダリング）。一部の実施形態では、Ｐ（タイル特徴｜条件１）／Ｐ（タイル特徴｜条件２）は、所与の特徴を伴うタイルの観測確率が条件１又は条件２（又は定義されている場合には他の条件）下でよりあり得ることを表し得る。該比は、十分に大きい又は小さい場合には条件１又は条件２の尤度がより大きいことを示すことになる。一部の実施形態では、低い予測確率を有するタイルについてはフィルタリングして外れ値を無視することができる。

ステージ２では、システムは（例えば、ステージ１で用いられる１つ以上の電子装置と同一又は類似の１つ以上の電子装置）、例えば１つ以上の線形回帰モデルを用いて、埋め込みについての統計分析を行うことができる。画像データではなく埋め込みを用いて統計分析をなすことによって、いくつかの技術的利点がもたらされる。第１に、埋め込みは、画像データのリッチなセマンティック情報（例えば、画像内にて反映されている組織の微細構造の特徴）を捕捉する一方で、下流側の分析に関して関連性を有さない情報（例えば、画像の向き）は排する。さらに、埋め込みは、それ自体が表す画像データよりも相当に小さなサイズのものとなっている。例示的な実装例では、埋め込みは2048次元のベクトルとすることができる一方で、対応する医用画像は膨大な画素数に対応するデータを含んでいる（例えば、数万画素、数十万画素、数百万画素等）。よって、埋め込みを記憶することによって、医用画像データを用いる場合に比して、メモリを節約しつつ分析の実行に要する処理時間をも減じることができる。

さらに、埋め込みによれば、システムは、入力として埋め込みを受信し及び有用な様々な予測を出力するように構成された線形回帰モデルを生成（例えば、適合化）することができる。一部の実施形態では、線形回帰モデルは線形混合モデルであり、これらは治療及び潜在的な共変量効果を含む表現型的バリエーションについての埋め込みについての統計分析のための柔軟な枠組みをもたらす。本明細書にて説明されるように、埋め込みに基づいて生成されている線形モデルは、教師あり機械学習モデル（例えば、画像データを受信するように構成されたニューラルネットワーク）と同様の又はそれより優位な予測力を提供できるのであり、また、教師あり機械学習モデルよりも訓練及び適用に関してより演算的に効率的である。

一部の実施形態では、ステージ２は、着目疾患について示す連続スコア等の医用画像102a-102dについての細かい粒度のラベルを取得するために埋め込みを用いることを伴う。例えば、線形モデルは、埋め込みと該埋め込みに関連付けられている病理学者によって割り当てられた離散的医療診断スコアとに基づいて、生成（例えば、適合化）されることができる。そして、モデルは、埋め込みに適用されて、連続医療診断スコアを予測することができる。

多くの場合、予測連続スコア（predicted continuous score）は、病理学者によって割り当てられた離散スコアに対して強力な利点を有している。具体的には、予測スコア（predicted score）は、連続的な値をとるのであり、故に病理学者によって割り当てられた離散スコアよりもニュアンスが多く捕捉されることとなる。埋め込み（及び画像データ）に連続的スコアを割り当てる能力の結果、より高い精密性及び下流側の分析における向上した統計能力がもたらされるのであり、例えば示される疾患状態の各々と遺伝的バリアントとの間により緊密な関連を取得し得る。例えば、ＮＡＳＨ及び肝線維症の重症度は病理学者によってNASH CRN及びIshakステージ序数スコアによって組織学的に評価されるのであって、例えば次のものがある：Ishak線維症スコア（整数たる０～６）、脂肪症スコア（整数たる０～３）、小葉内炎症スコア（整数たる０～３）、及びバルーニングスコア（整数たる０～２）。これらのメトリックの量的分析は、その手法の疾患分類が解像度の低さ故に困難を含む。他方で、線形モデルに関しては訓練をなして、画像データ（例えば、Ｈ＆Ｅ肝生検画像データ）から病理スコアについて予測をもたらし得る連続スコアを生成できる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析及び遺伝関連研究について促進し得る。

一部の実施形態では、ステージ２はブロック１１０～１６０を含む。各ブロックは１つ以上のコンピューティングシステムによってなされる機能についての機能的表現である。一部の実施形態では、同じ１つ以上のコンピューティングシステムが２つ以上のブロックのオペレーションを実効化することができる。例えば、ステージ２はブロック１１０を含む。ブロック１１０では、システム（例えば、１つ以上のコンピューティングシステム）は、候補遺伝的バリアントと着目疾患との間での関連検定を行うように構成されていることができる。関連検定は、候補遺伝的バリアントと着目疾患について示す連続スコアとに基づいて線形モデルを生成することを伴う。システムは、全ての着目候補遺伝的バリアント（例えば、100,000種、100万種、1,000万種のバリアント）についてバリアント特有モデル（例えば、100,000種、100万種、1,000万種のモデル）を生成できる。各モデルについては評価して、各候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定できる。ブロック１１０の詳細は図２を参照して説明される。

一部の実施形態では、ステージ２はブロック１２０を含む。ブロック１２０では、システムは、複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、埋め込みと有意な関連を有する候補遺伝的バリアントについてのサブセットを識別するように構成されていることができる。候補遺伝的バリアント（candidate genetic variant）と埋め込みとの間の関連について評価することによって、システムは、（あるならば）画像内にて反映されている組織学的差異と関連付けられている候補遺伝的バリアントについてのサブセットを識別できる。本明細書にて説明される手法は、分析を特定の診断スコアに絞ることによっては発見できないであろう組織学に影響を及ぼすバリアントを識別することができる。

一部の実施形態では、システムは、各候補バリアント（candidate variant）についてバリアント特有モデルを生成することによって関連検定を行うのであって、これは埋め込みを受信し及び候補遺伝的バリアントの値を出力するように構成されている。そして、バリアント特有モデルは評価されて、各候補遺伝的バリアントと埋め込みとの間に有意な関連があるかについて決定される（例えば、バリアント特有モデルと関連付けられているＰ値に基づいて）。システムは、全ての着目遺伝的バリアント（例えば、100,000種、100万種、1,000万種のバリアント）についてバリアント特有モデル（例えば、100,000種、100万種、1,000万種のモデル）を生成できる。

ブロック１２０では、さらに、システムは、サブセット内の各候補遺伝的バリアントを着目疾患と関連付けて、少なくとも１つの着目遺伝的バリアントをサブセットから識別できる。一部の実施形態では、システムは、サブセット内の候補遺伝的バリアントについてバリアント特有スコア予測モデルを生成できるのであって、これは候補遺伝的バリアントについて示す値を受信し及び着目疾患に関する医療診断スコアを出力するように構成されている（例えば、上述の連続スコアに基づいて）。そして、モデルは評価されて、候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定する。ブロック１２０の詳細は図７を参照して説明される。

ブロック１３０では、システムはさらに、着目疾患の進行との関係で治療を評価できる。疾患の進行は、本明細書にて説明される進行埋め込みを用いて定量化することができる。システムは、入力進行埋め込みを受信しプラセボ又は治療を示す分類結果を出力するモデルからの予測として、薬剤応答表現型（ＤＲＰ）として帰属させるように構成されていることができる。システムは、ＤＲＰと治療との間に有意な関連があるかについて決定できる。有意な関連がある場合、下流側の分析において治療をさらに分析できる（例えば、ブロック１４０）。ブロック１３０の詳細は図１６を参照して説明される。

ブロック１４０では、システムはさらに、治療と関連付けられているＤＲＰとの関係で着目コバリアントを識別するように構成されていることができる。ＤＲＰについての帰属決定は、進行埋め込みが利用可能である限り臨床試験データセットを用いることによって行うことができる。ＤＲＰと分子データ（例えば、表現及びジェネティクス）との間の有意な関連は関連検定を介して取り出すことができる。発現ありの関連付けでは、プラセボ対薬剤の差次的発現分析にて検出できなかった遺伝子を識別できる。一部の場合では、ＤＲＰ分析では、真のプラセボ対薬剤（placebo-vs-drug）の差次的発現分析の症例対照として相関付けられている遺伝子セットを識別できる。一部の場合では、ＤＲＰ分析では、より大きなコホートの分析故により大きな遺伝子セットを識別できるのでありＤＲＰ相関の解釈を支援し得る。

一部の実施形態では、小規模臨床試験における治療対プラセボ（treatment vs placebo）の分析のｚスコアに対してのより大規模な臨床試験における帰属ＤＲＰ分析のそれの比較を用いて、相関を識別することができる（例えば、図２８との関係で見られること）。ブロック１４０の詳細は図２０を参照して説明される。

ブロック１５０では、システムはさらに、着目疾患の進行との関係で治療を評価するように構成されていることができる。疾患進行は連続医療診断スコアによって定量化できる。高解像度ＮＡＳＨスコア及び様々な治療の間の有意な関連は、関連検定を介して取り出される。この処理では、病理学者によって割り当てられた離散スコアを用いては検出できなかった、医療診断スコアに対しての薬剤の影響を取り出すことができる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析（例えば、図２６Ａ）及び遺伝関連研究（例えば、図２６Ｂ）について促進し得る。ブロック１５０の詳細は図２２を参照して説明される。

ブロック１６０では、システムはさらに、着目患者サブグループを識別するように構成されていることができる。システムは、患者画像データから埋め込みを取得し及び埋め込みのクラスタを識別して患者サブグループを識別できる。各患者クラスタアイデンティティ及び疾患バイオマーカ、遺伝的バリアント、及び発現レベル間の有意な関連が関連検定にて取り出される。この手順では、患者セグメント及び関連付けられている臨床ラベル及び分子ドライバが取り出される。ブロック１６０の詳細は図２４を参照して説明される。

ステージ２では、他の関連検定手順を実施できる。一部の実施形態では、関連検定は次のものに基づき得る：出力が埋め込みであり入力が共変量である単変量線形モデル、出力が埋め込みであり入力が共変量である多変量線形モデルや、出力が共変量であり入力が埋め込みである線形モデル。また、関連検定手順は、線形混合モデルやロジステイック回帰等の線形モデルの拡張や非線形モデル（ランダムフォレストやＳＶＭ等）に基づいていることもできる。関連検定手順の適用によって、各埋め込み次元と検査されたあらゆる共変量との間での、又は、全体としての埋め込み次元の全てと検査されたあらゆる共変量との間での関連についてのＰ値をもたらし得る。多重仮説検定手順（例えば、Bonferroni型やBenjamini Hochberg型）を通じて決定される統計的に有意な関連によれば、高コンテンツ表現型データセット（例えば、医用画像データ）におけるバリエーションと関連付けられている因子をもたらし得る。

随意的なステージ３では、システムは、シミュレーション画像１７２等のシミュレーション画像を生成して、識別済み着目ジェネリック等の識別済み着目コバリアントの組織学的効果を可視化するように構成されていることができる。図１に示されているように、潜在空間内の埋め込みを生成してそしてこれを画像に変換して着目疾患との関係での表現型状態を可視化できる。一部の実施形態では、システムは、線形モデルを用いて測定エンドポイントについて予測し得る生検画像タイルを識別する。線形補間によって複数の埋め込みを生成して、着目疾患の進行を表すことができる。埋め込みは、一連の画像に変換することができる。一連の画像はアニメーションとして表示でき、関連する組織学的な変化について可視化表示を提供できるのであり、これによらずにしては病理スコアについての関連研究によって検出ができない場合がある。例示的な実装例について述べるに、手順では、ステージ２における発見された着目遺伝的バリアント、生検埋め込み（分析済み生検が行とされ、また、埋め込み次元が列とされる行列）、及びタイル埋め込み（対応するタイルが行とされ、また、埋め込み次元が列とされる行列）が入力として受け付けられて、また、一連のn 256x256タイル画像が出力される。可視化によって、モデル及び組織学的な変化に基づいての仮説の生成に用いられる特徴の解釈が支援され得る。したがって、システムは、ステージ２では疾患ラベルと関連付けられていないバリアントを発見でき、また、ステージ３では新規の可視化ツールによってそれらの効果を特徴付けることができる。

一部の実施形態では、シミュレーション画像は、訓練済み敵対的生成ネットワーク（ＧＡＮ）モデルの生成器コンポーネントによって生成される。生成器は、埋め込み（例えば、画像タイル埋め込み）に条件付けられた画像を生成でき、他の特徴を一定に保ちつつ表現型に沿った補間を可能とできる。例えば、生成器は、（条件としての）埋め込みｘ及び標準的な正規分布からサンプリングされたノイズベクトルｕを受信し、並びに、シミュレーション画像を出力するように構成されていることができる。１つの例示的な実装例では、埋め込みｘは２０４８次元の埋め込みであり、ノイズベクトルｕは標準的な正規分布からサンプリングされた５１２次元のベクトルである。

一部の実施形態では、シミュレーション画像はランキングされる。シミュレーション画像のランキングは、シミュレーション画像の提示及び／又はさらなる分析のための記憶に関しての根拠として用いられ得る。一部の実施形態では、シミュレーション画像は医療診断スコアに基づいてランキングされる。

本明細書にて説明される実施形態は、単に例示的なものにすぎず、また、発見プラットフォームは任意の着目表現型と共変量との間の関連を発見するために活用できる。本明細書にて説明される一部の例について述べるに：表現型データには医用画像が含まれ；着目表現型は着目疾患（例えば、ＮＡＳＨ）であり、これは医療診断スコア（例えば、線維症スコア）によって表されることができ；着目共変量は着目遺伝的バリアントである。もっとも、本明細書にて説明される手法は別の着目表現型と別の共変量との間の関連を発見することに関して活用することもできるということに留意されたい。例示的な表現型データとしては次のものが含まれる：医用画像（例えば、ＭＲＩ、Ｘ線、ＣＴスキャン）、病理組織学データ（例えば、Ｈ＆Ｅ染色、トリクローム染色）、臨床バイオマーカデータ（例えば、プロテオミクスやｃｆＤＮＡを含む血液検査測定値、認知／精神評価スコア、マイクロバイオーム評価等）、及びゲノムバイオマーカデータ（例えば、バルクＲＮＡ－ｓｅｑ、メチル化データ、ゲノム配列データ、エピジェネティック配列データ等）。例示的な表現型には次のものが含まれる：着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、トランスクリプトミクス、又はリピドミクス等。例示的な共変量クラスには次のものが含まれる：人口統計情報（例えば、年齢や性別）、臨床共変量（例えば、疾患状態、臨床スコア又は血液バイオマーカ）、ゲノムデータ（例えば、遺伝子データ、発現データ、メチル化データ、等）等。

図２は、いくつかの例による、着目疾患との関係で着目遺伝的バリアントを識別するための例示的な処理２００について示す。処理２００は、例えば、ソフトウェアプラットフォームを実装する１つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理２００は、クライアント－サーバシステムを使用して実施され、処理２００のステップは、任意の様式において、サーバと１つ以上のクライアントデバイスとの間で分割される。したがって、処理２００の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理２００はそのように限定されることは要さないことに留意されたい。他の例では、処理２００はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理２００では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理２００と組み合わせて実施されてもよい。故に、図示（および下記により詳細に説明）されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。

図２を参照するに、例示的なシステム（例えば、１つ以上の電子装置）は、臨床被験者群から取得された複数の医用画像を取得できる。医用画像は、着目疾患の状態を表す。一部の実施形態では、複数の医用画像は、臨床被験者群からの生検試料の複数の生検画像を含む。例えば、生検では１つ以上の組織スライドを被験者から取得でき、また、１つ以上のデジタル画像を撮って各組織スライドを撮像できる。

図３Ａに示される例示的なワークフローでは、生検1-nがなされている。生検1-nは複数の被験者（例えば、がん患者）及び／又は複数回の訪問（例えば、スクリーニング訪問回やフォローアップ訪問回）に対応し得る。示されている例では、着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）であり、また、生検はいくつかの臨床試験からのＨ＆Ｅ染色肝生検である（もっとも、類似のワークフローは他の着目疾患について実装され得る）。各生検（例えば、生検1）は、１つ以上の生検画像（例えば、生検1についての医用画像３０２）を結果としてもたらす。したがって、生検1-nは、医用画像３０２、医用画像３５２等を含む複数の医用画像を結果としてもたらす。

医用画像は、様々なデータと関連付けられることができる。例えば、図３Ａを参照するに、関連データ３０４は生検1と関連付けられており、データ３５４は生検nと関連付けられており以下同様。後述のように、データは着目疾患及び被験者についての既知情報を含み得るのであり、着目遺伝的バリアントについての情報も含まれる。

一部の実施形態では、医用画像と関連付けられているデータは、着目疾患に関する割り当て済み医療診断スコアを含み得る。割り当て済み医療診断スコアは、疾患状態を示し得る。一部の実施形態では、医療診断スコアは、一人以上の病理学者によって割り当てられた生検レベルスコアであることができ、これはそれらの病理学者の生検スライドの検討に基づいている。例えば、ＮＡＳＨ疾患に関しては、ＮＡＳＨの重症度、及び肝線維症については、病理学者によってNASH CRN及びIshakステージ序数スコアによって組織学的に評価できる。一部の実施形態では、割り当て済み医療診断スコアはIshak線維症スコア等の生検レベル線維症スコアとされ得るのであり、これは離散値たる0, 1, 2, 3, 4, 5,又は6とされる線維症の程度を示すものである。一部の実施形態では、割り当て済み医療診断スコアは生検レベル脂肪症スコアとされ得るのであり、これは離散値たる0, 1, 2,及び3とされる脂肪症の程度を示すものである。一部の実施形態では、割り当て済み医療診断スコアは生検レベル小葉内炎症スコアとされ得るのであり、これは離散値たる0, 1,及び2とされる小葉内炎症の程度を示すものである。一部の実施形態では、割り当て済み医療診断スコアは生検レベルバルーニングスコアとされ得るのであり、これは離散値たる0, 1,及び2とされるバルーニングの程度を示すものである。これらのメトリックの量的分析は、その手法の疾患分類が解像度の低さ故に困難を含む。後述のように、線形モデルに関しては訓練をなして、画像データ（例えば、Ｈ＆Ｅ肝生検画像データ）から病理スコアについて予測をもたらし得る連続スコアを生成できる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析及び遺伝関連研究について促進し得る。

一部の実施形態では、医用画像と関連付けられているデータは、生検サンプルの取得元の被験者の遺伝子データを含み得る。例えば、データ（例えば、関連データ３０４）は、複数の遺伝的バリアントについての被験者遺伝子情報を含み得る（例えば、100,000種、100万種、1,000万種のバリアント）。例えば、データは、被験者が複数の遺伝的バリアントの各々を有するかを示し得る。例えば、母集団において２つのアレルを伴う遺伝的バリアントについては、個体が最低頻度アレルのコピーを0, 1,又は2個有しているかに応じて、医用画像は遺伝的バリアント値（0, 1,又は2）と関連付けられることができる。一部の実施形態では、被験者遺伝子データは、被験者が着目疾患に罹患する尤度を示す多遺伝子リスクスコアとされ得る。

一部の実施形態では、医用画像と関連付けられているデータは（例えば、関連データ３０４、データ３５４等）、生検サンプルの取得元の被験者の人口統計データを含み得る。人口統計データは例えば、性別、年齢、及び／又は治療群（例えば、プラセボ、治療ｘ、治療ｙ）を含み得る。

図３Ａを参照するに、医用画像は複数の画像タイルに分割できる。例えば、生検１の医用画像３０２を分割して画像タイル306-1, 306-2, …, 306-M1を取得でき；生検ｎの医用画像５３２を分割して画像タイル356-1, 356-2, …, 356-Mnを取得できる。一部の実施形態では、画像タイルは、所定のグリッドを用いて医用画像から抽出されて、また、統一されたサイズの画像タイルとして記憶されることができる。１つの例示的実装例では、画像タイルはタイル寸法が192 μm × 192 μmとされる所定のグリッドを用いて抽出され、また、画像タイルは224画素 × 224画素のサイズとされる画像として保存される。

図２に戻るに、ブロック２０２では、システムは、臨床被験者群から取得された複数の医用画像を教師なし機械学習モデル内へと入力して、潜在空間内での複数の埋め込みを取得するように構成されていることができる。一部の実施形態では、システムは、複数の医用画像を上述のように複数の画像タイルに分割し、及び、各画像タイルを教師なし機械学習モデル内へと入力して、対応するタイル埋め込みを取得する。図３Ａを参照するに、画像タイル306-1-306-M1の各画像タイルは教師なし機械学習モデルに入力されて、タイル埋め込みを取得できる。例えば、画像タイル306-1は（処理Ａによって表されている）教師なし機械学習モデルに入力されて、タイル埋め込み308が取得される。したがって、生検１については、システムが、それぞれが画像タイル306-1-306-M1に対応するタイル埋め込み308-1 - 308-M1を取得する。同様に、生検ｎについては、システムが、画像タイル306-1-306-Mnに対応するタイル埋め込み358-1 358-Mnを取得できる。

一部の実施形態では、システムは、複数の画像タイルのサブセットのみを、教師なし機械学習モデルによるさらなる処理に付すために選択する。例えば、システムは、生検試料を表す所与の画像タイルの部分を決定して、該部分が所定の閾値を超過する場合（例えば、>90%）にのみ画像タイルを入力できる。別の例を挙げるに、システムは、所与の生検の結果もたらされる画像タイルのカウントを決定して、カウントが所定の閾値を超過する場合（例えば、>70タイル）にのみ画像タイルを入力できる。

図４Ａは、ブロック２０２にて用いられる例示的な教師なし機械学習モデルについて示す。図４Ａを参照するに、教師なし機械学習モデル４０４は、入力画像タイル４０２（例えば、図３Ａの画像タイルの１つ）を受信して、出力タイル埋め込み４０６を提供するように構成されていることができる。タイル埋め込み４０６は入力画像タイル４０２（例えば、タイル306-1）の潜在空間内でのベクトル表現とされ得る。入力画像を埋め込みに変換することによって、元のデータのサイズ及び寸法を相当に減じることができる。例を挙げるに、224画素 × 224画素のサイズとされた画像タイルは、２０４８次元ベクトルに縮減されることができる。より低次元な埋め込みは、後述のように、下流側での処理に用いられることができる。

一部の実施形態では、教師なし機械学習モデル４０４は、訓練済みの対照学習アルゴリズム（contrastive learning algorithm）である。対照学習とは、どのデータポイントが類似又は別異であるかをモデルに教える（teach）ことによってラベルを伴わずにデータセットの一般的特徴を学習（learn）するのに用いられる機械学習手法を、指す。対照学習モデル（contrastive learning model）は画像データから埋め込みを抽出できるのであって、これはそのようなデータにさもなくば割り当てられてしまいかねないラベルについて線形的に予測的である。適した対照学習モデルは、対照損失を最小化することによって訓練（train）されるのであって、これによって同じサンプル画像の異なる増強結果からの埋め込みの間の類似性が最大化され、且つ、異なるサンプル画像の埋め込みの間の類似性が最小化される。例えば、モデル（例えば、教師なし機械学習モデル４０４）は、回転、反転、クロッピング、及び／又は色ジッタリングに関して不変となるタイル埋め込みをタイル画像（例えば、入力画像タイル４０２）から抽出できる。例示的な対照学習モデルとしてはSimCLR及びSwAVが含まれるが、任意の対照学習アルゴリズムを教師なし機械学習モデル４０４として用い得ることに留意されたい。

入力画像（例えば、入力画像タイル４０２）を処理するために教師なし機械学習モデル４０４が用いられる前に、これを訓練しておくことを要する。図４Ｂは、いくつかの実施形態による、例示的な対照学習アルゴリズムの訓練のためのデータアーキテクチャ４５０について示す。一部の実施形態では、図４Ａの教師なし機械学習モデル４０４は、図４Ｂのエンコーダの１つとすることができる（例えば、エンコーダ462a, 462b）。訓練に際しては、元の画像４５２を取得できる。データ変換又は増強４５４を元の画像４５２に対して適用して、ビューイングステージ４５６にて２つの強化画像458a, 458bを取得できる。例えば、システムは、２つの別個のデータ増強オペレータ（例えば、クロッピング、反転、色ジッタリング、グレースケール、ブラー）を適用して、増強画像458a, 458bを取得できる。一部の実施形態では、２つ以上の画像をもたらし得る。例えば、Ｎ回の（類似し得る又は異なり得る）データ増強４５４を元の画像４５２に対して施して、Ｎ個の増強画像を取得できる。

データアーキテクチャ４５０はモデル訓練４５０内にエンコードステージ４６０を含み得るのであり、各増強画像（例えば、増強画像458a, 458b）はそれぞれ１つのエンコーダ462a, 462bによってエンコードされ得る。各増強画像458a, 458bはエンコーダを通されて、潜在空間にてそれぞれのベクトル表現464a, 464bを取得できる。一部の実施形態では、エンコーダ462a, 462bは共通の重み付けを有している。一部の実施形態では、各エンコーダ462a, 462bはニューラルネットワークとして実装されている。例えば、エンコーダは、残差ニューラルネットワーク（「ResNet」）アーキテクチャのバリアントを用いて実装できる。図示のように、エンコーダ462a, 462bはそれぞれ、ベクトル表現464a（例えば、増強画像458aに基づいてエンコーダ462aによって出力されたhiベクトル）及びベクトル表現464b（例えば、増強画像458bに基づいてエンコーダ462bによって出力されたhjベクトル）を出力する。

ベクトル表現464a, 464bはそれぞれ、投影ヘッド474a, 474bを通されて、２つの投影472a, 472bを取得できる。一部の実施形態では、投影ヘッド474a, 474bは一連の非線形層（例えば、Dense - Reu - Dense層）を備えるのであって、これはベクトル表現に対して非線形変換を適用して投影を取得する。例えば、投影ヘッド474aはdense層466aとReLu層468aとdense層470aとを含み得るのであり、また、投影ヘッド474bはdense層466bとReLu層468bとdense層470bとを含み得る。投影ヘッド474a, 474bのそれぞれは不変特徴を増幅するように構成されていることができ、また、同じ画像の異なる変換を識別することについてのネットワークの能力を最大化する。

訓練に際しては、同じ入力画像（元の画像４５２）についての投影472a, 472bの間の類似性は最大化されることができる。例えば、投影472a, 472bに基づいて損失が算出され、また、損失に基づいて各エンコーダ462a, 462bを更新して、２つの潜在表現（例えば、表現464a, 464b）の間の類似性を最大化できる。同様に、異なる入力画像の投影間の類似性は、訓練に際して最小化できる。一部の例では、投影間の合致度（即ち、類似性）を最大化するためにシステムは類似性メトリックを余弦類似性として定義できる：

一部の例では、システムは、正規化温度スケールクロスエントロピー損失を最小化することによってネットワークを訓練する：
ここで、τは調整可能な温度パラメータを表し、また、z_i, z_iはそれぞれ投影472a, 472bに対応する。したがって、訓練４５０を介して、データアーキテクチャ４５０のエンコーダ462a, 462bは、入力画像の不変特徴を保全しつつ画像特有特徴（例えば、撮像アングル、解像度、アーチファクト）を最小化するベクトル表現を出力することを学習するように構成されることができる。

図２に戻るに、一部の実施形態では、教師なし機械学習モデル４０４は、非医用画像を用いて訓練でき、そして、医用画像を処理するのに用い得る（ブロック２０４）。一部の実施形態では、モデルは先ず非医用画像を用いて訓練されて、そして、いくつかのエポックに亘って医用画像を用いて微調整（例えば、再訓練）されて、そして、入力医用画像を処理するのに用いられ得る（ブロック２０４）。一部の実施形態では、教師なし機械学習モデル４０４を微調整するのに用いられる医用画像は、生検1-nからの画像タイルから選択されることができる。換言するに、生検1-nからの画像タイル306-1 306-M₁, … , 356-1 356-M_nは、先ずモデルの訓練に用いることができ、そして、訓練済みモデルに入力してタイル埋め込みを取得できる。

タイル埋め込み308-1 308-M₁, … , 358-1 358-M_nは、生検レベルで集約できる。集約は、生検内の全タイルに亘ってタイル埋め込みを平均することを伴い得る。図３Ａを参照するに、生検１のタイル埋め込み308-1-308-M₁を集約して生検埋め込み３１０を取得できる。同様に、生検ｎのタイル埋め込み358-1-358-M_nを集約して生検埋め込み３６０を取得できる。各生検埋め込みは、生検にて反映されている着目疾患との関係での表現型状態に対応する。例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは２０４８次元ベクトルであり、これは複数の２０４８次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる（X∈R^N×L, N=6,782及びL=2,048）。

一部の実施形態では、さらなる処理前に、生検埋め込み310, 360は正規化されて、そして、埋め込み次元数の平方根の逆数によって再スケーリングされる。正規化によって、説明されるように、生検埋め込みに基づいて適合化された線形予測モデルの性能が向上し得る。

ブロック２０４では、システムは、線形回帰モデルを用いて複数の埋め込みに対応する複数の予測連続医療診断スコアを取得できる。上述のように、各埋め込みは、画像データに反映されている着目疾患との関係での表現型状態に対応し得るのであり、また、画像データに反映されているリッチなセマンティック情報（例えば、組織の微細構造の特徴）を捉えている場合がある。埋め込みは、画像データについて細かい粒度の疾患関連ラベルを生成するために用いられ得る。例えば、各埋め込みは、着目疾患に関する連続医療診断スコアを予測するために線形モデルによって用いられ得る。予測連続スコアは、図３Ａの関連データ３０４を参照して説明されている生検の割り当て済みスコアに比して優れている。具体的には、予測スコアは、離散的な値ではなく連続的な値をとるのであり（例えば、病理学者によって割り当てられた値（0, 1, 2, 3, 4, 5, 6））、故に病理学者によって割り当てられた離散スコアよりもニュアンスが多く捕捉されることとなる。埋め込み（及び画像データ）に連続的スコアを割り当てる能力は、より高い精密性及び下流側の分析における向上した統計能力をもたらすのであり、例えば示される疾患状態の各々と遺伝的バリアントとの間により緊密な関連を取得し得る。

図３Ａ及び図３Ｂにて示されている例について述べるに、生検1-nについての生検埋め込みは、線形回帰モデルを生成（例えば、適合化）するために用いられることができ（例えば、埋め込みスコア予測モデル３１２）、そしてこれは生検1-nについての予測医療診断スコアを生成するために用いられることができる。

一部の実施形態では、線形回帰モデル（例えば、埋め込みスコア予測モデル３１２）は、入力として埋め込みを受信し及び予測医療診断スコアを出力するように構成されている。一部の実施形態では、線形回帰モデルは線形混合モデル（ＬＭＭ、linear mixed model）として実装されており、これは固定型効果及びランダム型効果の両方を可能とする単純な線形モデルの拡張版である。線形混合モデルは、後述のように、共変量（例えば、性別、年齢、及び／又は臨床試験群等）について加味しつつ関連検定を行うことを可能とする。

一部の実施形態では、線形回帰モデルは次のものとすることができる：
y=Fb+u+ψ
ここで：
y∈R^N×1はＮ個の個体についての医療診断スコア（例えば、生検レベル線維症スコア）を表す。
F∈R^N×KはＫ個の共変量（例えば、性別、年齢、臨床試験群）についての行列を表す。
b∈R^K×1は共変量効果サイズベクトルを表す。該ベクトルは様々なモデルパラメータを含み、また、線形モデルにおける共変量の重みである。具体的には、Ｋ個の共変量についてＫ個の重みがそれぞれある。
u～N(0,σ_x ² XX^T)は組織学的埋め込みから寄与分をモデリングする。
ψ～N(0,σ_e ²I_N)は残差iidガウスノイズである。
X∈R^N×LはL次元のN個の個体についての生検埋め込みの行列である（例えば、L=2048）。
I_N∈R^N×NはN×N恒等行列を表す。
σ_x ²及びσ_e ²はスカラーモデルパラメータである。

一部の実施形態では、システムは、医療診断スコアを予測するために線形回帰モデルについてパラメータを生成する（モデルに関して適合化をなす）。モデルについては、生検データを用いて適合化をなし得るのであり、生検埋め込み及び対応する医療診断スコアが含まれる。図３Ａに示されている例では、生検1-nについての生検埋め込みは埋め込みスコア予測モデル３１２に関して適合化をなすために用いられる。

図５は、医療診断スコアを予測するための例示的な機械学習モデル（例えば、埋め込みスコア予測モデル３１２）の適合化について示す。一部の実施形態では、機械学習モデルは線形回帰モデルとされ得る。図示のように埋め込みスコア予測モデル５０４は訓練データ５１０を用いて適合化され得る。訓練データ５１０は、生検1-nのデータを備えることができ、これには生検埋め込み（例えば、生検埋め込み３１０）及び対応する生検レベル割り当て済み医療スコア（medical score）が含まれる。例えば、埋め込みは図３Ａを参照して説明されている生検1-nについての生検埋め込みであり、医療診断スコア（medical diagnosis score）は生検1-nについての割り当て済み線維症スコアである（例えば、図３Ａの関連データ304, 354の一部として記憶されている）。

例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは２０４８次元ベクトルとすることができ、これは複数の２０４８次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる（X∈R^N×L, N=6,782及びL=2,048）。行列は機械学習モデル（例えば、線形回帰モデル）を適合化するための入力行列Ｘとして用いられる。共変量行列たるF∈R^N×Kは切片（即ち、全てが１とされる単一の列（K=1））を含む。

機械学習モデルの負対数限界尤度は次のように定めることができる：
f(b,σ_x ²,σ_e ²)=-log N(y; Fb,σ_x ²XX^T +σ_e ² I_N),
パラメータはb、σ_x ²及びσ_e ²とされる。

b,σ_x ²,σ_e ²についての最大尤度推定器（ＭＬＥ、Maximum likelihood estimator）は、類似の効率的な手順を用いることによってf(b,σ_x ²,σ_e ²)を最小化することによって取得できる。一部の実施形態では、（ｉ）共分散が対角的である空間にてデータを回転させること（例えば、f(b,σ_x ²,σ_e ²)=-log N(U^Ty; U^TFb,σ_x ²S+σ_e ²I_N)）（XX^Tの固有値分解がUSU^Tとして表される）、及び、（ｉｉ）f(b,σ²,δ)=-log N(U^Ty; U^TFb,σ²δS+σ²(1-δ)I_N)としてモデルを再パラメータ化することによってこれを達成できる。新しい形式では、デルタ（δ）のそれぞれの値についてb,σ²のＭＬＥについて閉形式解を伴うデルタ（δ）に関するグリッド探索を行うことによって最適化を進めることができる。この最適化は演算的にも効率的である。最適化後においては、σ_x ²及びσ_e ²のＭＬＥは、ＭＬＥたる
として算出できる。

機械学習回帰モデル（例えば、埋め込みスコア予測モデル312, 504）が適合化された後に、予測連続医療診断スコアを取得できる。一部の実施形態では、予測連続医療診断スコアは、生検埋め込みを用いて単一除外（ＬＯＯ、Leave-one-out）予測として取得できる。単一除外予測では、単一ポイントを除いて全てのデータに対して適合化されたモデル全体を用いるのであり、そして、該ポイントにて予測を立てる。ＬＯＯアプローチは演算的に低コストであり、また、予測をより良い結果へと寄せることできる。例えば、予測スコアたるyについてのＬＯＯ予測たる

したがって、システムは、生検埋め込み（例えば、生検埋め込み310, 360）から予測された
を取得する。

図３Ｂを参照するに、埋め込みスコア予測モデル３１２は、生検1-nについての予測スコアを生成するために用いられることができる。例えば、医療診断スコアは生検レベル線維症スコアとされ得る。生検についての予測スコアは、図３Ａの関連データ３０４を参照して説明されている生検の割り当て済みスコアとは異なる。具体的には、予測スコアは、離散的な値ではなく連続的な値をとるのであり（例えば、病理学者によって割り当てられた値（0, 1, 2, 3, 4, 5, 6））、故により高い精密性及び向上した統計的パワーを下流側での分析にもたらす。

図２に戻るに、ブロック２０６では、システムは、複数の医療診断スコアを、複数の医用画像の取得元の臨床被験者群によって表現されている複数の候補遺伝的バリアントの各候補遺伝的バリアントと、関連付けることができる（例えば、関連について検定をなす）。これをなすに際して、システムは、特定の候補遺伝的バリアントと着目疾患との間に統計的に有意な関連があるかについて決定する。

一部の実施形態では、複数の医療診断スコアを候補遺伝的バリアントと関連付けるステップは、候補遺伝的バリアントを受信し及び医療診断スコアを出力するように構成されたバリアント特有モデルを生成するステップを含む。例えば、候補遺伝的バリアントが遺伝的バリアントＡである場合、システムは、遺伝的バリアントＡについて示す値を受信し、及び、予測線維症スコアを出力するように構成されたモデルを生成できる。図３Ｂに示されている例では、バリアント特有バリアントスコア予測モデル３１６は、後述のように生成できる。

バリアント特有モデル（例えば、バリアント特有バリアントスコア予測モデル（variant-specific variant-score prediction model）３１６）は線形回帰モデルとすることができる。一部の実施形態では、線形回帰モデルは次のものとすることができる：
である。

y∈R^N×1はＮ個の個体についての医療診断スコア（例えば、生検レベル線維症スコア）を表す。

X∈R^N×1は検査されている遺伝的バリアントの遺伝子型ベクトルを表す。例えば、母集団において２つのアレルを伴う遺伝的バリアントについては、各個体が最低頻度アレルのコピーを0, 1,又は2個有しているかに応じて、遺伝子型ベクトルは0, 1,又は2の値をとる。

F∈R^N×KはＫ個の共変量（例えば、性別、年齢、臨床試験群）についての行列を表す。１つの例示的な実装例では、５つの共変量がある：性別、年齢、及び３つの治療群。Ｆの第１の列は患者の性別についての二値指標であり（例えば、ＸＸ染色体については０であり、ＸＹ染色体については１）、第２の列については患者の年齢が含まれ、また、残余の列は３つの治療に関しての二値指標である（例えば、患者が特定の治療を受けた場合には１であり、その余の場合は０）。

図６は、いくつかの実施形態による、医療診断スコアを予測するための例示的なバリアント特有モデルの適合化について示す。図示のようにバリアントスコア予測モデル６０４は訓練データ６１０を用いて適合化される。訓練データ６１０は生検1-nのデータを備えるのであり、これには被験者の遺伝的バリアント値及び対応する予測医療スコアが含まれる。例えば、データには、生検1が行われる被験者の遺伝的バリアント値、及び生検1についての予測線維症スコア等が含まれる。

図３Ｂに戻るに、示されているように、バリアント特有モデル（variant-specific model）３１６は、生検1-nについての予測線維症スコアを用いて適合化されることができる。一部の実施形態では、システムは、複数の候補遺伝的バリアントに対応する例えばバリアントスコア予測モデル（variant-score prediction model）316, 322等の複数のバリアント特有モデルについて適合化をなす。例えば、バリアント特有モデル（variant-specific model）３１６は候補遺伝的バリアントＡに関して特有のものとされることができ、候補遺伝的バリアントＡについて示す値を受信し及び医療診断スコアを予測するように構成されていることができ、また、バリアントスコア予測モデル（variant-score prediction model）３２２は候補遺伝的バリアントＢに関して特有のものとされることができ、候補遺伝的バリアントＢについて示す値を受信し及び医療診断スコアを予測するように構成されていることができる。したがって、システムは、全ての着目遺伝的バリアント（例えば、100,000種、100万種、1,000万種のバリアント、又はバリアントについての他の量）についてバリアント特有モデル（例えば、100,000種、100万種、1,000万種のモデル、又はモデルについての他の量）を生成できる。

ブロック２０８では、システムは、着目疾患と各候補遺伝的バリアントとの間の相関メトリックを関連に基づいて決定して、少なくとも１つの着目遺伝的バリアントを識別することができる。相関メトリックは、着目疾患に対して候補遺伝的バリアントが及ぼすインパクトについて示す。一部の実施形態では、相関メトリックは、遺伝的バリアントと着目疾患との間での関連について定量化する。図３Ｂを参照するに、バリアント特有モデル３１６は、着目疾患と遺伝的バリアントＡとの間の相関メトリック３１８を決定するために用いられることができ（医療診断スコアによって表される）、また、バリアントスコア予測モデル３２２は、着目疾患と遺伝的バリアントＢとの間の相関メトリック３２４を決定するために用いられること等ができる。したがって、各着目遺伝的バリアントについて相関メトリックを算出できる。

一部の実施形態では、相関メトリックは線形回帰モデル（例えば、バリアントスコモデル（variant-score model）６０４）のＰ値である。システムはβ ≠ 0について検定する。Ｐ値は標準対数尤度レシオ検定手順にて求めることができ、また、効果サイズ及び標準誤差は古典線形モデル理論にて求めることができる。手順では、被検定バリアントと医療診断スコアとの間の関連についてのＰ値、バリアントの効果サイズ（線形モデルにおける推定器の重みβ）、標準誤差（モデルからの効果サイズ推定についての誤差）、又は他の情報が戻される。

一部の実施形態では、相関メトリックは１つ以上の所定の閾値と比較されて、着目遺伝的バリアントと着目疾患との間で有意な関連があるかについて決定される。例えば、Ｐ値が所定の閾値（例えば、5x10^-8）よりも小さい場合、システムは、有意な関連があると決定することができる。一部の実施形態では、システムは、比較に基づいて、着目遺伝的バリアントと着目疾患との間の関係を識別する。一部の実施形態では、関係は因果関係である。識別された関係又は関連は、後述のように診断及び治療や薬剤の開発に活用できる。

図２～６を参照して本明細書にて説明される手法は、単に例示的なものにすぎず、また、類似の手法を任意の着目表現型と共変量との間の関連を発見するために活用できる。図２～６を参照して本明細書にて説明される一部の例について述べるに：表現型データには医用画像が含まれ；着目表現型は着目疾患（例えば、ＮＡＳＨ）であり、これは医療診断スコア（例えば、線維症スコア）によって表されることができ；着目共変量は着目遺伝的バリアントである。もっとも、本明細書にて説明される手法は別の着目表現型と別の共変量との間の関連を発見することに関して活用することもできるということに留意されたい。例示的な表現型データとしては次のものが含まれるがこれらには限定されない：医用画像（例えば、ＭＲＩ、Ｘ線、ＣＴスキャン）、病理組織学データ（例えば、Ｈ＆Ｅ染色、トリクローム染色）、臨床バイオマーカデータ（例えば、プロテオミクスやｃｆＤＮＡを含む血液検査測定値、認知／精神評価スコア、マイクロバイオーム評価等）、又はゲノムバイオマーカデータ（例えば、バルクＲＮＡ－ｓｅｑ、メチル化データ、ゲノム配列データ、エピジェネティック配列データ等）。例示的な表現型には次のものが含まれる：着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、トランスクリプトミクス、又はリピドミクス等。例示的な共変量クラスには次のものが含まれる：人口統計情報（例えば、年齢や性別）、臨床共変量（例えば、疾患状態、臨床スコア又は血液バイオマーカ）、ゲノムデータ（例えば、遺伝子データ、発現データ、メチル化データ、等）等。

一部の実施形態では、システムは、比較に基づいて、着目遺伝的バリアントと着目疾患との間の関係を識別する。一部の実施形態では、関係は因果関係である。識別された関係は、新規被験者において着目疾患が発生する尤度について決定するために用いることができ、特定の症状又は他の疾患関連因子の存在をもとに新規被験者に疾患があるかをより高い信頼度を伴って診断できる。また、新規被験者にて遺伝的バリアントが識別された場合、着目疾患についての診断又は予後診断を適宜提供でき、これには疾患がどのように進行することが期待され得るかについての予後診断が含まれ得る。例えば、ＮＡＳＨについて着目遺伝的バリアントが発見された場合、新規被験者についてゲノム検査を行ってバリアントを検出できる。バリアントが存在する場合、システムは、疾患の発現を予測でき、診断を提供でき、及び／又は新規被験者においてどのように疾患が進行し得るかについて予後診断を提供できる。

一部の実施形態では、識別済みの関係は、バイオマーカや疾患介入用の標的の識別に関して用いられ得る。例えば、発病又は進行との関係で因果関係にあると識別された特定の遺伝的バリアントに関しては、治療的介入に関してそれらが適するかをさらに評価できる。また、遺伝的バリアントが着目疾患に対して及ぼす機能的インパクトを考慮して、治療的介入のための追加的な生物学的標的を識別することができる。そのような生物学的標的は、例えば、着目遺伝的バリアントが所在する遺伝子によって転写されるたんぱく質の場合がある。そのような生物学的標的は、着目疾患の少なくとも１つの遺伝的バリアントの機能的インパクトに関して変更、オフセット、緩和、補足や補完するものと見込まれている他の遺伝子、たんぱく質又は代謝産物を含み得る。一部の実施形態では、識別済みの関係は、治療を開発するために用いられ得る。例えば、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療のインパクトを、候補治療に関しての変更型又は類似型の開発に際して、考慮できる。以前施された候補治療の効果に関しての縦型の及びクロスセクショナル型のデータの双方は、着目疾患の予測状態又は進行と比較でき、量的観点から、着目疾患の状態又は進行に関して着目遺伝的バリアントがどの程度まで以前施された候補治療のインパクトに影響を与えるかを決定できる。そのような候補治療に関しての変更型又は類似型については、疾患及びその被験者群との関係での遺伝的バリアントのインパクトを考慮して、強化された治療的効果又は減じられた有害副作用を有するように選択できる。また、遺伝的バリアントを反映している疾患モデルは、治療的候補をスクリーニングするために用いられ得る。例えば、ゲノム特徴との関連付けの場合、統計的に有意な関連付けは新規な候補薬剤標的又は人間の疾患に関与する主要経路の発見につながり得る。同様に、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療（candidate therapies）のインパクト（疾患状態に対しての有害なインパクト又は副作用を含む）は、組合せ型治療の開発に用いられ得る。したがって、本明細書にて説明される手法は、異なる遺伝的背景を有する被験者間で治療的候補（therapeutic candidates）に対しての起こるであろう応答を予測するために、特定の治療を受けるべき適切な患者コホートを識別するために、及び結果を最適化するために臨床試験を一般的に設計するために用いることができる。

一部の実施形態では、識別された関係は、治療を選択的に施し、調整し、又は適用するために用いられ得る。一部の実施形態では、識別済みの関係は医学的提案を提供するために用いられ得る。一部の実施形態では、識別済みの関係に基づいてレポートが生成され得る。人口統計及び臨床的な特徴と関連付けられている場合、有意な関連は、新たな関連付けの発見につながったり（例えば、性別、年齢、コレステロール水準等との関連）、及び／又は、データセット内のテクニカルバイアス（例えば、特定の臨床センタとの関連）の探知につながり得る。

図７はいくつかの例による、着目疾患との関係で少なくとも１つの着目遺伝的バリアントを識別するための処理７００について示す。処理７００は、例えば、ソフトウェアプラットフォームを実装する１つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理７００は、クライアント－サーバシステムを使用して実施され、処理７００のブロックは、任意の様式において、サーバと１つ以上のクライアントデバイスとの間で分割される。したがって、処理７００の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理７００はそのように限定されることは要さないことに留意されたい。他の例では、処理７００はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理７００では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理７００と組み合わせて実施されてもよい。故に、図示（および下記により詳細に説明）されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。

図７を参照するに、ブロック７０２では、例示的なシステム（例えば、１つ以上の電子装置）は、臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは複数の医用画像の１つ以上にて反映されている着目疾患との関係での表現型状態に対応する、ステップをなすように構成されていることができる。

図８Ａに示される例示的なワークフローでは、生検1-nがなされている。生検1-nは複数の被験者（例えば、がん患者）及び／又は同じ被験者の複数回の訪問（例えば、スクリーニング訪問回やフォローアップ訪問回）に対応し得る。示されている例では、着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）であり、また、生検はいくつかの臨床試験からのＨ＆Ｅ染色肝生検からのものである。各生検（例えば、生検1）は、１つ以上の生検画像（例えば、生検1についての医用画像８０２）を結果としてもたらす。したがって、生検1-nは、医用画像８０２、医用画像８５２等を含む複数の医用画像を結果としてもたらす。

医用画像は、様々なデータと関連付けられることができる。例えば、図８Ａを参照するに、データ８０４は生検1についての医用画像８０２と関連付けられており、データ８５４は生検nについての医用画像８５２と関連付けられており以下同様。後述のように、データは着目疾患及び被験者についての既知情報を含み、着目遺伝的バリアントについての情報も含まれる。

一部の実施形態では、医用画像と関連付けられているデータは、着目疾患に関する割り当て済み医療診断スコアを含み得る。割り当て済み医療診断スコアは、疾患の状態又は進行具合を示し得る。一部の実施形態では、医療診断スコアは、一人以上の病理学者によって割り当てられた生検レベルスコアであることができ、これはそれらの病理学者の生検スライドの検討に基づいている。例えば、ＮＡＳＨ疾患については、割り当て済み医療診断スコアはIshak線維症スコア等の生検レベル線維症スコアとされ得るのであり、これは離散値たる0, 1, 2, 3, 4, 5,又は6とされる線維症の程度を示すものである。

一部の実施形態では、医用画像と関連付けられているデータは、生検サンプルの取得元の被験者の遺伝子データを含み得る。例えば、データは、複数の遺伝的バリアントについての被験者遺伝子情報を含み得る（例えば、100,000種、100万種、1,000万種のバリアント）。例えば、データは、被験者が複数の遺伝的バリアントの各々を有するかを示し得る。例えば、母集団において２つのアレルを伴う遺伝的バリアントについては、個体が最低頻度アレルのコピーを0, 1,又は2個有しているかに応じて、医用画像は遺伝的バリアント値（0, 1,又は2）と関連付けられることができる。一部の実施形態では、被験者遺伝子データは、被験者が着目疾患に罹患する尤度を示す多遺伝子リスクスコアとされ得る。

一部の実施形態では、医用画像と関連付けられているデータは、生検サンプルの取得元の被験者の人口統計データを含み得る。人口統計データは例えば、性別、年齢、治療群（例えば、プラセボ、治療ｘ、治療ｙ）、又は他のデータを含み得る。

図８Ａを参照するに、医用画像は複数の画像タイルに分割できる。例えば、生検１の医用画像８０２を分割して画像タイル806-1-806-M₁を取得でき、また、生検ｎの医用画像８５２を分割して画像タイル856-1-856-M_nを取得できる。一部の実施形態では、画像タイルは、所定のグリッドを用いて医用画像から抽出されて、また、統一されたサイズの画像タイルとして記憶されることができる。１つの例示的実装例では、画像タイルはタイル寸法が192 μm × 192 μmとされる所定のグリッドを用いて抽出され、また、画像タイルは224画素 × 224画素のサイズとされる画像として保存される。一部の実施形態では、画像タイルサイズは動的に構成可能であり、事案毎に調整され得る。

一部の実施形態では、システムは、複数の医用画像を複数の画像タイルに分割し、及び、各画像タイルを教師なし機械学習モデル内へと入力して、対応するタイル埋め込みを取得するように構成されている。図８Ａを参照するに、画像タイル806-1-806-M1のそれぞれは（処理Ａによって表されている）教師なし機械学習モデルに入力されて、タイル埋め込み808-1-808- M1が取得される。したがって、生検１については、システムが、それぞれが画像タイル806-1-806-M1に対応するタイル埋め込み808-1 - 808-M₁を取得できる。同様に、生検ｎについては、システムが、画像タイル856-1-856-M_nに対応するタイル埋め込み858-1 858-Mnを取得できる。

一部の実施形態では、システムは、複数の画像タイルのサブセットを、教師なし機械学習モデルによるさらなる処理に付すために選択する。例えば、システムは、生検試料を表す所与の画像タイルの部分を決定して、該部分が所定の閾値を超過する場合（例えば、>90%）にのみ画像タイルを入力できる。別の例を挙げるに、システムは、所与の生検の結果もたらされる画像タイルのカウントを決定して、カウントが所定の閾値を超過する場合（例えば、>70タイル）にのみ画像タイルを入力できる。

ブロック７０２にて用いられる例示的な教師なし機械学習モデルが図４Ａに示されており、これについては上述されている。例示的な対照学習アルゴリズムについては図４Ｂに示されており、これについては上述されている。一部の実施形態では、モデルは、非医用画像を用いて訓練でき、そして、医用画像を処理するのに用い得る（図７：ブロック７０２）。一部の実施形態では、モデルは先ず非医用画像を用いて訓練されて、そして、いくつかのエポック（例えば、５エポック、１０エポック、５０エポック、１００エポック）に亘って医用画像を用いて微調整（例えば、再訓練）されて、そして、入力医用画像を処理するのに用いられ得る（図７：ブロック７０２）。一部の実施形態では、モデルを微調整するのに用いられる医用画像は、生検1-nからの画像タイルから選択されることができる。換言するに、生検1-nからの画像タイルは、先ずモデルの訓練に用いることができ、そして、訓練済みモデルに入力してタイル埋め込みを取得できる。

タイル埋め込みは、生検レベルで集約できる。集約は、生検内の全タイルに亘ってタイル埋め込みを平均することを伴い得る。図８Ａを参照するに、生検１のタイル埋め込み808-1-808-M₁を集約して生検埋め込み８１０を取得できる。同様に、生検ｎのタイル埋め込み858-1-858-M_nを集約して生検埋め込み８６０を取得できる。各生検埋め込みは、生検にて反映されている着目疾患との関係での表現型状態に対応する。例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは２０４８次元ベクトルであり、これは複数の２０４８次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる（X∈R^N×L, N=6,782及びL=2,048）。一部の実施形態では、生検埋め込みはさらなる処理前に正規化される。例えば、さらなる処理前に、生検埋め込みは正規化されて、そして、埋め込み次元数の平方根の逆数によって再スケーリングされ得る。正規化によって、説明されるように、生検埋め込みに基づいて適合化された予測モデルの性能が向上し得る。

ブロック７０４では、システムは、複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、組織の微細構造と関連付けられている候補遺伝的バリアントについてのサブセットを識別するように構成されていることができる。特に、遺伝的バリアントと生検埋め込みとの間の関連について評価することによって、システムは、組織学的差異と関連付けられている複数の遺伝的バリアントについてのサブセットを識別できる。本明細書にて説明される手法は、分析を特定の診断スコアに絞ることによっては発見できないであろう組織学に影響を及ぼすバリアントを識別することができる。

一部の実施形態では、関連付けは、複数の候補遺伝的バリアントの各候補遺伝的バリアントについてバリアント特有モデルを生成（例えば、適合化）することと、バリアント特有モデルを評価して、１つ以上の閾値に基づいて遺伝的バリアントと埋め込みとの間に関連があるかを決定することとを伴う。関連がある場合、システムは、さらなる下流側での処理のために、候補遺伝的バリアントを候補遺伝的バリアントのサブセットに含めることができる。システムは、全ての着目遺伝的バリアント（例えば、100,000種、100万種、1,000万種等のバリアント）についてバリアント特有モデル（例えば、100,000種、100万種、1,000万種等のモデル）を生成できる。

図８Ｂにて示されている例では、生検埋め込みは、バリアントＡについて埋め込みバリアントモデル８１２を、バリアントＢについて埋め込みバリアントモデル８１４を、バリアントＺについて埋め込みバリアントモデル８１６を、生成（例えば、適合化）するために用いられることができる。そして、システムは、各モデルについて相関メトリックを算出することによって各モデルを評価することができる。例えば、システムは、埋め込みバリアントモデル８１２について相関メトリック８２２を、埋め込みバリアントモデル８１４について相関メトリック８２４を、埋め込みバリアントモデル８１６について相関メトリック８２６を算出することができる。各相関メトリックについては、遺伝的バリアントと埋め込みとの間に有意な関連があるかについて決定するために、評価をなすことができる（例えば、所定の閾値との比較）。示されている例では、システムは次のことを決定する：相関メトリック８２２に基づけばバリアントＡと埋め込みとの間には関連が存在すること、相関メトリック８２６に基づけばバリアントＺと埋め込みとの間には関連が存在すること、及び相関メトリック８２４に基づけばバリアントＢと埋め込みとの間には関連が存在していないこと。したがって、システムは、バリアントＡ及びバリアントＺを更なる処理のためにサブセットに含める一方で、バリアントＢをサブセットから排除することができる。遺伝的バリアントのサブセット識別することによって、システムは更なる処理のために、医用画像（例えば、生検画像）に示されている組織学的特徴と関連付けられている遺伝的バリアントを識別できる。遺伝的バリアントについてのこのより小さなセットが下流側の分析にて探索されるであり、例えば後述のように各遺伝的バリアントと着目疾患との間の関連を識別する。

一部の実施形態では、バリアント特有モデル（例えば、埋め込みバリアントモデル812, 814, 816）は線形回帰モデルであり、これは、埋め込みを入力として受信し及び遺伝的バリアントについて示す値を出力するように構成されている。一部の実施形態では、前記線形回帰モデルは線形混合モデルとして実装されることができる。

一部の実施形態では、線形回帰モデルは次のものとすることができる：
g=Fb+u+ψ ここで：

g∈R^N×1は検査されている遺伝的バリアントの遺伝子型ベクトルを表す。Ｎは生検画像データ及び遺伝子データの両方が利用可能となっている個体数である。

F∈R^N×KはＫ個の共変量（例えば、性別、年齢、臨床試験群）についての行列を表す。例示的な実装例では、行列は性別、年齢及び３つの治療群についての情報を含む（K = 5）。特に、Ｆの第１の列は患者の性別についての二値指標であり（患者の染色体がＸＸの場合には０であり、患者の染色体がＸＹの場合には１）、第２の列については患者の年齢が含まれ、また、残余の列は３つの治療に関しての二値指標である（患者がその特定の治療を受けた場合には１であり、その余の場合は０）。

X∈R^N×LはL次元のN個の個体についての生検埋め込みの入力行列である（例えば、L=2048）。

b∈R^K×1は共変量効果サイズベクトルを表す。該ベクトルは様々なモデルパラメータを含み、また、線形モデルにおける共変量の重みである。具体的には、Ｋ個の共変量についてＫ個の重みがそれぞれある。

u～N(0,σ_x ² XX^T)は組織学的埋め込みから寄与分をモデリングする。

ψ～N(0,σ_e ² I_N)は残差iidガウスノイズである。

I_N∈R^N×NはN×N恒等行列を表す。

σ_x ²及びσ_e ²はスカラーモデルパラメータである。

一部の実施形態では、システムは、線形回帰モデルについてパラメータを生成する（モデルに関して適合化をなす）。モデルについては、生検データを用いて適合化をなし得るのであり、生検埋め込み（例えば、生検埋め込み810, 860）及び対応する医療診断スコアが含まれる。図８Ｂに示されている例では、生検1-nについての生検埋め込み810, 860は埋め込みバリアントモデル812, 814, 816の各々に関して適合化をなすために用いられる。

図９は、例示的な線形回帰モデル（例えば、埋め込みバリアントモデル８１２）の適合化について示す図示のように埋め込みバリアントモデル９０４は訓練データ９１０を用いて適合化され得る。一部の実施形態では、モデル９０４は線形回帰モデルとされ得る。訓練データ９１０は、生検1-nのデータを備えることができ、これには生検埋め込み及び対応する遺伝的バリアント値が含まれる。例えば、埋め込みは図８Ｂを参照して説明されている生検1-nについての生検埋め込み810, 860であり、また、遺伝的バリアント値は生検1-nにて特定の遺伝的バリアント（例えば、バリアントＡ）について示す値である（例えば、図８Ａの関連データ804, 854の一部として記憶されている）。

例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは２０４８次元ベクトルとすることができ、これは複数の２０４８次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる（X∈R^N×L, N=6,782及びL=2,048）。行列は、線形回帰モデルを適合化するための入力行列Ｘとして用いられる。共変量行列たるF∈R^N×Kは切片（即ち、全てが１とされる単一の列（K=1））を含む。

線形回帰モデルの負対数限界尤度は次のように定めることができる：

f(b,σ_x ²,σ_e ²)=-log N(y;Fb,σ_x ² XX^T+σ_e ² I_N)、パラメータはb、σ_x ²及びσ_e ²とされる。

b,σ_x ²,σ_e ²についての最大尤度推定器（ＭＬＥ、Maximum likelihood estimator）は、類似の効率的な手順を用いることによってf(b,σ_x ²,σ_e ²)を最小化することによって取得できる。一部の実施形態では、（ｉ）共分散が対角的である空間にてデータを回転させること（例えば、f(b,σ_x ²,σ_e ²)=-log N(U^Ty; U^T Fb,σ_x ² S+σ_e ² I_N)）（XX^Tの固有値分解がUSU^Tとして表される）、及び、（ｉｉ）f(b,σ²,δ)=-log N(U^T y; U^T Fb,σ² δS+σ² (1-δ)I_N)としてモデルを再パラメータ化することによってこれを達成できる。新しい形式では、デルタ（δ）のそれぞれの値についてb,σ²のＭＬＥについて閉形式解を伴うデルタ（δ）に関するグリッド探索を行うことによって最適化を進めることができる。この最適化は演算的にも効率的である。最適化後においては、σ_x ²及びσ_e ²のＭＬＥは、ＭＬＥたる
として算出できる。

バリアント特有モデル（例えば、埋め込みバリアントモデル812, 814, 816）が適合化された後、各適合済みモデルは、対応する遺伝的バリアントと埋め込みとの間に関連があるかについて決定するために評価される。一部の実施形態では、バリアント特有モデルを評価するステップは、バリアント特有モデルに基づいて相関メトリックを算出すること及び相関メトリックを所定の閾値と比較することを含む。

一部の実施形態では、前記相関メトリックは前記バリアント特有モデルと関連付けられているＰ値である。Ｐ値は順列手順を介して取得できるのであって、実データからの対数尤度レシオ（ＬＬＲ、log likelihood ratio）統計が、埋め込み行列内にて個体についての置換がなされる際に取得されたＬＬＲと、比較される（nullモデルからのＬＬＲ）。一部の実施形態では、Ｐ値は、実データＬＬＲより大きな並べ替えＬＬＲの画分として定義される。

例えば、各遺伝的バリアントについて、バリアント特有モデルはＸの行についてのＫ個の順列に関して適合化できる。各遺伝的バリアントについて、この手順は、Ｋ個のＬＬＲをもたらす。特に、実データを用いてバリアント特有モデルの適合化をなすと、１つのＬＬＲが結果としてもたらされ得る。バリアント特有モデルを、Ｘの行についてのＫ個の順列に関して適合化すると、Ｋ個のＬＬＲが結果としてもたらされ得る。各遺伝的バリアントについて、Ｐ値は、実データからのＬＬＲが結果より大きなＫ個のＬＬＲの画分である。

各遺伝的バリアントについての相関メトリックは所定の閾値に対して比較されて、遺伝的バリアントと埋め込みとの間に関連があるかを決定できる。一部の実施形態では、閾値は5×10^-8に設定できる。例えば、閾値未満のＰ値を伴うバリアントについては、埋め込みと関連付けられているものと決定される。示されている例では、システムは、次のことについて決定するように構成されていることができる：相関メトリック８２２に基づけばバリアントＡと埋め込みとの間には関連が存在すること、相関メトリック８２６に基づけばバリアントＺと埋め込みとの間には関連が存在すること、及び相関メトリック８２４に基づけばバリアントＢと埋め込みとの間には関連が存在していないこと。したがって、システムは、バリアントＡ及びバリアントＺを更なる処理のためにサブセットに含める一方で、バリアントＢをサブセットから排除する。

ブロック７０６では、システムは、候補遺伝的バリアントのサブセットの各候補遺伝的バリアントを着目疾患と関連付けて少なくとも１つの着目遺伝的バリアントを識別する。これをなすに際して、システムは、特定の遺伝的バリアントと着目疾患との間に統計的に有意な関連があるかについて決定する。識別された着目遺伝的バリアントは、組織学及び着目疾患の両方と関連付けられる。

一部の実施形態では、遺伝的バリアントを着目疾患と関連付けることは、遺伝的バリアント値を受信し、及び、着目疾患に関する医療診断スコアを出力するように構成されたバリアント特有スコア予測モデルを生成（例えば、適合化）することを伴う。例えば、検査される遺伝的バリアントが遺伝的バリアントＡである場合、システムは、遺伝的バリアントＡについて示す値を受信し、及び、予測医療診断スコアを出力するように構成されたモデルを生成できる。図８Ｂを参照するに：バリアントＡについてはバリアント特有スコア予測モデル８３２が生成でき；バリアントＺについてはバリアント特有スコア予測モデル８３６が生成できる。バリアントＢについてはバリアント特有スコア予測モデルが生成されないことができる。なぜならば、バリアントＢについての相関メトリック８２４が所定の閾値を超過する故にバリアントＢを更なる処理から排除できるからである。

バリアントスコアモデル（例えば、バリアント特有スコア予測モデル８３２）は線形回帰モデルとすることができる。一部の実施形態では、線形回帰モデルは次のものとすることができる：
y=Fb+xβ+ψ

ここで、ψ～N(0,σ_e ² I_N)である。

F∈R^N×KはＫ個の共変量（例えば、性別、年齢、臨床試験群）についての行列を表す。１つの例示的な実装例では、５つの共変量がある：性別、年齢、及び３つの治療群。Ｆの第１の列は患者の性別についての二値指標であり（例えば、患者の染色体がＸＸの場合には０であり、また、患者の染色体がＸＹの場合には１）、第２の列については患者の年齢が含まれ、また、残余の列は３つの治療に関しての二値指標である（例えば、患者がその特定の治療を受けた場合には１であり、その余の場合は０）。例示的なバリアント特有スコア予測モデルについての適合化は図６を参照して説明されている。

バリアント特有スコア予測モデルが適合化された後、システムは、着目疾患と着目遺伝的バリアントとの間の相関メトリックを決定できる。相関メトリックは、着目疾患に対して着目遺伝的バリアントが及ぼすインパクトについて示す。図８Ｂを参照するに、バリアント特有スコア予測モデル（variant-specific score prediction model）８３２は、着目疾患（医療診断スコアによって表される）と遺伝的バリアントＡとの間の相関メトリック８４２を決定するために用いられることができ、また、バリアントスコアモデル（variant-score model）８３６は、着目疾患と遺伝的バリアントＺとの間の相関メトリック８４６を決定するために用いられること等ができる。したがって、候補遺伝的バリアントのサブセット内の各着目遺伝的バリアントについて、相関メトリックが算出される。

一部の実施形態では、相関メトリックは線形回帰モデルのＰ値である。システムはβ ≠ 0について検定する。Ｐ値は標準対数尤度レシオ検定手順にて求めることができ、また、効果サイズ及び標準誤差は古典線形モデル理論にて求められる。手順では、被検定バリアントと医療診断スコアとの間の関連についてのＰ値、バリアントの効果サイズ（線形モデルにおける推定器の重みβ）及び標準誤差（モデルからの効果サイズ推定についての誤差）。

一部の実施形態では、相関メトリックは１つ以上の所定の閾値と比較されて、着目遺伝的バリアントと着目疾患との間で有意な関連があるかについて決定される。例えば、Ｐ値が所定の閾値（例えば、5x10^-8）よりも小さい場合、システムは、有意な関連があると決定する。一部の実施形態では、システムは、比較に基づいて、着目遺伝的バリアントと着目疾患との間の関係を識別できる。一部の実施形態では、関係は因果関係である。識別された関係又は関連は、説明されるように診断及び治療や薬剤の開発に活用できる。例えば、図１６～２４を参照して説明されているように、システムが１つのデータセット（例えば、第１の臨床試験からの画像）から生成された埋め込みをもって、これを同じ予測的効果を伴って別のデータセットからの画像及び関連する遺伝的バリアントデータ（例えば、第２の臨床試験からの画像及び関連する遺伝的バリアント）に適用できるという意味でシステムは堅牢である。

図７に戻るに、システムは、識別済み着目ジェネリックについての組織学的効果について可視化するためのシミュレーション画像を生成できる。この手順によって、これによらずにしては病理スコアについての関連研究によって検出ができないであろう関連する組織学的な変化についての可視化表示がもたらされる。特に、ブロック７０８では、システムは、着目疾患を表す複数のシミュレーション画像を生成するように構成されていることができる。複数のシミュレーション画像は、後述のように、少なくとも１つの着目遺伝的バリアントの異なる値に対応する。

一部の実施形態では、システムは、訓練済み生成的モデルを用いてシミュレーション画像の形式で予測画像を生成するように構成されていることができる。一部の実施形態では、訓練済み生成的モデルは敵対的生成ネットワーク（ＧＡＮ）モデルである。図１０は、いくつかの実施形態による、例示的なＧＡＮモデル１００４について示す。一部の実施形態では、ＧＡＮモデル１００４は、訓練済み生成器コンポーネント１００４ａと訓練済み判別器コンポーネント１００４ｂとを備え得る。訓練済み生成器コンポーネント１００４ａは、埋め込み（例えば、埋め込み1002-1 - 1002-k）とノイズ（不図示）とを受信し、及び、シミュレーション画像（例えば、シミュレーション画像1006-1 - 1006-k）を出力するように構成されていることができる。図１０に示されているように、訓練済み生成器コンポーネント１００４ａは、埋め込み1002-1を受信してシミュレーション画像1006-1を出力し、埋め込み1002-2を受信してシミュレーション画像1006-2を出力し、以後同様にし、埋め込み1002-kを受信してシミュレーション画像1006-kを出力できる。

一部の実施形態では、埋め込み1002-1-1002-kを生成するために、システムは、埋め込みを受信し及び着目疾患に関連する医療診断スコアを出力するように構成されたモデルを生成（適合化）できる。一部の実施形態では、モデルは図８の埋め込みバリアントモデル８１２等の線形回帰モデルである。そして、モデルは医療診断スコアを予測するために用いられ得る。例えば、各タイル埋め込み（例えば、タイル埋め込み808-1 - 808-M1）は、線形回帰モデル内へと入力されて（input into）、タイルレベル医療診断スコアを生成できる。生検1-nからのタイル埋め込みは、線形回帰モデルへと入力されて（input to）、タイルレベル医療診断スコアのセットを生成できる。システムは、第１～５パーセンタイルに属する対応する医療診断スコアを有する第１のタイル埋め込み群と、第９５～９９パーセンタイルに属する対応する医療診断スコアを有する第２のタイル埋め込み群とを識別することができる。第１の平均埋め込みは第１の埋め込み群を集約すること（併せてその平均をもとること）によって生成でき、また、第２の平均埋め込みは第２の埋め込み群を集約すること（併せてその平均をもとること）によって生成できる。そして、システムは、２つの平均埋め込み間で線形補間をなして埋め込み1-kを取得できる。埋め込み1002-1-1002-kに対応するシミュレーション画像1006-1 - 1006-kは、着目疾患の進行と関連付けられている組織学的効果について示すことができる。

一部の実施形態では、埋め込み1002-1-1002-kを生成するために、システムは、埋め込みを受信し及び着目遺伝的バリアント（例えば、図２及び図７にて識別されている着目遺伝的バリアント）の値を出力するように構成されたモデルを生成（適合化）できる。遺伝的バリアント値は着目遺伝的バリアントについての遺伝子型情報について示す（例えば、個体がその遺伝子座にてマイナーアレルのコピーを0, 1,又は2個有している場合）。一部の実施形態では、モデルは、図３Ａの埋め込みスコア予測モデル３１２と類似の線形回帰モデルである。そして、モデルは着目遺伝的バリアントの値を予測するために用いられ得る。例えば、各タイル埋め込み（例えば、タイル埋め込み808）は、線形回帰モデルへと入力されて、タイルレベル遺伝的バリアント値を生成できる。生検1-nからのタイル埋め込みは、線形回帰モデルへと入力されて、タイルレベル医療診断スコアのセットを生成できる。システムは、第１～５パーセンタイルに属する対応する遺伝的バリアント値を有する第１のタイル埋め込み群と、第９５～９９パーセンタイルに属する対応する遺伝的バリアント値を有する第２のタイル埋め込み群とを識別することができる。第１の平均埋め込みは第１の埋め込み群を集約すること（例えば、その平均をとること）によって生成でき、また、第２の平均埋め込みは第２の埋め込み群を集約すること（例えば、その平均をとること）によって生成できる。そして、システムは、２つの平均埋め込み間で線形補間をなして埋め込み1-kを取得できる。埋め込み1-kに対応するシミュレーション画像は、着目遺伝的バリアントと関連付けられている組織学的効果について示すことができる。

一部の実施形態では、ＧＡＮモデルは条件付きＧＡＮモデルである。例えば、生成器は、埋め込みを条件として及びノイズを受信し、並びにシミュレーション画像を出力するように構成されていることができる。判別器は、シミュレーション画像又は現実画像とされ得る入力画像を受信し、及び入力画像をシミュレーション又は現実のものと分類するように構成されていることができる。訓練に際して、生成器はシミュレーション画像を生成し、また、シミュレーション画像及び現実の画像は判別器に分類のために提供される。判別器の出力に基づいて、生成器及び判別器は適宜更新して損失を最小化できる。一部の実施形態では、生成器及び判別器はニューラルネットワークである。

一部の実施形態では、ＧＡＮモデルは、プログレッシブＧＡＮ（ｐＧＡＮ）モデルを元に構築される。ｐＧＡＮモデルは次第に増加する画像解像度を伴ってプログレッシブな態様で訓練されて、訓練は安定化されまたモード崩壊が妨げられる。システムはプログレッシブ条件付きＧＡＮ（ｐｃＧＡＮ）モデルにも拡張されるのであって、本明細書にて説明された医用画像に基づいて生成された埋め込みに対しての条件付けを可能とする。特に、生成器は、（条件としての）埋め込みｘ及び標準的な正規分布からサンプリングされたノイズベクトルｕを受信するように構成されていることができる。また、判別器は生成された及び現実の画像並びに対応する埋め込みを受信する。図１１は、いくつかの実施形態による、シミュレーション画像処理の生成について示す。示されているように、生成器１１０４は、埋め込み１１０２及びノイズベクトル１１０８を受信し及び画像１１０６を出力できる。さらに、同じ埋め込み及び異なるノイズが提供された場合、異なるシミュレーション画像が生成され得る。特に、各生成器１１０４が同じ埋め込み１１０２を受信するも異なるノイズベクトル１１０８を受信した場合、同じセマンティック生物学的内容を伴うが異なるシミュレーション画像が生成され得る。したがって、埋め込みは複数の画像として可視化でき、埋め込みと関連付けられている組織学的特徴についての識別及び理解が促進される。

１つの例示的な実装例では、埋め込み１１０２は２０４８次元の埋め込みであり、ノイズベクトル１１０８は標準的な正規分布からサンプリングされた５１２次元のベクトルである。埋め込み１１０２とノイズベクトル１１０８とは５１２次元ベクトルｔに組み合わされることができ、これがｐＧＡＮ生成器の入力とされる。判別器は、画像ｉに加えて、（条件としての）埋め込みｘ（埋め込み１１０２等）を、入力として受信するように構成されていることができる。この追加によって、判別器は、入力埋め込みとの一貫性にも基づいて、現実の及び虚構の画像を分類できるようになる。例示的な実装例では、埋め込みは2048次元埋め込みであり、また、画像は256x256の画像である。

例示的な実装例では、ｐｃＧＡＮモデルは、先ずタイル画像及び対応する埋め込みについてｐＧＡＮと同じパラメータが用いられて訓練される。訓練後は、ｐｃＧＡＮモデルの生成器は、入力として、2048次元の埋め込みと標準的な正規分布からサンプリングされた512次元のベクトルとを受信し及び256 x 256のシミュレーションタイル画像（その内容は入力埋め込みと一貫している）を出力できる。正規分布からサンプリングされた512次元のノイズベクトル１１０８を与えられた場合、システムはｐｃＧＡＮを用いてｋ個の画像を生成できるのであって、入力としてはそれぞれのｋ個の補間埋め込み及びサンプリングされたノイズベクトル１１０８からのノイズが与えられる。したがって、この手順では、着目共変量（被分析生検についてのベクトル）、生検埋め込み（分析済み生検が行とされ、また、埋め込み次元が列とされる行列）、及びタイル埋め込み（対応するタイルが行とされ、また、埋め込み次元が列とされる行列）が入力として受け付けられて、また、一連のk 256x256タイル画像が出力され得る。

ブロック７１０では、システムは、ディスプレイ上で複数のシミュレーション画像１１０６を表示する（又は表示させる）ように構成されていることができる。ディスプレイは、例えば、コンピューティング装置等のユーザ装置（例えば、図２９のコンピューティング装置２９００）のディスプレイスクリーンに対応し得る。一部の実施形態では、予測シミュレーション画像１１０６は、組織学的変化についてのアニメーションを作成するために用いられ得る。図１１に示されるようにＧＡＮへの入力として正規分布からの異なる512次元サンプルを提供することによって、複数のアニメーションが同じ着目共変量について作成され得る。一部の実施形態では、同じ予測シミュレーション画像１１０６のシリーズからの画像に関しては同じサンプルが用いられる。一部の実施形態では、予測シミュレーション画像はランキングされる。表示されるシミュレーション画像は予測シミュレーション画像の一部又は全部を含み得るのであり、また、ランキングに基づいて予測シミュレーション画像から選択されることができる。一部の実施形態では、ランキングは対応する医療診断スコアに基づいていることができる。例えば、予測シミュレーション画像は、その予測シミュレーション画像の演算医療診断スコアに基づいてランキングされることができる（埋め込みに基づいて決定できる）。一部の実施形態では、表示されるべき予測シミュレーション画像は、それらの対応する医療診断スコアに基づいて選択されることができる。例えば、低位線維症に対応する予測タイルを表し得る、第１～５パーセンタイルに属する医療診断スコアを有する予測シミュレーション画像は、ユーザインタフェースでの表示のために選択されるかそこで表示されることができる。別の例を挙げるに、高位線維症に対応する予測タイルを表し得る、第９５～９９パーセンタイルに属する医療診断スコアを有する予測シミュレーション画像は、表示のために選択されるかそこで表示されることができる。予測シミュレーション画像を選択するためには別のパーセンタイル範囲を用いることもでき、先述の範囲は例示に過ぎない。

図１２Ａは、いくつかの実施形態による、増大する線維症スコアを可視化するための予測画像タイルについての例示的なセット及び３つの予測シミュレーション画像を伴う例示的なシリーズについて示す。上述のように、システムは、第１～５パーセンタイルに属する対応する医療診断スコアを有する第１の画像タイル埋め込み群１２０２を識別することができるのであり、それによって低位線維症に対応する予測タイルを識別できる。また、システムは、第９５～９９パーセンタイルに属する対応する医療診断スコアを有する第２の画像タイル埋め込み群１２０４をも識別することができるのであり、それによって高位線維症に対応する予測タイルを識別できる。システムは、第１のタイル埋め込み群についての第１の平均埋め込み及び第２のタイル埋め込み群についての第２の平均埋め込みを取得することができる。線形補間を行ってk個の埋め込みを取得できる。例えば、k = 3である場合、システムは次のように３つの埋め込みを取得できる：第１の埋め込み（例えば、第１の平均埋め込み）、第２の埋め込み（例えば、第１の埋め込み及び第３の埋め込みの平均）、及び第３の埋め込み（例えば、第２の平均埋め込み）。３つの埋め込みは生成器に入力することができるのであり、線維症スコアの増大に関連する組織学的変化を可視化するための一連の画像１２０６を取得できる。

図１２Ｂは、いくつかの実施形態による、増大するＰＮＰＬＡ３タイルスコアを可視化するための予測画像タイル1252, 1254についての例示的なセット及び３つのシミュレーション画像1256を伴う例示的なシリーズについて示す。画像1256は、一部の実施形態では、図１２Ａとの関連でせつめいされたのと類似の手法を用いて取得できる。

一部の実施形態では、複数の予測シミュレーション画像はランキングされる。ランキングは、線維症スコアや他の尺度に基づいていることができる。一部の実施形態では、複数の予測シミュレーション画像の一部又は全部を表示することができる。複数の予測シミュレーション画像のサブセット（又は全部）はランキングに基づいて選択されることができ、また、予測シミュレーション画像はランキングに基づいて表示のために選択されることができる。

図１３では次のものが示されており、これらは本明細書にて説明される手法を用いて生成されている：脂肪症スコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像１３０２；小葉内炎症スコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像１３０４；バルーニングスコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像１３０６；及び線維症スコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像１３０８。一部の実施形態では、可視化画像タイル（例えば、画像1302-1308）は、特定の表現型について低スコアを有すると予測されるタイルに対応し得る。

図１４は、いくつかの実施形態による、医療診断スコアを予測するように構成された様々な線形モデルの性能について示す。示されているように、５つのモデルは次のことをなすように訓練されている：線維症スコアの予測；脂肪症スコアの予測；小葉内炎症スコアの予測；及び肝細胞バルーニングスコアの予測。各スコアタイプについて、バーの色は、凡例の色の順序と同じ順序にされる。

初めの４つのモデルは図３Ａの埋め込みスコア予測モデル３１２についての例である。事前訓練済みモデルは、事前訓練済みの対照モデル（例えば、SimCLR）によって生成された埋め込みに基づいて適合化された線形モデルを指す。事前訓練済み対照モデルは、同じ画像ドメイン内の画像（例えば、肝生検画像）を用いて微調整されていない（has not been fine-tuned）。事前訓練済み正規化済みモデルは、事前訓練済みの対照モデルによって生成され且つ正規化された埋め込みに基づいて適合化された線形モデルを指す。一部の実施形態では、埋め込みは正規化されて、そして、埋め込み次元数の平方根の逆数によって再スケーリングされる。微調整済みモデルは、微調整済みの対照モデル（例えば、SimCLR）によって生成された埋め込みに基づいて適合化された線形モデルを指す。微調整済み対照モデルは、同じ画像ドメイン内の画像（例えば、肝生検画像）を用いて再訓練されている（has been re-trained）。微調整済み正規化済みモデルは、微調整済みの対照モデルによって生成され且つ正規化された埋め込みに基づいて適合化された線形モデルを指す。

他方で、教師ありモデル（例えば、Yr1）は、画像データを受信し及び医療診断スコアを予測するように構成された非線形機械学習モデル（例えば、ニューラルネットワーク）を指す。始めの４つのモデル等の線形回帰モデルは、訓練及び適用に関しては教師ありモデルに比してより演算的に効率的である。図１４にて示されているように、埋め込みに基づいて生成された線形モデルは、教師あり機械学習モデルのそれと同様の又はそれより優位な予測力を提供できるのであり、その一方では訓練及び適用に関しては格段に少ないリソース及び時間要求で済む。

図１５Ａは、研究、サイト、及び病理スコア効果を伴うバリアントコンポーネントモデル１５０２について示す。示されているように、プロット１５０４によれば、バリアントコンポーネントモデル１５０２によっては埋め込みの分散の３４％しか説明できない。図１５Ｂは、サイト及び研究影響について調整がなされる埋め込みについての全ゲノム的関連研究（ＧＷＡＳ、genome-wide association study）プロット１５０６について示す。示されているように、ＧＷＡＳプロット１５０６は、ベースライン埋め込みと関連付けられている３つのミスセンスバリアントを識別する。バリアントのサブセットについては、説明されているようにさらに分析できる。

図１５Ｂのプロット１５０８にて示されるように、組織学的分析を通じて優先順序が設けられた遺伝的バリアントについては、利用可能なエンドポイントと関連付けて関連する生物学事項についての知見を得ることができる。例えば、PNPLA3 rs738409における主位バリアントについてのPheWASによって、ベースライン血液バイオマーカ及びRNA-seqに対しての効果が識別されるも、病理又は連続NASHスコアについてはそうならない。図１５Ｃでは、PNPLA3 rs738409における主位バリアントについてのPheWASによっていくつかの血液バイオマーカ及び発現経路に対しての効果が識別されることを示すプロット１５１０が示されている。さらに、rs738409は組織学的疾患ラベルと関連付けられていないものとみられる。したがって、臨床試験データにおけるPheWASは、発見された遺伝的効果の解釈をサポートすることになる。

図１６，２０，２２，２４は、縦型の研究（例えば、治療効果のそれ）に向けられた手法について示す。当業者ならば、本明細書にて説明される縦型の研究では、本明細書にて説明されたベースライン分析のための様々な手法（訓練済みのモデル及びシステムを含む）が活用されていることと理解されるであろう。例えば、入力として特定の被験者について縦型の進行埋め込みを受信し及びプラセボ対治療の決定を出力するシステムは（例えば、ＤＲＰ分類モデル１７３０）、着目コバリアント（例えば、遺伝的バリアント）に基づいて疾患の状態又は進行について予測するように以前訓練されたシステムに基づいていることができる。

図１６は、いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な方法について示す。処理１６００では、疾患の進行は、進行埋め込みを用いて定量化される。システムは、進行埋め込みを入力として受信しプラセボ又は治療を示す分類結果を出力するモデルからの予測として、薬剤応答表現型（ＤＲＰ）として帰属させることができる。システムは、ＤＲＰと治療との間に有意な関連があるかについて決定できる。有意な関連がある場合、下流側の分析において治療をさらに分析できる（例えば、後述図２０との関係でさらに説明されている）。

処理１６００は、例えば、ソフトウェアプラットフォームを実装する１つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理１６００は、クライアント－サーバシステムを使用して実施され、処理１６００のブロックは、任意の様式において、サーバと１つ以上のクライアントデバイスとの間で分割される。したがって、処理１６００の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理１６００はそのように限定されることは要さないことに留意されたい。他の例では、処理１６００はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理１６００では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理１６００と組み合わせて実施されてもよい。故に、図示（および下記により詳細に説明）されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。

ブロック１６０２では、例示的なシステム（例えば、１つ以上の電子装置）は、プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ画像と、プラセボ群にプラセボが施された後に撮像された被験者プラセボ群についての複数のフォローアッププラセボ画像とを取得するように構成されていることができる。図１７は、いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な処理について示す。図示のように、システムは、プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ医用画像１７０２を取得する。システムはさらに、プラセボ群にプラセボが施された後に撮像された被験者プラセボ群についての複数のフォローアッププラセボ医用画像１７０４を取得する。

ブロック１６０４では、システムは、複数のベースラインプラセボ画像及び複数のフォローアッププラセボ画像に基づいて複数のプラセボ進行埋め込みを取得するように構成されていることができる。図１７を参照するに、システムは、複数のベースラインプラセボ埋め込み１７１２と複数のフォローアッププラセボ埋め込み１７１４とを取得できる。一部の実施形態では、ベースラインプラセボ埋め込み１７１２はベースラインプラセボ画像１７０２に基づいて取得でき、また、フォローアッププラセボ埋め込み１７１４はフォローアッププラセボ画像１７０４に基づいて取得できる。埋め込み1712, 1714に基づいて、システムはプラセボ進行埋め込み１７２２を取得することができる。

図１８Ａ～Ｂは、いくつかの実施形態による、例示的な進行埋め込み生成について示す。図１８Ａに示されているように、システムは、複数のベースラインプラセボ画像１８０４を訓練済み教師なし機械学習モデル（不図示）内へと入力して潜在空間内での複数のベースラインプラセボ埋め込み１８１２を取得できる。同様に、システムは、複数のフォローアッププラセボ画像１８０６を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のフォローアッププラセボ埋め込み１８１４を取得できる。一部の実施形態では、システムは、複数のベースライン治療画像１８０８を訓練済み教師なし機械学習モデル（不図示）内へと入力して潜在空間内での複数のベースライン治療埋め込み１８１６を取得できる。さらに、一部の実施形態では、システムは、複数のフォローアップ治療画像１８１０を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のフォローアップ治療埋め込み１８１８を取得できる。一部の実施形態では、教師なし機械学習モデルは対照モデルであり、これは図４Ａ～Ｂを参照して説明されたモデルと類似する。一部の実施形態では、前記対照モデルはSimCLRモデルである。一部の実施形態では、教師なし機械学習モデルは、図８Ａ～８Ｂ及び関連図面との関係で説明されたものに沿う態様で設計及び訓練されたシステムである。

そして、図１８Ｂに示されているように、システムは、ベースラインプラセボ埋め込み１８１２を訓練済み機械学習モデル１８５０内へと入力して、潜在空間にて複数の予測フォローアッププラセボ埋め込み１８５４を取得できる。そして、システムは、フォローアッププラセボ埋め込み１８１４と予測フォローアッププラセボ埋め込み１８５４との間の差を算出することによって複数のプラセボ進行埋め込み１８５６を決定できる。一部の実施形態では、プラセボ群内の患者について、システムは、患者のフォローアッププラセボ埋め込みと患者の予測フォローアッププラセボ埋め込みとの間で減算を行って、患者のプラセボ進行埋め込みを取得する。

図１８Ｃは、いくつかの実施形態による、例示的な進行埋め込み生成について示す。一部の実施形態では、各予測フォローアップ埋め込みは、図８Ａ～８Ｂ及び関連図面との関係で説明されたものに沿う態様で設計及び訓練されたシステムによって以前評価された着目コバリアントに関して、患者がそれを有するかそれと関連付けられているかを考慮する。

同様に、図１８Ｄにて示されているように、システムは、複数のベースライン治療埋め込み１８１６を訓練済み機械学習モデル１８５０内へと入力して、潜在空間にて複数の予測フォローアップ治療埋め込み１８５８を取得できる。そして、システムは、フォローアップ治療埋め込み１８１８と予測フォローアップ治療埋め込み１８５８との間の差を算出することによって複数の治療進行埋め込み１８６０を決定できる。一部の実施形態では、治療群内の患者について、システムは、患者のフォローアップ治療埋め込みと患者の予測フォローアップ治療埋め込みとの間で減算を行って、患者の治療進行埋め込みを取得する。

一部の実施形態では、訓練済み機械学習モデル１８５０は、ベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている。一部の実施形態では、訓練済み線形モデルは線形混合モデルであり、これは本明細書にて説明された他の線形混合モデルに類似している。図１９は、いくつかの実施形態による、訓練済み機械学習モデル１８５０についての例示的な訓練処理について示す図である。示されているように、訓練済み機械学習モデル１８５０は、訓練データ１９６０を用いて訓練されるのであり、これはプラセボデータを含み得る。一部の実施形態では、訓練データ１９６０は、図１８Ａ～Ｂにて分析されているものとは異なるプラセボ群から取得される。

ブロック１６０６では、システムは、治療群に治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像と、治療群に治療が施された後に撮像された被験者治療群についての複数のフォローアップ治療画像とを取得できる。図１７を参照するに、システムは、治療群に治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像１７０６と、治療群に治療が施された後に撮像された被験者治療群についての複数のフォローアップ治療画像１７０８とを取得できる。

ブロック１６０８では、システムは、複数のベースライン治療画像及び複数のフォローアップ治療画像に基づいて複数の治療進行埋め込みを取得できる。例えば、図１７を参照するに、システムは、複数のベースライン治療埋め込み１７１６と複数のフォローアップ治療埋め込み１７１８とを取得する。一部の実施形態では、ベースライン治療埋め込み１７１６はベースライン治療画像１７０６に基づいて取得され、また、フォローアップ治療埋め込み１７１８はフォローアップ治療画像１７０８に基づいて取得される。埋め込み１７１６及び１７１８に基づいて、システムは治療進行埋め込み１７２６を取得することができる。進行埋め込みの生成は、図１８Ａ～Ｃを参照して説明されている。

ブロック１６１０では、システムは、複数の治療進行埋め込みに基づいて患者がプラセボ又は治療を受けたのかを決定するための分類モデルを生成できるのであって、分類モデルの出力は薬物反応組織学的表現型（ＤＲＰ）について示す。図１７を参照するに、システムは、プラセボ進行埋め込み１７２２と治療進行埋め込み１７２６とに基づいてＤＲＰ分類モデル１７３０を生成する。一部の実施形態では、分類モデル（例えば、ＤＲＰ分類モデル１７３０）は、入力進行埋め込みを受信し、また、プラセボ又は治療を患者が受けたのかを示す分類結果を出力するように構成されている。分類モデルは、例えば、ロジスティック回帰モデル、人工ニューラルネットワークモデル、ランダムフォレストモデル、ナイーブなベイジアンモデル等として実装できる。

ブロック１６１２では、システムは、分類モデルに基づいて治療と着目疾患との間の相関メトリック１７３２を決定するように構成されていることができる。相関メトリック１７３２は、治療と着目疾患の進行とが有意な程に関連付けられているかを示し得る。一部の実施形態では、相関メトリック１７３２はＰ値である。

一部の実施形態では、システムは相関メトリック１７３２を所定の閾値と比較するように構成されていることができる。一部の実施形態では、システムは、比較に基づいて、治療Ａ１７３４と関連付けられている特徴について関連分析をさらになすように構成されていることができる。

一部の実施形態では、システムは、関連に基づいて新規被験者について治療（例えば、画像1706, 1708と関連付けられている被験者についてなされた治療）を処方するように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して処方できる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して処方されないこととし得る。

一部の実施形態では、システムは、関連に基づいて治療を施すように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して施すことができる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して施さないこととし得る。

一部の実施形態では、システムは、関連に基づいて治療を調整するように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、治療を増加させ得る。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、治療を減じるか停止できる。

一部の実施形態では、システムは、関連に基づいて医学的提案を提供するように構成されていることができる。一部の実施形態では、システムは、関連に基づいてレポートを生成するように構成されていることができる。一部の実施形態では、治療と着目疾患の進行とが有意な程に関連付けられている場合、例えば図２１にて説明されているように、システムでは治療についてさらに研究できる。

例示的な実装例では、２つの臨床試験が行われている。より小規模な臨床試験では、ベースライン及びフォローアップ肝生検画像データ並びに画像データと関連付けられている病理学者によって割り当てられたスコアが取得される。特に、より小規模な臨床試験はNASH Ph2治験であり、サンプル数は約380であり、また、肝生検画像データはベースライン及び４８週フォローアップにて取得される。より大規模な臨床試験では、アライン済みのベースライン及びフォローアップ肝生検画像データ並びに関連付けられている病理学スコアが取得される。特に、より大規模な臨床試験は２つのNASH Ph3治験であり、サンプル数は約1,600であり、また、肝生検画像データはベースライン及び４８週フォローアップにて取得される。

そして、システムは教師なし学習手順を介して全てのＨ＆Ｅ染色肝生検画像（例えば、図１７のベースラインプラセボ埋め込み１７１２、フォローアッププラセボ埋め込み１７１４、ベースライン治療埋め込み１７１６、及びフォローアップ治療埋め込み１７１８）から生検埋め込みを取得する。

さらにシステムは、進行埋め込み（例えば、プラセボ進行埋め込み１７２２、治療進行埋め込み１７２６）を取得する。先ず、システムは、表現型予測モデル（例えば、訓練済み機械学習モデル１８５０）を訓練して、ベースライン時の生検埋め込みからフォローアップ時（即ち、第４８週）の生検埋め込みの全次元を予測するのであって、より大規模な臨床試験のプラセボ群内の患者のみを考慮してこれがなされる。訓練済み機械学習モデル１８５０は、図３Ａの埋め込みスコア予測モデル３１２（これも線形モデルとされ得る）と類似の態様で構成されることができる。一部の実施形態では、機械学習モデル１８５０は、線形混合モデル等の線形回帰モデルとされ得る。

表現型予測モデルが訓練された後、システムは訓練済み表現型予測モデルを用いて、より小規模な臨床試験での患者のベースライン肝臓状態埋め込みを前提として、プラセボ下のフォローアップ肝臓状態埋め込みを予測できる。これらの予測フォローアップ埋め込みは、プラセボ患者のフォローアップ時の期待組織学的状態を捕捉する。システムは、進行埋め込みを、観測されたフォローアップ埋め込みと前のステップからの予測されたフォローアップ埋め込みとの間の差として定義する。定義されているように、進行埋め込みは、より小規模な臨床試験の患者の組織学的差異について表すのであり、それらのフォローアップ時の組織学的状態とプラセボ患者の期待組織学的状態との間が扱われる。

各治療群について、システムは、治療特有モデル（例えば、ＤＲＰ分類モデル１７３０）を訓練して、より小規模な臨床試験の進行埋め込みからのプラセボ及び治療群からの患者を分類する。このモデルからの予測は、フォローアップ時の薬剤応答組織学的表現型（ＤＲＰ）の各患者についての尺度を提供する。一部の実施形態では、分類モデルの入力は、進行埋め込み（例えば、プラセボ進行埋め込み１８５６、１８６０）である。一部の実施形態では、分類モデルの出力は、患者が治療群又はプラセボ群のどちらに属するかを示す各患者についての二値指標である。ＤＲＰ分類は、図３Ａの埋め込みスコア予測モデル３１２と類似の態様で構成されることができる。

予測ＤＲＰの統計的有意性は、例えば、本明細書にて説明される順列手順を用いて査定できる。例えば、システムは、モデルについて相関メトリックを算出できる。一部の実施形態では、前記相関メトリックはＰ値である。Ｐ値は順列手順を介して取得できるのであって、実データからの対数尤度レシオ（ＬＬＲ、log likelihood ratio）統計が、埋め込み行列内にて個体についての置換がなされる際に取得されたＬＬＲと、比較される（nullモデルからのＬＬＲ）。一部の実施形態では、Ｐ値は、上述のように、実データＬＬＲより大きな並べ替えＬＬＲの画分として定義される。

各遺伝的バリアントについての相関メトリックは所定の閾値に対して比較されて、遺伝的バリアントと埋め込みとの間に関連があるかを決定できる。１つの例示的な実装例では、システムは、0.05とされるBonferroni調整Ｐ値閾値を用いて、有意な治療組織学的効果を定義して治療が進行埋め込みに対して効果を及ぼすかを査定する。一部の実施形態では、有意なＰ値を有する治療のみがさらに研究されるのであり、例えば図２０の処理２０００を用いてこれがなされ得る。

一部の実施形態では、治療を分析する際には、治療の効果は、フォローアップ埋め込みを用いて直接的に分析できる。そのような場合では、ベースライン埋め込み／画像は、分析から除外され得る。

図２０では、治療についての薬物反応組織学的表現型（ＤＲＰ）との関係で着目コバリアントを識別する例示的な方法について示されている。ＤＲＰについての帰属決定は、進行埋め込みが利用可能である限り臨床試験データセットを用いることによって行うことができる。ＤＲＰと分子データ（例えば、表現及びジェネティクス）との間の有意な関連は関連検定を介して取り出すことができる。発現ありの関連付けでは、プラセボ対薬剤の差次的発現分析にて検出できなかった遺伝子を識別できる。遺伝的な関連付けによって着目疾患（例えば、ＮＡＳＨ）についての候補標的遺伝子が識別される。

処理２０００は、例えば、ソフトウェアプラットフォームを実装する１つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理２０００は、クライアント－サーバシステムを使用して実施され、処理２０００のブロックは、任意の様式において、サーバと１つ以上のクライアントデバイスとの間で分割される。したがって、処理２０００の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理２０００はそのように限定されることは要さないことに留意されたい。他の例では、処理２０００はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理２０００では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理２０００と組み合わせて実施されてもよい。故に、図示（および下記により詳細に説明）されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。

ブロック２００２では、例示的なシステム（例えば、１つ以上の電子装置）は、臨床被験者群から取得された共変量クラスのコバリアント情報を受信するように構成されていることができる。一部の実施形態では、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える。ブロック２００４では、システムは、臨床被験者群から複数のベースライン画像及び複数のフォローアップ画像を受信するように構成されていることができる。

ブロック２００２及びブロック２００４で取得されたデータは、同じ治療群の被験者のデータとされることができる。治療群は、例えば、図１６～１９，２３を参照して説明されるような態様で識別できる。図２１を参照するに、システムは、被験者1について画像データ２１０２を、被験者2について画像データ２１０４を、．．．、及び被験者Nについて画像データ２１０６を受信する。被験者1-Nは同じ治療を受ける同じ治療群に属することができる。一部の実施形態では、治療群は識別された着目治療を受けており、例えば図１６～１９，２３を参照して説明されている通りである（例えば、相関メトリック１７３２が所定の閾値を満たす場合には治療Ａ）。

ブロック２００６では、システムは、複数のベースライン画像及び複数のフォローアップ画像に基づいて複数の進行埋め込みを取得するように構成されていることができる。図２１に示されているように、システムは、進行埋め込み2112, 2114, ..., 2116を取得できる。進行埋め込みの生成については、例えば図１８Ａ～Ｃを参照して説明されている。一部の実施形態では、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて前記複数の進行埋め込みを取得するステップは次のステップを含む：前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップ。

ブロック２００８では、システムは、複数の進行埋め込みを訓練済み分類モデル内へと入力して臨床被験者群のＤＲＰ値について示す複数の分類結果を取得するように構成されていることができる。図２１に示されているように、各進行埋め込みは、ＤＲＰ分類モデル２１２０に入力することができる。例えば、画像データ２１０２に基づいて生成された進行埋め込み２１１２は、ＤＲＰ分類モデル２１２０に入力されて、被験者1についてのＤＲＰ値を取得でき；画像データ２１０４に基づいて生成された進行埋め込み２１１４は、ＤＲＰ分類モデル２１２０に入力されて、被験者2についてのＤＲＰ値を取得でき；及び画像データ２１０６に基づいて生成された進行埋め込み２１１６は、ＤＲＰ分類モデル２１２０に入力されて、被験者1-ＮについてのＤＲＰ値を取得できる。一部の実施形態では、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている。分類モデルは、図１８Ｂ～Ｃの訓練済み機械学習モデル１８５０と同一又は類似のものとされ得る。したがって、システムは、薬剤応答表現型（ＤＲＰ）を進行埋め込みから治療へのモデルからの予測として帰属させる（プラセボ対薬剤）。この帰属決定は、進行埋め込みが利用可能である限り他の臨床試験データセットにて行うことができる。

ブロック２０１０では、システムは、臨床被験者群についてのコバリアント情報、複数の分類結果、及び１つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントとＤＲＰ値（例えば、ＤＲＰ値2122-1 - 2122-N）との間の関連を決定して、着目コバリアントを識別するように構成されていることができる。換言するに、システムはＤＲＰと分子データとの間に有意な程の関連を識別できる（発現及びジェネティクス）。発現ありの関連付けでは、プラセボ対薬剤の差次的発現分析にて検出できなかった遺伝子を識別できる。一部の場合では、ＤＲＰ分析では、真のプラセボ対薬剤（placebo-vs-drug）の差次的発現分析の症例対照として相関付けられている遺伝子セットを識別できる。一部の場合では、ＤＲＰ分析では、より大きなコホートの分析故により大きな遺伝子セットを識別できるのでありＤＲＰ相関の解釈を支援し得る。

一部の実施形態では、着目コバリアントの識別は、ＤＲＰ値と臨床被験者群のコバリアント情報とに基づいて複数の候補コバリアントの各候補コバリアントについてコバリアント特有モデル２１３０を生成することを伴い得る。一部の実施形態では、一部又は全部のコバリアント特有モデル２１３０は、説明されているのと類似の線形混合モデルとされることができる。システムは、全ての着目コバリアント（例えば、100,000種、100万種、1,000万種の候補）についてコバリアント特有モデル（例えば、100,000種、100万種、1,000万種のモデル）を生成できる。各モデルを評価して、各候補コバリアントとＤＲＰとの間に有意な関連があるかについて決定して、１つ以上の着目コバリアントを識別できる。

一部の実施形態では、システムは、モデルに基づいて相関メトリックを決定できる。相関メトリックは、候補コバリアント及びＤＲＰ値が有意な程に関連付けられているかを示す。一部の実施形態では、前記相関メトリックはＰ値である。一部の実施形態では、相関メトリックを所定の閾値に対して比較して候補コバリアントが着目コバリアントであるかを決定できる。

一部の実施形態では、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える。例示的な実装例では、臨床試験にてACCi+FXRa DRPの進行GWASが行われたのであり、27,270個のミスセンスバリアントについて着目した（MAF>1%）。分析ではミスセンス遺伝子座を識別できる。

一部の実施形態では、前記複数の候補コバリアントは複数の候補遺伝子を備える。例示的な実装例では、様々な臨床試験においての発現とＤＲＰとの間の関連によって、図２７に示されているように何千もの関連遺伝子が識別された。

一部の実施形態では、識別された着目コバリアントは、新規被験者に関して着目疾患を診断するために用いることができる。一部の実施形態では、識別された着目コバリアントに基づいて治療を開発できる。

一部の実施形態では、識別された着目コバリアントに基づいて治療を施し、調整し、及び／又は適用できる。

一部の実施形態では、識別された着目コバリアントに基づいて医学的提案を提供すること（又は求めること）ができる。

一部の実施形態では、識別された着目コバリアントに基づいて生物学的標的を識別できる。

一部の実施形態では、複数の医用画像は生検画像を含む。

上述のように、各治療群について、システムは、治療特有モデル（例えば、ＤＲＰ分類モデル１７３０）を訓練して、より小規模な臨床試験の進行埋め込みからのプラセボ及び治療群からの患者を分類するように構成されていることができる。このモデルからの予測は、フォローアップ時の薬剤応答組織学的表現型（ＤＲＰ）の各患者についての尺度を提供する。一部の実施形態では、分類モデルの入力は進行埋め込みである。分類モデルの出力は、各患者が治療群又はプラセボ群のどちらに属するかについての二値指標である。ＤＲＰ分類は、図３Ａの埋め込みスコア予測モデル３１２と類似の態様で構成されることができる。

一部の実施形態では、システムは、訓練済みＤＲＰ分類モデルを用いて大規模臨床試験においてＤＲＰ値を予測するように構成されていることができる。そしてシステムは、より大規模な臨床試験を用いて、ＤＲＰを他のデータレイヤと併せて分析して具体的な問題に対応でき、以下の２つの例にて説明がある。

１つの例では、システムは大規模臨床試験でのＤＲＰ及び遺伝子発現を分析して、治療と関連付けられている遺伝子及び経路を識別する。先ず、システムは、図３Ｂのモデル３１６に関して説明されている線形モデル関連付け手順を用いて、ＤＲＰ値と遺伝子発現との間の関連について検定を行う。例えば、システムは、遺伝子値を受信し及びＤＲＰ値を出力する遺伝子特有モデルについて適合化をなし得る。モデルについてＰ値を決定できる。そしてシステムは、既存のアプローチを用いて経路エンリッチメント分析を行う（例えば、前のステップにてＤＲＰとの関連付けでのＰ値によってランキングされた遺伝子リスト及び外部ソース（例えば、遺伝子オントロジー）からの経路アノテーションを入力として受け付けるＧＳＥＡ）。例示的な実装例では、この手順は、相関する関連統計を治療及びプラセボ群についての直接差次的発現分析にもたらす。また、治療－プラセボ差次的発現分析と関連付けられているものより遙かに大規模な遺伝子セットが大規模な研究のＤＲＰと有意に関連付けられているものとして識別される。

一部の実施形態では、遺伝子発現は帰属させることができる。例えば、訓練済み線形回帰モデル等の機械学習モデルは、生物学的サンプルについての画像埋め込みに対して適合化されることができる。機械学習モデルは、臨床試験からの患者組織サンプルについての画像埋め込みに基づいて、組織ＲＮＡシーケンス測定を予測するように訓練されていることができる。一部の実施形態では、別の臨床試験からの患者組織サンプルについての画像埋め込みに対して同一又は類似の機械学習モデル（例えば、同一又は類似の線形回帰モデル）が適用され得る。例えば、他の臨床試験の患者からの画像埋め込みは関連付けられているＲＮＡシーケンスデータを有していない場合がある。予測ＲＮＡシーケンス測定と治療等の着目共変量との間の関連付けを査定して共変量の相関の解釈の一助とすることができる。

別の例では、システムは、ＤＲＰについての遺伝子分析を行って、薬剤の影響を受けるのと同じ組織学的表現型に影響を及ぼす候補標的遺伝子を識別する（故に同様の経路に影響を及ぼすであろう）。特に、システムは、図3Ｂのモデル316に関して説明された線形モデル関連付け手順を用いてＤＲＰとミスセンスバリアントとの間の関連について検定を行うのであって、その際は年齢、性別、表現型ＰＣ、及び治療群を共変量として調整がなされている。例えば、バリアント特有モデルは、ミスセンスバリアント値を受信し及びＤＲＰ値を出力するように構成されている。この分析によって、ＤＲＰと関連付けられている遺伝子内のミスセンスバリアントを識別することができる。一部の場合、複数回の仮説検定是正を経た後に関連付けは有意となり得る。

図２２は、いくつかの実施形態による、着目疾患の進行との関係で治療を評価するための例示的な方法について示す。図２２では、疾患進行は連続医療診断スコアによって定量化される。例示的な実装例では、着目共変量と進行スコアとの間の関連検定を行うことによって疾患進行について分析するのであり、その際は離散及び連続ベースライン疾患スコアの両方に加えて他の関連性を有する共変量について調整がなされる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、例えば縦型表現分析（例えば、図２６Ａ）、遺伝関連研究（例えば、図２６Ｂ）、及び治療応答についての関連研究に関して促進し得る。これらの例では、連続的疾患スコアの分析によって、離散的な病理学者によって割り当てられた疾患スコア（discrete pathologist-assigned disease score）の分析を通じて識別された関連が頻繁に反復され、また、病理スコアによっては識別されていない追加的な関連が識別されるということが見出される。

この手順では、病理学者によって割り当てられた離散スコア（pathologist-assigned, discrete scores）を用いては検出できなかった、連続スコアに対しての薬剤の影響を取り出すことができる。処理２２００は、例えば、ソフトウェアプラットフォームを実装する１つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理２２００は、クライアント－サーバシステムを使用して実施され、処理２２００のブロックは、任意の様式において、サーバと１つ以上のクライアントデバイスとの間で分割される。したがって、処理２２００の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理２２００はそのように限定されることは要さないことに留意されたい。他の例では、処理２２００はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理２２００では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理２２００と組み合わせて実施されてもよい。故に、図示（および下記により詳細に説明）されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。

ブロック２２０２では、例示的なシステム（例えば、１つ以上の電子装置）は医用画像を取得するように構成されていることができ、つぎのものが含まれる：（ａ）プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ画像と、（ｂ）前記プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ画像と、（ｃ）治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療画像と、（ｄ）前記治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療画像。図２３を参照するに、システムは、ベースラインプラセボ画像２３０２と、フォローアッププラセボ画像２３０４と、ベースライン治療画像２３０６と、フォローアップ治療画像２３０８とを取得する。

ブロック２２０４では、システムは、医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するように構成されていることができ、各埋め込みは医用画像の１つ以上にて反映されている着目疾患との関係での表現型状態に対応する。一部の実施形態では、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは：（ａ）プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ画像を訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得するステップと；（ｂ）プラセボ群にプラセボが施された後に撮像された被験者プラセボ群についての複数のフォローアッププラセボ画像を訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得するステップと；（ｃ）治療群に治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得するステップと；（ｄ）治療群に治療が施された後に撮像された被験者治療群についての複数のフォローアップ治療画像を訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得するステップとを含む。

図２３を参照するに、システムは次のものを入力するように構成されていることができる：ベースラインプラセボ埋め込み２３１２を取得するためのベースラインプラセボ画像２３０２、フォローアッププラセボ埋め込み２３１４を取得するためのフォローアッププラセボ画像２３０４、ベースライン治療埋め込み２３１６を取得するためのベースライン治療画像２３０６、及びフォローアップ治療埋め込み２３１８を取得するためのフォローアップ治療画像２３０８。埋め込みを生成するために用いられる教師なし機械学習モデルは、図４Ａ及び４Ｂを参照して説明されるモデルと類似していることができる。一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。一部の実施形態では、前記対照モデルはSimCLRモデルである。

ブロック２２０６では、システムは、複数の埋め込みを訓練済み線形回帰モデル内へと入力して複数の予測連続医療診断スコアを取得するように構成されていることができ、各予測連続医療診断スコアは着目疾患の状態について示し得る。一部の実施形態では、前記複数の埋め込みを前記訓練済み線形回帰モデル内へと入力するステップは：前記複数のベースラインプラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のベースラインプラセボスコア２３２２を取得することと、前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアッププラセボスコア２３２４を取得することと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して複数のベースライン治療スコア２３２６を取得することと、前記複数のフォローアップ治療埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアップ治療スコア２３２８を取得することとを含む。

一部の実施形態では、線形回帰モデルは線形混合モデルであり、これは図３Ａを参照して説明されている埋め込みスコア予測モデル３１２に類似している。一部の実施形態では、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化されている。一部の実施形態では、前記複数の割り当て済み医療診断スコアは１人以上の医師によって提供される。一部の実施形態では、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される。一部の実施形態では、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアとされる。

ブロック２２０８では、システムは、予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア２３３２及び複数の治療進行スコア２３３４を決定する。一部の実施形態では、プラセボ進行スコア２３３２及び治療進行スコア２３３４を決定するステップは：ベースラインプラセボスコア２３２２とフォローアッププラセボスコア２３２４との間の差を決定してプラセボ進行スコア２３３２を決定することと、ベースライン治療スコア２３２６とフォローアップ治療スコア２３２８との間の差を決定して治療進行スコア２３３４を決定することとを含む。例えば、プラセボ群内の患者については、プラセボ進行スコアは、患者のベースラインプラセボスコアとフォローアッププラセボスコアとの間の差である。例えば、治療群内の患者については、治療進行スコアは、患者のベースライン治療スコアとフォローアップ治療スコアとの間の差である。

一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは：前記プラセボ群内の各被験者について、前記プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、前記治療群内の各被験者について、前記治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む。例えば、患者については、システムは、経時的に患者の医療診断スコア（ベースラインスコア及びフォローアップスコアを含む）を取得していくことができ、容量（又は治療時間）を受信し及び医療診断スコアを予測するように構成された線形モデルについて適合化をなし得る。患者についての進行スコアは、線形モデルの勾配とすることができる。

ブロック２２１０では、システムは：複数のプラセボ進行スコア及び複数の治療進行スコアを治療と関連付けて；複数の疾患進行スコアと治療との間の相関メトリックを関連に基づいて決定するように構成されていることができる。一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む。図２３に示されているように、システムは、モデル２３４０を生成し及び相関メトリック２３４２を算出するように構成されていることができる。一部の実施形態では、モデルは本明細書にて説明されている線形混合モデルである。

一部の実施形態では、前記相関メトリックはモデルのＰ値である。相関メトリックは、治療と疾患（disease）の進行との間に有意な関連があるかについて示す。

一部の実施形態では、所与の治療についてのさらなる関連検定２３４４がなされ得る。例えば、相関メトリックは所定の閾値と比較され得る。一部の実施形態では、治療と着目疾患（disease of interest）との間の関連は、比較に基づいて識別され得る。一部の実施形態では、システムはさらに、関連に基づいて新規被験者について治療を処方するように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して処方できる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して処方されることはない。

一部の実施形態では、システムは、関連に基づいて治療を施すようにさらに構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して施すことができる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して施すことはない。

一部の実施形態では、システムは、関連に基づいて治療を調整するようにさらに構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、治療を増加させ得る。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、治療を減じるか停止できる。

一部の実施形態では、関連付けに基づいて医学的提案を提供することができる。一部の実施形態では、治療と着目疾患の進行とが有意な程に関連付けられている場合、例えば図２１にて説明されているように、システムでは治療についてさらに研究できる。一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である。

図２４は、いくつかの実施形態による、着目患者サブグループを識別するための例示的な方法について示す。システムは、患者画像データから埋め込みを取得し及び埋め込みのクラスタを患者サブグループ（subgroup）として識別するように構成されていることができる。患者クラスタ（cluster）アイデンティティ及び疾患バイオマーカ、遺伝的バリアント及び発現レベル間の有意な関連が関連検定にて取り出される。この手順では、患者セグメント（segment）及び関連付けられている臨床ラベル及び分子ドライバが取り出されるのであり、それらは各患者セグメントを特徴付けることを支援する。

処理２４００は、例えば、ソフトウェアプラットフォームを実装する１つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理２４００は、クライアント－サーバシステムを使用して実施され、処理２４００のブロックは、任意の様式において、サーバと１つ以上のクライアントデバイスとの間で分割される。したがって、処理２４００の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理２４００はそのように限定されることは要さないことに留意されたい。他の例では、処理２４００はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理２４００では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理２４００と組み合わせて実施されてもよい。故に、図示（および下記により詳細に説明）されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。

ブロック２４０２では、システムは、臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して、潜在空間内での複数の埋め込みを取得するように構成されていることができる。ブロック２４０４では、システムは、複数の埋め込みをクラスタリングして１つ以上の埋め込みクラスタを生成するように構成されていることができる。ブロック２４０６では、システムは、１つ以上の埋め込みクラスタに対応する１つ以上の患者サブグループを識別するように構成されていることができる。

ブロック２４０８では、システムは、１つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するように構成されていることができる。特に、システムは２つのタイプの分析をなし得る。第一に、システムは、関連検定を通じて患者サブグループと共変量（例えば、疾患バイオマーカ、遺伝的バリアント及び発現レベル）との間に有意な関連があるかを決定することによって各患者サブグループについて特徴付けをなし得る。このようにして、システムは識別された患者サブグループと、関連付けられている臨床ラベル及び分子ドライバを取得でき、それらは患者サブグループを特徴付ける。一部の実施形態では、関連検定は次のことをなすモデルを生成することを伴う：患者が患者サブグループに属するかを示す入力を受信することと（例えば、患者が属さない場合には0とされ、患者がサブグループに属する場合には1とされる）、共変量値を出力すること。第二に、システムは、共変量（例えば、治療又は表現型）の効果を各患者サブグループ内にて特徴付けることができる。例えば、システムは、サブグループ内の患者のみを考慮しての分析（例えば、遺伝関連研究並びに治療と臨床的進行との間での関連付け）をなし得る。関連検定は、サブグループ内の患者のデータのみを用いてモデルを生成することを伴う。

一部の実施形態では、前記相関メトリックはＰ値である。

一部の実施形態では、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである。一部の実施形態では、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。

一部の実施形態では、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは治療後に前記有害副作用を経験することについて有意な関連を有するサブグループである。一部の実施形態では、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、前記患者サブグループ内の患者が前記治療を受けたかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。

一部の実施形態では、前記相関メトリックはＰ値である。

例示的な実装例では、システムは、臨床的に関連性を有する患者セグメントを識別して、効率を増大させＡＳＥを減少させるように構成されていることができる。先ず、システムは、教師なし学習手順を介してＨ＆Ｅ染色肝生検画像から生検埋め込み（一部又は全部）を取得することができる。そして、システムは、ベースライン生検埋め込みについての教師なし分析を行って、生検埋め込みに基づいて患者のクラスタを識別できる。各クラスタについて、システムは、患者規模での二値指標ベクトルを決定又は取得し、患者がクラスタに属するか否かを示すことができる。二値表現型は、下流側での分析に用い得ることができる。

さらに、システムは、異なるクラスタの疾患進行との関連について査定するように構成されていることができ、例えば図３Ｂのモデル３１６にて説明されている線形モデル検定手順を用いる等してクラスタアイデンティティと臨床試験エンドポイントとの間での関連について検定することができる。例えば、システムはクラスタ特有モデルについて適合化を行うことができ、該モデルはクラスタ二値指標（クラスタに属する患者は１と符号化され、クラスタに属さない患者は０と符号化される）を受信し及び臨床スコア又はエンドポイント（例えば、疾患進行）を出力する。

システムはまた、異なる患者クラスタ毎の治療効果についても査定できるのであり、例えば図３Ｂのモデル３１６にて説明されている線形モデル検定手順を用いる等して所定のクラスタ内の患者のみを考慮して治療と臨床エンドポイントとの間の関連について検定できる。例えば、システムは、治療対プラセボについての二値指標を受信し及び臨床エンドポイント（例えば、線維症進行）を出力するクラスタ特有モデルについて適合化を行うことができる。そして、分析を特定のクラスタ内の患者に限定することができる。

システムはまた、異なるクラスタと関連付けられている有害副作用について査定することもできる（例えば、図３Ｂのモデル３１６にて説明されている線形モデル検定手順を用いる等してクラスタアイデンティティと有害副作用共変量との間での関連について検定することができる。）。例えば、システムはクラスタ特有モデルについて適合化を行うことができ、該モデルは二値指標（例えば、クラスタに属する患者は１と符号化され、クラスタに属さない患者は０と符号化される）を受信し及び副作用又は有害イベントを出力する。例えば、システムは分析を患者が特定の治療を受けている場合に限定でき、分析された出力は有害イベントによって臨床試験から脱落した患者であるかを（二値指標として）扱うことができる。これによって、治療からの有害副作用をより被りやすい患者を識別できることとなる。

そして、特定のクラスタが進行と関連付けられている場合、システムはそのクラスタの遺伝子及び表現型バイオマーカを識別できる（例えば、図３Ｂのモデル３１６にて説明されている線形モデル検定手順を用いる等してクラスタアイデンティティとジェネティクスや発現やラボ値等との間での関連について検定することができる）。例えば、システムはモデルについて適合化を行うのであり、該モデルはクラスタ二値指標（例えば、クラスタに属する患者は１と符号化され、クラスタに属さない患者は０と符号化される）を受信し及び臨床スコア又はエンドポイント（例えば、疾患進行）を出力する。臨床エンドポイントは、進行スコア又は臨床試験内で監視される臨床エンドポイントとして定量化できる（例えば、患者に関して病理学評価に基づいた線維症スコアが高い又は低いこと）。

一部の実施形態では、本明細書にて説明される手法は生検埋め込みではなく発現データに基づいていることができる。例えば、図３Ｂのモデル３１６に関して説明されている線形モデル検定手順を用いて、患者におけるベースライン発現レベルと疾患進行との間の関連について検定を行うことができる。例えば、線形混合モデルを生成して、入力としてベースライン発現レベルを受信し及び疾患進行予測を出力することができる。例を挙げるに、この手順では、進行と有意に関連付けられている130の遺伝子を識別できる。この例では、130の進行遺伝子の発現に基づいて患者についてのscanpyを用いてLeidenクラスタリングを行う（線維症ベースライン状態及び臨床試験指標を回帰で出した後）。

システムは、異なるクラスタの疾患進行との関連について査定するのであり、図３Ｂのモデル３１６にて説明されている線形モデル検定手順を用いてクラスタアイデンティティと疾患進行との間での関連について検定することができる。例えば、線形混合モデルを生成して、入力としてクラスタアイデンティティ（例えば、患者がクラスタに属するか）を受信し及び疾患進行予測を出力することができる。例においては、分析では、進行と関連付けられているものとして２つのクラスタが、並びに、退行と関連付けられているものとして１つのクラスタが識別された。

各遺伝子について、システムは、ベースライン状態及び臨床試験指標を入力として受信し及びその発現を出力する線形回帰モデルについて適合化を行うように構成されていることができる。システムは寄与分をベースライン状態及び臨床試験指標から減算し得るのであり、それは線形モデルを介して元の発現値から推定される。図２５との関連で示されているように、分析例では３つの患者クラスタ（cluster）が示された。２つの進行クラスタは異なる遺伝子発現に対応する。換言するに、図２５の例では、システムが、進行と関連付けられているベースライン発現レベルの遺伝子に基づいて患者をクラスタ化した後、３つの群（group）が認められる。これらのうち、２つの患者群は進行する傾向を示しているが、これらの群は異なる遺伝子シグネチャをベースラインにて有している。この不均一性は、これらの患者群間の基本的差異を示しているといえる。換言するに、これらの患者群は特定の治療に対して異なる態様で応答したり、遺伝的駆動因子が異なったり等し得る。

システムは、クラスタアイデンティティと発現値との間での関連について検定するための図３Ｂのモデル３１６にて説明されている線形モデル検定手順を用いることによって、異なるクラスタと関連付けられている発現バイオマーカについてなされた探索について査定している。例えば、線形混合モデルを生成して、入力としてクラスタアイデンティティを受信し（例えば、患者がクラスタに属するか）並びに発現値を出力できる。この分析は、各クラスタと関連付けられている約１０の発現バイオマーカを設定する。

一部の実施形態では、画像ベースドバイオマーカを開発できる。例えば、予測画像を着目条件について可視化できる。例えば、着目条件は高い又は低い疾患スコアや、ある遺伝的シーケンスに対しての別の遺伝的シーケンス等を示し得る。関連付けられている画像特徴についての仮説を、予測画像の可視化に基づいて、生成できる。例えば、細胞内の細胞特徴は、着目条件のサンプル内においては、着目条件を有さないものとは違って、異なる様相を呈するかもしれない。関連付けられている特徴を測定するように具体的に設計されているモデルを生成できるのであって、該特徴は画像ベースドバイオマーカとされ得る。そして、モデルは新たなデータを伴って評価されることができ、新たな画像ベースドバイオマーカとしてもちいられるかもしれない。

図２８は、いくつかの実施形態による、ｚスコアの比較について示す。一部の実施形態では、図２８は、小規模臨床試験における治療対プラセボの分析のｚスコアに対しての大規模な臨床試験における帰属ＤＲＰ分析のそれの比較について示す。図２８では、小規模サンプル内での真の治療効果についての分析と共に識別されるものと相関する遺伝子を識別できるＤＲＰ分析について示されている。さらに、図２８では、先述の手法にはより良いパワーが付与されていることが示されている。さらに、このアプローチでは、治療分析が可能とされ得るのであり、着目共変量について測定がなされなかった研究に関して相関付けがなされる故にそうなる。

図２９は、一実施形態によるコンピューティング装置の一例について示す。装置２９００は、ネットワークに接続されたホストコンピュータとすることができる。装置２９００は、クライアントコンピュータ又はサーバとすることができる。図２９に示されるように、装置２９００は、パーソナルコンピュータ、ワークステーション、サーバ又は、電話若しくはタブレット等のハンドヘルド型コンピューティング装置（可搬電子装置）等の任意の適切な種類のマイクロプロセッサベースの装置とすることができる。装置２９００は例えばプロセッサ２９１０、入力装置２９２０、出力装置２９３０、記憶装置２９４０、及び通信装置２９６０のうちの１つ以上を含むことができる。入力装置２９２０及び出力装置２９３０は概して上述のものに対応することができ、コンピュータに接続可能であるか又はコンピュータと一体化されるかのいずれかであってもよい。

入力装置２９２０は、タッチスクリーン、キーボード若しくはキーパッド、マウス、又は音声認識装置等の、入力を提供する任意の適切な装置とすることができる。出力装置２９３０は、タッチスクリーン、触覚装置、又はスピーカ等の、出力を提供する任意の適切な装置とすることができる。

記憶装置２９４０は、ＲＡＭ、キャッシュメモリ、ハードドライブ、若しくはリムーバブル記憶ディスクを含む、電気、磁気、又は光学メモリ等の、記憶装置を提供する任意の適切な装置とすることができる。通信装置２９６０は、ネットワークインタフェースチップ又は装置等のネットワークを介して信号を送信及び受信することが可能な任意の適切な装置を含むことができる。コンピュータのコンポーネントは、物理的又は無線等を介して、任意の適切な手法で接続することができる。

記憶装置２９４０に格納され、プロセッサ２９１０によって実行することができるソフトウェア２９５０は、例えば、本開示の機能を具現化する（例えば、上述したような装置において具現化される）プログラミングを含むことができる。

ソフトウェア２９５０はまた、命令実行システム、機器、若しくは装置からソフトウェアに関連付けられた命令をフェッチし、その命令を実行することができる、上述したものなどの命令実行システム、機器、若しくは装置によって使用するための又はそれに関連して使用するための任意の非一時的コンピュータ可読記憶媒体内に格納及び／又は輸送することができる。本開示の文脈では、コンピュータ可読記憶媒体は、命令実行システム、機器、若しくは装置によって使用するための、若しくはそれに関連して使用するためのプログラムを含むか又は格納することができる、記憶装置２９４０などの任意の媒体とすることができる。

ソフトウェア２９５０はまた、命令実行システム、機器、若しくは装置からソフトウェアに関連付けられた命令をフェッチし、その命令を実行することができる、上述したものなどの命令実行システム、機器、若しくは装置によって使用するための、又はそれに関連して使用するための、任意の輸送媒体内に伝播することができる。本開示の文脈では、輸送媒体は、命令実行システム、機器、若しくは装置によって使用するための、若しくはそれに関連して使用するためのプログラムを通信する、伝播する、又は輸送することができる任意の媒体とすることができる。輸送可読媒体は、電子、磁気、光学、電磁気、又は赤外線有線若しくは無線伝播媒体を含むことができるが、これらに限定されない。

装置２９００はネットワークに接続されていることができ、これは任意の適切な相互接続通信システムであることができる。ネットワークは、任意の適切な通信プロトコルを実装でき、また、任意の適切なセキュリティプロトコルによって保護できる。このネットワークは、無線ネットワーク接続、Ｔ１若しくはＴ３回線、ケーブルネットワーク、ＤＳＬ、又は電話回線等の、ネットワーク信号の送信及び受信をなすことができる任意の適切な配置のネットワークリンクを備えることができる。

装置２９００は、ネットワーク上で動作するのに適した任意のオペレーティングシステムを実装できる。ソフトウェア２９５０は、Ｃ、Ｃ＋＋、Ｊａｖａ、又はＰｙｔｈｏｎ等の任意の適切なプログラミング言語で記述され得る。様々な実施形態において、本開示の機能を具現化するアプリケーションソフトウェアは、例えばクライアント／サーバ配置において又はウェブベースのアプリケーション若しくはウェブサービスとしてウェブブラウザを通して、異なる構成で展開できる。

本開示及び実施例は添付の図面を参照して十分に説明されているも、様々な変更及び修正が当業者には明らかになることに留意されたい。そのような変更及び修正は、特許請求の範囲によって画定される開示及び実施例の範囲内に含まれているものと解されるべきである。

前述の説明は、説明の目的で、特定の実施形態を参照して説明されている。もっとも、上記の例示的な議論は、網羅的であること、又は本発明を開示された正確な形態に限定することを意図するものではない。上記の教示に照らせば、多くの修正及び変形が可能である。実施形態は、技術の原理及びそれらの実際の応用を最も良く説明するために選択及び説明された。これにより、当業者であれば、想定される特定の用途に適した様々な修正を加えて、本技術及び様々な実施形態を最良に利用することができる。

本手法は以下の列挙される実施形態を参照することによってより良く理解されよう：

1. 表現型との関係で着目コバリアントを識別する方法であって：臨床被験者群から取得された共変量クラスについてのコバリアント情報及び表現型に関する対応する表現型データを受信するステップと；表現型データを訓練済み教師なし機械学習モデル内へと入力して潜在空間内で複数の埋め込みを取得するステップであって、各埋め込みは表現型データにて反映されている表現型状態に対応する、ステップと；（ｉ）臨床被験者群についてのコバリアント情報、（ｉｉ）複数の埋め込み、及び（ｉｉｉ）１つ以上の機械学習モデルに基づいて、複数の候補コバリアントの各々と表現型との間の関連を決定して、着目コバリアントを識別するステップを含む、方法。

2. 実施例１に記載の方法において、前記１つ以上の機械学習モデルは線形回帰モデルを備える、方法。

3. 実施例１～２のいずれか１つに記載の方法において、前記１つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。

4. 実施例１～３のいずれか１つに記載の方法において、前記表現型は着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、又はリピドミクスを含む、方法。

5. 実施例１～４のいずれかに記載の方法において、前記表現型データは医用画像データ、生検データ、臨床バイオマーカデータ、又はゲノミックバイオマーカデータを含む、方法。

6. 実施例１～５のいずれかに記載の方法において、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える、方法。

7. 実施例１～６のいずれかに記載の方法において、各候補コバリアントと前記表現型との間の前記関連を決定するステップは：前記複数の埋め込みの各埋め込みを線形回帰モデル内へと入力して、複数の埋め込みの各埋め込みについて予測連続スコアを受信して、複数の予測連続スコアを取得するステップと、前記複数の予測連続スコアを、前記臨床被験者群によって発現されている候補コバリアントと関連付けるステップと、前記表現型と前記候補コバリアントとの間の相関メトリックを、前記関連に基づいて、決定するステップであって、前記相関メトリックは前記候補コバリアントが前記表現型に対して及ぼすインパクトについて示す、ステップとを含む、方法。

8. 実施例１～６のいずれかに記載の方法において、前記候補コバリアントと前記表現型との間の前記関連を決定するステップは：前記複数の埋め込みを前記複数の候補コバリアントの各候補コバリアントと関連付けて、前記複数の候補コバリアントのサブセットを識別するステップと、前記サブセット内の各候補コバリアントを前記表現型と関連付けて、前記着目コバリアントを識別するステップとを含む、方法。

9. 実施例１～８のいずれかに記載の方法において、さらに：前記表現型を表す複数の予測画像を、前記着目コバリアントに基づいて、生成するステップと、ディスプレイ上に前記複数の予測画像を表示するステップとを含む、方法。

10. 実施例９に記載の方法において、さらに：前記複数の予測画像をランキングするステップを含む、方法。

11. 実施例１０に記載の方法において、前記複数の予測画像は前記ランキングに基づいて表示される、方法。

12. 実施例１～１１のいずれかに記載の方法において、さらに：前記コバリアントと前記表現型との間の関係を識別するステップを含む、方法。

13. 実施例１２に記載の方法において、前記関係は因果関係である、方法。

14. 実施例１２～１３のいずれかに記載の方法において、さらに：前記関係に基づいて新規被験者について診断を提供するステップを含む、方法。

15. 実施例１２～１４のいずれかに記載の方法において、さらに：前記関係に基づいて治療を開発するステップを含む、方法。

16. 実施例１２～１５のいずれかに記載の方法において、さらに：前記関係に基づいて治療を施す、調整する、又は適用するステップを含む、方法。

17. 実施例１２～１６のいずれかに記載の方法において、さらに：前記関係に基づいて医学的提案を提供するステップを含む、方法。

18. 実施例１２～１７のいずれかに記載の方法において、さらに：前記関係に基づいて着目疾患の治療のための生物学的標的を識別するステップであって、前記表現型は前記着目疾患を含む、方法。

19. 実施例１８に記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である、方法。

20. 着目疾患との関係で少なくとも１つの着目遺伝的バリアントを識別する方法であって：臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みの各埋め込みを訓練済み機械学習モデル内へと入力して、前記複数の埋め込みの各埋め込みについて予測連続医療診断スコアを受信して、複数の予測医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記複数の予測医療診断スコアを、複数の医用画像の取得元の臨床被験者群によって発現されている複数の候補遺伝的バリアントの各候補遺伝的バリアントと、関連付けるステップと、前記着目疾患と各候補遺伝的バリアントとの間の相関メトリックを前記関連に基づいて決定し、前記少なくとも１つの着目遺伝的バリアントを前記複数の候補遺伝的バリアントから識別するステップであって、前記相関メトリックは各候補遺伝的バリアントが前記着目疾患に対して及ぼすインパクトについて示すステップとを含む、方法。

21. 実施例２０に記載の方法において、さらに：前記相関メトリックを所定の閾値と比較するステップを含む、方法。

22. 実施例２１に記載の方法において、さらに：前記比較に基づいて、各着目候補遺伝的バリアントと前記着目疾患との間の関係を識別するステップを含む、方法。

23. 実施例２２に記載の方法において、前記関係は因果関係である、方法。

24. 実施例２２～２３のいずれかに記載の方法において、さらに：前記関係に基づいて新規被験者にて前記着目疾患を診断するステップを含む、方法。

25. 実施例２２～２４のいずれかに記載の方法において、さらに：前記関係に基づいて治療を開発するステップを含む、方法。

26. 実施例２２～２５のいずれかに記載の方法において、さらに：前記関係に基づいて治療を施す、調整する、又は適用するステップを含む、方法。

27. 実施例２２～２６のいずれかに記載の方法において、さらに：前記関係に基づいて医学的提案を提供するステップを含む、方法。

28. 実施例２２～２７のいずれかに記載の方法において、さらに：前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップを含む、方法。

29. 実施例２２～２８のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である、方法。

30. 実施例２０～２９のいずれかに記載の方法において、前記複数の医用画像は生検画像を備える、方法。

31. 実施例３０に記載の方法において、前記生検画像は１つ以上の臨床試験に対応する、方法。

32. 実施例２０～３１のいずれかに記載の方法において、さらに：前記複数の医用画像の医用画像を複数の画像タイルに分割するステップと、前記複数の画像タイルの各画像タイルを前記訓練済み教師なし機械学習モデル内へと入力して、各画像タイルについてタイル埋め込みを受信して、複数のタイル埋め込みを取得するステップと、前記複数のタイル埋め込みを集約して前記複数の埋め込みの埋め込みを取得するステップとを含む、方法。

33. 実施例３２に記載の方法において、前記複数のタイル埋め込みを集約するステップは前記複数のタイル埋め込みを平均化するステップを含む、方法。

34. 実施例２０～３３のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。

35. 実施例３４に記載の方法において、前記対照モデルはSimCLRモデルである、方法。

36. 実施例２０～３４のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは少なくとも部分的には前記複数の医用画像に基づいて訓練されている、方法。

37. 実施例２０～３４のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは前記複数の医用画像に基づいて微調整されている、方法。

38. 実施例２０～３７のいずれか１つに記載の方法において、前記１つ以上の機械学習モデルは線形回帰モデルを備える、方法。

39. 実施例３８に記載の方法において、前記線形回帰モデルは訓練済み線形回帰モデルである、方法。

40. 実施例３９に記載の方法において、前記訓練済み線形回帰モデルは前記複数の埋め込み及び前記複数の埋め込みに対応する複数の割り当て済み医療診断スコアに基づいて適合化される、方法。

41. 実施例２０～３７のいずれかに記載の方法において、前記１つ以上の機械学習モデルは線形混合モデルを備える、方法。

42. 実施例２０～４１のいずれか１つに記載の方法において、前記１つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。

43. 実施例４２に記載の方法において、前記複数の割り当て済み医療診断スコアは１人以上の医師によって提供される、方法。

44. 実施例４３に記載の方法において、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される、方法。

45. 実施例２０～４４のいずれかに記載の方法において、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアとされる、方法。

46. 実施例２０～４５のいずれかに記載の方法において、前記複数の予測医療診断スコアは、臨床試験中に取得された別個の測定を反映する予測医療診断スコア間の差として算出された疾患進行スコアを含む、方法。

47. 実施例２０～４５のいずれかに記載の方法において、前記複数の予測医療診断スコアは、臨床試験中に各個人について取得された別個の測定を反映する予測医療診断スコアについて訓練された線形モデルによって決定された勾配として取得された疾患進行スコアを含む、方法。

48. 実施例１８～４７のいずれか１つに記載の方法において、前記複数の予測医療診断スコアは、予測フォローアップスコアと観測フォローアップスコアとの間の差として対応するベースラインスコアについて調整がなされて算出された疾患進行スコアを含む、方法。

49. 実施例２０～４８のいずれかに記載の方法において、前記複数の予測医療診断スコアを各候補遺伝的バリアントと関連付けるステップは、前記候補遺伝的バリアントについて示す値を受信し及び予測医療診断スコアを出力するように構成されたバリアント特有モデルについて適合化をなすステップを含む、方法。

50. 実施例４９に記載の方法において、前記バリアント特有モデルは線形モデルである、方法。

51. 実施例４９に記載の方法において、前記バリアント特有モデルは、前記複数の予測医療診断スコアと前記候補遺伝的バリアントについて示す複数の値とに基づいて適合化される、方法。

52. 実施例２０～５０のいずれかに記載の方法において、前記相関メトリックを決定するステップはバリアント特有モデルに基づいてＰ値を決定するステップを含む、方法。

53. 着目疾患との関係で少なくとも１つの着目遺伝的バリアントを識別する方法であって：臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、前記複数の候補遺伝的バリアントについてのサブセットを識別するステップであって、前記複数の候補遺伝的バリアントのサブセットは前記複数の医用画像にて反映されている組織学的特徴と関連付けられている、ステップと、前記複数の候補遺伝的バリアントの前記サブセットの各候補遺伝的バリアントを前記着目疾患と関連付けて少なくとも１つの着目遺伝的バリアントを前記サブセットから識別するステップとを含む、方法。

54. 実施例５３に記載の方法において、さらに：前記少なくとも１つの着目遺伝的バリアントに基づいて、前記着目疾患を表す複数のシミュレーション画像を生成するステップと、ディスプレイ上に複数のシミュレーション画像を表示するステップとを含む、方法。

55. 実施例５４に記載の方法において、さらに：前記複数のシミュレーション画像をランキングするステップを含む、方法。

56. 実施例５５に記載の方法において、前記複数のシミュレーション画像は前記ランキングに基づいて表示される、方法。

57. 実施例５３～５６のいずれか１つに記載の方法において、さらに：前記少なくとも１つの着目遺伝的バリアントと前記着目疾患との間の関係を識別するステップを含む、方法。

58. 実施例５７に記載の方法において、前記関係は因果関係である、方法。

59. 実施例５７～５８のいずれかに記載の方法において、さらに：前記関係に基づいて新規被験者にて前記着目疾患を診断するステップを含む、方法。

60. 実施例５７～５９のいずれかに記載の方法において、さらに：前記関係に基づいて治療を開発するステップを含む、方法。

61. 実施例５７～６０のいずれかに記載の方法において、さらに：前記関係に基づいて治療を施す、調整する、又は適用するステップを含む、方法。

62. 実施例５７～６１のいずれかに記載の方法において、さらに：前記関係に基づいて医学的提案を提供するステップを含む、方法。

63. 実施例５７～６２のいずれかに記載の方法において、さらに：前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップを含む、方法。

64. 実施例５３～６３のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である、方法。

65. 実施例５３～６４のいずれかに記載の方法において、前記複数の医用画像は生検画像を備える、方法。

66. 実施例６５に記載の方法において、前記生検画像は１つ以上の臨床試験に対応する、方法。

67. 実施例５３～６６のいずれかに記載の方法において、さらに：前記複数の医用画像の医用画像を複数の画像タイルに分割するステップと、前記複数の画像タイルの各画像タイルを前記訓練済み教師なし機械学習モデル内へと入力して、各画像タイルについてタイル埋め込みを受信して、複数のタイル埋め込みを取得するステップと、前記複数のタイル埋め込みを集約して前記複数の埋め込みの埋め込みを取得するステップとを含む、方法。

68. 実施例６７に記載の方法において、前記複数のタイル埋め込みを集約するステップは前記複数のタイル埋め込みを平均化するステップを含む、方法。

69. 実施例５３～６８のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。

70. 実施例６９に記載の方法において、前記対照モデルはSimCLRモデルである、方法。

71. 実施例５３～７０のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは少なくとも部分的には前記複数の医用画像に基づいて訓練されている、方法。

72. 実施例５３～７０のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは前記複数の医用画像に基づいて微調整されている、方法。

73. 実施例５３～７２のいずれかに記載の方法において、前記複数の埋め込みを前記複数の候補遺伝的バリアントの各遺伝的バリアントと関連付けて前記複数の候補遺伝的バリアントについての前記サブセットを識別するステップは：埋め込みを受信し及び前記候補遺伝的バリアントの値を出力するように構成されたバリアント特有モデルを、前記複数の候補遺伝的バリアントの候補遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントを前記サブセット内に含めるべきかを決定するステップとを含む、方法。

74. 実施例７３に記載の方法において、前記バリアント特有モデルを評価するステップは：前記バリアント特有モデルに基づいて相関メトリックを算出するステップと、前記相関メトリックを所定の閾値と比較するステップを含む、方法。

75. 実施例７４に記載の方法において、前記相関メトリックは前記バリアント特有モデルと関連付けられているＰ値である、方法。

76. 実施例５３～７５のいずれかに記載の方法において、前記複数の候補遺伝的バリアントの前記サブセットの各遺伝的バリアントを前記着目疾患と関連付けて前記少なくとも１つの着目遺伝的バリアントを識別するステップは：前記遺伝的バリアントについて示す値を受信し及び前記着目疾患に関する医療診断スコアを出力するように構成されたバリアント特有モデルを、前記サブセット内の遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントが前記少なくとも１つの着目遺伝的バリアントであるかを決定するステップとを含む、方法。

77. 実施例７６に記載の方法において、前記バリアント特有モデルを評価するステップは：前記バリアント特有モデルに基づいて相関メトリックを算出するステップと、前記相関メトリックを所定の閾値と比較するステップを含む、方法。

78. 実施例７７に記載の方法において、前記相関メトリックは前記バリアント特有モデルと関連付けられているＰ値である、方法。

79. 着目疾患の進行に関して治療を評価する方法であって：被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像とを取得するステップと、前記複数のベースラインプラセボ医用画像及び前記複数のフォローアッププラセボ医用画像に基づいて複数のプラセボ進行埋め込みを取得するステップと、被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを取得するステップと、前記複数のベースライン治療医用画像及び前記複数のフォローアップ治療医用画像に基づいて複数の治療進行埋め込みを取得するステップと、前記複数の治療進行埋め込みに基づいて患者が前記プラセボ又は前記治療を受けたのかを決定するための分類モデルを生成するステップとを含む、方法。

80. 実施例７９に記載の方法において、前記分類モデルの出力は薬物反応表現型について示す、方法。

81. 実施例８０に記載の方法において、さらに：前記分類モデルに基づいて、前記治療と前記着目疾患の前記進行との間の相関メトリックを決定するステップを含む、方法。

82. 実施例７９～８１のいずれか１つに記載の方法において、前記相関メトリックはＰ値である、方法。

83. 実施例７９～８２のいずれか１つに記載の方法において、さらに：前記相関メトリックを所定の閾値と比較するステップを含む、方法。

84. 実施例８３に記載の方法において、さらに：前記比較に基づいて、前記治療と前記着目疾患の進行との間の関連を識別するステップを含む、方法。

85. 実施例８４に記載の方法において、さらに：前記関連に基づいて前記治療を新規被験者について処方するステップを含む、方法。

86. 実施例８４に記載の方法において、さらに：前記関連に基づいて前記治療を施すステップを含む、方法。

87. 実施例８４に記載の方法において、さらに：前記関連に基づいて前記治療を調整するステップを含む、方法。

88. 実施例８４に記載の方法において、さらに：前記関連に基づいて医学的提案を提供するステップを含む、方法。

89. 実施例８４に記載の方法において、さらに：前記関連に基づいてレポートを生成するステップを含む、方法。

90. 実施例７９～８９のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である、方法。

91. 実施例７９～９０のいずれかに記載の方法において、前記複数のプラセボ進行埋め込みを取得するステップは：前記複数のベースラインプラセボ医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースラインプラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアッププラセボ埋め込みを取得するステップと、前記複数のベースラインプラセボ埋め込みを１つ以上の機械学習モデル内へと入力して前記潜在空間内での複数の予測フォローアッププラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ埋め込みと前記複数の予測フォローアッププラセボ埋め込みとの間の差を算出することによって前記複数のプラセボ進行埋め込みを決定するステップとを含む、方法。

92. 実施例９１に記載の方法において、前記１つ以上の機械学習モデルは訓練済み線形モデルを備える、方法。

93. 実施例９１～９２のいずれかに記載の方法において、前記１つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。

94. 実施例９１～９３のいずれかに記載の方法において、前記複数の治療進行埋め込みを取得するステップは：前記複数のベースライン治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン治療埋め込みを取得するステップと、前記複数のフォローアップ治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ治療埋め込みを取得するステップと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ治療埋め込みを取得するステップと、前記複数のフォローアップ治療埋め込みと前記複数の予測フォローアップ治療埋め込みとの間の差を算出することによって前記複数の治療進行埋め込みを決定するステップとを含む、方法。

95. 実施例９１～９４のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。

96. 実施例９５に記載の方法において、前記対照モデルはSimCLRモデルである、方法。

97. 実施例９１～９６のいずれかに記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。

98. 実施例９７に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。

99. 実施例９７に記載の方法において、前記被験者プラセボ群は第１のプラセボ群であり、前記訓練済み線形モデルは前記第１のプラセボ群とは異なる第２のプラセボ群からの医用画像データから取得された埋め込みを用いて訓練されている、方法。

100. 実施例７９～９９のいずれかに記載の方法において、前記分類モデルは、入力進行埋め込みを受信し、また、前記プラセボ又は前記治療を患者が受けたのかを示す分類結果を出力するように構成されている、方法。

101. 実施例７９～１００のいずれかに記載の方法において、前記複数のベースラインプラセボ医用画像、前記複数のフォローアッププラセボ医用画像、前記複数のベースライン治療医用画像、及び前記複数のフォローアップ治療医用画像は、生検画像である、方法。

102. 治療についての薬物反応表現型（ＤＲＰ）との関係で着目コバリアントを識別する方法であって：臨床被験者群から取得された共変量クラスについてのコバリアント情報を受信するステップと、前記臨床被験者群から複数のベースライン画像及び複数のフォローアップ画像を受信するステップと、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて複数の進行埋め込みを取得するステップと、前記複数の進行埋め込みを訓練済み分類モデル内へと入力して前記臨床被験者群のＤＲＰ値について示す複数の分類結果を取得するステップと、前記臨床被験者群についての前記コバリアント情報、前記複数の分類結果、及び１つ以上の機械学習モデルに基づいて、複数の候補コバリアントの各候補コバリアントと前記ＤＲＰ値との間の関連を決定して、前記着目コバリアントを識別するステップとを含む、方法。

103. 実施例１０２に記載の方法において、前記１つ以上の機械学習モデルは１つ以上の線形回帰モデルを備える、方法。

104. 実施例１０２～１０３のいずれか１つに記載の方法において、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える、方法。

105. 実施例１０２～１０３のいずれか１つに記載の方法において、前記複数の候補コバリアントは複数の候補遺伝子を備える、方法。

106. 実施例１０２～１０５のいずれかに記載の方法において、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える、方法。

107. 実施例１０２～１０６のいずれかに記載の方法において、さらに：前記識別された着目コバリアントに基づいて新規被験者にて着目疾患を診断するステップを含む、方法。

108. 実施例１０２～１０７のいずれかに記載の方法において、さらに：前記識別された着目コバリアントに基づいて治療を開発するステップを含む、方法。

109. 実施例１０２～１０８のいずれかに記載の方法において、さらに：前記識別された着目コバリアントに基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。

110. 実施例１０２～１０９のいずれかに記載の方法において、さらに：前記識別された着目コバリアントに基づいて医学的提案を提供するステップを含む、方法。

111. 実施例１０２～１１０のいずれかに記載の方法において、さらに：前記識別された着目コバリアントに基づいて生物学的標的を識別するステップを含む、方法。

112. 実施例１０２～１１１のいずれかに記載の方法において、前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像は生検画像を備える、方法。

113. 実施例１０２～１１２のいずれかに記載の方法において、前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像に基づいて前記複数の進行埋め込みを取得するステップは：前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップとを含む、方法。

114. 実施例１１３に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。

115. 実施例１１４に記載の方法において、前記対照モデルはSimCLRモデルである、方法。

116. 実施例１１３に記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。

117. 実施例１１３に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。

118. 実施例１０２～１１７のいずれかに記載の方法において、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている、方法。

119. 実施例１０２～１１８のいずれかに記載の方法において、前記着目コバリアントを識別するステップは：前記複数の候補コバリアントの候補コバリアントについて：前記臨床被験者群のＤＲＰ値及び前記コバリアント情報に基づいたモデルを生成するステップと、前記モデルに基づいて相関メトリックを決定するステップとを含む、方法。

120. 実施例１１９に記載の方法において、前記相関メトリックはＰ値である、方法。

121. 実施例１１９に記載の方法において、さらに：前記相関メトリックを所定の閾値に対して比較して前記候補コバリアントが前記着目コバリアントであるかを決定するステップをさらに含む、方法。

122. 着目疾患の進行に関して治療を評価する方法であって：医用画像を取得するステップであって、該医用画像は：（ａ）被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、（ｂ）前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像と、（ｃ）被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、（ｄ）前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを備える、ステップと、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するステップであって、各埋め込みは前記医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを１つ以上の機械学習モデル内へと入力して複数の予測連続医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記複数の予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア及び複数の治療進行スコアを決定するステップと、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップと、前記関連に基づいて、前記複数のプラセボ進行スコアと前記複数の治療進行スコアとの間の相関メトリックを決定するステップとを含む、方法。

123. 実施例１２２に記載の方法において、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは：前記（ａ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得することと、前記（ｂ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得することと、前記（ｃ）を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得することと、前記（ｄ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得することとを含む、方法。

124. 実施例１２２～１２３のいずれかに記載の方法において、前記１つ以上の機械学習モデルは訓練済み線形回帰モデルを備える、方法。

125. 実施例１２２～１２４のいずれか１つに記載の方法において、前記１つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。

126. 実施例１２４～１２５のいずれか１つに記載の方法において、前記複数の埋め込みを前記１つ以上の機械学習モデル内へと入力するステップは：前記複数のベースラインプラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースラインプラセボスコアを取得することと、前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアッププラセボスコアを取得することと、前記複数のベースライン治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースライン治療スコアを取得することと、前記複数のフォローアップ治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアップ治療スコアを取得することとを含む、方法。

127. 実施例１２６に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは：前記複数のベースラインプラセボスコアと前記複数のフォローアッププラセボスコアとの間の差を決定して前記複数のプラセボ進行スコアを決定することと、前記複数のベースライン治療スコアと前記複数のフォローアップ治療スコアとの間の差を決定して前記複数の治療進行スコアを決定することとを含む、方法。

128. 実施例１２６に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは：前記被験者プラセボ群内の各被験者について、前記被験者プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、前記被験者治療群内の各被験者について、前記被験者治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む、方法。

129. 実施例１２２～１２８のいずれか１つに記載の方法において、前記複数の予測医療診断スコアは、予測フォローアップスコアと観測フォローアップスコアとの間の差として対応するベースラインスコアについて調整がなされて算出された疾患進行スコアを含む、方法。

130. 実施例１２２～１２９のいずれかに記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む、方法。

131. 実施例１３０に記載の方法において、前記相関メトリックは前記モデルのＰ値である、方法。

132. 実施例１２２～１３０のいずれかに記載の方法において、さらに：前記相関メトリックを所定の閾値と比較するステップを含む、方法。

133. 実施例１３２に記載の方法において、さらに：前記比較に基づいて、前記治療と前記着目疾患との間の関連を識別するステップを含む、方法。

134. 実施例１３３に記載の方法において、さらに：前記関連に基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。

135. 実施例１３３に記載の方法において、さらに：前記関連に基づいて医学的提案を提供するステップを含む、方法。

136. 実施例１２２～１３５のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である、方法。

137. 実施例１２２～１３６のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。

138. 実施例１３７に記載の方法において、前記対照モデルはSimCLRモデルである、方法。

139. 実施例１２４～１３８のいずれかに記載の方法において、前記訓練済み線形回帰モデルは線形混合モデルである、方法。

140. 実施例１２４～１３９のいずれかに記載の方法において、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化される、方法。

141. 実施例１４０に記載の方法において、前記複数の割り当て済み医療診断スコアは１人以上の医師によって提供される、方法。

142. 実施例１４１に記載の方法において、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される、方法。

143. 実施例１２２～１４２のいずれかに記載の方法において、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアを含む、方法。

144. 着目患者サブグループを識別する方法であって：臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップと、前記複数の埋め込みをクラスタリングして１つ以上の埋め込みクラスタを生成するステップと、前記１つ以上の埋め込みクラスタに対応する１つ以上の患者サブグループを識別するステップと、前記１つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するステップとを含む、方法。

145. 実施例１４４に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。

146. 実施例１４５に記載の方法において、前記対照モデルはSimCLRモデルである、方法。

147. 実施例１４４～１４６のいずれかに記載の方法において、前記コバリアントは着目治療であり、また、前記着目患者サブグループは前記着目治療が相当なインパクトを及ぼすサブグループである、方法。

148. 実施例１４７に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、前記患者サブグループ内の患者が前記着目治療を受けたかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。

149. 実施例１４８に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。

150. 実施例１４８～１４９のいずれか１つに記載の方法において、前記相関メトリックはＰ値である、方法。

151. 実施例１４８～１５０のいずれかに記載の方法において、前記生成されたモデルは前記患者サブグループ内の被験者の疾患進行値によって訓練される、方法。

152. 実施例１５１に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の医療診断スコアを含む、方法。

153. 実施例１５１に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の進行スコアを含む、方法。

154. 実施例１５１に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者のＤＲＰ値を含む、方法。

155. 実施例１４４～１４６のいずれかに記載の方法において、前記コバリアントは着目疾患の進行であり、また、前記着目患者サブグループは前記着目疾患の前記進行と有意な関連を有するサブグループである、方法。

156. 実施例１５１に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、患者が前記患者サブグループに属するかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。

157. 実施例１５２に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。

158. 実施例１５７に記載の方法において、前記相関メトリックはＰ値である、方法。

159. 実施例１５６～１５８のいずれかに記載の方法において、前記生成されたモデルは前記臨床被験者群の疾患進行値によって訓練される、方法。

160. 実施例１５９に記載の方法において、前記疾患進行値は、前記患者サブグループ内の臨床被験者の医療診断スコア、前記患者サブグループ内の臨床被験者の進行スコア、又は前記患者サブグループ内の臨床被験者のＤＲＰ値を含む、方法。

161. 実施例１４４～１４６のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである、方法。

162. 実施例１６１に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。

163. 実施例１６２に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。

164. 実施例１６３に記載の方法において、前記相関メトリックはＰ値である、方法。

165. 実施例１４４～１４６のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは治療後に前記有害副作用を経験することについて有意な関連を有するサブグループである、方法。

166. 実施例１６５に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：患者サブグループについて、前記患者サブグループ内の患者が前記治療を受けたかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。

167. システムであって：１つ以上のプロセッサと、メモリと、１つ以上のプログラムとを備えるのであって、前記１つ以上のプログラムは前記メモリ内に記憶されており且つ前記１つ以上のプロセッサによって実行されるように構成されており、前記１つ以上のプログラムは実施例１～１６６のいずれかの方法を行うための命令を含む。

168. １つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、該１つ以上のプログラムは命令を備えるのであり、該命令は電子装置の１つ以上のプロセッサによって実行されると該電子装置に実施例１～１６６のいずれかの方法を行わせる、非一時的コンピュータ可読記憶媒体。

Claims

着目疾患の進行に関して治療を評価する方法であって：
被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像とを取得するステップと、
前記複数のベースラインプラセボ医用画像及び前記複数のフォローアッププラセボ医用画像に基づいて複数のプラセボ進行埋め込みを取得するステップと、
被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを取得するステップと、
前記複数のベースライン治療医用画像及び前記複数のフォローアップ治療医用画像に基づいて複数の治療進行埋め込みを取得するステップと、
前記複数の治療進行埋め込みに基づいて患者が前記プラセボ又は前記治療を受けたのかを決定するための分類モデルを生成するステップとを含む、方法。
請求項１に記載の方法において、前記分類モデルの出力は薬物反応表現型について示す、方法。
請求項１～２のいずれか１つに記載の方法において、さらに：
前記分類モデルに基づいて、前記治療と前記着目疾患の前記進行との間の相関メトリックを決定するステップを含む、方法。
請求項３に記載の方法において、前記相関メトリックはＰ値である、方法。
請求項３～４のいずれか１つに記載の方法において、さらに：
前記相関メトリックを所定の閾値と比較するステップを含む、方法。
請求項５に記載の方法において、さらに：
前記比較に基づいて、前記治療と前記着目疾患の進行との間の関連を識別するステップを含む、方法。
請求項６に記載の方法において、さらに：
前記関連に基づいて前記治療を新規被験者について処方するステップを含む、方法。
請求項６～７のいずれか１つに記載の方法において、さらに：
前記関連に基づいて前記治療を施すステップを含む、方法。
請求項６～８のいずれか１つに記載の方法において、さらに：
前記関連に基づいて前記治療を調整するステップを含む、方法。
請求項６～９のいずれか１つに記載の方法において、さらに：
前記関連に基づいて医学的提案を提供するステップを含む、方法。
請求項６～１０のいずれか１つに記載の方法において、さらに：
前記関連に基づいてレポートを生成するステップを含む、方法。
請求項１～１１のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である、方法。
請求項１～１２のいずれかに記載の方法において、前記複数のプラセボ進行埋め込みを取得するステップは：
前記複数のベースラインプラセボ医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースラインプラセボ埋め込みを取得するステップと、
前記複数のフォローアッププラセボ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアッププラセボ埋め込みを取得するステップと、
前記複数のベースラインプラセボ埋め込みを１つ以上の機械学習モデル内へと入力して前記潜在空間内での複数の予測フォローアッププラセボ埋め込みを取得するステップと、
前記複数のフォローアッププラセボ埋め込みと前記複数の予測フォローアッププラセボ埋め込みとの間の差を算出することによって前記複数のプラセボ進行埋め込みを決定するステップとを含む、方法。
請求項１３に記載の方法において、前記１つ以上の機械学習モデルは訓練済み線形モデルを備える、方法。
請求項１３～１４のいずれかに記載の方法において、前記１つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
請求項１３～１５のいずれかに記載の方法において、前記複数の治療進行埋め込みを取得するステップは：
前記複数のベースライン治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン治療埋め込みを取得するステップと、
前記複数のフォローアップ治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ治療埋め込みを取得するステップと、
前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ治療埋め込みを取得するステップと、
前記複数のフォローアップ治療埋め込みと前記複数の予測フォローアップ治療埋め込みとの間の差を算出することによって前記複数の治療進行埋め込みを決定するステップとを含む、方法。
請求項１３～１７のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
請求項１７に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
請求項１３～１８のいずれかに記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。
請求項１９に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。
請求項１９に記載の方法において、前記被験者プラセボ群は第１のプラセボ群であり、前記訓練済み線形モデルは前記第１のプラセボ群とは異なる第２のプラセボ群からの医用画像データを用いて訓練されている、方法。
請求項１～２１のいずれかに記載の方法において、前記分類モデルは、入力進行埋め込みを受信し、また、前記プラセボ又は前記治療を患者が受けたのかを示す分類結果を出力するように構成されている、方法。
請求項１～２１のいずれかに記載の方法において、前記複数のベースラインプラセボ医用画像、前記複数のフォローアッププラセボ医用画像、前記複数のベースライン治療医用画像、及び前記複数のフォローアップ治療画像は、生検医用画像である、方法。
治療についての薬物反応表現型（ＤＲＰ）との関係で着目コバリアントを識別する方法であって：
臨床被験者群から取得された共変量クラスについてのコバリアント情報を受信するステップと、
前記臨床被験者群から複数のベースライン医用画像及び複数のフォローアップ医用画像を受信するステップと、
前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像に基づいて複数の進行埋め込みを取得するステップと、
前記複数の進行埋め込みを訓練済み分類モデル内へと入力して前記臨床被験者群のＤＲＰ値について示す複数の分類結果を取得するステップと、
前記臨床被験者群についての前記コバリアント情報、前記複数の分類結果、及び１つ以上の機械学習モデルに基づいて、複数の候補コバリアントの各候補コバリアントと前記ＤＲＰ値との間の関連を決定して、前記着目コバリアントを識別するステップとを含む、方法。
請求項２４に記載の方法において、前記１つ以上の機械学習モデルは１つ以上の線形回帰モデルを備える、方法。
請求項２４に記載の方法において、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える、方法。
請求項２４に記載の方法において、前記複数の候補コバリアントは複数の候補遺伝子を備える、方法。
請求項２４～２７のいずれかに記載の方法において、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える、方法。
請求項２４～２８のいずれかに記載の方法において、さらに：
前記識別された着目コバリアントに基づいて新規被験者にて着目疾患を診断するステップを含む、方法。
請求項２４～２９のいずれかに記載の方法において、さらに：
前記識別された着目コバリアントに基づいて治療を開発するステップを含む、方法。
請求項２４～３０のいずれかに記載の方法において、さらに：
前記識別された着目コバリアントに基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。
請求項２４～３１のいずれかに記載の方法において、さらに：
前記識別された着目コバリアントに基づいて医学的提案を提供するステップを含む、方法。
請求項２４～３２のいずれかに記載の方法において、さらに：
前記識別された着目コバリアントに基づいて生物学的標的を識別するステップを含む、方法。
請求項２４～３３のいずれかに記載の方法において、前記複数のベースライン画像及び前記複数のフォローアップ画像は生検画像を備える、方法。
請求項２４～３４のいずれかに記載の方法において、前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像に基づいて前記複数の進行埋め込みを取得するステップは：
前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、
前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、
前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、
前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップとを含む、方法。
請求項３５に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
請求項３６に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
請求項３５に記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。
請求項３５に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。
請求項２４～３９のいずれかに記載の方法において、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている、方法。
請求項２４～４０のいずれかに記載の方法において、前記着目コバリアントを識別するステップは：前記複数の候補コバリアントの候補コバリアントについて：
前記臨床被験者群のＤＲＰ値及び前記コバリアント情報に基づいたモデルを生成するステップと、
前記モデルに基づいて相関メトリックを決定するステップとを含む、方法。
請求項４１に記載の方法において、前記相関メトリックはＰ値である、方法。
請求項４１に記載の方法において、さらに：
前記相関メトリックを所定の閾値に対して比較して前記候補コバリアントが前記着目コバリアントであるかを決定するステップを含む、方法。
着目疾患の進行に関して治療を評価する方法であって：
医用画像を取得するステップであって、該医用画像は：（ａ）被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、（ｂ）前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像と、（ｃ）被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、（ｄ）前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを備える、ステップと、
前記医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するステップであって、各埋め込みは前記医用画像の１つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、
前記複数の埋め込みを１つ以上の機械学習モデル内へと入力して複数の予測連続医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、
前記複数の予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア及び複数の治療進行スコアを決定するステップと、
前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップと、
前記関連に基づいて、前記複数のプラセボ進行スコアと前記複数の治療進行スコアとの間の相関メトリックを決定するステップとを含む、方法。
請求項４４に記載の方法において、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは：
前記（ａ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得することと、
前記（ｂ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得することと、
前記（ｃ）を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得することと、
前記（ｄ）を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得することとを含む、方法。
請求項４４～４５のいずれかに記載の方法において、前記１つ以上の機械学習モデルは訓練済み線形回帰モデルを備える、方法。
請求項４４～４６のいずれか１つに記載の方法において、前記１つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
請求項４６～４７のいずれか１つに記載の方法において、前記複数の埋め込みを前記１つ以上の機械学習モデル内へと入力するステップは：
前記複数のベースラインプラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースラインプラセボスコアを取得することと、
前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアッププラセボスコアを取得することと、
前記複数のベースライン治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースライン治療スコアを取得することと、
前記複数のフォローアップ治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアップ治療スコアを取得することとを含む、方法。
請求項４８に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは：
前記複数のベースラインプラセボスコアと前記複数のフォローアッププラセボスコアとの間の差を決定して前記複数のプラセボ進行スコアを決定することと、
前記複数のベースライン治療スコアと前記複数のフォローアップ治療スコアとの間の差を決定して前記複数の治療進行スコアを決定することとを含む、方法。
請求項４８に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは：
前記被験者プラセボ群内の各被験者について、前記被験者プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、
前記被験者治療群内の各被験者について、前記被験者治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む、方法。
請求項４４～５０のいずれか１つに記載の方法において、前記複数の予測医療診断スコアは、予測フォローアップスコアと観測フォローアップスコアとの間の差として対応するベースラインスコアについて調整がなされて算出された疾患進行スコアを含む、方法。
請求項４４～５１のいずれかに記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む、方法。
請求項５２に記載の方法において、前記相関メトリックは前記モデルのＰ値である、方法。
請求項４４～５２のいずれかに記載の方法において、さらに：
前記相関メトリックを所定の閾値と比較するステップを含む、方法。
請求項５４に記載の方法において、さらに：
前記比較に基づいて、前記治療と前記着目疾患との間の関連を識別するステップを含む、方法。
請求項５５に記載の方法において、さらに：
前記関連に基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。
請求項５５に記載の方法において、さらに：
前記関連に基づいて医学的提案を提供するステップを含む、方法。
請求項４４～５７のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎（ＮＡＳＨ、non-alcoholic steatohepatitis）である、方法。
請求項４４～５８のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
請求項５９に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
請求項４６～６０のいずれかに記載の方法において、前記訓練済み線形回帰モデルは線形混合モデルである、方法。
請求項４６～６１のいずれかに記載の方法において、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化される、方法。
請求項６２に記載の方法において、前記複数の割り当て済み医療診断スコアは１人以上の医師によって提供される、方法。
請求項６３に記載の方法において、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される、方法。
請求項４４～６４のいずれかに記載の方法において、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアを含む、方法。
着目患者サブグループを識別する方法であって：
臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップと、
前記複数の埋め込みをクラスタリングして１つ以上の埋め込みクラスタを生成するステップと、
前記１つ以上の埋め込みクラスタに対応する１つ以上の患者サブグループを識別するステップと、
前記１つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するステップとを含む、方法。
請求項６６に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
請求項６７に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
請求項６６～６８のいずれかに記載の方法において、前記コバリアントは着目治療であり、また、前記着目患者サブグループは前記着目治療が相当なインパクトを及ぼすサブグループである、方法。
請求項６９に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：
患者サブグループについて、前記患者サブグループ内の患者が前記着目治療を受けたかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、
前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
請求項７０に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
請求項７１に記載の方法において、前記相関メトリックはＰ値である、方法。
請求項７０～７２のいずれかに記載の方法において、前記生成されたモデルは前記患者サブグループ内の被験者の疾患進行値によって訓練される、方法。
請求項７３に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の医療診断スコアを含む、方法。
請求項７３に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の進行スコアを含む、方法。
請求項７３に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者のＤＲＰ値を含む、方法。
請求項６６～６８のいずれかに記載の方法において、前記コバリアントは着目疾患の進行であり、また、前記着目患者サブグループは前記着目疾患の前記進行と有意な関連を有するサブグループである、方法。
請求項７７に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：
患者サブグループについて、患者が前記患者サブグループに属するかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、
前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
請求項７８に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
請求項７９に記載の方法において、前記相関メトリックはＰ値である、方法。
請求項７８～８０のいずれかに記載の方法において、前記生成されたモデルは前記臨床被験者群の疾患進行値によって訓練される、方法。
請求項８１に記載の方法において、前記疾患進行値は、前記患者サブグループ内の臨床被験者の医療診断スコア、前記患者サブグループ内の臨床被験者の進行スコア、又は前記患者サブグループ内の臨床被験者のＤＲＰ値を含む、方法。
請求項６６～６８のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである、方法。
請求項８３に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：
患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、
前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
請求項８４に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
請求項８５に記載の方法において、前記相関メトリックはＰ値である、方法。
請求項６６～６８のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは治療後に前記有害副作用を経験することについて有意な関連を有するサブグループである、方法。
請求項８７に記載の方法において、前記１つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは：
患者サブグループについて、前記患者サブグループ内の患者が前記治療を受けたかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、
前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。