Nothing Special   »   [go: up one dir, main page]

JP2024534035A - 発見プラットフォーム - Google Patents

発見プラットフォーム Download PDF

Info

Publication number
JP2024534035A
JP2024534035A JP2024508966A JP2024508966A JP2024534035A JP 2024534035 A JP2024534035 A JP 2024534035A JP 2024508966 A JP2024508966 A JP 2024508966A JP 2024508966 A JP2024508966 A JP 2024508966A JP 2024534035 A JP2024534035 A JP 2024534035A
Authority
JP
Japan
Prior art keywords
model
treatment
embeddings
interest
placebo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2024508966A
Other languages
English (en)
Inventor
パオロ カサーレ フランチェスコ
ベレケット マイケル
アルバート マシュー
Original Assignee
インシトロ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インシトロ インコーポレイテッド filed Critical インシトロ インコーポレイテッド
Publication of JP2024534035A publication Critical patent/JP2024534035A/ja
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4848Monitoring or testing the effects of treatment, e.g. of medication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biophysics (AREA)
  • Image Analysis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本開示は発見プラットフォームに関するのであり、これには、弱い又は未知の遺伝的駆動因子を伴う複雑な疾患等の着目表現型について研究するために医用画像データを用いるための機械学習手法が含まれる。表現型との関係で着目コバリアントを識別する例示的な方法は次のステップを含む:臨床被験者群から取得された共変量クラスについてのコバリアント情報及び表現型に関する対応する表現型画像データを受信するステップと;表現型画像データを訓練済み教師なし機械学習モデル内へと入力して潜在空間内で複数の埋め込みを取得するステップであって、各埋め込みは表現型画像データにて反映されている表現型状態に対応する、ステップと;臨床被験者群についてのコバリアント情報、複数の埋め込み、及び1つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントと表現型状態との間の関連を決定して、着目コバリアントを識別するステップ。【選択図】図1

Description

概して本開示は発見プラットフォームに関するのであり、より具体的には、弱い又は未知の遺伝的駆動因子を伴う複雑な疾患等の着目表現型について研究するために医用画像データを用いるための機械学習手法に関する。
関連出願の相互参照
本願は、2021年8月16日に出願された米国仮特許出願第63/233,707号の優先権の利益を主張するのであり、その内容の全体が参照によって取り込まれる。
人間を悩ます多くの疾患は、部分的には遺伝子によって左右される。具体的には、1つ以上の遺伝的バリアント又は変異体を有する個体は、疾患について発病し易かったり或いはその発病後に病勢進展がより速まり得る。特に、複数の遺伝的バリアントによって影響を受けることのある疾患については、特定の遺伝的背景を有する対象者に疾患がもたらされ得る原因となる具体的な因子を識別すること並びに発症後その対象者においてその疾患が進行していくこととなろう様相を予測することが困難であると認識されている。また、他の点を除いて疾患をもち得る対象者での軽微な遺伝的バリアントによって、効果面及び安全性面の両方に関して、所定の治療的介入に対して欠く対象者がどの程度良好な応答を示すかに影響がもたらされ得る。したがって、特定の遺伝的バリアントが疾患の発生及び進行にどのように影響するかについての理解、転じては候補治療が疾患の退行又は臨床対象者における有害反応に関してどのように影響するかについての理解が欠けると、効果的な薬剤の開発に関しての相当の障害となり得る。
組織病理画像のコンピュータ分析における近時の進展により、特定の疾患を患っている様々な人間の対象にて発現されている疾患表現型についてより理解が深まった。対象者の遺伝的バリアントについての、また、疾患感受性リスクにどのような影響を複数の遺伝的バリアントが与え得るかについてのコンピュータ分析における近時の進展により、特定の疾患の精密な遺伝的根拠について理解がより良くなった。されども、これらのタイプの進展をより良く活用していくための余地は残っており、疾患標的を識別したり、疾患の発現や人間の対象における疾患進行の様相を予測したり、異なる遺伝的背景を有する対象者間での治療的候補に対しての起こり得る応答を予測したり、特定の治療を受けるべき適切な患者コホートを識別したり、結果を最適化するために臨床試験を一般的に設計するための活用をなし得る。
表現型との関係で着目コバリアントを識別する例示的な方法は次のステップを含む:臨床被験者群から取得された共変量クラスについてのコバリアント情報及び表現型に関する対応する表現型データを受信するステップと;表現型データを訓練済み教師なし機械学習モデル内へと入力して潜在空間内で複数の埋め込みを取得するステップであって、各埋め込みは表現型データにて反映されている表現型状態に対応する、ステップと;臨床被験者群についてのコバリアント情報、複数の埋め込み、及び1つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントと表現型との間の関連を決定して、着目コバリアントを識別するステップ。
一部の実施形態では、前記表現型は着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、又はリピドミクスを含む。
一部の実施形態では、前記表現型データは医用画像データ、組織病理データ、臨床バイオマーカデータ、又はゲノミックバイオマーカデータを含む。
一部の実施形態では、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える。
一部の実施形態では、各候補コバリアント(covariant)と前記表現型との間の前記関連(association)を決定することは次のステップを含む:前記複数の埋め込みの各埋め込みを線形回帰モデル内へと入力して、複数の埋め込みの各埋め込みについて予測連続スコアを受信して、複数の連続スコアを取得するステップと、前記複数の予測連続スコアを、前記臨床被験者群によって発現されている候補コバリアントと関連付ける(例えば、関連について試す)ステップと、前記表現型と前記候補コバリアントとの間の相関メトリックを、前記関連に基づいて、決定するステップであって、前記相関メトリックは前記候補コバリアントが前記表現型に対して及ぼすインパクトについて示す、ステップ。
一部の実施形態では、前記候補コバリアントと前記表現型との間の前記関連を決定することは次のステップを含む:前記複数の埋め込みを前記複数の候補コバリアントの各候補コバリアントと関連付けて、前記複数の候補コバリアントのサブセットを識別するステップと、前記サブセット内の各候補コバリアントを前記表現型と関連付けて、前記少なくとも1つの着目コバリアントを識別するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記少なくとも1つの着目遺伝的バリアントに基づいて、前記表現型を表す複数のシミュレーション画像を生成するステップと、ディスプレイ上に複数のシミュレーション画像を表示するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記少なくとも1つの着目遺伝的バリアント(variant)と前記表現型との間の関係(relationship)を識別するステップ。
一部の実施形態では、前記関係は因果関係である。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて新規被験者について診断を提供するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて治療を開発するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて治療を施す、調整する、又は適用するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて医学的提案を提供するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップ。
一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である。
着目疾患との関係で少なくとも1つの着目遺伝的バリアントを識別する例示的な方法は次のステップを含む:臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みの各埋め込みを訓練済み線形回帰モデル内へと入力して、前記複数の埋め込みの各埋め込みについて予測連続医療診断スコアを受信して、複数の予測医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記複数の予測連続医療診断スコアを、複数の医用画像の取得元の臨床被験者群によって発現されている複数の候補遺伝的バリアントの各候補遺伝的バリアントと、関連付けるステップと、前記着目疾患と各候補遺伝的バリアントとの間の相関メトリックを前記関連に基づいて決定し、前記少なくとも1つの着目遺伝的バリアントを前記複数の候補遺伝的バリアントから識別するステップであって、前記相関メトリックは前記候補遺伝的バリアントが前記着目疾患に対して及ぼすインパクトについて示す、ステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記相関メトリックを所定の閾値と比較するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記比較に基づいて、前記着目遺伝的バリアントと前記着目疾患との間の関係を識別するステップ。
一部の実施形態では、前記関係は因果関係である。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて新規被験者にて前記着目疾患を診断するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて治療を開発するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて治療を施す、調整する、又は適用するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて医学的提案を提供するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップ。
一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である。
一部の実施形態では、前記複数の医用画像は生検画像を備える。
一部の実施形態では、前記生検画像は1つ以上の臨床試験に対応する。
一部の実施形態では、方法はさらに次のステップを含む:前記複数の画像の医用画像を複数の画像タイルに分割するステップと、前記複数の画像タイルの各画像タイルを前記教師なし機械学習モデル内へと入力して、各画像タイルについてタイル埋め込みを受信して、複数のタイル埋め込みを取得するステップと、前記タイル埋め込みを集約して前記複数の埋め込みの埋め込みを取得するステップ。
一部の実施形態では、前記タイル埋め込みを集約するステップは前記タイル埋め込みを平均化するステップを含む。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記訓練済み教師なし機械学習モデルは少なくとも部分的には前記複数の医用画像に基づいて訓練されている。
一部の実施形態では、前記教師なし機械学習モデルは前記複数の医用画像に基づいて微調整されている。
一部の実施形態では、前記線形回帰モデルは線形混合モデルである。
一部の実施形態では、前記訓練済み線形回帰モデルは前記複数の埋め込み及び前記複数の埋め込みに対応する複数の割り当て済み医療診断スコアに基づいて適合化される。
一部の実施形態では、前記複数の割り当て済み医療診断スコアは1人以上の医師によって提供される。
一部の実施形態では、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される。
一部の実施形態では、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアとされる。
一部の実施形態では、前記複数の予測医療診断スコアは、臨床試験中の別個の測定での予測医療診断スコアの差として取得された疾患進行を含む。
一部の実施形態では、前記複数の予測医療診断スコアは、前記臨床試験中に取得された別個の測定を反映する予測医療診断スコア間の差として算出された疾患進行スコアを含む。
一部の実施形態では、前記複数の予測医療診断スコアは、前記臨床試験中に各個人について取得された別個の測定を反映する予測医療診断スコアについて訓練された線形モデルによって決定された勾配として取得された疾患進行スコアを含む。
一部の実施形態では、前記バリアント特有モデルは線形モデルである。
一部の実施形態では、前記バリアント特有モデルは、前記複数の予測医療診断スコアと前記候補遺伝的バリアントについて示す複数の値とに基づいて適合化される。
一部の実施形態では、前記相関メトリックを決定するステップは、前記バリアント特有モデルに基づいてP値を決定するステップを含む。
着目疾患との関係で少なくとも1つの着目遺伝的バリアントを識別する例示的な方法は次のステップを含む:臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、前記複数の候補遺伝的バリアントについてのサブセットを識別するステップであって、前記複数の遺伝的バリアントのサブセットは前記複数の医用画像にて反映されている組織学的特徴と関連付けられている、ステップと、前記複数の候補遺伝的バリアントの前記サブセットの各候補遺伝的バリアントを前記着目疾患と関連付けて少なくとも1つの着目遺伝的バリアントを前記サブセットから識別するステップとを含む、方法。
一部の実施形態では、方法はさらに次のステップを含む:前記少なくとも1つの着目遺伝的バリアントに基づいて、前記着目疾患を表す複数のシミュレーション画像を生成するステップと、ディスプレイ上に複数のシミュレーション画像を表示するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記少なくとも1つの着目遺伝的バリアントと前記着目疾患との間の関係を識別するステップ。
一部の実施形態では、前記関係は因果関係である。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて新規被験者にて前記着目疾患を診断するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて治療を開発するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて治療を施す、調整する、又は適用するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて医学的提案を提供するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップ。
一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である。
一部の実施形態では、前記複数の医用画像は生検画像を備える。
一部の実施形態では、前記生検画像は1つ以上の臨床試験に対応する。
一部の実施形態では、方法はさらに次のステップを含む:前記複数の画像の医用画像を複数の画像タイルに分割するステップと、前記複数の画像タイルの各画像タイルを前記教師なし機械学習モデル内へと入力して、各画像タイルについてタイル埋め込みを受信して、複数のタイル埋め込みを取得するステップと、前記タイル埋め込みを集約して前記複数の埋め込みの埋め込みを取得するステップ。
一部の実施形態では、前記タイル埋め込みを集約するステップは前記タイル埋め込みを平均化するステップを含む。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記訓練済み教師なし機械学習モデルは少なくとも部分的には前記複数の医用画像に基づいて訓練されている。
一部の実施形態では、前記教師なし機械学習モデルは前記複数の医用画像に基づいて微調整されている。
一部の実施形態では、前記複数の埋め込みを前記複数の遺伝的バリアントの各遺伝的バリアントと関連付けて前記複数の遺伝的バリアントについての前記サブセットを識別するステップは:埋め込みを受信し及び前記候補遺伝的バリアントの値を出力するように構成されたバリアント特有モデルを、前記複数の候補遺伝的バリアントの候補遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントを前記サブセット内に含めるべきかを決定するステップ。
一部の実施形態では、バリアント特有モデルを評価することは次のステップを含む:前記バリアント特有モデルに基づいて相関メトリックを算出するステップと、前記相関メトリックを所定の閾値と比較するステップ。
一部の実施形態では、前記相関メトリックは前記バリアント特有モデルと関連付けられているP値である。
一部の実施形態では、前記複数の遺伝的バリアントの前記サブセットの各遺伝的バリアントを前記着目疾患と関連付けて前記少なくとも1つの着目遺伝的バリアントを識別するステップは:前記遺伝的バリアントについて示す値を受信し及び前記着目疾患に関する医療診断スコアを出力するように構成されたバリアント特有モデルを、前記サブセット内の遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントが前記少なくとも1つの着目遺伝的バリアントであるかを決定するステップ。
一部の実施形態では、バリアント特有モデルを評価することは次のステップを含む:前記バリアント特有モデルに基づいて相関メトリックを算出するステップと、前記相関メトリックを所定の閾値と比較するステップ。
一部の実施形態では、前記相関メトリックは前記バリアント特有スコア予測モデルと関連付けられているP値である。
着目疾患の進行に関して治療を評価する例示的な方法は次のステップを含む:プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ画像と、前記プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ画像とを取得するステップと、前記複数のベースラインプラセボ画像及び前記複数のフォローアッププラセボ画像に基づいて複数のプラセボ進行埋め込みを取得するステップと、前記治療群に前記治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像と、前記治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療画像とを取得するステップと、前記複数のベースライン治療画像及び前記複数のフォローアップ治療画像に基づいて複数の治療進行埋め込みを取得するステップと、前記複数の治療進行埋め込みに基づいて患者が前記プラセボ又は前記治療を受けたのかを決定するための分類モデルを生成するステップであって、前記分類モデルの出力は薬物反応組織学的表現型(DRP)について示す、ステップと、前記分類モデルに基づいて、前記治療と前記着目疾患の前記進行との間の相関メトリックを決定するステップ。
一部の実施形態では、前記相関メトリックはP値である。
一部の実施形態では、方法はさらに次のステップを含む:前記相関メトリックを所定の閾値と比較するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記比較に基づいて、前記治療と前記着目疾患の進行との間の関連を識別するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関連に基づいて前記治療を新規被験者について処方するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関連に基づいて前記治療を施すステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関連に基づいて前記治療を調整するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関連に基づいて医学的提案を提供するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関連に基づいてレポートを生成するステップ。
一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である。
一部の実施形態では、前記複数のプラセボ進行埋め込みを取得するステップは:前記複数のベースラインプラセボ画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースラインプラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアッププラセボ埋め込みを取得するステップと、前記複数のベースラインプラセボ埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアッププラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ埋め込みと前記複数の予測フォローアッププラセボ埋め込みとの間の差を算出することによって前記複数のプラセボ進行埋め込みを決定するステップ。
一部の実施形態では、前記複数の治療進行埋め込みを取得するステップは:前記複数のベースライン治療画像を前記訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン治療埋め込みを取得するステップと、前記複数のフォローアップ治療画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ治療埋め込みを取得するステップと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ治療埋め込みを取得するステップと、前記複数のフォローアップ治療埋め込みと前記複数の予測フォローアップ治療埋め込みとの間の差を算出することによって前記複数の治療進行埋め込みを決定するステップ。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている。
一部の実施形態では、前記訓練済み線形モデルは線形混合モデルである。
一部の実施形態では、前記プラセボ群は第1のプラセボ群であり、前記線形モデルは前記第1のプラセボ群とは異なる第2のプラセボ群からの画像データを用いて訓練されている。
一部の実施形態では、前記分類モデルは、入力進行埋め込みを受信し、また、前記プラセボ又は前記治療を患者が受けたのかを示す分類結果を出力するように構成されている。
一部の実施形態では、前記複数のベースラインプラセボ画像、前記複数のフォローアッププラセボ画像、前記複数のベースライン治療画像、及び前記複数のフォローアップ治療画像は、生検画像である。
治療についての薬物反応組織学的表現型(DRP)との関係で着目コバリアントを識別する例示的な方法は次のステップを含む:臨床被験者群から取得された共変量クラスについてのコバリアント情報を受信するステップと、前記臨床被験者群から複数のベースライン画像及び複数のフォローアップ画像を受信するステップと、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて複数の進行埋め込みを取得するステップと、前記複数の進行埋め込みを訓練済み分類モデル内へと入力して前記臨床被験者群のDRP値について示す複数の分類結果を取得するステップと、前記臨床被験者群についての前記コバリアント情報、前記複数の分類結果、及び1つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントと前記DRP値との間の関連を決定して、前記着目コバリアントを識別するステップ。
一部の実施形態では、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える。
一部の実施形態では、前記複数の候補コバリアントは複数の候補遺伝子を備える。
一部の実施形態では、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える。
一部の実施形態では、方法はさらに次のステップを含む:前記識別された着目コバリアントに基づいて新規被験者にて着目疾患を診断するステップを含む、方法。
一部の実施形態では、方法はさらに次のステップを含む:前記識別された着目コバリアントに基づいて治療を開発するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記識別された着目コバリアントに基づいて前記治療を施す、調整する、又は適用するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記識別された着目コバリアントに基づいて医学的提案を提供するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記識別された着目コバリアントに基づいて生物学的標的を識別するステップ。
一部の実施形態では、前記複数の医用画像は生検画像を備える。
一部の実施形態では、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて前記複数の進行埋め込みを取得するステップは次のステップを含む:前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップ。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている。
一部の実施形態では、前記訓練済み線形モデルは線形混合モデルである。
一部の実施形態では、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている。
一部の実施形態では、前記着目コバリアントを識別するステップは:前記複数の候補コバリアントの候補コバリアントについて:前記臨床被験者群のDRP値及び前記コバリアント情報に基づいたモデルを生成するステップと、前記モデルに基づいて相関メトリックを決定するステップ。
一部の実施形態では、前記相関メトリックはP値である。
一部の実施形態では、方法はさらに次のステップを含む:前記相関メトリックを所定の閾値に対して比較して前記候補コバリアントが前記着目コバリアントであるかを決定するステップ。
着目疾患の進行に関して治療を評価する例示的な方法は次のステップを含む:医用画像を取得するステップであって、該医用画像は:(a)プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ画像と、(b)前記プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ画像と、(c)治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療画像と、(d)前記治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療画像とを備える、ステップと、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するステップであって、各埋め込みは前記医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを訓練済み線形回帰モデル内へと入力して複数の予測連続医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア及び複数の治療進行スコアを決定するステップと、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップと、前記複数の疾患進行スコアと前記治療との間の相関メトリックを前記関連に基づいて決定するステップ。
一部の実施形態では、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは:前記(a)を前記訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得することと、前記(b)を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得することと、前記(c)を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得することと、前記(d)を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得することとを含む。
一部の実施形態では、前記複数の埋め込みを前記訓練済み線形回帰モデル内へと入力するステップは:前記複数のベースラインプラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のベースラインプラセボスコアを取得することと、前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアッププラセボスコアを取得することと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して複数のベースライン治療スコアを取得することと、前記複数のフォローアップ治療埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアップ治療スコアを取得することとを含む。
一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは:前記複数のベースラインプラセボスコアと前記複数のフォローアッププラセボスコアとの間の差を決定して前記複数のプラセボ進行スコアを決定することと、前記複数のベースライン治療スコアと前記複数のフォローアップ治療スコアとの間の差を決定して前記複数の治療進行スコアを決定することとを含む、方法。
一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは:前記プラセボ群内の各被験者について、前記プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、前記治療群内の各被験者について、前記治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む。
一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む。
一部の実施形態では、前記相関メトリックはモデルのP値である。
一部の実施形態では、方法はさらに次のステップを含む:前記相関メトリックを所定の閾値と比較するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記比較に基づいて、前記治療と前記着目疾患との間の関連を識別するステップ。
一部の実施形態では、方法はさらに次のステップを含む:前記関連に基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。
一部の実施形態では、方法はさらに次のステップを含む:前記関連に基づいて医学的提案を提供するステップ。
一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記線形回帰モデルは線形混合モデルである。
一部の実施形態では、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化される。
一部の実施形態では、前記複数の割り当て済み医療診断スコアは1人以上の医師によって提供される。
一部の実施形態では、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される。
一部の実施形態では、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアとされる。
着目患者サブグループを識別する例示的な方法は次のステップを含む:臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップと、前記複数の埋め込みをクラスタリングして1つ以上の埋め込みクラスタを生成するステップと、前記1つ以上の埋め込みクラスタに対応する1つ以上の患者サブグループを識別するステップと、前記1つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するステップ。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記コバリアントは着目治療であり、また、前記着目患者サブグループは前記着目治療が相当なインパクトを及ぼすサブグループである。
一部の実施形態では、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記着目治療を受けたかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。
一部の実施形態では、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む。
一部の実施形態では、前記相関メトリックはP値である。
一部の実施形態では、前記生成されたモデルは前記患者サブグループ内の被験者の疾患進行値によって訓練される。
一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者の医療診断スコアを含む。
一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者の進行スコアを含む。
一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者のDRP値を含む。
一部の実施形態では、前記コバリアントは着目疾患の進行であり、また、前記着目患者サブグループは前記着目疾患の前記進行と有意な関連を有するサブグループである。
一部の実施形態では、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、患者が前記患者サブグループに属するかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。
一部の実施形態では、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む。
一部の実施形態では、前記相関メトリックはP値である。
一部の実施形態では、前記生成されたモデルは前記臨床被験者群の疾患進行値によって訓練される。
一部の実施形態では、前記疾患進行値は、前記患者サブグループ内の被験者の医療診断スコア、前記患者サブグループ内の被験者の進行スコア、又は前記患者サブグループ内の被験者のDRP値を含む。
一部の実施形態では、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである。
一部の実施形態では、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。
一部の実施形態では、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む。
一部の実施形態では、前記相関メトリックはP値である。
着目疾患との関係で少なくとも1つの着目生物学的標的を識別する例示的な方法は次のステップを含む:臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを複数の候補生物学的標的の各候補生物学的標的と関連付けて、前記複数の候補生物学的標的についてのサブセットを識別するステップであって、前記複数の生物学的標的のサブセットは前記複数の医用画像にて反映されている表現型特性と関連付けられている、ステップと、前記複数の候補生物学的標的の前記サブセットの各候補生物学的標的を前記着目疾患と関連付けて前記着目疾患の発病又はその進行に関して機能的インパクトを及ぼす少なくとも1つの着目生物学的標的を前記サブセットから識別するステップと、調節する生物学的標的を識別するステップであって、前記調節は、前記着目疾患に関しての前記少なくとも1つの生物学的標的の機能的インパクトに関して変更、オフセット、緩和、補足や補完するように設計されている、ステップ。
例示的なシステムは:1つ以上のプロセッサと、メモリと、1つ以上のプログラムとを備えるのであって、前記1つ以上のプログラムは前記メモリ内に記憶されており且つ前記1つ以上のプロセッサによって実行されるように構成されており、前記1つ以上のプログラムは上述された方法のいずれかを行うための命令を含む。
例示的な非一時的コンピュータ可読記憶媒体は1つ以上のプログラムを記憶するのであって、該1つ以上のプログラムは命令を備えるのであり、該命令は電子装置の1つ以上のプロセッサによって実行されると該電子装置に上述された方法のいずれかを行わせる。
特許又は出願のファイルは、少なくとも1つのカラーで表された図面を含む。
カラー図面を伴うこの特許又は特許出願公報のコピーは、請求及び必要費用の支払いがなされたらば、当局から提供される。
いくつかの実施形態による、例示的な発見プラットフォームのアーキテクチャについて示す図である。 いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的な方法について示す図である。 いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。 いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。 いくつかの実施形態による、例示的な教師なし機械学習モデルについて示す図である。 いくつかの実施形態による、例示的な対照学習アルゴリズムの訓練のためのデータアーキテクチャについて示す図である。 いくつかの実施形態による、医療診断スコアを予測するための例示的な線形回帰モデルの適合化について示す図である。 いくつかの実施形態による、医療診断スコアを予測するための例示的なバリアント特有モデルの適合化について示す図である。 いくつかの実施形態による、着目疾患との関係で少なくとも1つの着目遺伝的バリアントを識別するための例示的な処理について示す図である。 いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。 いくつかの実施形態による、着目疾患との関係で遺伝的バリアントを識別するための例示的なワークフローについて示す図である。 いくつかの実施形態による、例示的な線形回帰モデルの適合化について示す図である。 いくつかの実施形態による、例示的なGANモデルについて示す図である。 いくつかの実施形態による、予測されたシミュレーション画像の生成について示す図である。 図12Aは、いくつかの実施形態による、増大する線維症スコアを可視化するための予測画像タイルについての例示的なセット及び3つのシミュレーション画像を伴う例示的なシリーズについて示す図である。図12Bは、いくつかの実施形態による、増大するPNPLA3タイルスコアを可視化するための予測画像タイルについての例示的なセット及び3つのシミュレーション画像を伴う例示的なシリーズについて示す図である。 いくつかの実施形態による、様々なスコアと関連付けられている組織学的効果を可視化するための予測シミュレーション画像の例示的なシリーズについて示す図である。 いくつかの実施形態による、医療診断スコアを予測するように構成された様々な線形モデルの性能について示す図である。 図15Aは、いくつかの実施形態による、研究、サイト、及び病理スコア効果を伴うバリアントコンポーネントモデルについて示す図である。図15Bは、いくつかの実施形態による、サイト及び研究影響について調整がなされる埋め込みについての例示的な全ゲノム的関連研究(GWAS、genome-wide association study)について示す図である。図15Cは、いくつかの実施形態による、例示的な全フェノーム的関連研究(PheWAS、phenome-wide association study)について示す図である。 いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な方法について示す図である。 いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な処理について示す図である。 いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。 いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。 いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。 いくつかの実施形態による、例示的な進行埋め込み生成について示す図である。 いくつかの実施形態による、線形モデルについての例示的な訓練処理について示す図である。 いくつかの実施形態による、治療についての薬物反応組織学的表現型(DRP、Drug Response histological Phenotype)との関係で着目コバリアントを識別する例示的な方法について示す図である。 いくつかの実施形態による、治療についての薬物反応表現型(DRP、Drug Response Phenotype)との関係で着目コバリアントを識別する例示的な方法について示す図である。 いくつかの実施形態による、着目疾患の進行との関係で治療を評価するための例示的な方法について示す図である。 いくつかの実施形態による、着目疾患の進行との関係で治療を評価するための例示的な方法について示す図である。 いくつかの実施形態による、着目患者サブグループを識別するための例示的な方法について示す図である。 いくつかの実施形態による、3つの患者クラスタについて示す図である。 図26Aは、いくつかの実施形態による、例示的な縦型の表現分析について示す図である。図26Bは、いくつかの実施形態による、例示的な遺伝子関連研究について示す図である。 いくつかの実施形態による、DRPと発現との間の関連についての研究について示す図である。 いくつかの実施形態による、zスコアの比較について示す図である。 いくつかの実施形態による、例示的な電子装置について示す概略図である。
以下の詳細な説明は、当業者が様々な実施形態をもたらし並びにこれらを使用することを可能とするために提示されている。具体的な送致、手法、及び用途は、例示的に示されているに過ぎない。開示の例に対しての様々な改変は当業者にとっては明らかであり、本発明の精神及び範囲から逸脱することなく本明細書にて画定した一般原理を他の例や用途に適用できる。したがって、様々な実施形態は、本明細書にて説明及び示された例に限定されることは意図されておらず、むしろ特許請求の範囲と整合する範囲を与えられるべきである。
本明細書にて、発見プラットフォームを提供することに向けられた方法、システム、電子機器、非一時的記憶媒体、及び装置が開示される。発見プラットフォームは多遺伝子疾患等の複雑な疾患に適用でき、標的識別や臨床試験間分析を可能としたり解釈容易性を向上させたりすることができる。発見プラットフォームは弱い類いの又は未知の遺伝的駆動因子に適用できる。例えば、NASHは未知の遺伝的アーキテクチャを伴う疾患である。一部の実施形態では、発見プラットフォームは、着目遺伝的バリアントとNASH等の着目疾患との間の関係(例えば、因果関係)を識別できる。識別された関係は、新規被験者において着目疾患が発生する尤度について決定するために用いることができ、特定の症状又は他の疾患関連因子の存在をもとに新規被験者に疾患があるかをより高い信頼度を伴って診断できる。また、新規被験者にて遺伝的バリアントが識別された場合、着目疾患についての診断又は予後診断を適宜提供でき、これには疾患がどのように進行することが期待され得るかについての予後診断が含まれ得る。例えば、NASHについて着目遺伝的バリアントが発見された場合、新規被験者についてゲノム検査を行ってバリアントを検出できる。バリアントが存在する場合、システムは、疾患の発現を予測でき、診断を提供でき、及び/又は新規被験者においてどのように疾患が進行するかについて予後診断を提供できる。
一部の実施形態では、発見プラットフォームは複数の段階を備えることができる。第1段階では、例示的なシステム(例えば、1つ以上の電子装置)は、着目疾患等の着目表現型に関する医用画像データに基づいて、埋め込みを生成する。埋め込みとは、変数からベクトル(数値アレイ)への写像である。上述のように、埋め込みが指すのは、医用画像データにて反映されている着目疾患との関係での表現型状態についてのベクトル発現である。埋め込みは、医用画像データのリッチなセマンティック情報(例えば、画像内にて反映されている組織の微細構造の特徴)を捕捉する一方で、下流側の分析に関して関連性を有さない情報(例えば、画像の向き)は排する。例示的な実装例では、着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)であり、また、医用画像はいくつかの臨床試験からのヘマトキシリン・エオジン(H&E、hematoxylin & eosin)染色肝生検からのものである。結果として得られる教師なしでの埋め込みは、標的識別や臨床試験間分析を可能にし、また、上述のように解釈容易性を向上させ得る。
一部の実施形態では、システムは、医用画像データを対照学習アルゴリズム等に入力することによって埋め込みを生成する。対照学習モデルは、画像データから埋め込みを抽出できるのであり、また、上述のように、埋め込みはさもなければそのようなデータに割り当てられ得る生物学的エンドポイント又はラベル(例えば、着目疾患の進行)に関して線形的に予測できる。適した対照学習モデルは、同じサンプル画像の異なる増強結果からの埋め込みの間の類似性を最大化し、且つ、異なるサンプル画像の埋め込み間の類似性を最小化するように訓練される。例えば、モデルは、回転、反転、クロッピング、及び色ジッタリングに関して不変となる埋め込みを画像から抽出できる。
一部の実施形態では、埋め込みに関しては、下流側の分析に用いられる前に平均アグレゲーション及び/又は正規化をなすことができる。一部の実施形態では、埋め込みの正規化は分散安定化変換を行うことを伴い、これによってラベルの生物学的エンドポイントを線形的に予測するその能力が向上し得る。本明細書では、正規化によって、埋め込みに基づいて適合化された線形予測モデルの性能を向上させ得る。一部の実施形態では、正規化済みの埋め込みを用いて適合化された線形モデルは、教師あり機械学習モデルと同様の又はそれより優位な予測能力を有するのであり、また、後述のように生成及び適用に関してより演算的に効率的である。
第2段階では、システムは、例えば1つ以上の線形回帰モデルを用いて、埋め込みについての統計分析を行う。画像データではなく埋め込みを用いて統計分析をなすことによって、いくつかの技術的利点がもたらされる。第1に、埋め込みは、画像データのリッチなセマンティック情報(例えば、画像内にて反映されている組織の微細構造の特徴)を捕捉する一方で、下流側の分析に関して関連性を有さない情報(例えば、画像の向き)は排する。さらに、埋め込みは、それ自体が表す画像データよりも相当に小さなサイズのものとなっている。例示的な実装例では、埋め込みは2048次元のベクトルとすることができる一方で、対応する医用画像は膨大な画素数に対応するデータを含んでいる(例えば、数万画素、数十万画素、数百万画素等)。
さらに、埋め込みによれば、システムは、入力として埋め込みを受信し及び予測を出力するように構成された線形回帰モデルを生成(例えば、適合化)することができる。一部の実施形態では、線形回帰モデルは線形混合モデルであり、これらは治療及び潜在的な共変量効果を含む表現型的バリエーションについての埋め込みについての統計分析のための柔軟な枠組みをもたらす。本明細書にて説明されるように、埋め込みに基づいて生成されている線形モデルは、教師あり機械学習モデル(例えば、画像データを受信するように構成されたニューラルネットワーク)と同様の又はそれより優位な予測力を提供できるのであり、また、教師あり機械学習モデルよりも訓練及び適用に関してより演算的に効率的である。
一部の実施形態では、発見プラットフォームの第2段階は、着目疾患について示す連続スコア等の医用画像についての細かい粒度のラベルを取得するために埋め込みを用いることを伴う。例えば、線形モデルは、埋め込みと該埋め込みに関連付けられている病理学者によって割り当てられた離散的医療診断スコアとに基づいて、生成(例えば、適合化)されることができる。そして、モデルは、埋め込みに適用されて、連続医療診断スコアを予測することができる。
予測連続スコア(predicted continuous score)は、病理学者によって割り当てられた離散スコアに対して強力な利点を有している。具体的には、予測スコア(predicted score)は、連続的な値をとるのであり、故に病理学者によって割り当てられた離散スコアよりもニュアンスが多く捕捉されることとなる。埋め込み(及び画像データ)に連続的スコアを割り当てる能力の結果、より高い精密性及び下流側の分析における向上した統計能力がもたらされるのであり、例えば示される疾患状態の各々と遺伝的バリアントとの間により緊密な関連を取得し得る。例えば、NASH及び肝線維症の重症度は病理学者によってNASH CRN及びIshakステージ序数スコアによって組織学的に評価されるのであって、例えば次のものがある:Ishak線維症スコア(0~6)、脂肪症スコア(0~3)、小葉内炎症スコア(0~~3)、及びバルーニングスコア(0~2)。これらのメトリックの量的分析は、その手法の疾患分類が解像度の低さ故に困難を含む。線形モデルに関しては訓練をなして、画像データ(例えば、H&E肝生検画像データ)から病理スコアについて予測をもたらし得る連続スコアを生成できる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析及び遺伝関連研究について促進し得る。
一部の実施形態では、システムは、候補遺伝的バリアントと着目疾患との間での関連検定を行う。各医用画像(例えば、組織学画像)は、撮像元の人間対象からの関連遺伝子を伴う。関連検定は、候補遺伝的バリアントと着目疾患について示す連続スコアとに基づいて線形モデルを生成することを伴う。システムは、全ての着目候補遺伝的バリアント(例えば、100,000種、100万種、1,000万種等のバリアント)についてバリアント特有モデル(例えば、100,000種、100万種、1,000万種等のモデル)を生成できる。各モデルを評価して、各候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定して、1つ以上の着目遺伝的バリアントを識別できる。
一部の実施形態では、システムは、複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、埋め込みと有意な関連を有する候補遺伝的バリアントについてのサブセットを識別する。候補遺伝的バリアント(candidate genetic variant)と埋め込みとの間の関連について評価することによって、システムは、画像内にて反映されている組織学的差異と関連付けられている候補遺伝的バリアントについてのサブセットを識別する。一部の実施形態では、システムは、各候補バリアント(candidate variant)についてバリアント特有モデルを生成することによって関連検定を行うのであって、これは埋め込みを受信し及び候補遺伝的バリアントの値を出力するように構成されている。そして、バリアント特有モデルは評価されて、各候補遺伝的バリアントと埋め込みとの間に有意な関連があるかについて決定される(例えば、バリアント特有モデルと関連付けられているP値に基づいて)。システムは、全ての候補遺伝的バリアント(例えば、100,000種、100万種、1,000万種等のバリアント)についてバリアント特有モデル(例えば、100,000種、100万種、1,000万種等のモデル)を生成して、候補遺伝的バリアントについてのサブセットを識別できる。さらに、システムは、サブセット内の各候補遺伝的バリアントを着目疾患と関連付けて、少なくとも1つの着目遺伝的バリアントを識別できる。一部の実施形態では、システムは、サブセット内の候補遺伝的バリアントについてバリアント特有スコア予測モデルを生成できるのであって、これは候補遺伝的バリアントについて示す値を受信し及び着目疾患に関する医療診断スコアを出力するように構成されている(例えば、上述の連続スコアに基づいて)。そして、モデルについては評価して、候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定する。
第2段階では、他の関連検定手順を実施できる。一部の実施形態では、関連検定は次のものに基づき得る:出力が埋め込みであり入力が共変量である単変量線形モデル、出力が埋め込みであり入力が共変量である多変量線形モデル、又は出力が共変量であり入力が埋め込みである線形モデル。また、関連検定手順は、線形混合モデルやロジステイック回帰等の線形モデルの拡張や非線形モデル(例えば、ランダムフォレストやSVM等)に基づいていることもできる。関連検定手順の適用によって、各埋め込み次元と検査されたあらゆる共変量との間での、又は、全体としての埋め込み次元の全てと検査されたあらゆる共変量との間での関連についてのP値をもたらし得る。多重仮説検定手順(例えば、Bonferroni型やBenjamini Hochberg型)を通じて決定される統計的に有意な関連によれば、高コンテンツ表現型データセット(例えば、医用画像データ)におけるバリエーションと関連付けられている因子をもたらし得る。
第3段階においてシステムは、識別済み着目ジェネリック等の識別済み着目コバリアントの組織学的効果を説明するために画像に関して可視化をなすか可視化を支援できる。一部の実施形態では、システムは、線形モデルを用いて測定エンドポイントについて予測し得る生検画像タイルを識別する。線形補間によって複数の埋め込みを生成して、着目疾患の進行を表すことができる。埋め込みを、疾患の表現型状態を表す一連の画像に変換することができる。一連の画像はアニメーションとして表示でき、関連する組織学的な変化について可視化表示を提供できるのであり、これによらずにしては病理スコアについての関連研究によって検出ができない場合がある。可視化によって、モデル及び組織学的な変化に基づいての仮説の生成に用いられる特徴の解釈が支援され得る。したがって、システムは、第2段階では疾患ラベルと関連付けられていないバリアントを発見でき、また、第3段階では新規の可視化ツールによってそれらの効果を特徴付けることができる。
一部の実施形態では、シミュレーション画像の形式での予測画像は、訓練済み敵対的生成ネットワーク(GAN)モデルの生成器コンポーネントによって生成される。生成器は、埋め込み(例えば、画像タイル埋め込み)に条件付けられたシミュレーション画像を生成でき、他の特徴を一定に保ちつつ表現型に沿った補間を可能とできる。例えば、生成器は、(条件としての)埋め込みx及び標準的な正規分布からサンプリングされたノイズベクトルuを受信し、並びに、シミュレーション画像を出力するように構成されていることができる。1つの例示的な実装例では、埋め込みxは2048次元の埋め込みであり、ノイズベクトルuは標準的な正規分布からサンプリングされた512次元のベクトルである。
一部の実施形態では、予測画像は、各画像の予測スコア及び/又はそのような画像の埋め込みとの関係で生成された予測特徴に基づいてランキングされた実際の医用画像から選択されることができる。可視化される画像は、ランキングされた画像の一部又は全部とされ得る。例えば、ランキングの上位N件の画像を表示できる。別の例を挙げるに、上位N件及び下位M件の画像を表示できる。ランキングに基づいて代替的な画像サブセットを選択することもできる。
本明細書にて説明される実施形態は、単に例示的なものにすぎず、また、発見プラットフォームは任意の着目表現型と共変量との間の関連を発見するために活用できる。本明細書にて説明される一部の例について述べるに:表現型データには医用画像が含まれ;着目表現型は着目疾患(例えば、NASH)であり、これは医療診断スコア(例えば、線維症スコア)によって表されることができ;着目共変量は着目遺伝的バリアントである。もっとも、本明細書にて説明される手法は別の着目表現型と別の共変量との間の関連を発見することに関して活用することもできるということに留意されたい。例示的な表現型データとしては次のものが含まれるがこれらには限定されないのであり、また、他の列挙が限定的であるとも示唆はされない:生体医用画像(例えば、MRI、X線、CTスキャン)、病理組織学データ(例えば、H&E染色、トリクローム染色)等の生検試料から生成された医用画像、臨床バイオマーカデータ(例えば、プロテオミクスやcfDNAを含む血液検査測定値、認知/精神評価スコア、マイクロバイオーム評価等)、及びゲノムバイオマーカデータ(例えば、バルクRNA-seq、メチル化データ、ゲノム配列データ、エピジェネティック配列データ等)。例示的な表現型としては次のものが含まれるがこれらには限定されないのであり、また、他の列挙が限定的であるとも示唆はされない:着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、トランスクリプトミクス、又はリピドミクス等。例示的な共変量としては次のものが含まれるがこれらには限定されないのであり、また、他の列挙が限定的であるとも示唆はされない:人口統計情報(例えば、年齢や性別)、臨床共変量(例えば、疾患状態、臨床スコア又は血液バイオマーカ)、ゲノムデータ(例えば、遺伝子データ、発現データ、メチル化データ、等)等。
一部の実施形態では、識別済みの関係は、バイオマーカや疾患介入用の標的の識別に関して用いられ得る。例えば、発病又は進行との関係で因果関係にあると識別された特定の遺伝的バリアントに関しては、治療的介入に関してそれらが適するかをさらに評価できる。また、遺伝的バリアントが着目疾患に対して及ぼす機能的インパクトを考慮して、治療的介入のための追加的な生物学的標的を識別することができる。そのような生物学的標的は、例えば、着目遺伝的バリアントが所在する遺伝子によって転写されるたんぱく質の場合がある。そのような生物学的標的は、着目疾患の少なくとも1つの遺伝的バリアントの機能的インパクトに関して変更、オフセット、緩和、補足や補完するものと見込まれている他の遺伝子、たんぱく質、又は代謝産物を含み得る。一部の実施形態では、識別済みの関係は、治療を開発するために用いられ得る。例えば、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療のインパクトを、候補治療に関しての変更型又は類似型の開発に際して、考慮できる。以前施された候補治療の効果に関しての縦型の及びクロスセクショナル型のデータの双方は、着目疾患の予測状態又は進行と比較でき、量的観点から、着目疾患の状態又は進行に関して着目遺伝的バリアントがどの程度まで以前施された候補治療のインパクトに影響を与えるかを決定できる。そのような候補治療に関しての変更型又は類似型については、疾患及びその被験者群との関係での遺伝的バリアントのインパクトを考慮して、強化された治療的効果又は減じられた有害副作用を有するように選択できる。また、遺伝的バリアントを反映している疾患モデルは、治療的候補をスクリーニングするために用いられ得る。例えば、ゲノム特徴との関連付けの場合、統計的に有意な関連付けは新規な候補薬剤標的又は人間の疾患に関与する主要経路の発見につながり得る。同様に、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療(candidate therapies)のインパクト(疾患状態に対しての有害なインパクト又は副作用を含む)は、組合せ型治療の開発に用いられ得る。したがって、本明細書にて説明される手法は、異なる遺伝的背景を有する被験者間で治療的候補(therapeutic candidates)に対しての起こるであろう応答を予測するために、特定の治療を受けるべき適切な患者コホートを識別するために、及び結果を最適化するために臨床試験を一般的に設計するために用いることができる。
発見プラットフォームは、治療を選択的に施し、調整し、又は適用するために用いられ得る。一部の実施形態では、識別済みの関係は医学的提案を提供するために用いられ得る。医学的提案は、患者に対しての治療及び/若しくは療法の提案、並びに/又は、支援をもらうために医療専門家に連絡せよとの指示を含み得る。一部の実施形態では、識別済みの関係に基づいてレポートが生成され得る。人口統計及び臨床的な特徴と関連付けられている場合、有意な関連は、新たな関連付けの発見につながったり(例えば、性別、年齢、コレステロール水準等との関連)、及び/又は、データセット内のテクニカルバイアス(例えば、特定の臨床センタとの関連)の探知につながり得る。
一部の実施形態では、識別済みの関係(relationship)は、着目疾患の治療のための生物学的標的(例えば、薬剤標的)を識別するために用いられ得る。一旦、遺伝的バリアントが特定の疾患と関連付けられている(associated)ものとして識別されたらば、遺伝的バリアントは該疾患の治療のための標的(例えば、薬剤標的)として用いられ得る。一部の実施形態では、疾患と相関付けられている(correlated)遺伝的バリアントについては研究して、遺伝子機能や疾患病理(例えば、遺伝子型/表現型相関)についてさらなる理解を得る、及び/又は患者における疾患の治療のための遺伝的バリアントの治療的ターゲティングの有望性を査定する。例えば、遺伝的バリアントは機能喪失バリアントたり得るのであり、これは遺伝的バリアントを構成する遺伝子の発現の欠如故に疾患病理を付与する。一部の実施形態では、遺伝的バリアント遺伝子型との相関する疾患表現型に対しての様々な薬剤の効果を評価するために薬剤スクリーニングがなされる。一部の実施形態では、疾患治療用薬剤は、該薬剤による治療後の疾患表現型の緩和に基づいて選択される。一部の実施形態では、遺伝的バリアントはNASH疾患と相関付けられている。一部の実施形態では、NASH疾患と相関付けられている遺伝的バリアントはNASH疾患治療用の薬剤標的である。生物学的標的は関連付けられている遺伝的バリアントそれ自体とされ得るも、標的は次のものをも含み得る: (a)バリアントを含む遺伝子によって転写されるたんぱく質又は代謝産物、 (b)バリアントによって惹起された不足をオフセット/補うことができるたんぱく質又は代謝産物、 (c)バリアント及びその機能的インパクトの逆作動薬である遺伝子、たんぱく質又は代謝産物等。
以下の説明では、例示的方法、パラメータ、及びこれらに類することについて記載されている。もっとも、そのような説明は、本開示の範囲の限定として意図されるものではなく、代わりに、例示的実施形態の説明として提供されることを認識されたい。
以下の説明は、用語「第1」、「第2」等を使用して、種々の要素を説明するが、これらの要素は、用語によって限定されるべきではない。これらの用語は、1つの要素を別の要素から区別するためにのみ用いられているにすぎない。例えば、第1のグラフィカル表現は、種々の説明される実施形態の範囲から逸脱することなく、第2のグラフィカル表現と称され得るのであり、同様に、第2のグラフィカル表現は、第1のグラフィカル表現と称され得る。第1のグラフィカル表現及び第2のグラフィカル表現は両方ともグラフィカル表現であるも、それらは同一グラフィカル表現ではない。
本明細書の種々の説明される実施形態の説明において使用される用語は、特定の実施形態を説明する目的のためのものにすぎず、限定することは意図されていない。種々の説明される実施形態の説明および添付の請求項において使用されるように、単数形「a」、「an」、および「the」は、文脈によってそうでないことが明確に示されない限り、複数形形態も同様に含むように意図される。また、用語「及び/又は」は、本明細書に使用されるように、関連付けられる列挙されたアイテムのうちの1つ以上のあらゆる可能性として考えられる組み合わせを指し、包含することを理解されたい。さらに、「includes(~を含む)」、「including(~を含む)」、「comprises(~を備える)」及び/又は「comprising(~を備える)」との語は、本明細書において使用されるとき、述べられた特徴、整数、ステップ、動作、要素、及び/又は構成要素の存在を規定するが、1つ以上の他の特徴、整数、ステップ、動作、要素、構成要素、及び/又はその群の存在または追加を除外しないことを理解されたい。
「if(~の場合)」との語は、随意的には、文脈に応じて、「when(~のとき)」または「upon(~に応じて)」若しくは「in response to determining(~を決定することに応答して)」又は「in response to detecting(~を検出することに応答して)」を意味するように解釈される。同様に、「if it is determined(~であることが決定される場合)」又は「if [a stated condition or event] is detected([述べられた条件または事象]が検出される場合)」は、随意的には、文脈に応じて、「upon determining(~を決定することに応じて)」又は「in response to determining(~を決定することに応答して)」若しくは「upon detecting [the stated condition or event]([述べられた条件または事象]を検出することに応じて)」又は「in response to detecting [the stated condition or event]([述べられた条件または事象]を検出することに応答して)」を意味するように解釈される。
図1はいくつかの実施形態による、例示的な発見プラットフォームのアーキテクチャについて示す。ステージ1では、例示的なシステム(例えば、1つ以上の電子装置)は、着目疾患等の着目表現型に関する医用画像データに基づいて、埋め込みを生成する。埋め込みとは、医用画像データにて反映されている着目疾患との関係での表現型状態についてのベクトル表現である。埋め込みは、医用画像データのリッチなセマンティック情報(例えば、画像内にて反映されている組織の微細構造の特徴)を捕捉する一方で、下流側の分析に関して関連性を有さない情報(例えば、画像の向き)は排する。図1に示されるように、4つの医用画像102a, 102b, 102c, 102dは4つの埋め込みに変換できるのであり、これらは埋め込み空間106においてそれぞれ4つのポイント104a, 104b, 104c, 104dとして各々表されるのであり、該空間は本明細書では交換可能な態様で潜在空間106とも称される。示されている例では、着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)であり、また、医用画像はいくつかの臨床試験からのH&E染色肝生検からのものである。結果として得られる教師なしでの埋め込みは、標的識別や臨床試験間分析を可能にし、また、上述のように解釈容易性を向上させ得る。
一部の実施形態では、システムは、医用画像データを対照学習アルゴリズム等に入力することによって埋め込み(例えば、ポイント104a-104dによって表される埋め込み)を生成する。対照学習モデルは、画像データから埋め込みを抽出できるのであって、上述のように埋め込みはさもなければそのようなデータに割り当てられ得る生物学的エンドポイント又はラベル(例えば、着目疾患の進行)に関して線形的に予測できる。適した対照学習モデルは、同じサンプル画像の異なる増強結果からの埋め込みの間の類似性を最大化し、且つ、異なるサンプル画像の埋め込み間の類似性を最小化するように訓練される。例えば、モデルは、回転、反転、クロッピング、色ジッタリング、又は他の画像オーグメンテーション、又はこれらの組み合わせに関して不変となる埋め込みを画像から抽出できる。
一部の実施形態では、埋め込みに関しては、下流側の分析に用いられる前に平均アグレゲーション及び/又は正規化をなすことができる(例えば、ステージ2)。一部の実施形態では、埋め込みの正規化は分散安定化変換を行うことを伴うのであり、単純な回帰ベースド分析を下流側にて適用することが可能となる。本明細書では、正規化によって、埋め込みに基づいて適合化された線形予測モデルの性能を向上させ得る。一部の実施形態では、正規化済みの埋め込みを用いて適合化された線形モデルは、教師あり機械学習モデルと同様の又はそれより優位な予測能力を有するのであり、また、後述のように生成及び適用に関してより演算的に効率的である。
一部の実施形態では、予測画像は着目共変量決定のために識別され得る。一部の実施形態では、予測特徴は組織病理データにてタイルレベルで生成され得る。これは様々な手法を用いて達成され得る。例えば、平均アグレゲーションタイル埋め込みを取得して生検埋め込みを生成できる。生検埋め込みから共変量を予測できるように、このデータを用いて線形モデルを適合化させることができる。また、タイル埋め込みに線形モデルを適用して、タイルレベルスコアを生成できる。別の例を挙げるに、機械学習モデルの複数インスタンスをタイル埋め込みに直接的に適合化させることができる。例えば、各タイルについてスコア及び重みの両方を予測するモデルに関して適合化をなし得るのであり、そしてスコアに関して加重平均がとられる。スコア及び重みの両方は、2次元の予測特徴と看做され得る。
一部の実施形態では、予測画像はそれらの画像と関連付けられている予測特徴に基づいて識別され得る。例えば、最高の又は最低の予測スコアを有するタイルを解析して予測画像を識別できる。別の例を挙げるに、着目条件を定義できる(例えば、高い線維症スコア対低い線維症スコア、第1の遺伝シーケンス対第2の遺伝シーケンス、及びこれらに類する事項)。第1の着目条件との関係での所与のタイルの特徴の確率(例えば、P(タイル特徴|条件1))及び第2の着目条件との関係での所与のタイルの特徴の確率(例えば、P(タイル特徴|条件2))についてのモデルに関して適合化をなし得る。そして、タイル画像を可視化できる(例えば、ユーザインタフェース上でのレンダリング)。一部の実施形態では、P(タイル特徴|条件1)/P(タイル特徴|条件2)は、所与の特徴を伴うタイルの観測確率が条件1又は条件2(又は定義されている場合には他の条件)下でよりあり得ることを表し得る。該比は、十分に大きい又は小さい場合には条件1又は条件2の尤度がより大きいことを示すことになる。一部の実施形態では、低い予測確率を有するタイルについてはフィルタリングして外れ値を無視することができる。
ステージ2では、システムは(例えば、ステージ1で用いられる1つ以上の電子装置と同一又は類似の1つ以上の電子装置)、例えば1つ以上の線形回帰モデルを用いて、埋め込みについての統計分析を行うことができる。画像データではなく埋め込みを用いて統計分析をなすことによって、いくつかの技術的利点がもたらされる。第1に、埋め込みは、画像データのリッチなセマンティック情報(例えば、画像内にて反映されている組織の微細構造の特徴)を捕捉する一方で、下流側の分析に関して関連性を有さない情報(例えば、画像の向き)は排する。さらに、埋め込みは、それ自体が表す画像データよりも相当に小さなサイズのものとなっている。例示的な実装例では、埋め込みは2048次元のベクトルとすることができる一方で、対応する医用画像は膨大な画素数に対応するデータを含んでいる(例えば、数万画素、数十万画素、数百万画素等)。よって、埋め込みを記憶することによって、医用画像データを用いる場合に比して、メモリを節約しつつ分析の実行に要する処理時間をも減じることができる。
さらに、埋め込みによれば、システムは、入力として埋め込みを受信し及び有用な様々な予測を出力するように構成された線形回帰モデルを生成(例えば、適合化)することができる。一部の実施形態では、線形回帰モデルは線形混合モデルであり、これらは治療及び潜在的な共変量効果を含む表現型的バリエーションについての埋め込みについての統計分析のための柔軟な枠組みをもたらす。本明細書にて説明されるように、埋め込みに基づいて生成されている線形モデルは、教師あり機械学習モデル(例えば、画像データを受信するように構成されたニューラルネットワーク)と同様の又はそれより優位な予測力を提供できるのであり、また、教師あり機械学習モデルよりも訓練及び適用に関してより演算的に効率的である。
一部の実施形態では、ステージ2は、着目疾患について示す連続スコア等の医用画像102a-102dについての細かい粒度のラベルを取得するために埋め込みを用いることを伴う。例えば、線形モデルは、埋め込みと該埋め込みに関連付けられている病理学者によって割り当てられた離散的医療診断スコアとに基づいて、生成(例えば、適合化)されることができる。そして、モデルは、埋め込みに適用されて、連続医療診断スコアを予測することができる。
多くの場合、予測連続スコア(predicted continuous score)は、病理学者によって割り当てられた離散スコアに対して強力な利点を有している。具体的には、予測スコア(predicted score)は、連続的な値をとるのであり、故に病理学者によって割り当てられた離散スコアよりもニュアンスが多く捕捉されることとなる。埋め込み(及び画像データ)に連続的スコアを割り当てる能力の結果、より高い精密性及び下流側の分析における向上した統計能力がもたらされるのであり、例えば示される疾患状態の各々と遺伝的バリアントとの間により緊密な関連を取得し得る。例えば、NASH及び肝線維症の重症度は病理学者によってNASH CRN及びIshakステージ序数スコアによって組織学的に評価されるのであって、例えば次のものがある:Ishak線維症スコア(整数たる0~6)、脂肪症スコア(整数たる0~3)、小葉内炎症スコア(整数たる0~3)、及びバルーニングスコア(整数たる0~2)。これらのメトリックの量的分析は、その手法の疾患分類が解像度の低さ故に困難を含む。他方で、線形モデルに関しては訓練をなして、画像データ(例えば、H&E肝生検画像データ)から病理スコアについて予測をもたらし得る連続スコアを生成できる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析及び遺伝関連研究について促進し得る。
一部の実施形態では、ステージ2はブロック110~160を含む。各ブロックは1つ以上のコンピューティングシステムによってなされる機能についての機能的表現である。一部の実施形態では、同じ1つ以上のコンピューティングシステムが2つ以上のブロックのオペレーションを実効化することができる。例えば、ステージ2はブロック110を含む。ブロック110では、システム(例えば、1つ以上のコンピューティングシステム)は、候補遺伝的バリアントと着目疾患との間での関連検定を行うように構成されていることができる。関連検定は、候補遺伝的バリアントと着目疾患について示す連続スコアとに基づいて線形モデルを生成することを伴う。システムは、全ての着目候補遺伝的バリアント(例えば、100,000種、100万種、1,000万種のバリアント)についてバリアント特有モデル(例えば、100,000種、100万種、1,000万種のモデル)を生成できる。各モデルについては評価して、各候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定できる。ブロック110の詳細は図2を参照して説明される。
一部の実施形態では、ステージ2はブロック120を含む。ブロック120では、システムは、複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、埋め込みと有意な関連を有する候補遺伝的バリアントについてのサブセットを識別するように構成されていることができる。候補遺伝的バリアント(candidate genetic variant)と埋め込みとの間の関連について評価することによって、システムは、(あるならば)画像内にて反映されている組織学的差異と関連付けられている候補遺伝的バリアントについてのサブセットを識別できる。本明細書にて説明される手法は、分析を特定の診断スコアに絞ることによっては発見できないであろう組織学に影響を及ぼすバリアントを識別することができる。
一部の実施形態では、システムは、各候補バリアント(candidate variant)についてバリアント特有モデルを生成することによって関連検定を行うのであって、これは埋め込みを受信し及び候補遺伝的バリアントの値を出力するように構成されている。そして、バリアント特有モデルは評価されて、各候補遺伝的バリアントと埋め込みとの間に有意な関連があるかについて決定される(例えば、バリアント特有モデルと関連付けられているP値に基づいて)。システムは、全ての着目遺伝的バリアント(例えば、100,000種、100万種、1,000万種のバリアント)についてバリアント特有モデル(例えば、100,000種、100万種、1,000万種のモデル)を生成できる。
ブロック120では、さらに、システムは、サブセット内の各候補遺伝的バリアントを着目疾患と関連付けて、少なくとも1つの着目遺伝的バリアントをサブセットから識別できる。一部の実施形態では、システムは、サブセット内の候補遺伝的バリアントについてバリアント特有スコア予測モデルを生成できるのであって、これは候補遺伝的バリアントについて示す値を受信し及び着目疾患に関する医療診断スコアを出力するように構成されている(例えば、上述の連続スコアに基づいて)。そして、モデルは評価されて、候補遺伝的バリアントと着目疾患との間に有意な関連があるかについて決定する。ブロック120の詳細は図7を参照して説明される。
ブロック130では、システムはさらに、着目疾患の進行との関係で治療を評価できる。疾患の進行は、本明細書にて説明される進行埋め込みを用いて定量化することができる。システムは、入力進行埋め込みを受信しプラセボ又は治療を示す分類結果を出力するモデルからの予測として、薬剤応答表現型(DRP)として帰属させるように構成されていることができる。システムは、DRPと治療との間に有意な関連があるかについて決定できる。有意な関連がある場合、下流側の分析において治療をさらに分析できる(例えば、ブロック140)。ブロック130の詳細は図16を参照して説明される。
ブロック140では、システムはさらに、治療と関連付けられているDRPとの関係で着目コバリアントを識別するように構成されていることができる。DRPについての帰属決定は、進行埋め込みが利用可能である限り臨床試験データセットを用いることによって行うことができる。DRPと分子データ(例えば、表現及びジェネティクス)との間の有意な関連は関連検定を介して取り出すことができる。発現ありの関連付けでは、プラセボ対薬剤の差次的発現分析にて検出できなかった遺伝子を識別できる。一部の場合では、DRP分析では、真のプラセボ対薬剤(placebo-vs-drug)の差次的発現分析の症例対照として相関付けられている遺伝子セットを識別できる。一部の場合では、DRP分析では、より大きなコホートの分析故により大きな遺伝子セットを識別できるのでありDRP相関の解釈を支援し得る。
一部の実施形態では、小規模臨床試験における治療対プラセボ(treatment vs placebo)の分析のzスコアに対してのより大規模な臨床試験における帰属DRP分析のそれの比較を用いて、相関を識別することができる(例えば、図28との関係で見られること)。ブロック140の詳細は図20を参照して説明される。
ブロック150では、システムはさらに、着目疾患の進行との関係で治療を評価するように構成されていることができる。疾患進行は連続医療診断スコアによって定量化できる。高解像度NASHスコア及び様々な治療の間の有意な関連は、関連検定を介して取り出される。この処理では、病理学者によって割り当てられた離散スコアを用いては検出できなかった、医療診断スコアに対しての薬剤の影響を取り出すことができる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析(例えば、図26A)及び遺伝関連研究(例えば、図26B)について促進し得る。ブロック150の詳細は図22を参照して説明される。
ブロック160では、システムはさらに、着目患者サブグループを識別するように構成されていることができる。システムは、患者画像データから埋め込みを取得し及び埋め込みのクラスタを識別して患者サブグループを識別できる。各患者クラスタアイデンティティ及び疾患バイオマーカ、遺伝的バリアント、及び発現レベル間の有意な関連が関連検定にて取り出される。この手順では、患者セグメント及び関連付けられている臨床ラベル及び分子ドライバが取り出される。ブロック160の詳細は図24を参照して説明される。
ステージ2では、他の関連検定手順を実施できる。一部の実施形態では、関連検定は次のものに基づき得る:出力が埋め込みであり入力が共変量である単変量線形モデル、出力が埋め込みであり入力が共変量である多変量線形モデルや、出力が共変量であり入力が埋め込みである線形モデル。また、関連検定手順は、線形混合モデルやロジステイック回帰等の線形モデルの拡張や非線形モデル(ランダムフォレストやSVM等)に基づいていることもできる。関連検定手順の適用によって、各埋め込み次元と検査されたあらゆる共変量との間での、又は、全体としての埋め込み次元の全てと検査されたあらゆる共変量との間での関連についてのP値をもたらし得る。多重仮説検定手順(例えば、Bonferroni型やBenjamini Hochberg型)を通じて決定される統計的に有意な関連によれば、高コンテンツ表現型データセット(例えば、医用画像データ)におけるバリエーションと関連付けられている因子をもたらし得る。
随意的なステージ3では、システムは、シミュレーション画像172等のシミュレーション画像を生成して、識別済み着目ジェネリック等の識別済み着目コバリアントの組織学的効果を可視化するように構成されていることができる。図1に示されているように、潜在空間内の埋め込みを生成してそしてこれを画像に変換して着目疾患との関係での表現型状態を可視化できる。一部の実施形態では、システムは、線形モデルを用いて測定エンドポイントについて予測し得る生検画像タイルを識別する。線形補間によって複数の埋め込みを生成して、着目疾患の進行を表すことができる。埋め込みは、一連の画像に変換することができる。一連の画像はアニメーションとして表示でき、関連する組織学的な変化について可視化表示を提供できるのであり、これによらずにしては病理スコアについての関連研究によって検出ができない場合がある。例示的な実装例について述べるに、手順では、ステージ2における発見された着目遺伝的バリアント、生検埋め込み(分析済み生検が行とされ、また、埋め込み次元が列とされる行列)、及びタイル埋め込み(対応するタイルが行とされ、また、埋め込み次元が列とされる行列)が入力として受け付けられて、また、一連のn 256x256タイル画像が出力される。可視化によって、モデル及び組織学的な変化に基づいての仮説の生成に用いられる特徴の解釈が支援され得る。したがって、システムは、ステージ2では疾患ラベルと関連付けられていないバリアントを発見でき、また、ステージ3では新規の可視化ツールによってそれらの効果を特徴付けることができる。
一部の実施形態では、シミュレーション画像は、訓練済み敵対的生成ネットワーク(GAN)モデルの生成器コンポーネントによって生成される。生成器は、埋め込み(例えば、画像タイル埋め込み)に条件付けられた画像を生成でき、他の特徴を一定に保ちつつ表現型に沿った補間を可能とできる。例えば、生成器は、(条件としての)埋め込みx及び標準的な正規分布からサンプリングされたノイズベクトルuを受信し、並びに、シミュレーション画像を出力するように構成されていることができる。1つの例示的な実装例では、埋め込みxは2048次元の埋め込みであり、ノイズベクトルuは標準的な正規分布からサンプリングされた512次元のベクトルである。
一部の実施形態では、シミュレーション画像はランキングされる。シミュレーション画像のランキングは、シミュレーション画像の提示及び/又はさらなる分析のための記憶に関しての根拠として用いられ得る。一部の実施形態では、シミュレーション画像は医療診断スコアに基づいてランキングされる。
本明細書にて説明される実施形態は、単に例示的なものにすぎず、また、発見プラットフォームは任意の着目表現型と共変量との間の関連を発見するために活用できる。本明細書にて説明される一部の例について述べるに:表現型データには医用画像が含まれ;着目表現型は着目疾患(例えば、NASH)であり、これは医療診断スコア(例えば、線維症スコア)によって表されることができ;着目共変量は着目遺伝的バリアントである。もっとも、本明細書にて説明される手法は別の着目表現型と別の共変量との間の関連を発見することに関して活用することもできるということに留意されたい。例示的な表現型データとしては次のものが含まれる:医用画像(例えば、MRI、X線、CTスキャン)、病理組織学データ(例えば、H&E染色、トリクローム染色)、臨床バイオマーカデータ(例えば、プロテオミクスやcfDNAを含む血液検査測定値、認知/精神評価スコア、マイクロバイオーム評価等)、及びゲノムバイオマーカデータ(例えば、バルクRNA-seq、メチル化データ、ゲノム配列データ、エピジェネティック配列データ等)。例示的な表現型には次のものが含まれる:着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、トランスクリプトミクス、又はリピドミクス等。例示的な共変量クラスには次のものが含まれる:人口統計情報(例えば、年齢や性別)、臨床共変量(例えば、疾患状態、臨床スコア又は血液バイオマーカ)、ゲノムデータ(例えば、遺伝子データ、発現データ、メチル化データ、等)等。
図2は、いくつかの例による、着目疾患との関係で着目遺伝的バリアントを識別するための例示的な処理200について示す。処理200は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理200は、クライアント-サーバシステムを使用して実施され、処理200のステップは、任意の様式において、サーバと1つ以上のクライアントデバイスとの間で分割される。したがって、処理200の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理200はそのように限定されることは要さないことに留意されたい。他の例では、処理200はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理200では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理200と組み合わせて実施されてもよい。故に、図示(および下記により詳細に説明)されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。
図2を参照するに、例示的なシステム(例えば、1つ以上の電子装置)は、臨床被験者群から取得された複数の医用画像を取得できる。医用画像は、着目疾患の状態を表す。一部の実施形態では、複数の医用画像は、臨床被験者群からの生検試料の複数の生検画像を含む。例えば、生検では1つ以上の組織スライドを被験者から取得でき、また、1つ以上のデジタル画像を撮って各組織スライドを撮像できる。
図3Aに示される例示的なワークフローでは、生検1-nがなされている。生検1-nは複数の被験者(例えば、がん患者)及び/又は複数回の訪問(例えば、スクリーニング訪問回やフォローアップ訪問回)に対応し得る。示されている例では、着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)であり、また、生検はいくつかの臨床試験からのH&E染色肝生検である(もっとも、類似のワークフローは他の着目疾患について実装され得る)。各生検(例えば、生検1)は、1つ以上の生検画像(例えば、生検1についての医用画像302)を結果としてもたらす。したがって、生検1-nは、医用画像302、医用画像352等を含む複数の医用画像を結果としてもたらす。
医用画像は、様々なデータと関連付けられることができる。例えば、図3Aを参照するに、関連データ304は生検1と関連付けられており、データ354は生検nと関連付けられており以下同様。後述のように、データは着目疾患及び被験者についての既知情報を含み得るのであり、着目遺伝的バリアントについての情報も含まれる。
一部の実施形態では、医用画像と関連付けられているデータは、着目疾患に関する割り当て済み医療診断スコアを含み得る。割り当て済み医療診断スコアは、疾患状態を示し得る。一部の実施形態では、医療診断スコアは、一人以上の病理学者によって割り当てられた生検レベルスコアであることができ、これはそれらの病理学者の生検スライドの検討に基づいている。例えば、NASH疾患に関しては、NASHの重症度、及び肝線維症については、病理学者によってNASH CRN及びIshakステージ序数スコアによって組織学的に評価できる。一部の実施形態では、割り当て済み医療診断スコアはIshak線維症スコア等の生検レベル線維症スコアとされ得るのであり、これは離散値たる0, 1, 2, 3, 4, 5,又は6とされる線維症の程度を示すものである。一部の実施形態では、割り当て済み医療診断スコアは生検レベル脂肪症スコアとされ得るのであり、これは離散値たる0, 1, 2,及び3とされる脂肪症の程度を示すものである。一部の実施形態では、割り当て済み医療診断スコアは生検レベル小葉内炎症スコアとされ得るのであり、これは離散値たる0, 1,及び2とされる小葉内炎症の程度を示すものである。一部の実施形態では、割り当て済み医療診断スコアは生検レベルバルーニングスコアとされ得るのであり、これは離散値たる0, 1,及び2とされるバルーニングの程度を示すものである。これらのメトリックの量的分析は、その手法の疾患分類が解像度の低さ故に困難を含む。後述のように、線形モデルに関しては訓練をなして、画像データ(例えば、H&E肝生検画像データ)から病理スコアについて予測をもたらし得る連続スコアを生成できる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、縦型表現分析及び遺伝関連研究について促進し得る。
一部の実施形態では、医用画像と関連付けられているデータは、生検サンプルの取得元の被験者の遺伝子データを含み得る。例えば、データ(例えば、関連データ304)は、複数の遺伝的バリアントについての被験者遺伝子情報を含み得る(例えば、100,000種、100万種、1,000万種のバリアント)。例えば、データは、被験者が複数の遺伝的バリアントの各々を有するかを示し得る。例えば、母集団において2つのアレルを伴う遺伝的バリアントについては、個体が最低頻度アレルのコピーを0, 1,又は2個有しているかに応じて、医用画像は遺伝的バリアント値(0, 1,又は2)と関連付けられることができる。一部の実施形態では、被験者遺伝子データは、被験者が着目疾患に罹患する尤度を示す多遺伝子リスクスコアとされ得る。
一部の実施形態では、医用画像と関連付けられているデータは(例えば、関連データ304、データ354等)、生検サンプルの取得元の被験者の人口統計データを含み得る。人口統計データは例えば、性別、年齢、及び/又は治療群(例えば、プラセボ、治療x、治療y)を含み得る。
図3Aを参照するに、医用画像は複数の画像タイルに分割できる。例えば、生検1の医用画像302を分割して画像タイル306-1, 306-2, …, 306-M1を取得でき;生検nの医用画像532を分割して画像タイル356-1, 356-2, …, 356-Mnを取得できる。一部の実施形態では、画像タイルは、所定のグリッドを用いて医用画像から抽出されて、また、統一されたサイズの画像タイルとして記憶されることができる。1つの例示的実装例では、画像タイルはタイル寸法が192 μm × 192 μmとされる所定のグリッドを用いて抽出され、また、画像タイルは224画素 × 224画素のサイズとされる画像として保存される。
図2に戻るに、ブロック202では、システムは、臨床被験者群から取得された複数の医用画像を教師なし機械学習モデル内へと入力して、潜在空間内での複数の埋め込みを取得するように構成されていることができる。一部の実施形態では、システムは、複数の医用画像を上述のように複数の画像タイルに分割し、及び、各画像タイルを教師なし機械学習モデル内へと入力して、対応するタイル埋め込みを取得する。図3Aを参照するに、画像タイル306-1-306-M1の各画像タイルは教師なし機械学習モデルに入力されて、タイル埋め込みを取得できる。例えば、画像タイル306-1は(処理Aによって表されている)教師なし機械学習モデルに入力されて、タイル埋め込み308が取得される。したがって、生検1については、システムが、それぞれが画像タイル306-1-306-M1に対応するタイル埋め込み308-1 - 308-M1を取得する。同様に、生検nについては、システムが、画像タイル306-1-306-Mnに対応するタイル埋め込み358-1 358-Mnを取得できる。
一部の実施形態では、システムは、複数の画像タイルのサブセットのみを、教師なし機械学習モデルによるさらなる処理に付すために選択する。例えば、システムは、生検試料を表す所与の画像タイルの部分を決定して、該部分が所定の閾値を超過する場合(例えば、>90%)にのみ画像タイルを入力できる。別の例を挙げるに、システムは、所与の生検の結果もたらされる画像タイルのカウントを決定して、カウントが所定の閾値を超過する場合(例えば、>70タイル)にのみ画像タイルを入力できる。
図4Aは、ブロック202にて用いられる例示的な教師なし機械学習モデルについて示す。図4Aを参照するに、教師なし機械学習モデル404は、入力画像タイル402(例えば、図3Aの画像タイルの1つ)を受信して、出力タイル埋め込み406を提供するように構成されていることができる。タイル埋め込み406は入力画像タイル402(例えば、タイル306-1)の潜在空間内でのベクトル表現とされ得る。入力画像を埋め込みに変換することによって、元のデータのサイズ及び寸法を相当に減じることができる。例を挙げるに、224画素 × 224画素のサイズとされた画像タイルは、2048次元ベクトルに縮減されることができる。より低次元な埋め込みは、後述のように、下流側での処理に用いられることができる。
一部の実施形態では、教師なし機械学習モデル404は、訓練済みの対照学習アルゴリズム(contrastive learning algorithm)である。対照学習とは、どのデータポイントが類似又は別異であるかをモデルに教える(teach)ことによってラベルを伴わずにデータセットの一般的特徴を学習(learn)するのに用いられる機械学習手法を、指す。対照学習モデル(contrastive learning model)は画像データから埋め込みを抽出できるのであって、これはそのようなデータにさもなくば割り当てられてしまいかねないラベルについて線形的に予測的である。適した対照学習モデルは、対照損失を最小化することによって訓練(train)されるのであって、これによって同じサンプル画像の異なる増強結果からの埋め込みの間の類似性が最大化され、且つ、異なるサンプル画像の埋め込みの間の類似性が最小化される。例えば、モデル(例えば、教師なし機械学習モデル404)は、回転、反転、クロッピング、及び/又は色ジッタリングに関して不変となるタイル埋め込みをタイル画像(例えば、入力画像タイル402)から抽出できる。例示的な対照学習モデルとしてはSimCLR及びSwAVが含まれるが、任意の対照学習アルゴリズムを教師なし機械学習モデル404として用い得ることに留意されたい。
入力画像(例えば、入力画像タイル402)を処理するために教師なし機械学習モデル404が用いられる前に、これを訓練しておくことを要する。図4Bは、いくつかの実施形態による、例示的な対照学習アルゴリズムの訓練のためのデータアーキテクチャ450について示す。一部の実施形態では、図4Aの教師なし機械学習モデル404は、図4Bのエンコーダの1つとすることができる(例えば、エンコーダ462a, 462b)。訓練に際しては、元の画像452を取得できる。データ変換又は増強454を元の画像452に対して適用して、ビューイングステージ456にて2つの強化画像458a, 458bを取得できる。例えば、システムは、2つの別個のデータ増強オペレータ(例えば、クロッピング、反転、色ジッタリング、グレースケール、ブラー)を適用して、増強画像458a, 458bを取得できる。一部の実施形態では、2つ以上の画像をもたらし得る。例えば、N回の(類似し得る又は異なり得る)データ増強454を元の画像452に対して施して、N個の増強画像を取得できる。
データアーキテクチャ450はモデル訓練450内にエンコードステージ460を含み得るのであり、各増強画像(例えば、増強画像458a, 458b)はそれぞれ1つのエンコーダ462a, 462bによってエンコードされ得る。各増強画像458a, 458bはエンコーダを通されて、潜在空間にてそれぞれのベクトル表現464a, 464bを取得できる。一部の実施形態では、エンコーダ462a, 462bは共通の重み付けを有している。一部の実施形態では、各エンコーダ462a, 462bはニューラルネットワークとして実装されている。例えば、エンコーダは、残差ニューラルネットワーク(「ResNet」)アーキテクチャのバリアントを用いて実装できる。図示のように、エンコーダ462a, 462bはそれぞれ、ベクトル表現464a(例えば、増強画像458aに基づいてエンコーダ462aによって出力されたhiベクトル)及びベクトル表現464b(例えば、増強画像458bに基づいてエンコーダ462bによって出力されたhjベクトル)を出力する。
ベクトル表現464a, 464bはそれぞれ、投影ヘッド474a, 474bを通されて、2つの投影472a, 472bを取得できる。一部の実施形態では、投影ヘッド474a, 474bは一連の非線形層(例えば、Dense - Reu - Dense層)を備えるのであって、これはベクトル表現に対して非線形変換を適用して投影を取得する。例えば、投影ヘッド474aはdense層466aとReLu層468aとdense層470aとを含み得るのであり、また、投影ヘッド474bはdense層466bとReLu層468bとdense層470bとを含み得る。投影ヘッド474a, 474bのそれぞれは不変特徴を増幅するように構成されていることができ、また、同じ画像の異なる変換を識別することについてのネットワークの能力を最大化する。
訓練に際しては、同じ入力画像(元の画像452)についての投影472a, 472bの間の類似性は最大化されることができる。例えば、投影472a, 472bに基づいて損失が算出され、また、損失に基づいて各エンコーダ462a, 462bを更新して、2つの潜在表現(例えば、表現464a, 464b)の間の類似性を最大化できる。同様に、異なる入力画像の投影間の類似性は、訓練に際して最小化できる。一部の例では、投影間の合致度(即ち、類似性)を最大化するためにシステムは類似性メトリックを余弦類似性として定義できる:
一部の例では、システムは、正規化温度スケールクロスエントロピー損失を最小化することによってネットワークを訓練する:
ここで、τは調整可能な温度パラメータを表し、また、zi, ziはそれぞれ投影472a, 472bに対応する。したがって、訓練450を介して、データアーキテクチャ450のエンコーダ462a, 462bは、入力画像の不変特徴を保全しつつ画像特有特徴(例えば、撮像アングル、解像度、アーチファクト)を最小化するベクトル表現を出力することを学習するように構成されることができる。
図2に戻るに、一部の実施形態では、教師なし機械学習モデル404は、非医用画像を用いて訓練でき、そして、医用画像を処理するのに用い得る(ブロック204)。一部の実施形態では、モデルは先ず非医用画像を用いて訓練されて、そして、いくつかのエポックに亘って医用画像を用いて微調整(例えば、再訓練)されて、そして、入力医用画像を処理するのに用いられ得る(ブロック204)。一部の実施形態では、教師なし機械学習モデル404を微調整するのに用いられる医用画像は、生検1-nからの画像タイルから選択されることができる。換言するに、生検1-nからの画像タイル306-1 306-M1, … , 356-1 356-Mnは、先ずモデルの訓練に用いることができ、そして、訓練済みモデルに入力してタイル埋め込みを取得できる。
タイル埋め込み308-1 308-M1, … , 358-1 358-Mnは、生検レベルで集約できる。集約は、生検内の全タイルに亘ってタイル埋め込みを平均することを伴い得る。図3Aを参照するに、生検1のタイル埋め込み308-1-308-M1を集約して生検埋め込み310を取得できる。同様に、生検nのタイル埋め込み358-1-358-Mnを集約して生検埋め込み360を取得できる。各生検埋め込みは、生検にて反映されている着目疾患との関係での表現型状態に対応する。例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは2048次元ベクトルであり、これは複数の2048次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる(X∈RN×L, N=6,782及びL=2,048)。
一部の実施形態では、さらなる処理前に、生検埋め込み310, 360は正規化されて、そして、埋め込み次元数の平方根の逆数によって再スケーリングされる。正規化によって、説明されるように、生検埋め込みに基づいて適合化された線形予測モデルの性能が向上し得る。
ブロック204では、システムは、線形回帰モデルを用いて複数の埋め込みに対応する複数の予測連続医療診断スコアを取得できる。上述のように、各埋め込みは、画像データに反映されている着目疾患との関係での表現型状態に対応し得るのであり、また、画像データに反映されているリッチなセマンティック情報(例えば、組織の微細構造の特徴)を捉えている場合がある。埋め込みは、画像データについて細かい粒度の疾患関連ラベルを生成するために用いられ得る。例えば、各埋め込みは、着目疾患に関する連続医療診断スコアを予測するために線形モデルによって用いられ得る。予測連続スコアは、図3Aの関連データ304を参照して説明されている生検の割り当て済みスコアに比して優れている。具体的には、予測スコアは、離散的な値ではなく連続的な値をとるのであり(例えば、病理学者によって割り当てられた値(0, 1, 2, 3, 4, 5, 6))、故に病理学者によって割り当てられた離散スコアよりもニュアンスが多く捕捉されることとなる。埋め込み(及び画像データ)に連続的スコアを割り当てる能力は、より高い精密性及び下流側の分析における向上した統計能力をもたらすのであり、例えば示される疾患状態の各々と遺伝的バリアントとの間により緊密な関連を取得し得る。
図3A及び図3Bにて示されている例について述べるに、生検1-nについての生検埋め込みは、線形回帰モデルを生成(例えば、適合化)するために用いられることができ(例えば、埋め込みスコア予測モデル312)、そしてこれは生検1-nについての予測医療診断スコアを生成するために用いられることができる。
一部の実施形態では、線形回帰モデル(例えば、埋め込みスコア予測モデル312)は、入力として埋め込みを受信し及び予測医療診断スコアを出力するように構成されている。一部の実施形態では、線形回帰モデルは線形混合モデル(LMM、linear mixed model)として実装されており、これは固定型効果及びランダム型効果の両方を可能とする単純な線形モデルの拡張版である。線形混合モデルは、後述のように、共変量(例えば、性別、年齢、及び/又は臨床試験群等)について加味しつつ関連検定を行うことを可能とする。
一部の実施形態では、線形回帰モデルは次のものとすることができる:
y=Fb+u+ψ
ここで:
y∈RN×1はN個の個体についての医療診断スコア(例えば、生検レベル線維症スコア)を表す。
F∈RN×KはK個の共変量(例えば、性別、年齢、臨床試験群)についての行列を表す。
b∈RK×1は共変量効果サイズベクトルを表す。該ベクトルは様々なモデルパラメータを含み、また、線形モデルにおける共変量の重みである。具体的には、K個の共変量についてK個の重みがそれぞれある。
u~N(0,σx 2 XXT)は組織学的埋め込みから寄与分をモデリングする。
ψ~N(0,σe 2IN)は残差iidガウスノイズである。
X∈RN×LはL次元のN個の個体についての生検埋め込みの行列である(例えば、L=2048)。
IN∈RN×NはN×N恒等行列を表す。
σx 2及びσe 2はスカラーモデルパラメータである。
一部の実施形態では、システムは、医療診断スコアを予測するために線形回帰モデルについてパラメータを生成する(モデルに関して適合化をなす)。モデルについては、生検データを用いて適合化をなし得るのであり、生検埋め込み及び対応する医療診断スコアが含まれる。図3Aに示されている例では、生検1-nについての生検埋め込みは埋め込みスコア予測モデル312に関して適合化をなすために用いられる。
図5は、医療診断スコアを予測するための例示的な機械学習モデル(例えば、埋め込みスコア予測モデル312)の適合化について示す。一部の実施形態では、機械学習モデルは線形回帰モデルとされ得る。図示のように埋め込みスコア予測モデル504は訓練データ510を用いて適合化され得る。訓練データ510は、生検1-nのデータを備えることができ、これには生検埋め込み(例えば、生検埋め込み310)及び対応する生検レベル割り当て済み医療スコア(medical score)が含まれる。例えば、埋め込みは図3Aを参照して説明されている生検1-nについての生検埋め込みであり、医療診断スコア(medical diagnosis score)は生検1-nについての割り当て済み線維症スコアである(例えば、図3Aの関連データ304, 354の一部として記憶されている)。
例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは2048次元ベクトルとすることができ、これは複数の2048次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる(X∈RN×L, N=6,782及びL=2,048)。行列は機械学習モデル(例えば、線形回帰モデル)を適合化するための入力行列Xとして用いられる。共変量行列たるF∈RN×Kは切片(即ち、全てが1とされる単一の列(K=1))を含む。
機械学習モデルの負対数限界尤度は次のように定めることができる:
f(b,σx 2e 2)=-log N(y; Fb,σx 2XXTe 2 IN),
パラメータはb、σx 2及びσe 2とされる。
b,σx 2e 2についての最大尤度推定器(MLE、Maximum likelihood estimator)は、類似の効率的な手順を用いることによってf(b,σx 2e 2)を最小化することによって取得できる。一部の実施形態では、(i)共分散が対角的である空間にてデータを回転させること(例えば、f(b,σx 2e 2)=-log N(UTy; UTFb,σx 2S+σe 2IN))(XXTの固有値分解がUSUTとして表される)、及び、(ii)f(b,σ2,δ)=-log N(UTy; UTFb,σ2δS+σ2(1-δ)IN)としてモデルを再パラメータ化することによってこれを達成できる。新しい形式では、デルタ(δ)のそれぞれの値についてb,σ2のMLEについて閉形式解を伴うデルタ(δ)に関するグリッド探索を行うことによって最適化を進めることができる。この最適化は演算的にも効率的である。最適化後においては、σx 2及びσe 2のMLEは、MLEたる
として算出できる。
機械学習回帰モデル(例えば、埋め込みスコア予測モデル312, 504)が適合化された後に、予測連続医療診断スコアを取得できる。一部の実施形態では、予測連続医療診断スコアは、生検埋め込みを用いて単一除外(LOO、Leave-one-out)予測として取得できる。単一除外予測では、単一ポイントを除いて全てのデータに対して適合化されたモデル全体を用いるのであり、そして、該ポイントにて予測を立てる。LOOアプローチは演算的に低コストであり、また、予測をより良い結果へと寄せることできる。例えば、予測スコアたるyについてのLOO予測たる
したがって、システムは、生検埋め込み(例えば、生検埋め込み310, 360)から予測された
を取得する。
図3Bを参照するに、埋め込みスコア予測モデル312は、生検1-nについての予測スコアを生成するために用いられることができる。例えば、医療診断スコアは生検レベル線維症スコアとされ得る。生検についての予測スコアは、図3Aの関連データ304を参照して説明されている生検の割り当て済みスコアとは異なる。具体的には、予測スコアは、離散的な値ではなく連続的な値をとるのであり(例えば、病理学者によって割り当てられた値(0, 1, 2, 3, 4, 5, 6))、故により高い精密性及び向上した統計的パワーを下流側での分析にもたらす。
図2に戻るに、ブロック206では、システムは、複数の医療診断スコアを、複数の医用画像の取得元の臨床被験者群によって表現されている複数の候補遺伝的バリアントの各候補遺伝的バリアントと、関連付けることができる(例えば、関連について検定をなす)。これをなすに際して、システムは、特定の候補遺伝的バリアントと着目疾患との間に統計的に有意な関連があるかについて決定する。
一部の実施形態では、複数の医療診断スコアを候補遺伝的バリアントと関連付けるステップは、候補遺伝的バリアントを受信し及び医療診断スコアを出力するように構成されたバリアント特有モデルを生成するステップを含む。例えば、候補遺伝的バリアントが遺伝的バリアントAである場合、システムは、遺伝的バリアントAについて示す値を受信し、及び、予測線維症スコアを出力するように構成されたモデルを生成できる。図3Bに示されている例では、バリアント特有バリアントスコア予測モデル316は、後述のように生成できる。
バリアント特有モデル(例えば、バリアント特有バリアントスコア予測モデル(variant-specific variant-score prediction model)316)は線形回帰モデルとすることができる。一部の実施形態では、線形回帰モデルは次のものとすることができる:
である。
y∈RN×1はN個の個体についての医療診断スコア(例えば、生検レベル線維症スコア)を表す。
X∈RN×1は検査されている遺伝的バリアントの遺伝子型ベクトルを表す。例えば、母集団において2つのアレルを伴う遺伝的バリアントについては、各個体が最低頻度アレルのコピーを0, 1,又は2個有しているかに応じて、遺伝子型ベクトルは0, 1,又は2の値をとる。
F∈RN×KはK個の共変量(例えば、性別、年齢、臨床試験群)についての行列を表す。1つの例示的な実装例では、5つの共変量がある:性別、年齢、及び3つの治療群。Fの第1の列は患者の性別についての二値指標であり(例えば、XX染色体については0であり、XY染色体については1)、第2の列については患者の年齢が含まれ、また、残余の列は3つの治療に関しての二値指標である(例えば、患者が特定の治療を受けた場合には1であり、その余の場合は0)。
図6は、いくつかの実施形態による、医療診断スコアを予測するための例示的なバリアント特有モデルの適合化について示す。図示のようにバリアントスコア予測モデル604は訓練データ610を用いて適合化される。訓練データ610は生検1-nのデータを備えるのであり、これには被験者の遺伝的バリアント値及び対応する予測医療スコアが含まれる。例えば、データには、生検1が行われる被験者の遺伝的バリアント値、及び生検1についての予測線維症スコア等が含まれる。
図3Bに戻るに、示されているように、バリアント特有モデル(variant-specific model)316は、生検1-nについての予測線維症スコアを用いて適合化されることができる。一部の実施形態では、システムは、複数の候補遺伝的バリアントに対応する例えばバリアントスコア予測モデル(variant-score prediction model)316, 322等の複数のバリアント特有モデルについて適合化をなす。例えば、バリアント特有モデル(variant-specific model)316は候補遺伝的バリアントAに関して特有のものとされることができ、候補遺伝的バリアントAについて示す値を受信し及び医療診断スコアを予測するように構成されていることができ、また、バリアントスコア予測モデル(variant-score prediction model)322は候補遺伝的バリアントBに関して特有のものとされることができ、候補遺伝的バリアントBについて示す値を受信し及び医療診断スコアを予測するように構成されていることができる。したがって、システムは、全ての着目遺伝的バリアント(例えば、100,000種、100万種、1,000万種のバリアント、又はバリアントについての他の量)についてバリアント特有モデル(例えば、100,000種、100万種、1,000万種のモデル、又はモデルについての他の量)を生成できる。
ブロック208では、システムは、着目疾患と各候補遺伝的バリアントとの間の相関メトリックを関連に基づいて決定して、少なくとも1つの着目遺伝的バリアントを識別することができる。相関メトリックは、着目疾患に対して候補遺伝的バリアントが及ぼすインパクトについて示す。一部の実施形態では、相関メトリックは、遺伝的バリアントと着目疾患との間での関連について定量化する。図3Bを参照するに、バリアント特有モデル316は、着目疾患と遺伝的バリアントAとの間の相関メトリック318を決定するために用いられることができ(医療診断スコアによって表される)、また、バリアントスコア予測モデル322は、着目疾患と遺伝的バリアントBとの間の相関メトリック324を決定するために用いられること等ができる。したがって、各着目遺伝的バリアントについて相関メトリックを算出できる。
一部の実施形態では、相関メトリックは線形回帰モデル(例えば、バリアントスコモデル(variant-score model)604)のP値である。システムはβ ≠ 0について検定する。P値は標準対数尤度レシオ検定手順にて求めることができ、また、効果サイズ及び標準誤差は古典線形モデル理論にて求めることができる。手順では、被検定バリアントと医療診断スコアとの間の関連についてのP値、バリアントの効果サイズ(線形モデルにおける推定器の重みβ)、標準誤差(モデルからの効果サイズ推定についての誤差)、又は他の情報が戻される。
一部の実施形態では、相関メトリックは1つ以上の所定の閾値と比較されて、着目遺伝的バリアントと着目疾患との間で有意な関連があるかについて決定される。例えば、P値が所定の閾値(例えば、5x10-8)よりも小さい場合、システムは、有意な関連があると決定することができる。一部の実施形態では、システムは、比較に基づいて、着目遺伝的バリアントと着目疾患との間の関係を識別する。一部の実施形態では、関係は因果関係である。識別された関係又は関連は、後述のように診断及び治療や薬剤の開発に活用できる。
図2~6を参照して本明細書にて説明される手法は、単に例示的なものにすぎず、また、類似の手法を任意の着目表現型と共変量との間の関連を発見するために活用できる。図2~6を参照して本明細書にて説明される一部の例について述べるに:表現型データには医用画像が含まれ;着目表現型は着目疾患(例えば、NASH)であり、これは医療診断スコア(例えば、線維症スコア)によって表されることができ;着目共変量は着目遺伝的バリアントである。もっとも、本明細書にて説明される手法は別の着目表現型と別の共変量との間の関連を発見することに関して活用することもできるということに留意されたい。例示的な表現型データとしては次のものが含まれるがこれらには限定されない:医用画像(例えば、MRI、X線、CTスキャン)、病理組織学データ(例えば、H&E染色、トリクローム染色)、臨床バイオマーカデータ(例えば、プロテオミクスやcfDNAを含む血液検査測定値、認知/精神評価スコア、マイクロバイオーム評価等)、又はゲノムバイオマーカデータ(例えば、バルクRNA-seq、メチル化データ、ゲノム配列データ、エピジェネティック配列データ等)。例示的な表現型には次のものが含まれる:着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、トランスクリプトミクス、又はリピドミクス等。例示的な共変量クラスには次のものが含まれる:人口統計情報(例えば、年齢や性別)、臨床共変量(例えば、疾患状態、臨床スコア又は血液バイオマーカ)、ゲノムデータ(例えば、遺伝子データ、発現データ、メチル化データ、等)等。
一部の実施形態では、システムは、比較に基づいて、着目遺伝的バリアントと着目疾患との間の関係を識別する。一部の実施形態では、関係は因果関係である。識別された関係は、新規被験者において着目疾患が発生する尤度について決定するために用いることができ、特定の症状又は他の疾患関連因子の存在をもとに新規被験者に疾患があるかをより高い信頼度を伴って診断できる。また、新規被験者にて遺伝的バリアントが識別された場合、着目疾患についての診断又は予後診断を適宜提供でき、これには疾患がどのように進行することが期待され得るかについての予後診断が含まれ得る。例えば、NASHについて着目遺伝的バリアントが発見された場合、新規被験者についてゲノム検査を行ってバリアントを検出できる。バリアントが存在する場合、システムは、疾患の発現を予測でき、診断を提供でき、及び/又は新規被験者においてどのように疾患が進行し得るかについて予後診断を提供できる。
一部の実施形態では、識別済みの関係は、バイオマーカや疾患介入用の標的の識別に関して用いられ得る。例えば、発病又は進行との関係で因果関係にあると識別された特定の遺伝的バリアントに関しては、治療的介入に関してそれらが適するかをさらに評価できる。また、遺伝的バリアントが着目疾患に対して及ぼす機能的インパクトを考慮して、治療的介入のための追加的な生物学的標的を識別することができる。そのような生物学的標的は、例えば、着目遺伝的バリアントが所在する遺伝子によって転写されるたんぱく質の場合がある。そのような生物学的標的は、着目疾患の少なくとも1つの遺伝的バリアントの機能的インパクトに関して変更、オフセット、緩和、補足や補完するものと見込まれている他の遺伝子、たんぱく質又は代謝産物を含み得る。一部の実施形態では、識別済みの関係は、治療を開発するために用いられ得る。例えば、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療のインパクトを、候補治療に関しての変更型又は類似型の開発に際して、考慮できる。以前施された候補治療の効果に関しての縦型の及びクロスセクショナル型のデータの双方は、着目疾患の予測状態又は進行と比較でき、量的観点から、着目疾患の状態又は進行に関して着目遺伝的バリアントがどの程度まで以前施された候補治療のインパクトに影響を与えるかを決定できる。そのような候補治療に関しての変更型又は類似型については、疾患及びその被験者群との関係での遺伝的バリアントのインパクトを考慮して、強化された治療的効果又は減じられた有害副作用を有するように選択できる。また、遺伝的バリアントを反映している疾患モデルは、治療的候補をスクリーニングするために用いられ得る。例えば、ゲノム特徴との関連付けの場合、統計的に有意な関連付けは新規な候補薬剤標的又は人間の疾患に関与する主要経路の発見につながり得る。同様に、関連付けられている遺伝的バリアントを有する被験者群に以前施された候補治療(candidate therapies)のインパクト(疾患状態に対しての有害なインパクト又は副作用を含む)は、組合せ型治療の開発に用いられ得る。したがって、本明細書にて説明される手法は、異なる遺伝的背景を有する被験者間で治療的候補(therapeutic candidates)に対しての起こるであろう応答を予測するために、特定の治療を受けるべき適切な患者コホートを識別するために、及び結果を最適化するために臨床試験を一般的に設計するために用いることができる。
一部の実施形態では、識別された関係は、治療を選択的に施し、調整し、又は適用するために用いられ得る。一部の実施形態では、識別済みの関係は医学的提案を提供するために用いられ得る。一部の実施形態では、識別済みの関係に基づいてレポートが生成され得る。人口統計及び臨床的な特徴と関連付けられている場合、有意な関連は、新たな関連付けの発見につながったり(例えば、性別、年齢、コレステロール水準等との関連)、及び/又は、データセット内のテクニカルバイアス(例えば、特定の臨床センタとの関連)の探知につながり得る。
図7はいくつかの例による、着目疾患との関係で少なくとも1つの着目遺伝的バリアントを識別するための処理700について示す。処理700は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理700は、クライアント-サーバシステムを使用して実施され、処理700のブロックは、任意の様式において、サーバと1つ以上のクライアントデバイスとの間で分割される。したがって、処理700の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理700はそのように限定されることは要さないことに留意されたい。他の例では、処理700はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理700では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理700と組み合わせて実施されてもよい。故に、図示(および下記により詳細に説明)されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。
図7を参照するに、ブロック702では、例示的なシステム(例えば、1つ以上の電子装置)は、臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは複数の医用画像の1つ以上にて反映されている着目疾患との関係での表現型状態に対応する、ステップをなすように構成されていることができる。
図8Aに示される例示的なワークフローでは、生検1-nがなされている。生検1-nは複数の被験者(例えば、がん患者)及び/又は同じ被験者の複数回の訪問(例えば、スクリーニング訪問回やフォローアップ訪問回)に対応し得る。示されている例では、着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)であり、また、生検はいくつかの臨床試験からのH&E染色肝生検からのものである。各生検(例えば、生検1)は、1つ以上の生検画像(例えば、生検1についての医用画像802)を結果としてもたらす。したがって、生検1-nは、医用画像802、医用画像852等を含む複数の医用画像を結果としてもたらす。
医用画像は、様々なデータと関連付けられることができる。例えば、図8Aを参照するに、データ804は生検1についての医用画像802と関連付けられており、データ854は生検nについての医用画像852と関連付けられており以下同様。後述のように、データは着目疾患及び被験者についての既知情報を含み、着目遺伝的バリアントについての情報も含まれる。
一部の実施形態では、医用画像と関連付けられているデータは、着目疾患に関する割り当て済み医療診断スコアを含み得る。割り当て済み医療診断スコアは、疾患の状態又は進行具合を示し得る。一部の実施形態では、医療診断スコアは、一人以上の病理学者によって割り当てられた生検レベルスコアであることができ、これはそれらの病理学者の生検スライドの検討に基づいている。例えば、NASH疾患については、割り当て済み医療診断スコアはIshak線維症スコア等の生検レベル線維症スコアとされ得るのであり、これは離散値たる0, 1, 2, 3, 4, 5,又は6とされる線維症の程度を示すものである。
一部の実施形態では、医用画像と関連付けられているデータは、生検サンプルの取得元の被験者の遺伝子データを含み得る。例えば、データは、複数の遺伝的バリアントについての被験者遺伝子情報を含み得る(例えば、100,000種、100万種、1,000万種のバリアント)。例えば、データは、被験者が複数の遺伝的バリアントの各々を有するかを示し得る。例えば、母集団において2つのアレルを伴う遺伝的バリアントについては、個体が最低頻度アレルのコピーを0, 1,又は2個有しているかに応じて、医用画像は遺伝的バリアント値(0, 1,又は2)と関連付けられることができる。一部の実施形態では、被験者遺伝子データは、被験者が着目疾患に罹患する尤度を示す多遺伝子リスクスコアとされ得る。
一部の実施形態では、医用画像と関連付けられているデータは、生検サンプルの取得元の被験者の人口統計データを含み得る。人口統計データは例えば、性別、年齢、治療群(例えば、プラセボ、治療x、治療y)、又は他のデータを含み得る。
図8Aを参照するに、医用画像は複数の画像タイルに分割できる。例えば、生検1の医用画像802を分割して画像タイル806-1-806-M1を取得でき、また、生検nの医用画像852を分割して画像タイル856-1-856-Mnを取得できる。一部の実施形態では、画像タイルは、所定のグリッドを用いて医用画像から抽出されて、また、統一されたサイズの画像タイルとして記憶されることができる。1つの例示的実装例では、画像タイルはタイル寸法が192 μm × 192 μmとされる所定のグリッドを用いて抽出され、また、画像タイルは224画素 × 224画素のサイズとされる画像として保存される。一部の実施形態では、画像タイルサイズは動的に構成可能であり、事案毎に調整され得る。
一部の実施形態では、システムは、複数の医用画像を複数の画像タイルに分割し、及び、各画像タイルを教師なし機械学習モデル内へと入力して、対応するタイル埋め込みを取得するように構成されている。図8Aを参照するに、画像タイル806-1-806-M1のそれぞれは(処理Aによって表されている)教師なし機械学習モデルに入力されて、タイル埋め込み808-1-808- M1が取得される。したがって、生検1については、システムが、それぞれが画像タイル806-1-806-M1に対応するタイル埋め込み808-1 - 808-M1を取得できる。同様に、生検nについては、システムが、画像タイル856-1-856-Mnに対応するタイル埋め込み858-1 858-Mnを取得できる。
一部の実施形態では、システムは、複数の画像タイルのサブセットを、教師なし機械学習モデルによるさらなる処理に付すために選択する。例えば、システムは、生検試料を表す所与の画像タイルの部分を決定して、該部分が所定の閾値を超過する場合(例えば、>90%)にのみ画像タイルを入力できる。別の例を挙げるに、システムは、所与の生検の結果もたらされる画像タイルのカウントを決定して、カウントが所定の閾値を超過する場合(例えば、>70タイル)にのみ画像タイルを入力できる。
ブロック702にて用いられる例示的な教師なし機械学習モデルが図4Aに示されており、これについては上述されている。例示的な対照学習アルゴリズムについては図4Bに示されており、これについては上述されている。一部の実施形態では、モデルは、非医用画像を用いて訓練でき、そして、医用画像を処理するのに用い得る(図7:ブロック702)。一部の実施形態では、モデルは先ず非医用画像を用いて訓練されて、そして、いくつかのエポック(例えば、5エポック、10エポック、50エポック、100エポック)に亘って医用画像を用いて微調整(例えば、再訓練)されて、そして、入力医用画像を処理するのに用いられ得る(図7:ブロック702)。一部の実施形態では、モデルを微調整するのに用いられる医用画像は、生検1-nからの画像タイルから選択されることができる。換言するに、生検1-nからの画像タイルは、先ずモデルの訓練に用いることができ、そして、訓練済みモデルに入力してタイル埋め込みを取得できる。
タイル埋め込みは、生検レベルで集約できる。集約は、生検内の全タイルに亘ってタイル埋め込みを平均することを伴い得る。図8Aを参照するに、生検1のタイル埋め込み808-1-808-M1を集約して生検埋め込み810を取得できる。同様に、生検nのタイル埋め込み858-1-858-Mnを集約して生検埋め込み860を取得できる。各生検埋め込みは、生検にて反映されている着目疾患との関係での表現型状態に対応する。例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは2048次元ベクトルであり、これは複数の2048次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる(X∈RN×L, N=6,782及びL=2,048)。一部の実施形態では、生検埋め込みはさらなる処理前に正規化される。例えば、さらなる処理前に、生検埋め込みは正規化されて、そして、埋め込み次元数の平方根の逆数によって再スケーリングされ得る。正規化によって、説明されるように、生検埋め込みに基づいて適合化された予測モデルの性能が向上し得る。
ブロック704では、システムは、複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、組織の微細構造と関連付けられている候補遺伝的バリアントについてのサブセットを識別するように構成されていることができる。特に、遺伝的バリアントと生検埋め込みとの間の関連について評価することによって、システムは、組織学的差異と関連付けられている複数の遺伝的バリアントについてのサブセットを識別できる。本明細書にて説明される手法は、分析を特定の診断スコアに絞ることによっては発見できないであろう組織学に影響を及ぼすバリアントを識別することができる。
一部の実施形態では、関連付けは、複数の候補遺伝的バリアントの各候補遺伝的バリアントについてバリアント特有モデルを生成(例えば、適合化)することと、バリアント特有モデルを評価して、1つ以上の閾値に基づいて遺伝的バリアントと埋め込みとの間に関連があるかを決定することとを伴う。関連がある場合、システムは、さらなる下流側での処理のために、候補遺伝的バリアントを候補遺伝的バリアントのサブセットに含めることができる。システムは、全ての着目遺伝的バリアント(例えば、100,000種、100万種、1,000万種等のバリアント)についてバリアント特有モデル(例えば、100,000種、100万種、1,000万種等のモデル)を生成できる。
図8Bにて示されている例では、生検埋め込みは、バリアントAについて埋め込みバリアントモデル812を、バリアントBについて埋め込みバリアントモデル814を、バリアントZについて埋め込みバリアントモデル816を、生成(例えば、適合化)するために用いられることができる。そして、システムは、各モデルについて相関メトリックを算出することによって各モデルを評価することができる。例えば、システムは、埋め込みバリアントモデル812について相関メトリック822を、埋め込みバリアントモデル814について相関メトリック824を、埋め込みバリアントモデル816について相関メトリック826を算出することができる。各相関メトリックについては、遺伝的バリアントと埋め込みとの間に有意な関連があるかについて決定するために、評価をなすことができる(例えば、所定の閾値との比較)。示されている例では、システムは次のことを決定する:相関メトリック822に基づけばバリアントAと埋め込みとの間には関連が存在すること、相関メトリック826に基づけばバリアントZと埋め込みとの間には関連が存在すること、及び相関メトリック824に基づけばバリアントBと埋め込みとの間には関連が存在していないこと。したがって、システムは、バリアントA及びバリアントZを更なる処理のためにサブセットに含める一方で、バリアントBをサブセットから排除することができる。遺伝的バリアントのサブセット識別することによって、システムは更なる処理のために、医用画像(例えば、生検画像)に示されている組織学的特徴と関連付けられている遺伝的バリアントを識別できる。遺伝的バリアントについてのこのより小さなセットが下流側の分析にて探索されるであり、例えば後述のように各遺伝的バリアントと着目疾患との間の関連を識別する。
一部の実施形態では、バリアント特有モデル(例えば、埋め込みバリアントモデル812, 814, 816)は線形回帰モデルであり、これは、埋め込みを入力として受信し及び遺伝的バリアントについて示す値を出力するように構成されている。一部の実施形態では、前記線形回帰モデルは線形混合モデルとして実装されることができる。
一部の実施形態では、線形回帰モデルは次のものとすることができる:
g=Fb+u+ψ ここで:
g∈RN×1は検査されている遺伝的バリアントの遺伝子型ベクトルを表す。Nは生検画像データ及び遺伝子データの両方が利用可能となっている個体数である。
F∈RN×KはK個の共変量(例えば、性別、年齢、臨床試験群)についての行列を表す。例示的な実装例では、行列は性別、年齢及び3つの治療群についての情報を含む(K = 5)。特に、Fの第1の列は患者の性別についての二値指標であり(患者の染色体がXXの場合には0であり、患者の染色体がXYの場合には1)、第2の列については患者の年齢が含まれ、また、残余の列は3つの治療に関しての二値指標である(患者がその特定の治療を受けた場合には1であり、その余の場合は0)。
X∈RN×LはL次元のN個の個体についての生検埋め込みの入力行列である(例えば、L=2048)。
b∈RK×1は共変量効果サイズベクトルを表す。該ベクトルは様々なモデルパラメータを含み、また、線形モデルにおける共変量の重みである。具体的には、K個の共変量についてK個の重みがそれぞれある。
u~N(0,σx 2 XXT)は組織学的埋め込みから寄与分をモデリングする。
ψ~N(0,σe 2 IN)は残差iidガウスノイズである。
IN∈RN×NはN×N恒等行列を表す。
σx 2及びσe 2はスカラーモデルパラメータである。
一部の実施形態では、システムは、線形回帰モデルについてパラメータを生成する(モデルに関して適合化をなす)。モデルについては、生検データを用いて適合化をなし得るのであり、生検埋め込み(例えば、生検埋め込み810, 860)及び対応する医療診断スコアが含まれる。図8Bに示されている例では、生検1-nについての生検埋め込み810, 860は 埋め込みバリアントモデル812, 814, 816の各々に関して適合化をなすために用いられる。
図9は、例示的な線形回帰モデル(例えば、埋め込みバリアントモデル812)の適合化について示す図示のように埋め込みバリアントモデル904は訓練データ910を用いて適合化され得る。一部の実施形態では、モデル904は線形回帰モデルとされ得る。訓練データ910は、生検1-nのデータを備えることができ、これには生検埋め込み及び対応する遺伝的バリアント値が含まれる。例えば、埋め込みは図8Bを参照して説明されている生検1-nについての生検埋め込み810, 860であり、また、遺伝的バリアント値は生検1-nにて特定の遺伝的バリアント(例えば、バリアントA)について示す値である(例えば、図8Aの関連データ804, 854の一部として記憶されている)。
例示的な実装例では、6,782件の生検は6,782件の生検埋め込みを結果としてもたらす。各生検埋め込みは2048次元ベクトルとすることができ、これは複数の2048次元タイル埋め込みベクトルを平均することによって算出される。このデータは、6,782 × 2,048の行列として表すことができる(X∈RN×L, N=6,782及びL=2,048)。行列は、線形回帰モデルを適合化するための入力行列Xとして用いられる。共変量行列たるF∈RN×Kは切片(即ち、全てが1とされる単一の列(K=1))を含む。
線形回帰モデルの負対数限界尤度は次のように定めることができる:
f(b,σx 2e 2)=-log N(y;Fb,σx 2 XXTe 2 IN)、パラメータはb、σx 2及びσe 2とされる。
b,σx 2e 2についての最大尤度推定器(MLE、Maximum likelihood estimator)は、類似の効率的な手順を用いることによってf(b,σx 2e 2)を最小化することによって取得できる。一部の実施形態では、(i)共分散が対角的である空間にてデータを回転させること(例えば、f(b,σx 2e 2)=-log N(UTy; UT Fb,σx 2 S+σe 2 IN))(XXTの固有値分解がUSUTとして表される)、及び、(ii)f(b,σ2,δ)=-log N(UT y; UT Fb,σ2 δS+σ2 (1-δ)IN)としてモデルを再パラメータ化することによってこれを達成できる。新しい形式では、デルタ(δ)のそれぞれの値についてb,σ2のMLEについて閉形式解を伴うデルタ(δ)に関するグリッド探索を行うことによって最適化を進めることができる。この最適化は演算的にも効率的である。最適化後においては、σx 2及びσe 2のMLEは、MLEたる
として算出できる。
バリアント特有モデル(例えば、埋め込みバリアントモデル812, 814, 816)が適合化された後、各適合済みモデルは、対応する遺伝的バリアントと埋め込みとの間に関連があるかについて決定するために評価される。一部の実施形態では、バリアント特有モデルを評価するステップは、バリアント特有モデルに基づいて相関メトリックを算出すること及び相関メトリックを所定の閾値と比較することを含む。
一部の実施形態では、前記相関メトリックは前記バリアント特有モデルと関連付けられているP値である。P値は順列手順を介して取得できるのであって、実データからの対数尤度レシオ(LLR、log likelihood ratio)統計が、埋め込み行列内にて個体についての置換がなされる際に取得されたLLRと、比較される(nullモデルからのLLR)。一部の実施形態では、P値は、実データLLRより大きな並べ替えLLRの画分として定義される。
例えば、各遺伝的バリアントについて、バリアント特有モデルはXの行についてのK個の順列に関して適合化できる。各遺伝的バリアントについて、この手順は、K個のLLRをもたらす。特に、実データを用いてバリアント特有モデルの適合化をなすと、1つのLLRが結果としてもたらされ得る。バリアント特有モデルを、Xの行についてのK個の順列に関して適合化すると、K個のLLRが結果としてもたらされ得る。各遺伝的バリアントについて、P値は、実データからのLLRが結果より大きなK個のLLRの画分である。
各遺伝的バリアントについての相関メトリックは所定の閾値に対して比較されて、遺伝的バリアントと埋め込みとの間に関連があるかを決定できる。一部の実施形態では、閾値は5×10-8に設定できる。例えば、閾値未満のP値を伴うバリアントについては、埋め込みと関連付けられているものと決定される。示されている例では、システムは、次のことについて決定するように構成されていることができる:相関メトリック822に基づけばバリアントAと埋め込みとの間には関連が存在すること、相関メトリック826に基づけばバリアントZと埋め込みとの間には関連が存在すること、及び相関メトリック824に基づけばバリアントBと埋め込みとの間には関連が存在していないこと。したがって、システムは、バリアントA及びバリアントZを更なる処理のためにサブセットに含める一方で、バリアントBをサブセットから排除する。
ブロック706では、システムは、候補遺伝的バリアントのサブセットの各候補遺伝的バリアントを着目疾患と関連付けて少なくとも1つの着目遺伝的バリアントを識別する。これをなすに際して、システムは、特定の遺伝的バリアントと着目疾患との間に統計的に有意な関連があるかについて決定する。識別された着目遺伝的バリアントは、組織学及び着目疾患の両方と関連付けられる。
一部の実施形態では、遺伝的バリアントを着目疾患と関連付けることは、遺伝的バリアント値を受信し、及び、着目疾患に関する医療診断スコアを出力するように構成されたバリアント特有スコア予測モデルを生成(例えば、適合化)することを伴う。例えば、検査される遺伝的バリアントが遺伝的バリアントAである場合、システムは、遺伝的バリアントAについて示す値を受信し、及び、予測医療診断スコアを出力するように構成されたモデルを生成できる。図8Bを参照するに:バリアントAについてはバリアント特有スコア予測モデル832が生成でき;バリアントZについてはバリアント特有スコア予測モデル836が生成できる。バリアントBについてはバリアント特有スコア予測モデルが生成されないことができる。なぜならば、バリアントBについての相関メトリック824が所定の閾値を超過する故にバリアントBを更なる処理から排除できるからである。
バリアントスコアモデル(例えば、バリアント特有スコア予測モデル832)は線形回帰モデルとすることができる。一部の実施形態では、線形回帰モデルは次のものとすることができる:
y=Fb+xβ+ψ
ここで、ψ~N(0,σe 2 IN)である。
y∈RN×1はN個の個体についての医療診断スコア(例えば、生検レベル線維症スコア)を表す。
X∈RN×1は検査されている遺伝的バリアントの遺伝子型ベクトルを表す。例えば、母集団において2つのアレルを伴う遺伝的バリアントについては、各個体が最低頻度アレルのコピーを0, 1,又は2個有しているかに応じて、遺伝子型ベクトルは0, 1,又は2の値をとる。
F∈RN×KはK個の共変量(例えば、性別、年齢、臨床試験群)についての行列を表す。1つの例示的な実装例では、5つの共変量がある:性別、年齢、及び3つの治療群。Fの第1の列は患者の性別についての二値指標であり(例えば、患者の染色体がXXの場合には0であり、また、患者の染色体がXYの場合には1)、第2の列については患者の年齢が含まれ、また、残余の列は3つの治療に関しての二値指標である(例えば、患者がその特定の治療を受けた場合には1であり、その余の場合は0)。例示的なバリアント特有スコア予測モデルについての適合化は図6を参照して説明されている。
バリアント特有スコア予測モデルが適合化された後、システムは、着目疾患と着目遺伝的バリアントとの間の相関メトリックを決定できる。相関メトリックは、着目疾患に対して着目遺伝的バリアントが及ぼすインパクトについて示す。図8Bを参照するに、バリアント特有スコア予測モデル(variant-specific score prediction model)832は、着目疾患(医療診断スコアによって表される)と遺伝的バリアントAとの間の相関メトリック842を決定するために用いられることができ、また、バリアントスコアモデル(variant-score model)836は、着目疾患と遺伝的バリアントZとの間の相関メトリック846を決定するために用いられること等ができる。したがって、候補遺伝的バリアントのサブセット内の各着目遺伝的バリアントについて、相関メトリックが算出される。
一部の実施形態では、相関メトリックは線形回帰モデルのP値である。システムはβ ≠ 0について検定する。P値は標準対数尤度レシオ検定手順にて求めることができ、また、効果サイズ及び標準誤差は古典線形モデル理論にて求められる。手順では、被検定バリアントと医療診断スコアとの間の関連についてのP値、バリアントの効果サイズ(線形モデルにおける推定器の重みβ)及び標準誤差(モデルからの効果サイズ推定についての誤差)。
一部の実施形態では、相関メトリックは1つ以上の所定の閾値と比較されて、着目遺伝的バリアントと着目疾患との間で有意な関連があるかについて決定される。例えば、P値が所定の閾値(例えば、5x10-8)よりも小さい場合、システムは、有意な関連があると決定する。一部の実施形態では、システムは、比較に基づいて、着目遺伝的バリアントと着目疾患との間の関係を識別できる。一部の実施形態では、関係は因果関係である。識別された関係又は関連は、説明されるように診断及び治療や薬剤の開発に活用できる。例えば、図16~24を参照して説明されているように、システムが1つのデータセット(例えば、第1の臨床試験からの画像)から生成された埋め込みをもって、これを同じ予測的効果を伴って別のデータセットからの画像及び関連する遺伝的バリアントデータ(例えば、第2の臨床試験からの画像及び関連する遺伝的バリアント)に適用できるという意味でシステムは堅牢である。
図7に戻るに、システムは、識別済み着目ジェネリックについての組織学的効果について可視化するためのシミュレーション画像を生成できる。この手順によって、これによらずにしては病理スコアについての関連研究によって検出ができないであろう関連する組織学的な変化についての可視化表示がもたらされる。特に、ブロック708では、システムは、着目疾患を表す複数のシミュレーション画像を生成するように構成されていることができる。複数のシミュレーション画像は、後述のように、少なくとも1つの着目遺伝的バリアントの異なる値に対応する。
一部の実施形態では、システムは、訓練済み生成的モデルを用いてシミュレーション画像の形式で予測画像を生成するように構成されていることができる。一部の実施形態では、訓練済み生成的モデルは敵対的生成ネットワーク(GAN)モデルである。図10は、いくつかの実施形態による、例示的なGANモデル1004について示す。一部の実施形態では、GANモデル1004は、訓練済み生成器コンポーネント1004aと訓練済み判別器コンポーネント1004bとを備え得る。訓練済み生成器コンポーネント1004aは、埋め込み(例えば、埋め込み1002-1 - 1002-k)とノイズ(不図示)とを受信し、及び、シミュレーション画像(例えば、シミュレーション画像1006-1 - 1006-k)を出力するように構成されていることができる。図10に示されているように、訓練済み生成器コンポーネント1004aは、埋め込み1002-1を受信してシミュレーション画像1006-1を出力し、埋め込み1002-2を受信してシミュレーション画像1006-2を出力し、以後同様にし、埋め込み1002-kを受信してシミュレーション画像1006-kを出力できる。
一部の実施形態では、埋め込み1002-1-1002-kを生成するために、システムは、埋め込みを受信し及び着目疾患に関連する医療診断スコアを出力するように構成されたモデルを生成(適合化)できる。一部の実施形態では、モデルは図8の埋め込みバリアントモデル812等の線形回帰モデルである。そして、モデルは医療診断スコアを予測するために用いられ得る。例えば、各タイル埋め込み(例えば、タイル埋め込み808-1 - 808-M1)は、線形回帰モデル内へと入力されて(input into)、タイルレベル医療診断スコアを生成できる。生検1-nからのタイル埋め込みは、線形回帰モデルへと入力されて(input to)、タイルレベル医療診断スコアのセットを生成できる。システムは、第1~5パーセンタイルに属する対応する医療診断スコアを有する第1のタイル埋め込み群と、第95~99パーセンタイルに属する対応する医療診断スコアを有する第2のタイル埋め込み群とを識別することができる。第1の平均埋め込みは第1の埋め込み群を集約すること(併せてその平均をもとること)によって生成でき、また、第2の平均埋め込みは第2の埋め込み群を集約すること(併せてその平均をもとること)によって生成できる。そして、システムは、2つの平均埋め込み間で線形補間をなして埋め込み1-kを取得できる。埋め込み1002-1-1002-kに対応するシミュレーション画像1006-1 - 1006-kは、着目疾患の進行と関連付けられている組織学的効果について示すことができる。
一部の実施形態では、埋め込み1002-1-1002-kを生成するために、システムは、埋め込みを受信し及び着目遺伝的バリアント(例えば、図2及び図7にて識別されている着目遺伝的バリアント)の値を出力するように構成されたモデルを生成(適合化)できる。遺伝的バリアント値は着目遺伝的バリアントについての遺伝子型情報について示す(例えば、個体がその遺伝子座にてマイナーアレルのコピーを0, 1,又は2個有している場合)。一部の実施形態では、モデルは、図3Aの埋め込みスコア予測モデル312と類似の線形回帰モデルである。そして、モデルは着目遺伝的バリアントの値を予測するために用いられ得る。例えば、各タイル埋め込み(例えば、タイル埋め込み808)は、線形回帰モデルへと入力されて、タイルレベル遺伝的バリアント値を生成できる。生検1-nからのタイル埋め込みは、線形回帰モデルへと入力されて、タイルレベル医療診断スコアのセットを生成できる。システムは、第1~5パーセンタイルに属する対応する遺伝的バリアント値を有する第1のタイル埋め込み群と、第95~99パーセンタイルに属する対応する遺伝的バリアント値を有する第2のタイル埋め込み群とを識別することができる。第1の平均埋め込みは第1の埋め込み群を集約すること(例えば、その平均をとること)によって生成でき、また、第2の平均埋め込みは第2の埋め込み群を集約すること(例えば、その平均をとること)によって生成できる。そして、システムは、2つの平均埋め込み間で線形補間をなして埋め込み1-kを取得できる。埋め込み1-kに対応するシミュレーション画像は、着目遺伝的バリアントと関連付けられている組織学的効果について示すことができる。
一部の実施形態では、GANモデルは条件付きGANモデルである。例えば、生成器は、埋め込みを条件として及びノイズを受信し、並びにシミュレーション画像を出力するように構成されていることができる。判別器は、シミュレーション画像又は現実画像とされ得る入力画像を受信し、及び入力画像をシミュレーション又は現実のものと分類するように構成されていることができる。訓練に際して、生成器はシミュレーション画像を生成し、また、シミュレーション画像及び現実の画像は判別器に分類のために提供される。判別器の出力に基づいて、生成器及び判別器は適宜更新して損失を最小化できる。一部の実施形態では、生成器及び判別器はニューラルネットワークである。
一部の実施形態では、GANモデルは、プログレッシブGAN(pGAN)モデルを元に構築される。pGANモデルは次第に増加する画像解像度を伴ってプログレッシブな態様で訓練されて、訓練は安定化されまたモード崩壊が妨げられる。システムはプログレッシブ条件付きGAN(pcGAN)モデルにも拡張されるのであって、本明細書にて説明された医用画像に基づいて生成された埋め込みに対しての条件付けを可能とする。特に、生成器は、(条件としての)埋め込みx及び標準的な正規分布からサンプリングされたノイズベクトルuを受信するように構成されていることができる。また、判別器は生成された及び現実の画像並びに対応する埋め込みを受信する。図11は、いくつかの実施形態による、シミュレーション画像処理の生成について示す。示されているように、生成器1104は、埋め込み1102及びノイズベクトル1108を受信し及び画像1106を出力できる。さらに、同じ埋め込み及び異なるノイズが提供された場合、異なるシミュレーション画像が生成され得る。特に、各生成器1104が同じ埋め込み1102を受信するも異なるノイズベクトル1108を受信した場合、同じセマンティック生物学的内容を伴うが異なるシミュレーション画像が生成され得る。したがって、埋め込みは複数の画像として可視化でき、埋め込みと関連付けられている組織学的特徴についての識別及び理解が促進される。
1つの例示的な実装例では、埋め込み1102は2048次元の埋め込みであり、ノイズベクトル1108は標準的な正規分布からサンプリングされた512次元のベクトルである。埋め込み1102とノイズベクトル1108とは512次元ベクトルtに組み合わされることができ、これがpGAN生成器の入力とされる。判別器は、画像iに加えて、(条件としての)埋め込みx(埋め込み1102等)を、入力として受信するように構成されていることができる。この追加によって、判別器は、入力埋め込みとの一貫性にも基づいて、現実の及び虚構の画像を分類できるようになる。例示的な実装例では、埋め込みは2048次元埋め込みであり、また、画像は256x256の画像である。
例示的な実装例では、pcGANモデルは、先ずタイル画像及び対応する埋め込みについてpGANと同じパラメータが用いられて訓練される。訓練後は、pcGANモデルの生成器は、入力として、2048次元の埋め込みと標準的な正規分布からサンプリングされた512次元のベクトルとを受信し及び256 x 256のシミュレーションタイル画像(その内容は入力埋め込みと一貫している)を出力できる。正規分布からサンプリングされた512次元のノイズベクトル1108を与えられた場合、システムはpcGANを用いてk個の画像を生成できるのであって、入力としてはそれぞれのk個の補間埋め込み及びサンプリングされたノイズベクトル1108からのノイズが与えられる。したがって、この手順では、着目共変量(被分析生検についてのベクトル)、生検埋め込み(分析済み生検が行とされ、また、埋め込み次元が列とされる行列)、及びタイル埋め込み(対応するタイルが行とされ、また、埋め込み次元が列とされる行列)が入力として受け付けられて、また、一連のk 256x256タイル画像が出力され得る。
ブロック710では、システムは、ディスプレイ上で複数のシミュレーション画像1106を表示する(又は表示させる)ように構成されていることができる。ディスプレイは、例えば、コンピューティング装置等のユーザ装置(例えば、図29のコンピューティング装置2900)のディスプレイスクリーンに対応し得る。一部の実施形態では、予測シミュレーション画像1106は、組織学的変化についてのアニメーションを作成するために用いられ得る。図11に示されるようにGANへの入力として正規分布からの異なる512次元サンプルを提供することによって、複数のアニメーションが同じ着目共変量について作成され得る。一部の実施形態では、同じ予測シミュレーション画像1106のシリーズからの画像に関しては同じサンプルが用いられる。一部の実施形態では、予測シミュレーション画像はランキングされる。表示されるシミュレーション画像は予測シミュレーション画像の一部又は全部を含み得るのであり、また、ランキングに基づいて予測シミュレーション画像から選択されることができる。一部の実施形態では、ランキングは対応する医療診断スコアに基づいていることができる。例えば、予測シミュレーション画像は、その予測シミュレーション画像の演算医療診断スコアに基づいてランキングされることができる(埋め込みに基づいて決定できる)。一部の実施形態では、表示されるべき予測シミュレーション画像は、それらの対応する医療診断スコアに基づいて選択されることができる。例えば、低位線維症に対応する予測タイルを表し得る、第1~5パーセンタイルに属する医療診断スコアを有する予測シミュレーション画像は、ユーザインタフェースでの表示のために選択されるかそこで表示されることができる。別の例を挙げるに、高位線維症に対応する予測タイルを表し得る、第95~99パーセンタイルに属する医療診断スコアを有する予測シミュレーション画像は、表示のために選択されるかそこで表示されることができる。予測シミュレーション画像を選択するためには別のパーセンタイル範囲を用いることもでき、先述の範囲は例示に過ぎない。
図12Aは、いくつかの実施形態による、増大する線維症スコアを可視化するための予測画像タイルについての例示的なセット及び3つの予測シミュレーション画像を伴う例示的なシリーズについて示す。上述のように、システムは、第1~5パーセンタイルに属する対応する医療診断スコアを有する第1の画像タイル埋め込み群1202を識別することができるのであり、それによって低位線維症に対応する予測タイルを識別できる。また、システムは、第95~99パーセンタイルに属する対応する医療診断スコアを有する第2の画像タイル埋め込み群1204をも識別することができるのであり、それによって高位線維症に対応する予測タイルを識別できる。システムは、第1のタイル埋め込み群についての第1の平均埋め込み及び第2のタイル埋め込み群についての第2の平均埋め込みを取得することができる。線形補間を行ってk個の埋め込みを取得できる。例えば、k = 3である場合、システムは次のように3つの埋め込みを取得できる:第1の埋め込み(例えば、第1の平均埋め込み)、第2の埋め込み(例えば、第1の埋め込み及び第3の埋め込みの平均)、及び第3の埋め込み(例えば、第2の平均埋め込み)。3つの埋め込みは生成器に入力することができるのであり、線維症スコアの増大に関連する組織学的変化を可視化するための一連の画像1206を取得できる。
図12Bは、いくつかの実施形態による、増大するPNPLA3タイルスコアを可視化するための予測画像タイル1252, 1254についての例示的なセット及び3つのシミュレーション画像1256を伴う例示的なシリーズについて示す。画像1256は、一部の実施形態では、図12Aとの関連でせつめいされたのと類似の手法を用いて取得できる。
一部の実施形態では、複数の予測シミュレーション画像はランキングされる。ランキングは、線維症スコアや他の尺度に基づいていることができる。一部の実施形態では、複数の予測シミュレーション画像の一部又は全部を表示することができる。複数の予測シミュレーション画像のサブセット(又は全部)はランキングに基づいて選択されることができ、また、予測シミュレーション画像はランキングに基づいて表示のために選択されることができる。
図13では次のものが示されており、これらは本明細書にて説明される手法を用いて生成されている:脂肪症スコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像1302;小葉内炎症スコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像1304;バルーニングスコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像1306;及び線維症スコアと関連付けられている組織学的効果について可視化するための一連の例示的な予測シミュレーション画像1308。一部の実施形態では、可視化画像タイル(例えば、画像1302-1308)は、特定の表現型について低スコアを有すると予測されるタイルに対応し得る。
図14は、いくつかの実施形態による、医療診断スコアを予測するように構成された様々な線形モデルの性能について示す。示されているように、5つのモデルは次のことをなすように訓練されている:線維症スコアの予測;脂肪症スコアの予測;小葉内炎症スコアの予測;及び肝細胞バルーニングスコアの予測。各スコアタイプについて、バーの色は、凡例の色の順序と同じ順序にされる。
初めの4つのモデルは図3Aの埋め込みスコア予測モデル312についての例である。事前訓練済みモデルは、事前訓練済みの対照モデル(例えば、SimCLR)によって生成された埋め込みに基づいて適合化された線形モデルを指す。事前訓練済み対照モデルは、同じ画像ドメイン内の画像(例えば、肝生検画像)を用いて微調整されていない(has not been fine-tuned)。事前訓練済み正規化済みモデルは、事前訓練済みの対照モデルによって生成され且つ正規化された埋め込みに基づいて適合化された線形モデルを指す。一部の実施形態では、埋め込みは正規化されて、そして、埋め込み次元数の平方根の逆数によって再スケーリングされる。微調整済みモデルは、微調整済みの対照モデル(例えば、SimCLR)によって生成された埋め込みに基づいて適合化された線形モデルを指す。微調整済み対照モデルは、同じ画像ドメイン内の画像(例えば、肝生検画像)を用いて再訓練されている(has been re-trained)。微調整済み正規化済みモデルは、微調整済みの対照モデルによって生成され且つ正規化された埋め込みに基づいて適合化された線形モデルを指す。
他方で、教師ありモデル(例えば、Yr1)は、画像データを受信し及び医療診断スコアを予測するように構成された非線形機械学習モデル(例えば、ニューラルネットワーク)を指す。始めの4つのモデル等の線形回帰モデルは、訓練及び適用に関しては教師ありモデルに比してより演算的に効率的である。図14にて示されているように、埋め込みに基づいて生成された線形モデルは、教師あり機械学習モデルのそれと同様の又はそれより優位な予測力を提供できるのであり、その一方では訓練及び適用に関しては格段に少ないリソース及び時間要求で済む。
図15Aは、研究、サイト、及び病理スコア効果を伴うバリアントコンポーネントモデル1502について示す。示されているように、プロット1504によれば、バリアントコンポーネントモデル1502によっては埋め込みの分散の34%しか説明できない。図15Bは、サイト及び研究影響について調整がなされる埋め込みについての全ゲノム的関連研究(GWAS、genome-wide association study)プロット1506について示す。示されているように、GWASプロット1506は、ベースライン埋め込みと関連付けられている3つのミスセンスバリアントを識別する。バリアントのサブセットについては、説明されているようにさらに分析できる。
図15Bのプロット1508にて示されるように、組織学的分析を通じて優先順序が設けられた遺伝的バリアントについては、利用可能なエンドポイントと関連付けて関連する生物学事項についての知見を得ることができる。例えば、PNPLA3 rs738409における主位バリアントについてのPheWASによって、ベースライン血液バイオマーカ及びRNA-seqに対しての効果が識別されるも、病理又は連続NASHスコアについてはそうならない。図15Cでは、PNPLA3 rs738409における主位バリアントについてのPheWASによっていくつかの血液バイオマーカ及び発現経路に対しての効果が識別されることを示すプロット1510が示されている。さらに、rs738409は組織学的疾患ラベルと関連付けられていないものとみられる。したがって、臨床試験データにおけるPheWASは、発見された遺伝的効果の解釈をサポートすることになる。
図16,20,22,24は、縦型の研究(例えば、治療効果のそれ)に向けられた手法について示す。当業者ならば、本明細書にて説明される縦型の研究では、本明細書にて説明されたベースライン分析のための様々な手法(訓練済みのモデル及びシステムを含む)が活用されていることと理解されるであろう。例えば、入力として特定の被験者について縦型の進行埋め込みを受信し及びプラセボ対治療の決定を出力するシステムは(例えば、DRP分類モデル1730)、着目コバリアント(例えば、遺伝的バリアント)に基づいて疾患の状態又は進行について予測するように以前訓練されたシステムに基づいていることができる。
図16は、いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な方法について示す。処理1600では、疾患の進行は、進行埋め込みを用いて定量化される。システムは、進行埋め込みを入力として受信しプラセボ又は治療を示す分類結果を出力するモデルからの予測として、薬剤応答表現型(DRP)として帰属させることができる。システムは、DRPと治療との間に有意な関連があるかについて決定できる。有意な関連がある場合、下流側の分析において治療をさらに分析できる(例えば、後述図20との関係でさらに説明されている)。
処理1600は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理1600は、クライアント-サーバシステムを使用して実施され、処理1600のブロックは、任意の様式において、サーバと1つ以上のクライアントデバイスとの間で分割される。したがって、処理1600の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理1600はそのように限定されることは要さないことに留意されたい。他の例では、処理1600はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理1600では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理1600と組み合わせて実施されてもよい。故に、図示(および下記により詳細に説明)されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。
ブロック1602では、例示的なシステム(例えば、1つ以上の電子装置)は、プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ画像と、プラセボ群にプラセボが施された後に撮像された被験者プラセボ群についての複数のフォローアッププラセボ画像とを取得するように構成されていることができる。図17は、いくつかの実施形態による、着目疾患との関係で治療を評価するための例示的な処理について示す。図示のように、システムは、プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ医用画像1702を取得する。システムはさらに、プラセボ群にプラセボが施された後に撮像された被験者プラセボ群についての複数のフォローアッププラセボ医用画像1704を取得する。
ブロック1604では、システムは、複数のベースラインプラセボ画像及び複数のフォローアッププラセボ画像に基づいて複数のプラセボ進行埋め込みを取得するように構成されていることができる。図17を参照するに、システムは、複数のベースラインプラセボ埋め込み1712と複数のフォローアッププラセボ埋め込み1714とを取得できる。一部の実施形態では、ベースラインプラセボ埋め込み1712はベースラインプラセボ画像1702に基づいて取得でき、また、フォローアッププラセボ埋め込み1714はフォローアッププラセボ画像1704に基づいて取得できる。埋め込み1712, 1714に基づいて、システムはプラセボ進行埋め込み1722を取得することができる。
図18A~Bは、いくつかの実施形態による、例示的な進行埋め込み生成について示す。図18Aに示されているように、システムは、複数のベースラインプラセボ画像1804を訓練済み教師なし機械学習モデル(不図示)内へと入力して潜在空間内での複数のベースラインプラセボ埋め込み1812を取得できる。同様に、システムは、複数のフォローアッププラセボ画像1806を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のフォローアッププラセボ埋め込み1814を取得できる。一部の実施形態では、システムは、複数のベースライン治療画像1808を訓練済み教師なし機械学習モデル(不図示)内へと入力して潜在空間内での複数のベースライン治療埋め込み1816を取得できる。さらに、一部の実施形態では、システムは、複数のフォローアップ治療画像1810を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のフォローアップ治療埋め込み1818を取得できる。一部の実施形態では、教師なし機械学習モデルは対照モデルであり、これは図4A~Bを参照して説明されたモデルと類似する。一部の実施形態では、前記対照モデルはSimCLRモデルである。一部の実施形態では、教師なし機械学習モデルは、図8A~8B及び関連図面との関係で説明されたものに沿う態様で設計及び訓練されたシステムである。
そして、図18Bに示されているように、システムは、ベースラインプラセボ埋め込み1812を訓練済み機械学習モデル1850内へと入力して、潜在空間にて複数の予測フォローアッププラセボ埋め込み1854を取得できる。そして、システムは、フォローアッププラセボ埋め込み1814と予測フォローアッププラセボ埋め込み1854との間の差を算出することによって複数のプラセボ進行埋め込み1856を決定できる。一部の実施形態では、プラセボ群内の患者について、システムは、患者のフォローアッププラセボ埋め込みと患者の予測フォローアッププラセボ埋め込みとの間で減算を行って、患者のプラセボ進行埋め込みを取得する。
図18Cは、いくつかの実施形態による、例示的な進行埋め込み生成について示す。一部の実施形態では、各予測フォローアップ埋め込みは、図8A~8B及び関連図面との関係で説明されたものに沿う態様で設計及び訓練されたシステムによって以前評価された着目コバリアントに関して、患者がそれを有するかそれと関連付けられているかを考慮する。
同様に、図18Dにて示されているように、システムは、複数のベースライン治療埋め込み1816を訓練済み機械学習モデル1850内へと入力して、潜在空間にて複数の予測フォローアップ治療埋め込み1858を取得できる。そして、システムは、フォローアップ治療埋め込み1818と予測フォローアップ治療埋め込み1858との間の差を算出することによって複数の治療進行埋め込み1860を決定できる。一部の実施形態では、治療群内の患者について、システムは、患者のフォローアップ治療埋め込みと患者の予測フォローアップ治療埋め込みとの間で減算を行って、患者の治療進行埋め込みを取得する。
一部の実施形態では、訓練済み機械学習モデル1850は、ベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている。一部の実施形態では、訓練済み線形モデルは線形混合モデルであり、これは本明細書にて説明された他の線形混合モデルに類似している。図19は、いくつかの実施形態による、訓練済み機械学習モデル1850についての例示的な訓練処理について示す図である。示されているように、訓練済み機械学習モデル1850は、訓練データ1960を用いて訓練されるのであり、これはプラセボデータを含み得る。一部の実施形態では、訓練データ1960は、図18A~Bにて分析されているものとは異なるプラセボ群から取得される。
ブロック1606では、システムは、治療群に治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像と、治療群に治療が施された後に撮像された被験者治療群についての複数のフォローアップ治療画像とを取得できる。図17を参照するに、システムは、治療群に治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像1706と、治療群に治療が施された後に撮像された被験者治療群についての複数のフォローアップ治療画像1708とを取得できる。
ブロック1608では、システムは、複数のベースライン治療画像及び複数のフォローアップ治療画像に基づいて複数の治療進行埋め込みを取得できる。例えば、図17を参照するに、システムは、複数のベースライン治療埋め込み1716と複数のフォローアップ治療埋め込み1718とを取得する。一部の実施形態では、ベースライン治療埋め込み1716はベースライン治療画像1706に基づいて取得され、また、フォローアップ治療埋め込み1718はフォローアップ治療画像1708に基づいて取得される。埋め込み1716及び1718に基づいて、システムは治療進行埋め込み1726を取得することができる。進行埋め込みの生成は、図18A~Cを参照して説明されている。
ブロック1610では、システムは、複数の治療進行埋め込みに基づいて患者がプラセボ又は治療を受けたのかを決定するための分類モデルを生成できるのであって、分類モデルの出力は薬物反応組織学的表現型(DRP)について示す。図17を参照するに、システムは、プラセボ進行埋め込み1722と治療進行埋め込み1726とに基づいてDRP分類モデル1730を生成する。一部の実施形態では、分類モデル(例えば、DRP分類モデル1730)は、入力進行埋め込みを受信し、また、プラセボ又は治療を患者が受けたのかを示す分類結果を出力するように構成されている。分類モデルは、例えば、ロジスティック回帰モデル、人工ニューラルネットワークモデル、ランダムフォレストモデル、ナイーブなベイジアンモデル等として実装できる。
ブロック1612では、システムは、分類モデルに基づいて治療と着目疾患との間の相関メトリック1732を決定するように構成されていることができる。相関メトリック1732は、治療と着目疾患の進行とが有意な程に関連付けられているかを示し得る。一部の実施形態では、相関メトリック1732はP値である。
一部の実施形態では、システムは相関メトリック1732を所定の閾値と比較するように構成されていることができる。一部の実施形態では、システムは、比較に基づいて、治療A1734と関連付けられている特徴について関連分析をさらになすように構成されていることができる。
一部の実施形態では、システムは、関連に基づいて新規被験者について治療(例えば、画像1706, 1708と関連付けられている被験者についてなされた治療)を処方するように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して処方できる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して処方されないこととし得る。
一部の実施形態では、システムは、関連に基づいて治療を施すように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して施すことができる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して施さないこととし得る。
一部の実施形態では、システムは、関連に基づいて治療を調整するように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、治療を増加させ得る。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、治療を減じるか停止できる。
一部の実施形態では、システムは、関連に基づいて医学的提案を提供するように構成されていることができる。一部の実施形態では、システムは、関連に基づいてレポートを生成するように構成されていることができる。一部の実施形態では、治療と着目疾患の進行とが有意な程に関連付けられている場合、例えば図21にて説明されているように、システムでは治療についてさらに研究できる。
一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である。
例示的な実装例では、2つの臨床試験が行われている。より小規模な臨床試験では、ベースライン及びフォローアップ肝生検画像データ並びに画像データと関連付けられている病理学者によって割り当てられたスコアが取得される。特に、より小規模な臨床試験はNASH Ph2治験であり、サンプル数は約380であり、また、肝生検画像データはベースライン及び48週フォローアップにて取得される。より大規模な臨床試験では、アライン済みのベースライン及びフォローアップ肝生検画像データ並びに関連付けられている病理学スコアが取得される。特に、より大規模な臨床試験は2つのNASH Ph3治験であり、サンプル数は約1,600であり、また、肝生検画像データはベースライン及び48週フォローアップにて取得される。
そして、システムは教師なし学習手順を介して全てのH&E染色肝生検画像(例えば、図17のベースラインプラセボ埋め込み1712、フォローアッププラセボ埋め込み1714、ベースライン治療埋め込み1716、及びフォローアップ治療埋め込み1718)から生検埋め込みを取得する。
さらにシステムは、進行埋め込み(例えば、プラセボ進行埋め込み1722、治療進行埋め込み1726)を取得する。先ず、システムは、表現型予測モデル(例えば、訓練済み機械学習モデル1850)を訓練して、ベースライン時の生検埋め込みからフォローアップ時(即ち、第48週)の生検埋め込みの全次元を予測するのであって、より大規模な臨床試験のプラセボ群内の患者のみを考慮してこれがなされる。訓練済み機械学習モデル1850は、図3Aの埋め込みスコア予測モデル312(これも線形モデルとされ得る)と類似の態様で構成されることができる。一部の実施形態では、機械学習モデル1850は、線形混合モデル等の線形回帰モデルとされ得る。
表現型予測モデルが訓練された後、システムは訓練済み表現型予測モデルを用いて、より小規模な臨床試験での患者のベースライン肝臓状態埋め込みを前提として、プラセボ下のフォローアップ肝臓状態埋め込みを予測できる。これらの予測フォローアップ埋め込みは、プラセボ患者のフォローアップ時の期待組織学的状態を捕捉する。システムは、進行埋め込みを、観測されたフォローアップ埋め込みと前のステップからの予測されたフォローアップ埋め込みとの間の差として定義する。定義されているように、進行埋め込みは、より小規模な臨床試験の患者の組織学的差異について表すのであり、それらのフォローアップ時の組織学的状態とプラセボ患者の期待組織学的状態との間が扱われる。
各治療群について、システムは、治療特有モデル(例えば、DRP分類モデル1730)を訓練して、より小規模な臨床試験の進行埋め込みからのプラセボ及び治療群からの患者を分類する。このモデルからの予測は、フォローアップ時の薬剤応答組織学的表現型(DRP)の各患者についての尺度を提供する。一部の実施形態では、分類モデルの入力は、進行埋め込み(例えば、プラセボ進行埋め込み1856、1860)である。一部の実施形態では、分類モデルの出力は、患者が治療群又はプラセボ群のどちらに属するかを示す各患者についての二値指標である。DRP分類は、図3Aの埋め込みスコア予測モデル312と類似の態様で構成されることができる。
予測DRPの統計的有意性は、例えば、本明細書にて説明される順列手順を用いて査定できる。例えば、システムは、モデルについて相関メトリックを算出できる。一部の実施形態では、前記相関メトリックはP値である。P値は順列手順を介して取得できるのであって、実データからの対数尤度レシオ(LLR、log likelihood ratio)統計が、埋め込み行列内にて個体についての置換がなされる際に取得されたLLRと、比較される(nullモデルからのLLR)。一部の実施形態では、P値は、上述のように、実データLLRより大きな並べ替えLLRの画分として定義される。
各遺伝的バリアントについての相関メトリックは所定の閾値に対して比較されて、遺伝的バリアントと埋め込みとの間に関連があるかを決定できる。1つの例示的な実装例では、システムは、0.05とされるBonferroni調整P値閾値を用いて、有意な治療組織学的効果を定義して治療が進行埋め込みに対して効果を及ぼすかを査定する。一部の実施形態では、有意なP値を有する治療のみがさらに研究されるのであり、例えば図20の処理2000を用いてこれがなされ得る。
一部の実施形態では、治療を分析する際には、治療の効果は、フォローアップ埋め込みを用いて直接的に分析できる。そのような場合では、ベースライン埋め込み/画像は、分析から除外され得る。
図20では、治療についての薬物反応組織学的表現型(DRP)との関係で着目コバリアントを識別する例示的な方法について示されている。DRPについての帰属決定は、進行埋め込みが利用可能である限り臨床試験データセットを用いることによって行うことができる。DRPと分子データ(例えば、表現及びジェネティクス)との間の有意な関連は関連検定を介して取り出すことができる。発現ありの関連付けでは、プラセボ対薬剤の差次的発現分析にて検出できなかった遺伝子を識別できる。遺伝的な関連付けによって着目疾患(例えば、NASH)についての候補標的遺伝子が識別される。
処理2000は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理2000は、クライアント-サーバシステムを使用して実施され、処理2000のブロックは、任意の様式において、サーバと1つ以上のクライアントデバイスとの間で分割される。したがって、処理2000の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理2000はそのように限定されることは要さないことに留意されたい。他の例では、処理2000はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理2000では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理2000と組み合わせて実施されてもよい。故に、図示(および下記により詳細に説明)されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。
ブロック2002では、例示的なシステム(例えば、1つ以上の電子装置)は、臨床被験者群から取得された共変量クラスのコバリアント情報を受信するように構成されていることができる。一部の実施形態では、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える。ブロック2004では、システムは、臨床被験者群から複数のベースライン画像及び複数のフォローアップ画像を受信するように構成されていることができる。
ブロック2002及びブロック2004で取得されたデータは、同じ治療群の被験者のデータとされることができる。治療群は、例えば、図16~19,23を参照して説明されるような態様で識別できる。図21を参照するに、システムは、被験者1について画像データ2102を、被験者2について画像データ2104を、...、及び被験者Nについて画像データ2106を受信する。被験者1-Nは同じ治療を受ける同じ治療群に属することができる。一部の実施形態では、治療群は識別された着目治療を受けており、例えば図16~19,23を参照して説明されている通りである(例えば、相関メトリック1732が所定の閾値を満たす場合には治療A)。
ブロック2006では、システムは、複数のベースライン画像及び複数のフォローアップ画像に基づいて複数の進行埋め込みを取得するように構成されていることができる。図21に示されているように、システムは、進行埋め込み2112, 2114, ..., 2116を取得できる。進行埋め込みの生成については、例えば図18A~Cを参照して説明されている。一部の実施形態では、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて前記複数の進行埋め込みを取得するステップは次のステップを含む:前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップ。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている。
一部の実施形態では、前記訓練済み線形モデルは線形混合モデルである。
ブロック2008では、システムは、複数の進行埋め込みを訓練済み分類モデル内へと入力して臨床被験者群のDRP値について示す複数の分類結果を取得するように構成されていることができる。図21に示されているように、各進行埋め込みは、DRP分類モデル2120に入力することができる。例えば、画像データ2102に基づいて生成された進行埋め込み2112は、DRP分類モデル2120に入力されて、被験者1についてのDRP値を取得でき;画像データ2104に基づいて生成された進行埋め込み2114は、DRP分類モデル2120に入力されて、被験者2についてのDRP値を取得でき;及び画像データ2106に基づいて生成された進行埋め込み2116は、DRP分類モデル2120に入力されて、被験者1-NについてのDRP値を取得できる。一部の実施形態では、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている。分類モデルは、図18B~Cの訓練済み機械学習モデル1850と同一又は類似のものとされ得る。したがって、システムは、薬剤応答表現型(DRP)を進行埋め込みから治療へのモデルからの予測として帰属させる(プラセボ対薬剤)。この帰属決定は、進行埋め込みが利用可能である限り他の臨床試験データセットにて行うことができる。
ブロック2010では、システムは、臨床被験者群についてのコバリアント情報、複数の分類結果、及び1つ以上の線形回帰モデルに基づいて、複数の候補コバリアントの各候補コバリアントとDRP値(例えば、DRP値2122-1 - 2122-N)との間の関連を決定して、着目コバリアントを識別するように構成されていることができる。換言するに、システムはDRPと分子データとの間に有意な程の関連を識別できる(発現及びジェネティクス)。発現ありの関連付けでは、プラセボ対薬剤の差次的発現分析にて検出できなかった遺伝子を識別できる。一部の場合では、DRP分析では、真のプラセボ対薬剤(placebo-vs-drug)の差次的発現分析の症例対照として相関付けられている遺伝子セットを識別できる。一部の場合では、DRP分析では、より大きなコホートの分析故により大きな遺伝子セットを識別できるのでありDRP相関の解釈を支援し得る。
一部の実施形態では、着目コバリアントの識別は、DRP値と臨床被験者群のコバリアント情報とに基づいて複数の候補コバリアントの各候補コバリアントについてコバリアント特有モデル2130を生成することを伴い得る。一部の実施形態では、一部又は全部のコバリアント特有モデル2130は、説明されているのと類似の線形混合モデルとされることができる。システムは、全ての着目コバリアント(例えば、100,000種、100万種、1,000万種の候補)についてコバリアント特有モデル(例えば、100,000種、100万種、1,000万種のモデル)を生成できる。各モデルを評価して、各候補コバリアントとDRPとの間に有意な関連があるかについて決定して、1つ以上の着目コバリアントを識別できる。
一部の実施形態では、システムは、モデルに基づいて相関メトリックを決定できる。相関メトリックは、候補コバリアント及びDRP値が有意な程に関連付けられているかを示す。一部の実施形態では、前記相関メトリックはP値である。一部の実施形態では、相関メトリックを所定の閾値に対して比較して候補コバリアントが着目コバリアントであるかを決定できる。
一部の実施形態では、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える。例示的な実装例では、臨床試験にてACCi+FXRa DRPの進行GWASが行われたのであり、27,270個のミスセンスバリアントについて着目した(MAF>1%)。分析ではミスセンス遺伝子座を識別できる。
一部の実施形態では、前記複数の候補コバリアントは複数の候補遺伝子を備える。例示的な実装例では、様々な臨床試験においての発現とDRPとの間の関連によって、図27に示されているように何千もの関連遺伝子が識別された。
一部の実施形態では、識別された着目コバリアントは、新規被験者に関して着目疾患を診断するために用いることができる。一部の実施形態では、識別された着目コバリアントに基づいて治療を開発できる。
一部の実施形態では、識別された着目コバリアントに基づいて治療を施し、調整し、及び/又は適用できる。
一部の実施形態では、識別された着目コバリアントに基づいて医学的提案を提供すること(又は求めること)ができる。
一部の実施形態では、識別された着目コバリアントに基づいて生物学的標的を識別できる。
一部の実施形態では、複数の医用画像は生検画像を含む。
例示的な実装例では、2つの臨床試験が行われている。より小規模な臨床試験では、ベースライン及びフォローアップ肝生検画像データ並びに画像データと関連付けられている病理学者によって割り当てられたスコアが取得される。特に、より小規模な臨床試験はNASH Ph2治験であり、サンプル数は約380であり、また、肝生検画像データはベースライン及び48週フォローアップにて取得される。より大規模な臨床試験では、アライン済みのベースライン及びフォローアップ肝生検画像データ並びに関連付けられている病理学スコアが取得される。特に、より大規模な臨床試験は2つのNASH Ph3治験であり、サンプル数は約1,600であり、また、肝生検画像データはベースライン及び48週フォローアップにて取得される。
上述のように、各治療群について、システムは、治療特有モデル(例えば、DRP分類モデル1730)を訓練して、より小規模な臨床試験の進行埋め込みからのプラセボ及び治療群からの患者を分類するように構成されていることができる。このモデルからの予測は、フォローアップ時の薬剤応答組織学的表現型(DRP)の各患者についての尺度を提供する。一部の実施形態では、分類モデルの入力は進行埋め込みである。分類モデルの出力は、各患者が治療群又はプラセボ群のどちらに属するかについての二値指標である。DRP分類は、図3Aの埋め込みスコア予測モデル312と類似の態様で構成されることができる。
一部の実施形態では、システムは、訓練済みDRP分類モデルを用いて大規模臨床試験においてDRP値を予測するように構成されていることができる。そしてシステムは、より大規模な臨床試験を用いて、DRPを他のデータレイヤと併せて分析して具体的な問題に対応でき、以下の2つの例にて説明がある。
1つの例では、システムは大規模臨床試験でのDRP及び遺伝子発現を分析して、治療と関連付けられている遺伝子及び経路を識別する。先ず、システムは、図3Bのモデル316に関して説明されている線形モデル関連付け手順を用いて、DRP値と遺伝子発現との間の関連について検定を行う。例えば、システムは、遺伝子値を受信し及びDRP値を出力する遺伝子特有モデルについて適合化をなし得る。モデルについてP値を決定できる。そしてシステムは、既存のアプローチを用いて経路エンリッチメント分析を行う( 例えば、前のステップにてDRPとの関連付けでのP値によってランキングされた遺伝子リスト及び外部ソース(例えば、遺伝子オントロジー)からの経路アノテーションを入力として受け付けるGSEA)。例示的な実装例では、この手順は、相関する関連統計を治療及びプラセボ群についての直接差次的発現分析にもたらす。また、治療-プラセボ差次的発現分析と関連付けられているものより遙かに大規模な遺伝子セットが大規模な研究のDRPと有意に関連付けられているものとして識別される。
一部の実施形態では、遺伝子発現は帰属させることができる。例えば、訓練済み線形回帰モデル等の機械学習モデルは、生物学的サンプルについての画像埋め込みに対して適合化されることができる。機械学習モデルは、臨床試験からの患者組織サンプルについての画像埋め込みに基づいて、組織RNAシーケンス測定を予測するように訓練されていることができる。一部の実施形態では、別の臨床試験からの患者組織サンプルについての画像埋め込みに対して同一又は類似の機械学習モデル(例えば、同一又は類似の線形回帰モデル)が適用され得る。例えば、他の臨床試験の患者からの画像埋め込みは関連付けられているRNAシーケンスデータを有していない場合がある。予測RNAシーケンス測定と治療等の着目共変量との間の関連付けを査定して共変量の相関の解釈の一助とすることができる。
別の例では、システムは、DRPについての遺伝子分析を行って、薬剤の影響を受けるのと同じ組織学的表現型に影響を及ぼす候補標的遺伝子を識別する(故に同様の経路に影響を及ぼすであろう)。特に、システムは、図3Bのモデル316に関して説明された線形モデル関連付け手順を用いてDRPとミスセンスバリアントとの間の関連について検定を行うのであって、その際は年齢、性別、表現型PC、及び治療群を共変量として調整がなされている。例えば、バリアント特有モデルは、ミスセンスバリアント値を受信し及びDRP値を出力するように構成されている。この分析によって、DRPと関連付けられている遺伝子内のミスセンスバリアントを識別することができる。一部の場合、複数回の仮説検定是正を経た後に関連付けは有意となり得る。
図22は、いくつかの実施形態による、着目疾患の進行との関係で治療を評価するための例示的な方法について示す。図22では、疾患進行は連続医療診断スコアによって定量化される。例示的な実装例では、着目共変量と進行スコアとの間の関連検定を行うことによって疾患進行について分析するのであり、その際は離散及び連続ベースライン疾患スコアの両方に加えて他の関連性を有する共変量について調整がなされる。連続スコアは、疾患進行についてより精密な定義付けを可能とし、例えば縦型表現分析(例えば、図26A)、遺伝関連研究(例えば、図26B)、及び治療応答についての関連研究に関して促進し得る。これらの例では、連続的疾患スコアの分析によって、離散的な病理学者によって割り当てられた疾患スコア(discrete pathologist-assigned disease score)の分析を通じて識別された関連が頻繁に反復され、また、病理スコアによっては識別されていない追加的な関連が識別されるということが見出される。
この手順では、病理学者によって割り当てられた離散スコア(pathologist-assigned, discrete scores)を用いては検出できなかった、連続スコアに対しての薬剤の影響を取り出すことができる。処理2200は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理2200は、クライアント-サーバシステムを使用して実施され、処理2200のブロックは、任意の様式において、サーバと1つ以上のクライアントデバイスとの間で分割される。したがって、処理2200の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理2200はそのように限定されることは要さないことに留意されたい。他の例では、処理2200はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理2200では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理2200と組み合わせて実施されてもよい。故に、図示(および下記により詳細に説明)されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。
ブロック2202では、例示的なシステム(例えば、1つ以上の電子装置)は医用画像を取得するように構成されていることができ、つぎのものが含まれる:(a)プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ画像と、(b)前記プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ画像と、(c)治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療画像と、(d)前記治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療画像。図23を参照するに、システムは、ベースラインプラセボ画像2302と、フォローアッププラセボ画像2304と、ベースライン治療画像2306と、フォローアップ治療画像2308とを取得する。
ブロック2204では、システムは、医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するように構成されていることができ、各埋め込みは医用画像の1つ以上にて反映されている着目疾患との関係での表現型状態に対応する。一部の実施形態では、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは:(a)プラセボ群にプラセボが施される前に撮像された被験者プラセボ群についての複数のベースラインプラセボ画像を訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得するステップと;(b)プラセボ群にプラセボが施された後に撮像された被験者プラセボ群についての複数のフォローアッププラセボ画像を訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得するステップと;(c)治療群に治療が施される前に撮像された被験者治療群についての複数のベースライン治療画像を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得するステップと;(d)治療群に治療が施された後に撮像された被験者治療群についての複数のフォローアップ治療画像を訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得するステップとを含む。
図23を参照するに、システムは次のものを入力するように構成されていることができる:ベースラインプラセボ埋め込み2312を取得するためのベースラインプラセボ画像2302、フォローアッププラセボ埋め込み2314を取得するためのフォローアッププラセボ画像2304、ベースライン治療埋め込み2316を取得するためのベースライン治療画像2306、及びフォローアップ治療埋め込み2318を取得するためのフォローアップ治療画像2308。埋め込みを生成するために用いられる教師なし機械学習モデルは、図4A及び4Bを参照して説明されるモデルと類似していることができる。一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。一部の実施形態では、前記対照モデルはSimCLRモデルである。
ブロック2206では、システムは、複数の埋め込みを訓練済み線形回帰モデル内へと入力して複数の予測連続医療診断スコアを取得するように構成されていることができ、各予測連続医療診断スコアは着目疾患の状態について示し得る。一部の実施形態では、前記複数の埋め込みを前記訓練済み線形回帰モデル内へと入力するステップは:前記複数のベースラインプラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のベースラインプラセボスコア2322を取得することと、前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアッププラセボスコア2324を取得することと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して複数のベースライン治療スコア2326を取得することと、前記複数のフォローアップ治療埋め込みを前記訓練済み線形モデル内へと入力して複数のフォローアップ治療スコア2328を取得することとを含む。
一部の実施形態では、線形回帰モデルは線形混合モデルであり、これは図3Aを参照して説明されている埋め込みスコア予測モデル312に類似している。一部の実施形態では、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化されている。一部の実施形態では、前記複数の割り当て済み医療診断スコアは1人以上の医師によって提供される。一部の実施形態では、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される。一部の実施形態では、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアとされる。
ブロック2208では、システムは、予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア2332及び複数の治療進行スコア2334を決定する。一部の実施形態では、プラセボ進行スコア2332及び治療進行スコア2334を決定するステップは:ベースラインプラセボスコア2322とフォローアッププラセボスコア2324との間の差を決定してプラセボ進行スコア2332を決定することと、ベースライン治療スコア2326とフォローアップ治療スコア2328との間の差を決定して治療進行スコア2334を決定することとを含む。例えば、プラセボ群内の患者については、プラセボ進行スコアは、患者のベースラインプラセボスコアとフォローアッププラセボスコアとの間の差である。例えば、治療群内の患者については、治療進行スコアは、患者のベースライン治療スコアとフォローアップ治療スコアとの間の差である。
一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは:前記プラセボ群内の各被験者について、前記プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、前記治療群内の各被験者について、前記治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む。例えば、患者については、システムは、経時的に患者の医療診断スコア(ベースラインスコア及びフォローアップスコアを含む)を取得していくことができ、容量(又は治療時間)を受信し及び医療診断スコアを予測するように構成された線形モデルについて適合化をなし得る。患者についての進行スコアは、線形モデルの勾配とすることができる。
ブロック2210では、システムは:複数のプラセボ進行スコア及び複数の治療進行スコアを治療と関連付けて;複数の疾患進行スコアと治療との間の相関メトリックを関連に基づいて決定するように構成されていることができる。一部の実施形態では、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む。図23に示されているように、システムは、モデル2340を生成し及び相関メトリック2342を算出するように構成されていることができる。一部の実施形態では、モデルは本明細書にて説明されている線形混合モデルである。
一部の実施形態では、前記相関メトリックはモデルのP値である。相関メトリックは、治療と疾患(disease)の進行との間に有意な関連があるかについて示す。
一部の実施形態では、所与の治療についてのさらなる関連検定2344がなされ得る。例えば、相関メトリックは所定の閾値と比較され得る。一部の実施形態では、治療と着目疾患(disease of interest)との間の関連は、比較に基づいて識別され得る。一部の実施形態では、システムはさらに、関連に基づいて新規被験者について治療を処方するように構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して処方できる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して処方されることはない。
一部の実施形態では、システムは、関連に基づいて治療を施すようにさらに構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、同じ治療を、疾患を有する新規被験者に対して施すことができる。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、同じ治療は、疾患を有する新規被験者に対して施すことはない。
一部の実施形態では、システムは、関連に基づいて治療を調整するようにさらに構成されていることができる。例えば、治療と着目疾患の進行とが有意な程に関連付けられている場合、治療を増加させ得る。別の例を挙げるに、治療と着目疾患の進行とが有意な程に関連付けられていない場合、治療を減じるか停止できる。
一部の実施形態では、関連付けに基づいて医学的提案を提供することができる。一部の実施形態では、治療と着目疾患の進行とが有意な程に関連付けられている場合、例えば図21にて説明されているように、システムでは治療についてさらに研究できる。一部の実施形態では、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である。
図24は、いくつかの実施形態による、着目患者サブグループを識別するための例示的な方法について示す。システムは、患者画像データから埋め込みを取得し及び埋め込みのクラスタを患者サブグループ(subgroup)として識別するように構成されていることができる。患者クラスタ(cluster)アイデンティティ及び疾患バイオマーカ、遺伝的バリアント及び発現レベル間の有意な関連が関連検定にて取り出される。この手順では、患者セグメント(segment)及び関連付けられている臨床ラベル及び分子ドライバが取り出されるのであり、それらは各患者セグメントを特徴付けることを支援する。
処理2400は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子装置を使用して、実施される。いくつかの実施例では、処理2400は、クライアント-サーバシステムを使用して実施され、処理2400のブロックは、任意の様式において、サーバと1つ以上のクライアントデバイスとの間で分割される。したがって、処理2400の部分がクライアントサーバシステムの特定の装置によって実行されると説明されているも、処理2400はそのように限定されることは要さないことに留意されたい。他の例では、処理2400はクライアント装置のみ又は複数のクライアント装置のみを用いて実行される。処理2400では、いくつかのブロックは、随意に、組み合わせられ、いくつかのブロックの順序は、随意に、変更され、いくつかのブロックは、随意に、省略される。いくつかの実施例では、付加的ステップが、処理2400と組み合わせて実施されてもよい。故に、図示(および下記により詳細に説明)されるような動作は、本質的に、例示的であって、したがって、限定として見なされるべきではない。
ブロック2402では、システムは、臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して、潜在空間内での複数の埋め込みを取得するように構成されていることができる。ブロック2404では、システムは、複数の埋め込みをクラスタリングして1つ以上の埋め込みクラスタを生成するように構成されていることができる。ブロック2406では、システムは、1つ以上の埋め込みクラスタに対応する1つ以上の患者サブグループを識別するように構成されていることができる。
ブロック2408では、システムは、1つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するように構成されていることができる。特に、システムは2つのタイプの分析をなし得る。第一に、システムは、関連検定を通じて患者サブグループと共変量(例えば、疾患バイオマーカ、遺伝的バリアント及び発現レベル)との間に有意な関連があるかを決定することによって各患者サブグループについて特徴付けをなし得る。このようにして、システムは識別された患者サブグループと、関連付けられている臨床ラベル及び分子ドライバを取得でき、それらは患者サブグループを特徴付ける。一部の実施形態では、関連検定は次のことをなすモデルを生成することを伴う:患者が患者サブグループに属するかを示す入力を受信することと(例えば、患者が属さない場合には0とされ、患者がサブグループに属する場合には1とされる)、共変量値を出力すること。第二に、システムは、共変量(例えば、治療又は表現型)の効果を各患者サブグループ内にて特徴付けることができる。例えば、システムは、サブグループ内の患者のみを考慮しての分析(例えば、遺伝関連研究並びに治療と臨床的進行との間での関連付け)をなし得る。関連検定は、サブグループ内の患者のデータのみを用いてモデルを生成することを伴う。
一部の実施形態では、前記教師なし機械学習モデルは対照モデルである。
一部の実施形態では、前記対照モデルはSimCLRモデルである。
一部の実施形態では、前記コバリアントは着目治療であり、また、前記着目患者サブグループは前記着目治療が相当なインパクトを及ぼすサブグループである。
一部の実施形態では、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記着目治療を受けたかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。
一部の実施形態では、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む。
一部の実施形態では、前記相関メトリックはP値である。
一部の実施形態では、前記生成されたモデルは前記患者サブグループ内の被験者の疾患進行値によって訓練される。
一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者の医療診断スコアを含む。
一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者の進行スコアを含む。
一部の実施形態では、前記疾患進行値は前記患者サブグループ内の前記被験者のDRP値を含む。
一部の実施形態では、前記コバリアントは着目疾患の進行であり、また、前記着目患者サブグループは前記着目疾患の前記進行と有意な関連を有するサブグループである。
一部の実施形態では、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、患者が前記患者サブグループに属するかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。
一部の実施形態では、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む。
一部の実施形態では、前記相関メトリックはP値である。
一部の実施形態では、前記生成されたモデルは前記臨床被験者群の疾患進行値によって訓練される。
一部の実施形態では、前記疾患進行値は、前記患者サブグループ内の被験者の医療診断スコア、前記患者サブグループ内の被験者の進行スコア、又は前記患者サブグループ内の被験者のDRP値を含む。
一部の実施形態では、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである。一部の実施形態では、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。
一部の実施形態では、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは治療後に前記有害副作用を経験することについて有意な関連を有するサブグループである。一部の実施形態では、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記治療を受けたかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む。
一部の実施形態では、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む。
一部の実施形態では、前記相関メトリックはP値である。
例示的な実装例では、システムは、臨床的に関連性を有する患者セグメントを識別して、効率を増大させASEを減少させるように構成されていることができる。先ず、システムは、教師なし学習手順を介してH&E染色肝生検画像から生検埋め込み(一部又は全部)を取得することができる。そして、システムは、ベースライン生検埋め込みについての教師なし分析を行って、生検埋め込みに基づいて患者のクラスタを識別できる。各クラスタについて、システムは、患者規模での二値指標ベクトルを決定又は取得し、患者がクラスタに属するか否かを示すことができる。二値表現型は、下流側での分析に用い得ることができる。
さらに、システムは、異なるクラスタの疾患進行との関連について査定するように構成されていることができ、例えば図3Bのモデル316にて説明されている線形モデル検定手順を用いる等してクラスタアイデンティティと臨床試験エンドポイントとの間での関連について検定することができる。例えば、システムはクラスタ特有モデルについて適合化を行うことができ、該モデルはクラスタ二値指標(クラスタに属する患者は1と符号化され、クラスタに属さない患者は0と符号化される)を受信し及び臨床スコア又はエンドポイント(例えば、疾患進行)を出力する。
システムはまた、異なる患者クラスタ毎の治療効果についても査定できるのであり、例えば図3Bのモデル316にて説明されている線形モデル検定手順を用いる等して所定のクラスタ内の患者のみを考慮して治療と臨床エンドポイントとの間の関連について検定できる。例えば、システムは、治療対プラセボについての二値指標を受信し及び臨床エンドポイント(例えば、線維症進行)を出力するクラスタ特有モデルについて適合化を行うことができる。そして、分析を特定のクラスタ内の患者に限定することができる。
システムはまた、異なるクラスタと関連付けられている有害副作用について査定することもできる(例えば、図3Bのモデル316にて説明されている線形モデル検定手順を用いる等してクラスタアイデンティティと有害副作用共変量との間での関連について検定することができる。)。例えば、システムはクラスタ特有モデルについて適合化を行うことができ、該モデルは二値指標(例えば、クラスタに属する患者は1と符号化され、クラスタに属さない患者は0と符号化される)を受信し及び副作用又は有害イベントを出力する。例えば、システムは分析を患者が特定の治療を受けている場合に限定でき、分析された出力は有害イベントによって臨床試験から脱落した患者であるかを(二値指標として)扱うことができる。これによって、治療からの有害副作用をより被りやすい患者を識別できることとなる。
そして、特定のクラスタが進行と関連付けられている場合、システムはそのクラスタの遺伝子及び表現型バイオマーカを識別できる(例えば、図3Bのモデル316にて説明されている線形モデル検定手順を用いる等してクラスタアイデンティティとジェネティクスや発現やラボ値等との間での関連について検定することができる)。例えば、システムはモデルについて適合化を行うのであり、該モデルはクラスタ二値指標(例えば、クラスタに属する患者は1と符号化され、クラスタに属さない患者は0と符号化される)を受信し及び臨床スコア又はエンドポイント(例えば、疾患進行)を出力する。臨床エンドポイントは、進行スコア又は臨床試験内で監視される臨床エンドポイントとして定量化できる(例えば、患者に関して病理学評価に基づいた線維症スコアが高い又は低いこと)。
一部の実施形態では、本明細書にて説明される手法は生検埋め込みではなく発現データに基づいていることができる。例えば、図3Bのモデル316に関して説明されている線形モデル検定手順を用いて、患者におけるベースライン発現レベルと疾患進行との間の関連について検定を行うことができる。例えば、線形混合モデルを生成して、入力としてベースライン発現レベルを受信し及び疾患進行予測を出力することができる。例を挙げるに、この手順では、進行と有意に関連付けられている130の遺伝子を識別できる。この例では、130の進行遺伝子の発現に基づいて患者についてのscanpyを用いてLeidenクラスタリングを行う(線維症ベースライン状態及び臨床試験指標を回帰で出した後)。
システムは、異なるクラスタの疾患進行との関連について査定するのであり、図3Bのモデル316にて説明されている線形モデル検定手順を用いてクラスタアイデンティティと疾患進行との間での関連について検定することができる。例えば、線形混合モデルを生成して、入力としてクラスタアイデンティティ(例えば、患者がクラスタに属するか)を受信し及び疾患進行予測を出力することができる。例においては、分析では、進行と関連付けられているものとして2つのクラスタが、並びに、退行と関連付けられているものとして1つのクラスタが識別された。
各遺伝子について、システムは、ベースライン状態及び臨床試験指標を入力として受信し及びその発現を出力する線形回帰モデルについて適合化を行うように構成されていることができる。システムは寄与分をベースライン状態及び臨床試験指標から減算し得るのであり、それは線形モデルを介して元の発現値から推定される。図25との関連で示されているように、分析例では3つの患者クラスタ(cluster)が示された。2つの進行クラスタは異なる遺伝子発現に対応する。換言するに、図25の例では、システムが、進行と関連付けられているベースライン発現レベルの遺伝子に基づいて患者をクラスタ化した後、3つの群(group)が認められる。これらのうち、2つの患者群は進行する傾向を示しているが、これらの群は異なる遺伝子シグネチャをベースラインにて有している。この不均一性は、これらの患者群間の基本的差異を示しているといえる。換言するに、これらの患者群は特定の治療に対して異なる態様で応答したり、遺伝的駆動因子が異なったり等し得る。
システムは、クラスタアイデンティティと発現値との間での関連について検定するための図3Bのモデル316にて説明されている線形モデル検定手順を用いることによって、異なるクラスタと関連付けられている発現バイオマーカについてなされた探索について査定している。例えば、線形混合モデルを生成して、入力としてクラスタアイデンティティを受信し(例えば、患者がクラスタに属するか)並びに発現値を出力できる。この分析は、各クラスタと関連付けられている約10の発現バイオマーカを設定する。
一部の実施形態では、画像ベースドバイオマーカを開発できる。例えば、予測画像を着目条件について可視化できる。例えば、着目条件は高い又は低い疾患スコアや、ある遺伝的シーケンスに対しての別の遺伝的シーケンス等を示し得る。関連付けられている画像特徴についての仮説を、予測画像の可視化に基づいて、生成できる。例えば、細胞内の細胞特徴は、着目条件のサンプル内においては、着目条件を有さないものとは違って、異なる様相を呈するかもしれない。関連付けられている特徴を測定するように具体的に設計されているモデルを生成できるのであって、該特徴は画像ベースドバイオマーカとされ得る。そして、モデルは新たなデータを伴って評価されることができ、新たな画像ベースドバイオマーカとしてもちいられるかもしれない。
図28は、いくつかの実施形態による、zスコアの比較について示す。一部の実施形態では、図28は、小規模臨床試験における治療対プラセボの分析のzスコアに対しての大規模な臨床試験における帰属DRP分析のそれの比較について示す。図28では、小規模サンプル内での真の治療効果についての分析と共に識別されるものと相関する遺伝子を識別できるDRP分析について示されている。さらに、図28では、先述の手法にはより良いパワーが付与されていることが示されている。さらに、このアプローチでは、治療分析が可能とされ得るのであり、着目共変量について測定がなされなかった研究に関して相関付けがなされる故にそうなる。
図29は、一実施形態によるコンピューティング装置の一例について示す。装置2900は、ネットワークに接続されたホストコンピュータとすることができる。装置2900は、クライアントコンピュータ又はサーバとすることができる。図29に示されるように、装置2900は、パーソナルコンピュータ、ワークステーション、サーバ又は、電話若しくはタブレット等のハンドヘルド型コンピューティング装置(可搬電子装置)等の任意の適切な種類のマイクロプロセッサベースの装置とすることができる。装置2900は例えばプロセッサ2910、入力装置2920、出力装置2930、記憶装置2940、及び通信装置2960のうちの1つ以上を含むことができる。入力装置2920及び出力装置2930は概して上述のものに対応することができ、コンピュータに接続可能であるか又はコンピュータと一体化されるかのいずれかであってもよい。
入力装置2920は、タッチスクリーン、キーボード若しくはキーパッド、マウス、又は音声認識装置等の、入力を提供する任意の適切な装置とすることができる。出力装置2930は、タッチスクリーン、触覚装置、又はスピーカ等の、出力を提供する任意の適切な装置とすることができる。
記憶装置2940は、RAM、キャッシュメモリ、ハードドライブ、若しくはリムーバブル記憶ディスクを含む、電気、磁気、又は光学メモリ等の、記憶装置を提供する任意の適切な装置とすることができる。通信装置2960は、ネットワークインタフェースチップ又は装置等のネットワークを介して信号を送信及び受信することが可能な任意の適切な装置を含むことができる。コンピュータのコンポーネントは、物理的又は無線等を介して、任意の適切な手法で接続することができる。
記憶装置2940に格納され、プロセッサ2910によって実行することができるソフトウェア2950は、例えば、本開示の機能を具現化する(例えば、上述したような装置において具現化される)プログラミングを含むことができる。
ソフトウェア2950はまた、命令実行システム、機器、若しくは装置からソフトウェアに関連付けられた命令をフェッチし、その命令を実行することができる、上述したものなどの命令実行システム、機器、若しくは装置によって使用するための又はそれに関連して使用するための任意の非一時的コンピュータ可読記憶媒体内に格納及び/又は輸送することができる。本開示の文脈では、コンピュータ可読記憶媒体は、命令実行システム、機器、若しくは装置によって使用するための、若しくはそれに関連して使用するためのプログラムを含むか又は格納することができる、記憶装置2940などの任意の媒体とすることができる。
ソフトウェア2950はまた、命令実行システム、機器、若しくは装置からソフトウェアに関連付けられた命令をフェッチし、その命令を実行することができる、上述したものなどの命令実行システム、機器、若しくは装置によって使用するための、又はそれに関連して使用するための、任意の輸送媒体内に伝播することができる。本開示の文脈では、輸送媒体は、命令実行システム、機器、若しくは装置によって使用するための、若しくはそれに関連して使用するためのプログラムを通信する、伝播する、又は輸送することができる任意の媒体とすることができる。輸送可読媒体は、電子、磁気、光学、電磁気、又は赤外線有線若しくは無線伝播媒体を含むことができるが、これらに限定されない。
装置2900はネットワークに接続されていることができ、これは任意の適切な相互接続通信システムであることができる。ネットワークは、任意の適切な通信プロトコルを実装でき、また、任意の適切なセキュリティプロトコルによって保護できる。このネットワークは、無線ネットワーク接続、T1若しくはT3回線、ケーブルネットワーク、DSL、又は電話回線等の、ネットワーク信号の送信及び受信をなすことができる任意の適切な配置のネットワークリンクを備えることができる。
装置2900は、ネットワーク上で動作するのに適した任意のオペレーティングシステムを実装できる。ソフトウェア2950は、C、C++、Java、又はPython等の任意の適切なプログラミング言語で記述され得る。様々な実施形態において、本開示の機能を具現化するアプリケーションソフトウェアは、例えばクライアント/サーバ配置において又はウェブベースのアプリケーション若しくはウェブサービスとしてウェブブラウザを通して、異なる構成で展開できる。
本開示及び実施例は添付の図面を参照して十分に説明されているも、様々な変更及び修正が当業者には明らかになることに留意されたい。そのような変更及び修正は、特許請求の範囲によって画定される開示及び実施例の範囲内に含まれているものと解されるべきである。
前述の説明は、説明の目的で、特定の実施形態を参照して説明されている。もっとも、上記の例示的な議論は、網羅的であること、又は本発明を開示された正確な形態に限定することを意図するものではない。上記の教示に照らせば、多くの修正及び変形が可能である。実施形態は、技術の原理及びそれらの実際の応用を最も良く説明するために選択及び説明された。これにより、当業者であれば、想定される特定の用途に適した様々な修正を加えて、本技術及び様々な実施形態を最良に利用することができる。
本手法は以下の列挙される実施形態を参照することによってより良く理解されよう:
1. 表現型との関係で着目コバリアントを識別する方法であって:臨床被験者群から取得された共変量クラスについてのコバリアント情報及び表現型に関する対応する表現型データを受信するステップと;表現型データを訓練済み教師なし機械学習モデル内へと入力して潜在空間内で複数の埋め込みを取得するステップであって、各埋め込みは表現型データにて反映されている表現型状態に対応する、ステップと;(i)臨床被験者群についてのコバリアント情報、(ii)複数の埋め込み、及び(iii)1つ以上の機械学習モデルに基づいて、複数の候補コバリアントの各々と表現型との間の関連を決定して、着目コバリアントを識別するステップを含む、方法。
2. 実施例1に記載の方法において、前記1つ以上の機械学習モデルは線形回帰モデルを備える、方法。
3. 実施例1~2のいずれか1つに記載の方法において、前記1つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
4. 実施例1~3のいずれか1つに記載の方法において、前記表現型は着目疾患、遺伝子発現、メタボロミクス、プロテオミクス、又はリピドミクスを含む、方法。
5. 実施例1~4のいずれかに記載の方法において、前記表現型データは医用画像データ、生検データ、臨床バイオマーカデータ、又はゲノミックバイオマーカデータを含む、方法。
6. 実施例1~5のいずれかに記載の方法において、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える、方法。
7. 実施例1~6のいずれかに記載の方法において、各候補コバリアントと前記表現型との間の前記関連を決定するステップは:前記複数の埋め込みの各埋め込みを線形回帰モデル内へと入力して、複数の埋め込みの各埋め込みについて予測連続スコアを受信して、複数の予測連続スコアを取得するステップと、前記複数の予測連続スコアを、前記臨床被験者群によって発現されている候補コバリアントと関連付けるステップと、前記表現型と前記候補コバリアントとの間の相関メトリックを、前記関連に基づいて、決定するステップであって、前記相関メトリックは前記候補コバリアントが前記表現型に対して及ぼすインパクトについて示す、ステップとを含む、方法。
8. 実施例1~6のいずれかに記載の方法において、前記候補コバリアントと前記表現型との間の前記関連を決定するステップは:前記複数の埋め込みを前記複数の候補コバリアントの各候補コバリアントと関連付けて、前記複数の候補コバリアントのサブセットを識別するステップと、前記サブセット内の各候補コバリアントを前記表現型と関連付けて、前記着目コバリアントを識別するステップとを含む、方法。
9. 実施例1~8のいずれかに記載の方法において、さらに:前記表現型を表す複数の予測画像を、前記着目コバリアントに基づいて、生成するステップと、ディスプレイ上に前記複数の予測画像を表示するステップとを含む、方法。
10. 実施例9に記載の方法において、さらに:前記複数の予測画像をランキングするステップを含む、方法。
11. 実施例10に記載の方法において、前記複数の予測画像は前記ランキングに基づいて表示される、方法。
12. 実施例1~11のいずれかに記載の方法において、さらに:前記コバリアントと前記表現型との間の関係を識別するステップを含む、方法。
13. 実施例12に記載の方法において、前記関係は因果関係である、方法。
14. 実施例12~13のいずれかに記載の方法において、さらに:前記関係に基づいて新規被験者について診断を提供するステップを含む、方法。
15. 実施例12~14のいずれかに記載の方法において、さらに:前記関係に基づいて治療を開発するステップを含む、方法。
16. 実施例12~15のいずれかに記載の方法において、さらに:前記関係に基づいて治療を施す、調整する、又は適用するステップを含む、方法。
17. 実施例12~16のいずれかに記載の方法において、さらに:前記関係に基づいて医学的提案を提供するステップを含む、方法。
18. 実施例12~17のいずれかに記載の方法において、さらに:前記関係に基づいて着目疾患の治療のための生物学的標的を識別するステップであって、前記表現型は前記着目疾患を含む、方法。
19. 実施例18に記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である、方法。
20. 着目疾患との関係で少なくとも1つの着目遺伝的バリアントを識別する方法であって:臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みの各埋め込みを訓練済み機械学習モデル内へと入力して、前記複数の埋め込みの各埋め込みについて予測連続医療診断スコアを受信して、複数の予測医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記複数の予測医療診断スコアを、複数の医用画像の取得元の臨床被験者群によって発現されている複数の候補遺伝的バリアントの各候補遺伝的バリアントと、関連付けるステップと、前記着目疾患と各候補遺伝的バリアントとの間の相関メトリックを前記関連に基づいて決定し、前記少なくとも1つの着目遺伝的バリアントを前記複数の候補遺伝的バリアントから識別するステップであって、前記相関メトリックは各候補遺伝的バリアントが前記着目疾患に対して及ぼすインパクトについて示すステップとを含む、方法。
21. 実施例20に記載の方法において、さらに:前記相関メトリックを所定の閾値と比較するステップを含む、方法。
22. 実施例21に記載の方法において、さらに:前記比較に基づいて、各着目候補遺伝的バリアントと前記着目疾患との間の関係を識別するステップを含む、方法。
23. 実施例22に記載の方法において、前記関係は因果関係である、方法。
24. 実施例22~23のいずれかに記載の方法において、さらに:前記関係に基づいて新規被験者にて前記着目疾患を診断するステップを含む、方法。
25. 実施例22~24のいずれかに記載の方法において、さらに:前記関係に基づいて治療を開発するステップを含む、方法。
26. 実施例22~25のいずれかに記載の方法において、さらに:前記関係に基づいて治療を施す、調整する、又は適用するステップを含む、方法。
27. 実施例22~26のいずれかに記載の方法において、さらに:前記関係に基づいて医学的提案を提供するステップを含む、方法。
28. 実施例22~27のいずれかに記載の方法において、さらに:前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップを含む、方法。
29. 実施例22~28のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である、方法。
30. 実施例20~29のいずれかに記載の方法において、前記複数の医用画像は生検画像を備える、方法。
31. 実施例30に記載の方法において、前記生検画像は1つ以上の臨床試験に対応する、方法。
32. 実施例20~31のいずれかに記載の方法において、さらに:前記複数の医用画像の医用画像を複数の画像タイルに分割するステップと、前記複数の画像タイルの各画像タイルを前記訓練済み教師なし機械学習モデル内へと入力して、各画像タイルについてタイル埋め込みを受信して、複数のタイル埋め込みを取得するステップと、前記複数のタイル埋め込みを集約して前記複数の埋め込みの埋め込みを取得するステップとを含む、方法。
33. 実施例32に記載の方法において、前記複数のタイル埋め込みを集約するステップは前記複数のタイル埋め込みを平均化するステップを含む、方法。
34. 実施例20~33のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
35. 実施例34に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
36. 実施例20~34のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは少なくとも部分的には前記複数の医用画像に基づいて訓練されている、方法。
37. 実施例20~34のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは前記複数の医用画像に基づいて微調整されている、方法。
38. 実施例20~37のいずれか1つに記載の方法において、前記1つ以上の機械学習モデルは線形回帰モデルを備える、方法。
39. 実施例38に記載の方法において、前記線形回帰モデルは訓練済み線形回帰モデルである、方法。
40. 実施例39に記載の方法において、前記訓練済み線形回帰モデルは前記複数の埋め込み及び前記複数の埋め込みに対応する複数の割り当て済み医療診断スコアに基づいて適合化される、方法。
41. 実施例20~37のいずれかに記載の方法において、前記1つ以上の機械学習モデルは線形混合モデルを備える、方法。
42. 実施例20~41のいずれか1つに記載の方法において、前記1つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
43. 実施例42に記載の方法において、前記複数の割り当て済み医療診断スコアは1人以上の医師によって提供される、方法。
44. 実施例43に記載の方法において、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される、方法。
45. 実施例20~44のいずれかに記載の方法において、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアとされる、方法。
46. 実施例20~45のいずれかに記載の方法において、前記複数の予測医療診断スコアは、臨床試験中に取得された別個の測定を反映する予測医療診断スコア間の差として算出された疾患進行スコアを含む、方法。
47. 実施例20~45のいずれかに記載の方法において、前記複数の予測医療診断スコアは、臨床試験中に各個人について取得された別個の測定を反映する予測医療診断スコアについて訓練された線形モデルによって決定された勾配として取得された疾患進行スコアを含む、方法。
48. 実施例18~47のいずれか1つに記載の方法において、前記複数の予測医療診断スコアは、予測フォローアップスコアと観測フォローアップスコアとの間の差として対応するベースラインスコアについて調整がなされて算出された疾患進行スコアを含む、方法。
49. 実施例20~48のいずれかに記載の方法において、前記複数の予測医療診断スコアを各候補遺伝的バリアントと関連付けるステップは、前記候補遺伝的バリアントについて示す値を受信し及び予測医療診断スコアを出力するように構成されたバリアント特有モデルについて適合化をなすステップを含む、方法。
50. 実施例49に記載の方法において、前記バリアント特有モデルは線形モデルである、方法。
51. 実施例49に記載の方法において、前記バリアント特有モデルは、前記複数の予測医療診断スコアと前記候補遺伝的バリアントについて示す複数の値とに基づいて適合化される、方法。
52. 実施例20~50のいずれかに記載の方法において、前記相関メトリックを決定するステップはバリアント特有モデルに基づいてP値を決定するステップを含む、方法。
53. 着目疾患との関係で少なくとも1つの着目遺伝的バリアントを識別する方法であって:臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップであって、各埋め込みは前記複数の医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを複数の候補遺伝的バリアントの各候補遺伝的バリアントと関連付けて、前記複数の候補遺伝的バリアントについてのサブセットを識別するステップであって、前記複数の候補遺伝的バリアントのサブセットは前記複数の医用画像にて反映されている組織学的特徴と関連付けられている、ステップと、前記複数の候補遺伝的バリアントの前記サブセットの各候補遺伝的バリアントを前記着目疾患と関連付けて少なくとも1つの着目遺伝的バリアントを前記サブセットから識別するステップとを含む、方法。
54. 実施例53に記載の方法において、さらに:前記少なくとも1つの着目遺伝的バリアントに基づいて、前記着目疾患を表す複数のシミュレーション画像を生成するステップと、ディスプレイ上に複数のシミュレーション画像を表示するステップとを含む、方法。
55. 実施例54に記載の方法において、さらに:前記複数のシミュレーション画像をランキングするステップを含む、方法。
56. 実施例55に記載の方法において、前記複数のシミュレーション画像は前記ランキングに基づいて表示される、方法。
57. 実施例53~56のいずれか1つに記載の方法において、さらに:前記少なくとも1つの着目遺伝的バリアントと前記着目疾患との間の関係を識別するステップを含む、方法。
58. 実施例57に記載の方法において、前記関係は因果関係である、方法。
59. 実施例57~58のいずれかに記載の方法において、さらに:前記関係に基づいて新規被験者にて前記着目疾患を診断するステップを含む、方法。
60. 実施例57~59のいずれかに記載の方法において、さらに:前記関係に基づいて治療を開発するステップを含む、方法。
61. 実施例57~60のいずれかに記載の方法において、さらに:前記関係に基づいて治療を施す、調整する、又は適用するステップを含む、方法。
62. 実施例57~61のいずれかに記載の方法において、さらに:前記関係に基づいて医学的提案を提供するステップを含む、方法。
63. 実施例57~62のいずれかに記載の方法において、さらに:前記関係に基づいて前記着目疾患の治療のための生物学的標的を識別するステップを含む、方法。
64. 実施例53~63のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である、方法。
65. 実施例53~64のいずれかに記載の方法において、前記複数の医用画像は生検画像を備える、方法。
66. 実施例65に記載の方法において、前記生検画像は1つ以上の臨床試験に対応する、方法。
67. 実施例53~66のいずれかに記載の方法において、さらに:前記複数の医用画像の医用画像を複数の画像タイルに分割するステップと、前記複数の画像タイルの各画像タイルを前記訓練済み教師なし機械学習モデル内へと入力して、各画像タイルについてタイル埋め込みを受信して、複数のタイル埋め込みを取得するステップと、前記複数のタイル埋め込みを集約して前記複数の埋め込みの埋め込みを取得するステップとを含む、方法。
68. 実施例67に記載の方法において、前記複数のタイル埋め込みを集約するステップは前記複数のタイル埋め込みを平均化するステップを含む、方法。
69. 実施例53~68のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
70. 実施例69に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
71. 実施例53~70のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは少なくとも部分的には前記複数の医用画像に基づいて訓練されている、方法。
72. 実施例53~70のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは前記複数の医用画像に基づいて微調整されている、方法。
73. 実施例53~72のいずれかに記載の方法において、前記複数の埋め込みを前記複数の候補遺伝的バリアントの各遺伝的バリアントと関連付けて前記複数の候補遺伝的バリアントについての前記サブセットを識別するステップは:埋め込みを受信し及び前記候補遺伝的バリアントの値を出力するように構成されたバリアント特有モデルを、前記複数の候補遺伝的バリアントの候補遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントを前記サブセット内に含めるべきかを決定するステップとを含む、方法。
74. 実施例73に記載の方法において、前記バリアント特有モデルを評価するステップは:前記バリアント特有モデルに基づいて相関メトリックを算出するステップと、前記相関メトリックを所定の閾値と比較するステップを含む、方法。
75. 実施例74に記載の方法において、前記相関メトリックは前記バリアント特有モデルと関連付けられているP値である、方法。
76. 実施例53~75のいずれかに記載の方法において、前記複数の候補遺伝的バリアントの前記サブセットの各遺伝的バリアントを前記着目疾患と関連付けて前記少なくとも1つの着目遺伝的バリアントを識別するステップは:前記遺伝的バリアントについて示す値を受信し及び前記着目疾患に関する医療診断スコアを出力するように構成されたバリアント特有モデルを、前記サブセット内の遺伝的バリアントについて、生成するステップと、前記バリアント特有モデルを評価して前記候補遺伝的バリアントが前記少なくとも1つの着目遺伝的バリアントであるかを決定するステップとを含む、方法。
77. 実施例76に記載の方法において、前記バリアント特有モデルを評価するステップは:前記バリアント特有モデルに基づいて相関メトリックを算出するステップと、前記相関メトリックを所定の閾値と比較するステップを含む、方法。
78. 実施例77に記載の方法において、前記相関メトリックは前記バリアント特有モデルと関連付けられているP値である、方法。
79. 着目疾患の進行に関して治療を評価する方法であって:被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像とを取得するステップと、前記複数のベースラインプラセボ医用画像及び前記複数のフォローアッププラセボ医用画像に基づいて複数のプラセボ進行埋め込みを取得するステップと、被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを取得するステップと、前記複数のベースライン治療医用画像及び前記複数のフォローアップ治療医用画像に基づいて複数の治療進行埋め込みを取得するステップと、前記複数の治療進行埋め込みに基づいて患者が前記プラセボ又は前記治療を受けたのかを決定するための分類モデルを生成するステップとを含む、方法。
80. 実施例79に記載の方法において、前記分類モデルの出力は薬物反応表現型について示す、方法。
81. 実施例80に記載の方法において、さらに:前記分類モデルに基づいて、前記治療と前記着目疾患の前記進行との間の相関メトリックを決定するステップを含む、方法。
82. 実施例79~81のいずれか1つに記載の方法において、前記相関メトリックはP値である、方法。
83. 実施例79~82のいずれか1つに記載の方法において、さらに:前記相関メトリックを所定の閾値と比較するステップを含む、方法。
84. 実施例83に記載の方法において、さらに:前記比較に基づいて、前記治療と前記着目疾患の進行との間の関連を識別するステップを含む、方法。
85. 実施例84に記載の方法において、さらに:前記関連に基づいて前記治療を新規被験者について処方するステップを含む、方法。
86. 実施例84に記載の方法において、さらに:前記関連に基づいて前記治療を施すステップを含む、方法。
87. 実施例84に記載の方法において、さらに:前記関連に基づいて前記治療を調整するステップを含む、方法。
88. 実施例84に記載の方法において、さらに:前記関連に基づいて医学的提案を提供するステップを含む、方法。
89. 実施例84に記載の方法において、さらに:前記関連に基づいてレポートを生成するステップを含む、方法。
90. 実施例79~89のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である、方法。
91. 実施例79~90のいずれかに記載の方法において、前記複数のプラセボ進行埋め込みを取得するステップは:前記複数のベースラインプラセボ医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースラインプラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアッププラセボ埋め込みを取得するステップと、前記複数のベースラインプラセボ埋め込みを1つ以上の機械学習モデル内へと入力して前記潜在空間内での複数の予測フォローアッププラセボ埋め込みを取得するステップと、前記複数のフォローアッププラセボ埋め込みと前記複数の予測フォローアッププラセボ埋め込みとの間の差を算出することによって前記複数のプラセボ進行埋め込みを決定するステップとを含む、方法。
92. 実施例91に記載の方法において、前記1つ以上の機械学習モデルは訓練済み線形モデルを備える、方法。
93. 実施例91~92のいずれかに記載の方法において、前記1つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
94. 実施例91~93のいずれかに記載の方法において、前記複数の治療進行埋め込みを取得するステップは:前記複数のベースライン治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン治療埋め込みを取得するステップと、前記複数のフォローアップ治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ治療埋め込みを取得するステップと、前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ治療埋め込みを取得するステップと、前記複数のフォローアップ治療埋め込みと前記複数の予測フォローアップ治療埋め込みとの間の差を算出することによって前記複数の治療進行埋め込みを決定するステップとを含む、方法。
95. 実施例91~94のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
96. 実施例95に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
97. 実施例91~96のいずれかに記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。
98. 実施例97に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。
99. 実施例97に記載の方法において、前記被験者プラセボ群は第1のプラセボ群であり、前記訓練済み線形モデルは前記第1のプラセボ群とは異なる第2のプラセボ群からの医用画像データから取得された埋め込みを用いて訓練されている、方法。
100. 実施例79~99のいずれかに記載の方法において、前記分類モデルは、入力進行埋め込みを受信し、また、前記プラセボ又は前記治療を患者が受けたのかを示す分類結果を出力するように構成されている、方法。
101. 実施例79~100のいずれかに記載の方法において、前記複数のベースラインプラセボ医用画像、前記複数のフォローアッププラセボ医用画像、前記複数のベースライン治療医用画像、及び前記複数のフォローアップ治療医用画像は、生検画像である、方法。
102. 治療についての薬物反応表現型(DRP)との関係で着目コバリアントを識別する方法であって:臨床被験者群から取得された共変量クラスについてのコバリアント情報を受信するステップと、前記臨床被験者群から複数のベースライン画像及び複数のフォローアップ画像を受信するステップと、前記複数のベースライン画像及び前記複数のフォローアップ画像に基づいて複数の進行埋め込みを取得するステップと、前記複数の進行埋め込みを訓練済み分類モデル内へと入力して前記臨床被験者群のDRP値について示す複数の分類結果を取得するステップと、前記臨床被験者群についての前記コバリアント情報、前記複数の分類結果、及び1つ以上の機械学習モデルに基づいて、複数の候補コバリアントの各候補コバリアントと前記DRP値との間の関連を決定して、前記着目コバリアントを識別するステップとを含む、方法。
103. 実施例102に記載の方法において、前記1つ以上の機械学習モデルは1つ以上の線形回帰モデルを備える、方法。
104. 実施例102~103のいずれか1つに記載の方法において、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える、方法。
105. 実施例102~103のいずれか1つに記載の方法において、前記複数の候補コバリアントは複数の候補遺伝子を備える、方法。
106. 実施例102~105のいずれかに記載の方法において、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える、方法。
107. 実施例102~106のいずれかに記載の方法において、さらに:前記識別された着目コバリアントに基づいて新規被験者にて着目疾患を診断するステップを含む、方法。
108. 実施例102~107のいずれかに記載の方法において、さらに:前記識別された着目コバリアントに基づいて治療を開発するステップを含む、方法。
109. 実施例102~108のいずれかに記載の方法において、さらに:前記識別された着目コバリアントに基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。
110. 実施例102~109のいずれかに記載の方法において、さらに:前記識別された着目コバリアントに基づいて医学的提案を提供するステップを含む、方法。
111. 実施例102~110のいずれかに記載の方法において、さらに:前記識別された着目コバリアントに基づいて生物学的標的を識別するステップを含む、方法。
112. 実施例102~111のいずれかに記載の方法において、前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像は生検画像を備える、方法。
113. 実施例102~112のいずれかに記載の方法において、前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像に基づいて前記複数の進行埋め込みを取得するステップは:前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップとを含む、方法。
114. 実施例113に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
115. 実施例114に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
116. 実施例113に記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。
117. 実施例113に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。
118. 実施例102~117のいずれかに記載の方法において、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている、方法。
119. 実施例102~118のいずれかに記載の方法において、前記着目コバリアントを識別するステップは:前記複数の候補コバリアントの候補コバリアントについて:前記臨床被験者群のDRP値及び前記コバリアント情報に基づいたモデルを生成するステップと、前記モデルに基づいて相関メトリックを決定するステップとを含む、方法。
120. 実施例119に記載の方法において、前記相関メトリックはP値である、方法。
121. 実施例119に記載の方法において、さらに:前記相関メトリックを所定の閾値に対して比較して前記候補コバリアントが前記着目コバリアントであるかを決定するステップをさらに含む、方法。
122. 着目疾患の進行に関して治療を評価する方法であって:医用画像を取得するステップであって、該医用画像は:(a)被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、(b)前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像と、(c)被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、(d)前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを備える、ステップと、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するステップであって、各埋め込みは前記医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、前記複数の埋め込みを1つ以上の機械学習モデル内へと入力して複数の予測連続医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、前記複数の予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア及び複数の治療進行スコアを決定するステップと、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップと、前記関連に基づいて、前記複数のプラセボ進行スコアと前記複数の治療進行スコアとの間の相関メトリックを決定するステップとを含む、方法。
123. 実施例122に記載の方法において、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは:前記(a)を前記訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得することと、前記(b)を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得することと、前記(c)を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得することと、前記(d)を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得することとを含む、方法。
124. 実施例122~123のいずれかに記載の方法において、前記1つ以上の機械学習モデルは訓練済み線形回帰モデルを備える、方法。
125. 実施例122~124のいずれか1つに記載の方法において、前記1つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
126. 実施例124~125のいずれか1つに記載の方法において、前記複数の埋め込みを前記1つ以上の機械学習モデル内へと入力するステップは:前記複数のベースラインプラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースラインプラセボスコアを取得することと、前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアッププラセボスコアを取得することと、前記複数のベースライン治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースライン治療スコアを取得することと、前記複数のフォローアップ治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアップ治療スコアを取得することとを含む、方法。
127. 実施例126に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは:前記複数のベースラインプラセボスコアと前記複数のフォローアッププラセボスコアとの間の差を決定して前記複数のプラセボ進行スコアを決定することと、前記複数のベースライン治療スコアと前記複数のフォローアップ治療スコアとの間の差を決定して前記複数の治療進行スコアを決定することとを含む、方法。
128. 実施例126に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは:前記被験者プラセボ群内の各被験者について、前記被験者プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、前記被験者治療群内の各被験者について、前記被験者治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む、方法。
129. 実施例122~128のいずれか1つに記載の方法において、前記複数の予測医療診断スコアは、予測フォローアップスコアと観測フォローアップスコアとの間の差として対応するベースラインスコアについて調整がなされて算出された疾患進行スコアを含む、方法。
130. 実施例122~129のいずれかに記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む、方法。
131. 実施例130に記載の方法において、前記相関メトリックは前記モデルのP値である、方法。
132. 実施例122~130のいずれかに記載の方法において、さらに:前記相関メトリックを所定の閾値と比較するステップを含む、方法。
133. 実施例132に記載の方法において、さらに:前記比較に基づいて、前記治療と前記着目疾患との間の関連を識別するステップを含む、方法。
134. 実施例133に記載の方法において、さらに:前記関連に基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。
135. 実施例133に記載の方法において、さらに:前記関連に基づいて医学的提案を提供するステップを含む、方法。
136. 実施例122~135のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である、方法。
137. 実施例122~136のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
138. 実施例137に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
139. 実施例124~138のいずれかに記載の方法において、前記訓練済み線形回帰モデルは線形混合モデルである、方法。
140. 実施例124~139のいずれかに記載の方法において、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化される、方法。
141. 実施例140に記載の方法において、前記複数の割り当て済み医療診断スコアは1人以上の医師によって提供される、方法。
142. 実施例141に記載の方法において、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される、方法。
143. 実施例122~142のいずれかに記載の方法において、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアを含む、方法。
144. 着目患者サブグループを識別する方法であって:臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップと、前記複数の埋め込みをクラスタリングして1つ以上の埋め込みクラスタを生成するステップと、前記1つ以上の埋め込みクラスタに対応する1つ以上の患者サブグループを識別するステップと、前記1つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するステップとを含む、方法。
145. 実施例144に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
146. 実施例145に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
147. 実施例144~146のいずれかに記載の方法において、前記コバリアントは着目治療であり、また、前記着目患者サブグループは前記着目治療が相当なインパクトを及ぼすサブグループである、方法。
148. 実施例147に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記着目治療を受けたかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
149. 実施例148に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
150. 実施例148~149のいずれか1つに記載の方法において、前記相関メトリックはP値である、方法。
151. 実施例148~150のいずれかに記載の方法において、前記生成されたモデルは前記患者サブグループ内の被験者の疾患進行値によって訓練される、方法。
152. 実施例151に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の医療診断スコアを含む、方法。
153. 実施例151に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の進行スコアを含む、方法。
154. 実施例151に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者のDRP値を含む、方法。
155. 実施例144~146のいずれかに記載の方法において、前記コバリアントは着目疾患の進行であり、また、前記着目患者サブグループは前記着目疾患の前記進行と有意な関連を有するサブグループである、方法。
156. 実施例151に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、患者が前記患者サブグループに属するかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
157. 実施例152に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
158. 実施例157に記載の方法において、前記相関メトリックはP値である、方法。
159. 実施例156~158のいずれかに記載の方法において、前記生成されたモデルは前記臨床被験者群の疾患進行値によって訓練される、方法。
160. 実施例159に記載の方法において、前記疾患進行値は、前記患者サブグループ内の臨床被験者の医療診断スコア、前記患者サブグループ内の臨床被験者の進行スコア、又は前記患者サブグループ内の臨床被験者のDRP値を含む、方法。
161. 実施例144~146のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである、方法。
162. 実施例161に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
163. 実施例162に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
164. 実施例163に記載の方法において、前記相関メトリックはP値である、方法。
165. 実施例144~146のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは治療後に前記有害副作用を経験することについて有意な関連を有するサブグループである、方法。
166. 実施例165に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:患者サブグループについて、前記患者サブグループ内の患者が前記治療を受けたかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
167. システムであって:1つ以上のプロセッサと、メモリと、1つ以上のプログラムとを備えるのであって、前記1つ以上のプログラムは前記メモリ内に記憶されており且つ前記1つ以上のプロセッサによって実行されるように構成されており、前記1つ以上のプログラムは実施例1~166のいずれかの方法を行うための命令を含む。
168. 1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、該1つ以上のプログラムは命令を備えるのであり、該命令は電子装置の1つ以上のプロセッサによって実行されると該電子装置に実施例1~166のいずれかの方法を行わせる、非一時的コンピュータ可読記憶媒体。

Claims (88)

  1. 着目疾患の進行に関して治療を評価する方法であって:
    被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像とを取得するステップと、
    前記複数のベースラインプラセボ医用画像及び前記複数のフォローアッププラセボ医用画像に基づいて複数のプラセボ進行埋め込みを取得するステップと、
    被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを取得するステップと、
    前記複数のベースライン治療医用画像及び前記複数のフォローアップ治療医用画像に基づいて複数の治療進行埋め込みを取得するステップと、
    前記複数の治療進行埋め込みに基づいて患者が前記プラセボ又は前記治療を受けたのかを決定するための分類モデルを生成するステップとを含む、方法。
  2. 請求項1に記載の方法において、前記分類モデルの出力は薬物反応表現型について示す、方法。
  3. 請求項1~2のいずれか1つに記載の方法において、さらに:
    前記分類モデルに基づいて、前記治療と前記着目疾患の前記進行との間の相関メトリックを決定するステップを含む、方法。
  4. 請求項3に記載の方法において、前記相関メトリックはP値である、方法。
  5. 請求項3~4のいずれか1つに記載の方法において、さらに:
    前記相関メトリックを所定の閾値と比較するステップを含む、方法。
  6. 請求項5に記載の方法において、さらに:
    前記比較に基づいて、前記治療と前記着目疾患の進行との間の関連を識別するステップを含む、方法。
  7. 請求項6に記載の方法において、さらに:
    前記関連に基づいて前記治療を新規被験者について処方するステップを含む、方法。
  8. 請求項6~7のいずれか1つに記載の方法において、さらに:
    前記関連に基づいて前記治療を施すステップを含む、方法。
  9. 請求項6~8のいずれか1つに記載の方法において、さらに:
    前記関連に基づいて前記治療を調整するステップを含む、方法。
  10. 請求項6~9のいずれか1つに記載の方法において、さらに:
    前記関連に基づいて医学的提案を提供するステップを含む、方法。
  11. 請求項6~10のいずれか1つに記載の方法において、さらに:
    前記関連に基づいてレポートを生成するステップを含む、方法。
  12. 請求項1~11のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である、方法。
  13. 請求項1~12のいずれかに記載の方法において、前記複数のプラセボ進行埋め込みを取得するステップは:
    前記複数のベースラインプラセボ医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースラインプラセボ埋め込みを取得するステップと、
    前記複数のフォローアッププラセボ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアッププラセボ埋め込みを取得するステップと、
    前記複数のベースラインプラセボ埋め込みを1つ以上の機械学習モデル内へと入力して前記潜在空間内での複数の予測フォローアッププラセボ埋め込みを取得するステップと、
    前記複数のフォローアッププラセボ埋め込みと前記複数の予測フォローアッププラセボ埋め込みとの間の差を算出することによって前記複数のプラセボ進行埋め込みを決定するステップとを含む、方法。
  14. 請求項13に記載の方法において、前記1つ以上の機械学習モデルは訓練済み線形モデルを備える、方法。
  15. 請求項13~14のいずれかに記載の方法において、前記1つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
  16. 請求項13~15のいずれかに記載の方法において、前記複数の治療進行埋め込みを取得するステップは:
    前記複数のベースライン治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン治療埋め込みを取得するステップと、
    前記複数のフォローアップ治療医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ治療埋め込みを取得するステップと、
    前記複数のベースライン治療埋め込みを前記訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ治療埋め込みを取得するステップと、
    前記複数のフォローアップ治療埋め込みと前記複数の予測フォローアップ治療埋め込みとの間の差を算出することによって前記複数の治療進行埋め込みを決定するステップとを含む、方法。
  17. 請求項13~17のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
  18. 請求項17に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
  19. 請求項13~18のいずれかに記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。
  20. 請求項19に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。
  21. 請求項19に記載の方法において、前記被験者プラセボ群は第1のプラセボ群であり、前記訓練済み線形モデルは前記第1のプラセボ群とは異なる第2のプラセボ群からの医用画像データを用いて訓練されている、方法。
  22. 請求項1~21のいずれかに記載の方法において、前記分類モデルは、入力進行埋め込みを受信し、また、前記プラセボ又は前記治療を患者が受けたのかを示す分類結果を出力するように構成されている、方法。
  23. 請求項1~21のいずれかに記載の方法において、前記複数のベースラインプラセボ医用画像、前記複数のフォローアッププラセボ医用画像、前記複数のベースライン治療医用画像、及び前記複数のフォローアップ治療画像は、生検医用画像である、方法。
  24. 治療についての薬物反応表現型(DRP)との関係で着目コバリアントを識別する方法であって:
    臨床被験者群から取得された共変量クラスについてのコバリアント情報を受信するステップと、
    前記臨床被験者群から複数のベースライン医用画像及び複数のフォローアップ医用画像を受信するステップと、
    前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像に基づいて複数の進行埋め込みを取得するステップと、
    前記複数の進行埋め込みを訓練済み分類モデル内へと入力して前記臨床被験者群のDRP値について示す複数の分類結果を取得するステップと、
    前記臨床被験者群についての前記コバリアント情報、前記複数の分類結果、及び1つ以上の機械学習モデルに基づいて、複数の候補コバリアントの各候補コバリアントと前記DRP値との間の関連を決定して、前記着目コバリアントを識別するステップとを含む、方法。
  25. 請求項24に記載の方法において、前記1つ以上の機械学習モデルは1つ以上の線形回帰モデルを備える、方法。
  26. 請求項24に記載の方法において、前記複数の候補コバリアントは複数の候補ミスセンスバリアントを備える、方法。
  27. 請求項24に記載の方法において、前記複数の候補コバリアントは複数の候補遺伝子を備える、方法。
  28. 請求項24~27のいずれかに記載の方法において、前記共変量クラスは人口統計情報、臨床共変量、又はゲノムデータを備える、方法。
  29. 請求項24~28のいずれかに記載の方法において、さらに:
    前記識別された着目コバリアントに基づいて新規被験者にて着目疾患を診断するステップを含む、方法。
  30. 請求項24~29のいずれかに記載の方法において、さらに:
    前記識別された着目コバリアントに基づいて治療を開発するステップを含む、方法。
  31. 請求項24~30のいずれかに記載の方法において、さらに:
    前記識別された着目コバリアントに基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。
  32. 請求項24~31のいずれかに記載の方法において、さらに:
    前記識別された着目コバリアントに基づいて医学的提案を提供するステップを含む、方法。
  33. 請求項24~32のいずれかに記載の方法において、さらに:
    前記識別された着目コバリアントに基づいて生物学的標的を識別するステップを含む、方法。
  34. 請求項24~33のいずれかに記載の方法において、前記複数のベースライン画像及び前記複数のフォローアップ画像は生検画像を備える、方法。
  35. 請求項24~34のいずれかに記載の方法において、前記複数のベースライン医用画像及び前記複数のフォローアップ医用画像に基づいて前記複数の進行埋め込みを取得するステップは:
    前記複数のベースライン医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数のベースライン埋め込みを取得するステップと、
    前記複数のフォローアップ医用画像を前記訓練済み教師なし機械学習モデル内へと入力して前記潜在空間内での複数のフォローアップ埋め込みを取得するステップと、
    前記複数のベースライン埋め込みを訓練済み線形モデル内へと入力して前記潜在空間内での複数の予測フォローアップ埋め込みを取得するステップと、
    前記複数のフォローアップ埋め込みと前記複数の予測フォローアップ埋め込みとの間の差を算出することによって前記複数の進行埋め込みを決定するステップとを含む、方法。
  36. 請求項35に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
  37. 請求項36に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
  38. 請求項35に記載の方法において、前記訓練済み線形モデルはベースライン埋め込みを受信し及び予測フォローアップ埋め込みを出力するように構成されている、方法。
  39. 請求項35に記載の方法において、前記訓練済み線形モデルは線形混合モデルである、方法。
  40. 請求項24~39のいずれかに記載の方法において、前記訓練済み分類モデルは、入力進行埋め込みを受信し、また、患者がプラセボ又は前記治療を受けたかを決定するように構成されている、方法。
  41. 請求項24~40のいずれかに記載の方法において、前記着目コバリアントを識別するステップは:前記複数の候補コバリアントの候補コバリアントについて:
    前記臨床被験者群のDRP値及び前記コバリアント情報に基づいたモデルを生成するステップと、
    前記モデルに基づいて相関メトリックを決定するステップとを含む、方法。
  42. 請求項41に記載の方法において、前記相関メトリックはP値である、方法。
  43. 請求項41に記載の方法において、さらに:
    前記相関メトリックを所定の閾値に対して比較して前記候補コバリアントが前記着目コバリアントであるかを決定するステップを含む、方法。
  44. 着目疾患の進行に関して治療を評価する方法であって:
    医用画像を取得するステップであって、該医用画像は:(a)被験者プラセボ群にプラセボが施される前に撮像された前記被験者プラセボ群についての複数のベースラインプラセボ医用画像と、(b)前記被験者プラセボ群に前記プラセボが施された後に撮像された前記被験者プラセボ群についての複数のフォローアッププラセボ医用画像と、(c)被験者治療群に前記治療が施される前に撮像された前記被験者治療群についての複数のベースライン治療医用画像と、(d)前記被験者治療群に前記治療が施された後に撮像された前記被験者治療群についての複数のフォローアップ治療医用画像とを備える、ステップと、
    前記医用画像を訓練済み教師なし機械学習モデル内へと入力して複数の埋め込みを取得するステップであって、各埋め込みは前記医用画像の1つ以上にて反映されている前記着目疾患との関係での表現型状態に対応する、ステップと、
    前記複数の埋め込みを1つ以上の機械学習モデル内へと入力して複数の予測連続医療診断スコアを取得するステップであって、各予測連続医療診断スコアは前記着目疾患の状態について示す、ステップと、
    前記複数の予測連続医療診断スコアに基づいて、複数のプラセボ進行スコア及び複数の治療進行スコアを決定するステップと、
    前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップと、
    前記関連に基づいて、前記複数のプラセボ進行スコアと前記複数の治療進行スコアとの間の相関メトリックを決定するステップとを含む、方法。
  45. 請求項44に記載の方法において、前記医用画像を訓練済み教師なし機械学習モデル内へと入力して前記複数の埋め込みを取得するステップは:
    前記(a)を前記訓練済み教師なし機械学習モデル内へと入力して複数のベースラインプラセボ埋め込みを取得することと、
    前記(b)を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアッププラセボ埋め込みを取得することと、
    前記(c)を訓練済み教師なし機械学習モデル内へと入力して複数のベースライン治療埋め込みを取得することと、
    前記(d)を前記訓練済み教師なし機械学習モデル内へと入力して複数のフォローアップ治療埋め込みを取得することとを含む、方法。
  46. 請求項44~45のいずれかに記載の方法において、前記1つ以上の機械学習モデルは訓練済み線形回帰モデルを備える、方法。
  47. 請求項44~46のいずれか1つに記載の方法において、前記1つ以上の機械学習モデルは前記訓練済み教師なし機械学習モデルを含む、方法。
  48. 請求項46~47のいずれか1つに記載の方法において、前記複数の埋め込みを前記1つ以上の機械学習モデル内へと入力するステップは:
    前記複数のベースラインプラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースラインプラセボスコアを取得することと、
    前記複数のフォローアッププラセボ埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアッププラセボスコアを取得することと、
    前記複数のベースライン治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のベースライン治療スコアを取得することと、
    前記複数のフォローアップ治療埋め込みを前記訓練済み線形回帰モデル内へと入力して複数のフォローアップ治療スコアを取得することとを含む、方法。
  49. 請求項48に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは:
    前記複数のベースラインプラセボスコアと前記複数のフォローアッププラセボスコアとの間の差を決定して前記複数のプラセボ進行スコアを決定することと、
    前記複数のベースライン治療スコアと前記複数のフォローアップ治療スコアとの間の差を決定して前記複数の治療進行スコアを決定することとを含む、方法。
  50. 請求項48に記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを決定するステップは:
    前記被験者プラセボ群内の各被験者について、前記被験者プラセボ群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することと、
    前記被験者治療群内の各被験者について、前記被験者治療群内の前記被験者のベースラインプラセボスコア及びフォローアッププラセボスコアに少なくとも基づいて適合化された線形モデルの勾配を決定することとを含む、方法。
  51. 請求項44~50のいずれか1つに記載の方法において、前記複数の予測医療診断スコアは、予測フォローアップスコアと観測フォローアップスコアとの間の差として対応するベースラインスコアについて調整がなされて算出された疾患進行スコアを含む、方法。
  52. 請求項44~51のいずれかに記載の方法において、前記複数のプラセボ進行スコア及び前記複数の治療進行スコアを前記治療と関連付けるステップは、患者が前記治療を受けたかについての指示を受信し及び予測疾患進行スコアを出力するように構成されたモデルを生成するステップを含む、方法。
  53. 請求項52に記載の方法において、前記相関メトリックは前記モデルのP値である、方法。
  54. 請求項44~52のいずれかに記載の方法において、さらに:
    前記相関メトリックを所定の閾値と比較するステップを含む、方法。
  55. 請求項54に記載の方法において、さらに:
    前記比較に基づいて、前記治療と前記着目疾患との間の関連を識別するステップを含む、方法。
  56. 請求項55に記載の方法において、さらに:
    前記関連に基づいて前記治療を施す、調整する、又は適用するステップを含む、方法。
  57. 請求項55に記載の方法において、さらに:
    前記関連に基づいて医学的提案を提供するステップを含む、方法。
  58. 請求項44~57のいずれかに記載の方法において、前記着目疾患は非アルコール性脂肪性肝炎(NASH、non-alcoholic steatohepatitis)である、方法。
  59. 請求項44~58のいずれかに記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
  60. 請求項59に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
  61. 請求項46~60のいずれかに記載の方法において、前記訓練済み線形回帰モデルは線形混合モデルである、方法。
  62. 請求項46~61のいずれかに記載の方法において、前記訓練済み線形回帰モデルは複数の割り当て済み医療診断スコアに基づいて適合化される、方法。
  63. 請求項62に記載の方法において、前記複数の割り当て済み医療診断スコアは1人以上の医師によって提供される、方法。
  64. 請求項63に記載の方法において、前記複数の割り当て済み医療診断スコアの各割り当て済み医療診断スコアは予め定義された値のセットから選択される、方法。
  65. 請求項44~64のいずれかに記載の方法において、前記複数の予測連続医療診断スコアは、複数の予測線維症スコア、複数の予測小葉内炎症スコア、又は複数の予測脂肪症スコアを含む、方法。
  66. 着目患者サブグループを識別する方法であって:
    臨床被験者群から取得された複数の医用画像を訓練済み教師なし機械学習モデル内へと入力して潜在空間内での複数の埋め込みを取得するステップと、
    前記複数の埋め込みをクラスタリングして1つ以上の埋め込みクラスタを生成するステップと、
    前記1つ以上の埋め込みクラスタに対応する1つ以上の患者サブグループを識別するステップと、
    前記1つ以上の患者サブグループの各患者サブグループをコバリアントと関連付けて前記着目患者サブグループを識別するステップとを含む、方法。
  67. 請求項66に記載の方法において、前記訓練済み教師なし機械学習モデルは対照モデルである、方法。
  68. 請求項67に記載の方法において、前記対照モデルはSimCLRモデルである、方法。
  69. 請求項66~68のいずれかに記載の方法において、前記コバリアントは着目治療であり、また、前記着目患者サブグループは前記着目治療が相当なインパクトを及ぼすサブグループである、方法。
  70. 請求項69に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:
    患者サブグループについて、前記患者サブグループ内の患者が前記着目治療を受けたかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、
    前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
  71. 請求項70に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
  72. 請求項71に記載の方法において、前記相関メトリックはP値である、方法。
  73. 請求項70~72のいずれかに記載の方法において、前記生成されたモデルは前記患者サブグループ内の被験者の疾患進行値によって訓練される、方法。
  74. 請求項73に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の医療診断スコアを含む、方法。
  75. 請求項73に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者の進行スコアを含む、方法。
  76. 請求項73に記載の方法において、前記疾患進行値は前記患者サブグループ内の前記被験者のDRP値を含む、方法。
  77. 請求項66~68のいずれかに記載の方法において、前記コバリアントは着目疾患の進行であり、また、前記着目患者サブグループは前記着目疾患の前記進行と有意な関連を有するサブグループである、方法。
  78. 請求項77に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:
    患者サブグループについて、患者が前記患者サブグループに属するかについての指示を受信し及び予測疾患進行を出力するように構成されたモデルを、生成するステップと、
    前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
  79. 請求項78に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
  80. 請求項79に記載の方法において、前記相関メトリックはP値である、方法。
  81. 請求項78~80のいずれかに記載の方法において、前記生成されたモデルは前記臨床被験者群の疾患進行値によって訓練される、方法。
  82. 請求項81に記載の方法において、前記疾患進行値は、前記患者サブグループ内の臨床被験者の医療診断スコア、前記患者サブグループ内の臨床被験者の進行スコア、又は前記患者サブグループ内の臨床被験者のDRP値を含む、方法。
  83. 請求項66~68のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは前記有害副作用と有意な関連を有するサブグループである、方法。
  84. 請求項83に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:
    患者サブグループについて、前記患者サブグループ内の患者が前記患者サブグループに属するかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、
    前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
  85. 請求項84に記載の方法において、前記モデルを評価するステップは、前記モデルの相関メトリックを決定すること及び前記相関メトリックを所定の閾値に対して比較することを含む、方法。
  86. 請求項85に記載の方法において、前記相関メトリックはP値である、方法。
  87. 請求項66~68のいずれかに記載の方法において、前記コバリアントは有害副作用であり、また、前記着目患者サブグループは治療後に前記有害副作用を経験することについて有意な関連を有するサブグループである、方法。
  88. 請求項87に記載の方法において、前記1つ以上の患者サブグループの各患者サブグループを前記コバリアントと関連付けるステップは:
    患者サブグループについて、前記患者サブグループ内の患者が前記治療を受けたかについての指示を受信し及び前記患者に前記有害副作用が生じるかを予測するように構成されたモデルを、生成するステップと、
    前記モデルを評価して前記患者サブグループが前記着目患者サブグループであるかを決定するステップとを含む、方法。
JP2024508966A 2021-08-16 2022-08-16 発見プラットフォーム Pending JP2024534035A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163233707P 2021-08-16 2021-08-16
US63/233,707 2021-08-16
PCT/US2022/075006 WO2023023507A1 (en) 2021-08-16 2022-08-16 Discovery platform

Publications (1)

Publication Number Publication Date
JP2024534035A true JP2024534035A (ja) 2024-09-18

Family

ID=83271147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024508966A Pending JP2024534035A (ja) 2021-08-16 2022-08-16 発見プラットフォーム

Country Status (8)

Country Link
US (3) US12002559B2 (ja)
EP (1) EP4388549A1 (ja)
JP (1) JP2024534035A (ja)
KR (1) KR20240068638A (ja)
AU (1) AU2022328586A1 (ja)
CA (1) CA3228785A1 (ja)
IL (1) IL310877A (ja)
WO (1) WO2023023507A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023023507A1 (en) 2021-08-16 2023-02-23 Insitro, Inc. Discovery platform

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9741110B2 (en) 2005-03-22 2017-08-22 Medinet Co., Ltd. Cell culture evaluation system for measuring suspension cells, cell culture evaluation method for measuring suspension cells, and cell culture evaluation program for measuring suspension cells
EP2387777A2 (en) * 2009-01-13 2011-11-23 Koninklijke Philips Electronics N.V. Image based clinical trial assessment
EP3235900B1 (en) 2014-12-19 2020-01-29 Panasonic Corporation Cell culture apparatus
US10467754B1 (en) 2017-02-15 2019-11-05 Google Llc Phenotype analysis of cellular image data using a deep metric network
US11107583B2 (en) * 2018-03-20 2021-08-31 Case Western Reserve University Sequential integration of adversarial networks with handcrafted features (SANwicH): identifying sites of prognostic significance for predicting cancer recurrence
US10957041B2 (en) 2018-05-14 2021-03-23 Tempus Labs, Inc. Determining biomarkers from histopathology slide images
US11955241B2 (en) * 2018-06-03 2024-04-09 The Regents Of The University Of California Pathogenic biomarkers and serum extracellular vesicular biomarkers associated with vascular malformation of endothelial cells, and uses thereof
WO2020010163A1 (en) 2018-07-02 2020-01-09 Tempus Labs, Inc. 3d radiomic platform for imaging biomarker development
EP3857564A1 (en) * 2018-09-29 2021-08-04 F. Hoffmann-La Roche AG Multimodal machine learning based clinical predictor
US20200388287A1 (en) 2018-11-13 2020-12-10 CurieAI, Inc. Intelligent health monitoring
JP7462632B2 (ja) 2018-11-30 2024-04-05 カリス エムピーアイ インコーポレイテッド 次世代分子プロファイリング
US20220059240A1 (en) 2018-12-31 2022-02-24 Tempus Labs, Inc. Method and process for predicting and analyzing patient cohort response, progression, and survival
US12118715B2 (en) 2019-02-01 2024-10-15 Owkin, Inc. Systems and methods for image classification
CA3145370A1 (en) 2019-06-25 2020-12-30 Owkin Inc. Systems and methods for mesothelioma feature detection and enhanced prognosis or response to treatment
CN114787876A (zh) 2019-06-25 2022-07-22 奥金股份有限公司 用于图像预处理的系统和方法
US20220367053A1 (en) 2019-09-27 2022-11-17 The Brigham And Women's Hospital, Inc. Multimodal fusion for diagnosis, prognosis, and therapeutic response prediction
WO2021113821A1 (en) 2019-12-05 2021-06-10 Tempus Labs, Inc. Systems and methods for high throughput drug screening
EP3872711A1 (en) * 2020-02-28 2021-09-01 Sensyne Health Group Limited Semi-supervised machine learning method and system suitable for identification of patient subgroups in electronic healthcare records
EP4133503A1 (en) 2020-04-10 2023-02-15 Koninklijke Philips N.V. Clinically meaningful and personalized disease progression monitoring incorporating established disease staging definitions
US20210374553A1 (en) * 2020-06-02 2021-12-02 Salesforce.Com, Inc. Systems and methods for noise-robust contrastive learning
IL301182A (en) 2020-09-08 2023-05-01 Insitro Inc Biological image conversion using machine learning models
JP2023015674A (ja) 2021-07-20 2023-02-01 株式会社エビデント 細胞塊の内部予測方法、プログラム、及び、画像処理装置
JP2024529420A (ja) 2021-07-29 2024-08-06 テンプス エーアイ,インコーポレイティド がんにおけるヘテロタイプエフェクター細胞療法のインビトロ有効性を特徴付けるための共培養イメージングのためのプラットフォーム
WO2023023507A1 (en) 2021-08-16 2023-02-23 Insitro, Inc. Discovery platform
IL312839A (en) 2021-11-19 2024-07-01 Insitro Inc Autonomous cell imaging system

Also Published As

Publication number Publication date
US20240274254A1 (en) 2024-08-15
EP4388549A1 (en) 2024-06-26
CA3228785A1 (en) 2023-02-23
IL310877A (en) 2024-04-01
KR20240068638A (ko) 2024-05-17
WO2023023507A1 (en) 2023-02-23
AU2022328586A1 (en) 2024-02-29
US20230360758A1 (en) 2023-11-09
US12002559B2 (en) 2024-06-04
US20240274255A1 (en) 2024-08-15

Similar Documents

Publication Publication Date Title
Whalen et al. Navigating the pitfalls of applying machine learning in genomics
Wells et al. Artificial intelligence in dermatopathology: Diagnosis, education, and research
Gatta et al. Towards a modular decision support system for radiomics: A case study on rectal cancer
Chakraborty et al. Multi-OMICS approaches in cancer biology: New era in cancer therapy
JP7197795B2 (ja) 機械学習プログラム、機械学習方法および機械学習装置
CN115210772B (zh) 用于处理通用疾病检测的电子图像的系统和方法
Imrie et al. AutoPrognosis 2.0: Democratizing diagnostic and prognostic modeling in healthcare with automated machine learning
Westling et al. Inference for treatment-specific survival curves using machine learning
Howard et al. The impact of digital histopathology batch effect on deep learning model accuracy and bias
Quinn et al. Cancer as a tissue anomaly: classifying tumor transcriptomes based only on healthy data
US20240274255A1 (en) Discovery platform
Kumar et al. Deep-learning-enabled multimodal data fusion for lung disease classification
US20230326542A1 (en) Genomic sequence dataset generation
Meng et al. SEGAL time series classification—Stable explanations using a generative model and an adaptive weighting method for LIME
Abbas et al. Particle Swarm Optimization for Penalize cox models in long-term prediction of breast cancer data
US20090006055A1 (en) Automated Reduction of Biomarkers
Zhang et al. Radio-iBAG: Radiomics-based integrative Bayesian analysis of multiplatform genomic data
WO2022029492A1 (en) Methods of assessing breast cancer using machine learning systems
Yang et al. Identifying severe community-acquired pneumonia using radiomics and clinical data: a machine learning approach
Torkay et al. Artificial intelligence in cancer: a SWOT analysis
US20240120096A1 (en) Computational Method And System For Diagnostic And Therapeutic Prediction From Multimodal Data
Chen et al. Composite large margin classifiers with latent subclasses for heterogeneous biomedical data
Siriwardana Meta–Analysis of Genomic Data in Endometrial Cancer
Gwon et al. Bayesian Modeling on Microbiome Data Analysis: Application to Subgingival Microbiome Study
Wei Identification of Spatially Variable Genes with Weighted Leverage Scores