JP6876300B2 - Predictor - Google Patents
Predictor Download PDFInfo
- Publication number
- JP6876300B2 JP6876300B2 JP2017167634A JP2017167634A JP6876300B2 JP 6876300 B2 JP6876300 B2 JP 6876300B2 JP 2017167634 A JP2017167634 A JP 2017167634A JP 2017167634 A JP2017167634 A JP 2017167634A JP 6876300 B2 JP6876300 B2 JP 6876300B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- preterm
- birth
- preterm birth
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000005107 Premature Birth Diseases 0.000 claims description 128
- 230000001580 bacterial effect Effects 0.000 claims description 99
- 241000894007 species Species 0.000 claims description 41
- 230000035935 pregnancy Effects 0.000 claims description 20
- 206010036590 Premature baby Diseases 0.000 claims description 12
- 208000035010 Term birth Diseases 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 10
- 210000000214 mouth Anatomy 0.000 claims description 9
- 241000605862 Porphyromonas gingivalis Species 0.000 claims description 5
- 241000589892 Treponema denticola Species 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 241000611351 Bergeyella Species 0.000 claims description 4
- 241000190890 Capnocytophaga Species 0.000 claims description 4
- 241000589015 Kingella denitrificans Species 0.000 claims description 4
- 241000585143 Scardovia wiggsiae Species 0.000 claims description 4
- 241000605036 Selenomonas Species 0.000 claims description 4
- 230000035606 childbirth Effects 0.000 claims description 4
- 230000002028 premature Effects 0.000 claims description 3
- 241000984746 Treponema vincentii Species 0.000 claims description 2
- 238000010187 selection method Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 39
- 238000000034 method Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 24
- 238000000605 extraction Methods 0.000 description 13
- 101100533558 Mus musculus Sipa1 gene Proteins 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000007477 logistic regression Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 208000028169 periodontal disease Diseases 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 208000018773 low birth weight Diseases 0.000 description 3
- 231100000533 low birth weight Toxicity 0.000 description 3
- 241001470488 Tannerella Species 0.000 description 2
- 206010043508 Threatened labour Diseases 0.000 description 2
- 241000589886 Treponema Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 201000001245 periodontitis Diseases 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 229940034610 toothpaste Drugs 0.000 description 2
- 239000000606 toothpaste Substances 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 208000002064 Dental Plaque Diseases 0.000 description 1
- 208000034702 Multiple pregnancies Diseases 0.000 description 1
- 206010036595 Premature delivery Diseases 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 208000037063 Thinness Diseases 0.000 description 1
- 238000001790 Welch's t-test Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009984 peri-natal effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 206010048828 underweight Diseases 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
本発明は、一般に医療診断技術に関し、より詳細には、非侵襲的に早産の発症予測又は異常検出を行うために情報を収集し早産発症予測を行う予測装置及び方法に関する。 The present invention relates generally to medical diagnostic techniques, and more specifically to predictors and methods for collecting information and predicting the onset of preterm birth in order to non-invasively predict the onset of preterm birth or detect abnormalities.
妊娠関連疾患として、早産は、原因不明が約3分の1を占める周産期医療上の代表的な疾患であり、複雑な相互作用により発症する多因子疾患である。妊婦の歯周炎と早産・低体重児出産との関連が報告されているが、その詳細なメカニズムは不明な点が多い。 As a pregnancy-related disease, preterm birth is a typical perinatal medical disease in which the cause is unknown in about one-third, and it is a multifactorial disease that develops through complex interactions. The relationship between periodontitis in pregnant women and the birth of premature and low birth weight infants has been reported, but the detailed mechanism remains unclear.
非特許文献1によると、妊婦124名に対し、妊娠期間中あるいは産後3日以内にClinical attachment level (CAL)、Probing depth (PD)を測定し、PLBW(Preterm Low Birth Weight)だったケース群とそうでないコントロール群で評価したところ、ケース群(31名)のCAL平均値がコントロール群よりも有意に大きかった。また、CALが3mm以上の歯が60%以上を占めた妊婦においては、PLBW発症危険率が全体で5.9倍、初産で6.7倍だった。 According to Non-Patent Document 1, 124 pregnant women were measured for clinical attachment level (CAL) and Probing depth (PD) during pregnancy or within 3 days after delivery, and were PLBW (Preterm Low Birth Weight). When evaluated in the control group that did not, the CAL mean value of the case group (31 persons) was significantly larger than that of the control group. In pregnant women with CALs of 3 mm or more accounting for 60% or more, the risk of developing PLBW was 5.9 times overall and 6.7 times at the first delivery.
また、非特許文献2によると、切迫早産から早産となった18名とそうでない正期産40名の第2トライメスターの歯垢細菌叢を比較したところ、歯周病関連細菌の一つであるTannerella forsythenesisの割合が有意に高かった。このTannerella forsythenesisは、歯周病に関連のある細菌と言われる3つのred complexのうちの一つである。 In addition, according to Non-Patent Document 2, a comparison of the plaque flora of the second trimester of 18 patients who had a preterm birth due to imminent preterm birth and 40 patients who did not have a term birth was one of the periodontal disease-related bacteria. The proportion of certain Tannerella forsythenesis was significantly higher. This Tannerella forsythenesis is one of three red complexes called bacteria related to periodontal disease.
Offenbacherらの報告を発端として、世界各地で同様に歯周病と早産・低体重との関連が報告されているが、これらの関係は人種差があり、日本人の妊婦を対象にした研究が少ない。長谷川らの報告によると、時系列で1点のみの測定であるため、経時的な変化による早産への影響が不明である。また、単に関連性のみを報告しているが、それが早産の予測にどれだけ役立つのかの評価がない。 Starting with the report by Offenbacher et al., The association between periodontal disease and preterm birth / underweight has been reported all over the world, but there are racial differences in these relationships, and studies targeting pregnant Japanese women have been conducted. Few. According to the report by Hasegawa et al., Since only one point was measured in chronological order, the effect of changes over time on preterm birth is unknown. It also reports only relevance, but there is no assessment of how useful it is in predicting preterm birth.
上述した問題点を鑑み、本発明の課題は、口腔内細菌叢から早産発症予測を実現するための予測装置及び方法を提供することである。 In view of the above-mentioned problems, an object of the present invention is to provide a prediction device and a method for realizing prediction of the onset of preterm birth from the oral bacterial flora.
上記課題を解決するため、本発明の一態様は、正期産群の妊婦と早産群の妊婦との口腔内の細菌叢に関する細菌叢データを取得するデータ取得機能と、前記細菌叢データに基づき早産予測モデルを生成する早産予測モデル生成機能と、前記早産予測モデルに基づき、前記取得した細菌叢データから予測対象の妊婦の早産発症予測を実行する早産予測機能と、前記早産発症予測の結果を通知する結果通知機能と、を有し、前記データ取得機能は、前記予測対象の妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記細菌叢データを複数の時点にて取得し、前記早産予測機能は、前記複数の時点において取得された前記細菌叢データに基づき前記早産発症予測を実行する予測装置に関する。
To solve the above problems, one aspect of the present invention includes a data acquisition function of acquiring flora data relating flora in the oral cavity of the pregnant women pregnant with preterm group full-term production group, based on the flora data The preterm birth prediction model generation function that generates a preterm birth prediction model, the preterm birth prediction function that executes the preterm birth prediction prediction of the pregnant woman to be predicted from the acquired bacterial flora data based on the preterm birth prediction model, and the result of the preterm birth onset prediction. It has a result notification function for notifying, and the data acquisition function obtains the bacterial flora data during a data acquisition period from any time before or after pregnancy to any time before or after childbirth of the pregnant woman to be predicted. The preterm birth prediction function, which is acquired at a plurality of time points, relates to a prediction device that executes the preterm birth onset prediction based on the bacterial flora data acquired at the plurality of time points.
本発明によると、口腔内細菌叢から早産発症予測を実現するための予測装置及び方法を提供することができる。 According to the present invention, it is possible to provide a prediction device and a method for realizing prediction of the onset of preterm birth from the oral bacterial flora.
以下、図面に基づいて本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
後述される実施例では、早産発症予測のための予測装置が開示される。後述される実施例によると、複数の妊娠フェーズにおいて採取された妊婦の口腔内の細菌叢に関する細菌叢データを取得すると、予測装置は、早産発症と相関を有する細菌種を抽出し、抽出した細菌種を用いて生成した早産予測モデルに基づき、取得した細菌叢データから妊婦の早産発症予測を実行する。これにより、人種間の差があると共に、経時的に変化すると考えられている細菌叢データからの早産予測に対して、特定の人種に適した早産予測モデルが生成可能になる。 In the examples described later, a prediction device for predicting the onset of preterm birth is disclosed. According to the examples described below, when the bacterial flora data on the oral flora of pregnant women collected in multiple pregnancy phases is acquired, the predictor extracts the bacterial species that correlates with the onset of preterm birth and the extracted bacteria. Based on the preterm birth prediction model generated using seeds, the onset of preterm birth in pregnant women is predicted from the acquired bacterial flora data. This makes it possible to generate a preterm birth prediction model suitable for a specific race, as opposed to the preterm birth prediction from bacterial flora data, which is considered to change over time as well as being different between races.
まず、図1を参照して、本発明の一実施例による予測システムを説明する。図1は、本発明の一実施例による予測システムの構成を示す概略図である。 First, a prediction system according to an embodiment of the present invention will be described with reference to FIG. FIG. 1 is a schematic view showing a configuration of a prediction system according to an embodiment of the present invention.
図1に示されるように、予測システム10は、細菌叢計測装置50及び予測装置100を有する。
As shown in FIG. 1, the
細菌叢計測装置50は、採取された歯垢検体から口腔内の細菌叢を測定し、生成された細菌叢データを予測装置100に提供する。具体的には、検査技師が妊婦の歯垢検体を採取し、細菌叢計測装置50を用いて採取した歯垢検体に存在する細菌種を示す細菌叢データを取得し、取得した細菌叢データを予測装置100に提供する。
The bacterial
人間の口腔内に存在する細菌種として、例えば、Porphyromonas gingivalis, Treponema denticola, Tabberella forsythensis, Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentiiなどを含む約200種類以上の細菌種が知られており、特にPorphyromonas gingivalis, Treponema denticola, Tabberella forsythensisは、歯周病に関わるred complexとして分類され、妊娠関連疾患との相関が指摘されている。細菌叢計測装置50は、口腔内の細菌種を計測するのに用いられる何れか既知のものであってもよい。
More than 200 bacterial species present in the human oral cavity, including, for example, Porphyromonas gingivalis, Treponema denticola, Tabberella forsythensis, Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentii, etc. Known, especially Porphyromonas gingivalis, Treponema denticola, and Tabberella forsythensis are classified as a red complex related to periodontal disease, and their correlation with pregnancy-related diseases has been pointed out. The bacterial
予測装置100は、提供された細菌叢データから早産発症を予測する。具体的には、予測装置100は、以下で詳細に説明されるように、早産群の細菌叢データ及び非早産群又は正期産群の細菌叢データを含む既知のデータから早産予測モデルを作成し、作成した早産予測モデルに予測対象となる妊婦の細菌叢データを入力することによって、当該妊婦の早産の発症の有無を予測する。なお、本発明による早産発症予測は、早産の発症の有無に限定されず、後述されるように、出産日の予測、早産リスクの算出などを含むものであってもよい。
The
ここで、予測装置100は、典型的には、コンピュータ、サーバ、スマートフォン、タブレットなどの通信機能を備えた情報処理装置により実現されてもよい。例えば、情報処理装置に搭載されたプロセッサが、メモリ装置に格納されたデータやプログラムを処理及び実行することによって、後述される各種機能及び処理を実行する。しかしながら、予測装置100は、何れか特定のハードウェア構成に限定されるものでなく、適切なハードウェア構成により実現されてもよい。
Here, the
次に、図2を参照して、本発明の一実施例による予測装置を説明する。図2は、本発明の一実施例による予測装置の機能構成を示すブロック図である。 Next, a prediction device according to an embodiment of the present invention will be described with reference to FIG. FIG. 2 is a block diagram showing a functional configuration of a prediction device according to an embodiment of the present invention.
図2に示されるように、予測装置100は、データ取得機能110、データ保存機能120、早産予測モデル生成機能130、早産予測機能140及び結果通知機能150を有する。
As shown in FIG. 2, the
データ取得機能110は、細菌叢計測装置50から細菌叢データを取得する。具体的には、データ取得機能110は、妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、妊婦に関する細菌叢データを複数の時点にて取得する。例えば、データ取得機能110は、細菌叢計測装置50から、異なる妊娠フェーズ(例えば、12〜23週と24〜34週)に採取された妊婦の口腔内の細菌叢データを取得してもよい。
The
データ保存機能120は、取得した妊婦の口腔内の細菌叢データを保存する。具体的には、データ保存機能120は、取得した細菌叢データを各妊娠フェーズで採取された細菌種(例えば、200菌種など)のそれぞれを独立した変数として保存する。例えば、2つの妊娠フェーズでそれぞれ200菌種の細菌種が採取された場合、経時的な複数時点の歯垢細菌組成の変化を加味したモデルを作成できるように、400個(200菌種×2妊娠フェーズ)の変数が設定されてもよい。
The
早産予測モデル生成機能130は、取得された妊婦の口腔内の細菌叢データに基づき、早産の発症の有無を予測する早産予測モデルを生成する。具体的には、早産予測モデル生成機能130は、正期産により出産した妊婦(正期産群)と早産により出産した妊婦(早産群)とを含む複数の妊婦から取得した口腔内の細菌叢データに基づき、早産発症予測モデルを生成及び更新してもよい。例えば、以下で詳細に説明されるように、早産予測モデル生成機能130は、取得した細菌叢データから早産群と正期産群とをよく分ける細菌種を特定し、変数を削減するため、二群をよく分ける細菌種として10〜20個の細菌種×妊娠フェーズを抽出してもよい。早産群と正期産群とをよく分ける細菌種として、red complexとして分類されるPorphyromonas gingivalis, Treponema denticola, Tabberella forsythensisや、Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentiiなどが抽出されてもよい。
The preterm birth prediction
続いて、早産予測モデル生成機能130は、抽出された細菌種を特徴量として用いて早産予測モデルを作成する。具体的な予測モデルの作成手法として、例えば、早産予測モデル生成機能130は、Linear SVMを用いて、特徴量として用いられる細菌種をforward stepwise selectionによって選択してもよい。例えば、最初に20個の特徴量(妊娠フェーズごとの細菌種)について、早産予測モデル生成機能130は、1つの特徴量だけを用いて早産予測モデルM(1)〜M(20)を作成し、最も性能の良いM(A)(特徴量Aを使用)を特定する。次に、早産予測モデル生成機能130は、当該特徴量を除いた残りの19個の特徴量から1つの特徴量を選択してAと併せた2変数の予測モデルM(A,1)〜M(A,19)を作成し、M(A)を含めて最適なモデルを選択する。早産予測モデル生成機能130は、上述した一連の処理を再帰的に実行し、最終的に予測モデルM(A,B,C,...)を特定する。
Subsequently, the preterm birth prediction
なお、上述した実施例では、早産の発症有無を示す早産発症予測モデルについて説明したが、本発明による早産予測モデルは、これに限定されず、出産日を予測する出産日予測及び早産発症リスクモデル又は発症確率を予測する早産発症リスクモデルであってもよい。 In the above-mentioned examples, the preterm birth prediction model showing the onset of preterm birth has been described, but the preterm birth prediction model according to the present invention is not limited to this, and the birth date prediction and the preterm birth risk model for predicting the birth date are not limited to this. Alternatively, it may be a preterm birth risk model that predicts the onset probability.
早産予測機能140は、早産予測モデルに基づき、取得した妊婦の細菌叢データから当該妊婦の早産発症予測を実行する。具体的には、早産予測機能140は、複数の時点において取得した妊婦の細菌叢データを早産予測モデルに投入し、複数の時点において取得した細菌叢データに基づく早産予測モデルの出力結果に基づき当該妊婦の早産有無予測、出産日予測又は早産発症リスク算出を実行してもよい。すなわち、早産予測機能140は、当該妊婦に早産の可能性があるか予測するか(早産発症有無予測)、当該妊婦の出産日を予測するか(出産日予測)、あるいは、当該妊婦の早産発症リスクを算出してもよい(早産発症リスク算出)。
The preterm
結果通知機能150は、早産予測機能140によって実行された早産予測の結果を妊婦、医療関係者などに通知する。
The
次に、図3〜6を参照して、本発明の一実施例による予測処理を説明する。当該予測処理は、上述した予測装置100によって実行される。図3は、本発明の一実施例による予測処理を示すフローチャートである。
Next, the prediction process according to the embodiment of the present invention will be described with reference to FIGS. 3 to 6. The prediction process is executed by the
図3に示されるように、ステップS100において、予測装置100は、細菌叢計測装置50から細菌叢データを取得し、取得した細菌叢データを保存する。具体的には、細菌叢計測装置50は、妊婦から採取された歯垢検体を計測し、当該歯垢検体に含まれる細菌種量を示す細菌叢データを予測装置100に提供する。予測装置100は、細菌叢計測装置50から取得した細菌叢データを妊婦毎に保存する。本実施例によると、細菌叢データは、例えば、妊娠フェーズ毎など、妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において各妊婦に対して複数回採取される。
As shown in FIG. 3, in step S100, the
ステップs101において、予測装置100は、取得した細菌叢データに対して異常値を検出及び除去し、欠測値を補完する。例えば、基準値から閾値範囲外の細菌種量が測定された場合、予測装置100は、当該測定値を実際の値ではなく計測エラーとみなして、当該測定値を除去すると共に、他の細菌種量の値が類似する別の歯垢検体の当該測定値にランダムなノイズを加えて流用するか、他の細菌種量の値が類似する別の歯垢検体を複数抽出してそれらの当該測定値の分布からその分布に従うように1つの推定値を算出するなど何れかの方法により当該測定値を補完してもよい。例えば、検体Sの細菌種spA-2が閾値範囲外または欠測値である場合、まず検体S以外の検体群においてspA-2の細菌種量の分散Vを計算する。つぎに、細菌種群BALL={spA-1, spB-1,…, spA-2, spB-2}からspA-2を抜いた細菌種群BSUBの各細菌種量が検体Sと近い検体を1検体抽出し、そのspA-2の細菌種量に正規分布N(0,V)に従うランダムな1点を足し合わせた値を検体SのspA-2の推定量とする方法がある。このとき、検体Sと近い検体の抽出には、各細菌種量を各細菌種量の標準偏差で割って標準化した値を用いてユーグリッド距離を計算しても良いし、MSE(平均平方誤差)又はR2(決定係数)などを用いても良い。また別の補完方法として、細菌種群BSUBの各細菌種量が検体Sと近い検体を例えば10検体だけ抽出し、その平均値E2および分散V2を求め、正規分布N(E2,V2)に従うランダムな1点を検体SのspA-2の推定量とする方法がある。また、分布は必ずしも正規分布とせず、任意の分布で推定してもよい。
In step s101, the
ステップs102において、予測装置100は、既に出産して出産状況が確定している妊婦のデータを用いて、早産群と正期産群とをよく分ける変数を特徴量として抽出する。これには、ステューデントのt検定、ウェルチのt検定、多変量ロジスティック回帰、カイ二乗検定などを用いて変数を限定する方法、Lasso回帰、Ridge回帰、Elastic Netなどにより有用な変数を限定する方法、主成分分析の寄与率などから変数を限定する方法などがあるが、それらに限定されるものでない。
In step s102, the
ステップs103、s105及びs107において、予測装置100は、抽出した特徴量を用いて早産予測モデルを生成する。具体的には、予測装置100は、ステップs103において、早産になるかどうかを予測する分類モデルとして早産発症予測モデルを生成する。また、予測装置100は、ステップs105において、各妊婦の出産日を予測する回帰モデルとして出産日予測モデルを生成する。また、予測装置100は、s107において、早産発症のリスクを算出する早産発症リスク算出モデルを生成する。回帰モデルには、線形回帰モデル、ロジスティック回帰モデル、SVMによる回帰モデル、多層ニューラルネットワークによる回帰モデルなどがあるが、それらに限定されるものでない。また、分類モデルにおいても、線形分類、ロジスティック回帰、ベイジアンネットワーク、SVM、k近傍法、ランダムフォレスト、多層ニューラルネットワークによる分類モデルなどがあるが、それらに限定されるものでない。早産発症リスク算出モデルについては、オッズ比、寄与危険度、相対危険度などがあるが、それらに限定されるものでない。また、ステップs103、s105、s107は、s102と切り離さずに一体で処理されてもよい。
In steps s103, s105 and s107, the
ステップs104、s106及びs108において、予測装置100は、生成された早産発症予測モデル、出産日予測モデル及び早産発症リスク算出モデルに予測対象の妊婦の細菌叢データをそれぞれ投入し、早産予測を実行する。具体的には、予測装置100は、ステップs104において、早産発症予測モデルを利用して予測対象の妊婦の細菌叢データから将来の早産発症の有無を予測する。また、予測装置100は、ステップs106において、出産日予測モデルを利用して予測対象の妊婦の細菌叢データから出産日を予測する。また、予測装置100は、ステップs108において、早産発症リスク算出モデルを利用して予測対象の妊婦の細菌叢データから早産発症リスクを算出する。なお、早産有無予測は、最終的な早産発症有無の予測、この先n1週間(n1は任意の数値)で早産を発症しない予測、この先n2週間(n2は任意の数値)で早産を発症する予測、などを含むが、それらに限定されるものでない。
In steps s104, s106 and s108, the
ステップs109において、予測装置100は、早産発症予測結果、出産日予測結果及び/又は早産発症リスク計算結果を妊婦又は医療機関に通知し、当該予測処理を終了する。
In step s109, the
図4は、本発明の一実施例による特徴量抽出・モデル作成処理を示すフローチャートである。当該特徴量抽出・モデル作成処理は、上述された図3のステップs102,s103において実行可能であり、後述されるステップs102−1〜5がステップs102の特徴量の抽出処理に対応し、ステップs103−1〜3がステップs103の早産発症有無予測モデルの生成処理に対応する。当該特徴量抽出・モデル作成処理では、早産予測モデル生成機能130は、取得したデータを早産群と正期産群とに分け、各変数のうち二群をよく分ける(すなわち、区別する、判別する、分離するなど)変数、例えば、二群をよく分ける上位の所定数の変数を特徴量として抽出し、抽出された特徴量を用いて早産予測モデルを作成し、最も性能の良い特徴量による早産予測モデルを特定する。次に、早産予測モデル生成機能130は、当該特徴量を除いた残りの特徴量と特定された特徴量とを併せた2変数の予測モデルを作成し、これらのモデルを含めて最適なモデルを選択する。早産予測モデル生成機能130は、上述した一連の処理を再帰的に実行し、最終的に早産予測モデルを特定する。なお、上記は早産発症有無予測モデルに利用する特徴量の抽出方法や早産発症有無予測モデルの選定方法の一例であって、早産発症有無予測モデルはこれに制限されない。例えば、多層ニューラルネットワークまたはLasso回帰などによって特徴量を抽出し、早産発症有無予測モデルを生成する方法もある。
FIG. 4 is a flowchart showing a feature amount extraction / model creation process according to an embodiment of the present invention. The feature amount extraction / model creation process can be executed in steps s102 and s103 of FIG. 3 described above, and steps s102-1 to 5 described later correspond to the feature amount extraction process of step s102, and step s103. -1 to 3 correspond to the generation process of the preterm birth onset prediction model in step s103. In the feature amount extraction / model creation process, the preterm birth prediction
図4に示されるように、ステップs102−1において、予測装置100は、取得した細菌叢データを加工する。具体的には、予測装置100は、例えば、細菌種の計測量を相対量に標準化してもよいし、また、相対量が少ない細菌種を削除してもよい。
As shown in FIG. 4, in step s102-1, the
ステップs102−2において、予測装置100は、モデル生成のために、既に出産済みの妊婦の細菌叢データを抽出する。
In step s102-2, the
ステップs102−3において、予測装置100は、妊娠フェーズ毎に採取された歯垢検体の細菌叢データについて、各妊娠フェーズにおいて採取された各細菌種のそれぞれを独立した変数として保存する。例えば、2つの妊娠フェーズでそれぞれ200菌種の細菌種が採取された場合、400個(200菌種×2妊娠フェーズ)の変数が設定される。例えば、400個のデータは、当該妊婦のID(userid)と関連付けて、"spA-1, spB-1, ...,spA-2, spB-2, ..."の変数列により表されてもよい。
In step s102-3, the
ステップS102−4において、予測装置100は、早産群と正期産群とに細菌叢データを分け、検定にてp値がa未満(例えば、a=0.01)となる二群間をよく分ける細菌種を抽出する。
In step S102-4, the
ステップS102−5において、予測装置100は、抽出した細菌種をp値の昇順にソートし、これらを特徴量とする。
In step S102-5, the
ステップS103−1において、予測装置100は、細菌叢データを早産群D1と正期産群D2とに分け、それぞれの比率e(例えば、e=0.9)で早産群D1を学習用データD1a及び評価用データD1bに分け、正期産群D2を学習用データD2a及び評価用データD2bに分ける。
In step S103-1, the
ステップS103−2において、予測装置100は、予測性能を向上させるため、学習用データD1a, D2aにおいてD1aをオーバーサンプリングしてもよく、及び/又はD2aをアンダーサンプリングしてもよい。
In step S103-2, the
ステップS103−3において、予測装置100は、学習用データD1a, D2aを用いてforward stepwise selectionによって特徴量を選択し、早産予測モデルMを作成する。例えば、最初に20個の特徴量(妊娠フェーズごとの細菌種)について、予測装置100は、1つの特徴量だけを用いて早産予測モデルM(1)〜M(20)を作成する。そして、予測装置100は、評価データ用D1b, D2bを用いて、最も性能の良いM(A)(特徴量Aを使用)を特定する。性能スコアとして、例えば、AUC(Area under the curve)又はf-scoreが利用されてもよい。次に、予測装置100は、学習用データD1a, D2aを用いて、当該特徴量を除いた残りの19個の特徴量から1つの特徴量を選択してAと併せた2変数の早産予測モデルM(A,1)〜M(A,19)を作成し、評価用データD1b, D2bを用いて、M(A)を含めて最適なモデルを選択する。予測装置100は、上述した一連の処理を再帰的に実行し、最終的に早産予測モデルM(A,B,C,...)を特定する。
In step S103-3, the
なお、早産予測モデルMは、SVM、線形ロジスティック回帰、ニューラルネットワーク、ランダムフォレストなどに基づき生成されてもよい。また、性能スコアは、AUC又はf-scoreに限定されず、sensitivityとspecificityとの調和平均などが用いられてもよい。また、最適な特徴量を選択する方法としてはforward step selectionに限定されず、backward stepwise selection又はbidirectional stepwise selectionが利用されてもよい。また、全細菌種を利用し、PCAやMDS、NMDSなどで次元削減した後、PC1, PC2, ..., PCNのN個の特徴量に対してforward/backward/bidirectional stepwise selectionを適用してもよい。 The preterm birth prediction model M may be generated based on SVM, linear logistic regression, neural network, random forest, or the like. Further, the performance score is not limited to AUC or f-score, and a harmonic mean of sensitivity and specificity may be used. Further, the method of selecting the optimum feature amount is not limited to forward step selection, and backward stepwise selection or bidirectional stepwise selection may be used. In addition, after using all bacterial species and reducing the dimensions with PCA, MDS, NMDS, etc., apply forward / backward / bidirectional stepwise selection to N features of PC1, PC2, ..., PCN. May be good.
図5は、本発明の他の実施例による特徴量抽出・モデル作成処理を示すフローチャートである。当該特徴量抽出・モデル作成処理は、上述された図3のステップs102,s105において実行可能であり、後述されるステップs102−1〜5がステップs102の特徴量の抽出処理に対応し、ステップs105−1〜3がステップs105の出産日予測モデルの生成処理に対応する。なお、ステップS102−1〜5は図4のステップS102−1〜5と同じであるため、その説明は省く。 FIG. 5 is a flowchart showing a feature amount extraction / model creation process according to another embodiment of the present invention. The feature amount extraction / model creation process can be executed in steps s102 and s105 of FIG. 3 described above, and steps s102-1 to 5 described later correspond to the feature amount extraction process of step s102, and step s105. -1 to 3 correspond to the generation process of the birth date prediction model in step s105. Since steps S102-1 to 5 are the same as steps S102-1 to 5 in FIG. 4, the description thereof will be omitted.
ステップS105−1において、予測装置100は、細菌叢データを早産群D1と正期産群D2とに分け、それぞれの比率e(例えば、e=0.9)で早産群D1を学習用データD1a及び評価用データD1bに分け、正期産群D2を学習用データD2a及び評価用データD2bに分ける。
In step S105-1, the
ステップS105−2において、予測装置100は、予測性能を向上させるため、学習用データD1a, D2aにおいてD1aをオーバーサンプリングしてもよく、及び/又はD2aをアンダーサンプリングしてもよい。
In step S105-2, the
ステップS105−3において、予測装置100は、学習用データD1a, D2aを用いてforward stepwise selectionによって特徴量を選択し、出産日予測モデルMを作成する。例えば、最初に20個の特徴量(妊娠フェーズごとの細菌種)について、予測装置100は、1つの特徴量だけを用いて出産日予測モデルM(1)〜M(20)を作成する。そして、予測装置100は、評価データ用D1b, D2bを用いて、最も性能の良いM(A)(特徴量Aを使用)を特定する。性能スコアとして、例えば、MSE(平均平方誤差)又はR2(決定係数)が利用されてもよい。次に、予測装置100は、学習用データD1a, D2aを用いて、当該特徴量を除いた残りの19個の特徴量から1つの特徴量を選択してAと併せた2変数の出産日予測モデルM(A,1)〜M(A,19)を作成し、評価用データD1b, D2bを用いて、M(A)を含めて最適なモデルを選択する。予測装置100は、上述した一連の処理を再帰的に実行し、最終的に出産日予測モデルM(A,B,C,...)を特定する。
In step S105-3, the
なお、出産日予測モデルMは、SVM、線形ロジスティック回帰、ニューラルネットワークなどに基づき生成されてもよい。また、性能スコアは、MSE(平均平方誤差)又はR2(決定係数)に限定されなくてもよい。また、最適な特徴量を選択する方法としてはforward step selectionに限定されず、backward stepwise selection又はbidirectional stepwise selectionが利用されてもよい。また、全細菌種を利用し、PCAやMDS、NMDSなどで次元削減した後、PC1, PC2, ..., PCNのN個の特徴量に対してforward/backward/bidirectional stepwise selectionを適用してもよい。 The birth date prediction model M may be generated based on SVM, linear logistic regression, neural network, or the like. Also, the performance score does not have to be limited to MSE (mean square error) or R 2 (coefficient of determination). Further, the method of selecting the optimum feature amount is not limited to forward step selection, and backward stepwise selection or bidirectional stepwise selection may be used. In addition, after using all bacterial species and reducing the dimensions with PCA, MDS, NMDS, etc., apply forward / backward / bidirectional stepwise selection to N features of PC1, PC2, ..., PCN. May be good.
図6は、本発明の他の実施例による特徴量抽出・モデル作成処理を示すフローチャートである。当該特徴量抽出・モデル作成処理は、上述された図3のステップs102,s107において実行可能であり、後述されるステップs102−1〜5がステップs102の特徴量の抽出処理に対応し、ステップs107−1〜2がステップs107の早産リスクモデルの生成処理に対応する。なお、ステップS102−1〜5は図4のステップS102−1〜5と同じであるため、その説明は省く。 FIG. 6 is a flowchart showing a feature amount extraction / model creation process according to another embodiment of the present invention. The feature amount extraction / model creation process can be executed in steps s102 and s107 of FIG. 3 described above, and steps s102-1 to 5 described later correspond to the feature amount extraction process of step s102, and step s107. -1 to 2 correspond to the process of generating the preterm birth risk model in step s107. Since steps S102-1 to 5 are the same as steps S102-1 to 5 in FIG. 4, the description thereof will be omitted.
ステップS107−1において、予測装置100は、細菌種(spA-1, spB-1, ..., spA-2, spB-2, ...)毎に量の閾値範囲SspA-1=[AspA-1, Bspa-1]を設定し、早産に対するリスク比(RRspA-1)を計算する。ここで、リスク比はRR=a(c+d)/c(a+b)であり、aは早産群であって(細菌種の量が)閾値範囲内である歯垢検体数であり、bは正期産群であって閾値範囲内である歯垢検体数であり、cは早産群であって閾値範囲外である歯垢検体数であり、dは正期産群であって閾値範囲外である歯垢検体数である。 In step S107-1, the predictor 100 determines the amount threshold range S spA-1 = [for each bacterial species (spA-1, spB-1, ..., spA-2, spB-2, ...). Set A spA-1 , B spa-1 ] and calculate the risk ratio (RR spA-1) to preterm birth. Here, the risk ratio is RR = a (c + d) / c (a + b), where a is the number of plaque samples in the preterm birth group (the amount of bacterial species) within the threshold range. b is the number of plaque samples in the term birth group and within the threshold range, c is the number of plaque samples in the preterm birth group and outside the threshold range, and d is the term birth group and threshold. The number of plaque samples that are out of range.
ステップS107−2において、予測装置100は、予測対象の妊婦の細菌種の量を(xspA-1, xspB-1,...)とした場合、
RR=ΠspRRsp f(x sp )
f(xsp) = 1 if xsp is in Ssp
f(xsp) = -1 if xsp is not in Ssp
によって、早産リスク予測モデルを生成してもよい。
In step S107-2, when the amount of bacterial species of the pregnant woman to be predicted is (x spA-1 , x spB-1 , ...), the
RR = Π sp RR sp f (x sp )
f (x sp ) = 1 if x sp is in S sp
f (x sp ) = -1 if x sp is not in S sp
May generate a preterm birth risk prediction model.
上記の一例を実施した結果では、早産群と正期産群をよく分ける細菌種として、Porphyromonas gingivalis, Treponema denticola, Tabberella forsythensisや、Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema vincentiiなどが抽出され、これらを特徴量として用いた早産発症有無予測モデルの性能は、感度0.714、特異度0.751となった。 According to the results of the above example, Porphyromonas gingivalis, Treponema denticola, Tabberella forsythensis, Bergeyella, Kingella denitrificans, Scardovia wiggsiae, Streptococus mutans, Selenomonas, Capnocytophaga, Treponema The performance of the preterm birth onset prediction model using these as feature quantities was 0.714 for sensitivity and 0.751 for specificity.
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 Although the examples of the present invention have been described in detail above, the present invention is not limited to the above-mentioned specific embodiments, and various modifications are made within the scope of the gist of the present invention described in the claims.・ Can be changed.
10 予測システム
50 細菌叢計測装置
100 予測装置
110 データ取得機能
120 データ保存機能
130 早産予測モデル生成機能
140 早産予測機能
150 結果通知機能
10
Claims (4)
前記細菌叢データに基づき早産予測モデルを生成する早産予測モデル生成機能と、
前記早産予測モデルに基づき、前記取得した細菌叢データから予測対象の妊婦の早産発症予測を実行する早産予測機能と、
前記早産発症予測の結果を通知する結果通知機能と、
を有し、
前記データ取得機能は、前記予測対象の妊婦の妊娠前後の何れかの時期から出産前後の何れかの時期までのデータ取得期間において、前記細菌叢データを複数の時点にて取得し、
前記早産予測機能は、前記複数の時点において取得された前記細菌叢データに基づき前記早産発症予測を実行する予測装置。 A data acquisition function of acquiring flora data relating flora in the oral cavity of the pregnant full-term production group and preterm group pregnant women,
A preterm birth prediction model generation function that generates a preterm birth prediction model based on the bacterial flora data,
Based on the preterm birth prediction model, the preterm birth prediction function that executes the prediction of the onset of preterm birth of the pregnant woman to be predicted from the acquired bacterial flora data, and
A result notification function that notifies the result of the prediction of the onset of preterm birth,
Have,
The data acquisition function acquires the bacterial flora data at a plurality of time points during the data acquisition period from any time before and after pregnancy to any time before and after childbirth of the pregnant woman to be predicted.
The preterm birth prediction function is a prediction device that executes the preterm birth onset prediction based on the bacterial flora data acquired at the plurality of time points.
前記早産予測モデル生成機能は、forward stepwise selection方式に従って、前記抽出した変数から前記早産予測モデルを生成する、請求項1記載の予測装置。 The preterm birth prediction model generation function sets each bacterial species of the bacterial flora data acquired at the plurality of time points as independent variables, and extracts a predetermined number of high-ranking variables that often separate the preterm birth group and the term birth group. And
The prediction device according to claim 1, wherein the premature birth prediction model generation function generates the premature birth prediction model from the extracted variables according to a forward stepwise selection method.
前記早産予測機能は、前記生成された早産発症有無予測モデル及び早産リスクモデルにそれぞれ基づき、早産発症有無予測及び早産リスク算出を実行する、請求項1乃至3何れか一項記載の予測装置。 The Preterm Prediction model generation function generates a premature onset whether prediction model及beauty preterm risk model,
The Preterm Prediction, based respectively on the generated preterm onset whether prediction model及beauty preterm risk model, executes the onset whether pre Haka及beauty premature risk calculating preterm claims 1 to 3 set forth in any one Predictor.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017167634A JP6876300B2 (en) | 2017-08-31 | 2017-08-31 | Predictor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017167634A JP6876300B2 (en) | 2017-08-31 | 2017-08-31 | Predictor |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019045264A JP2019045264A (en) | 2019-03-22 |
JP6876300B2 true JP6876300B2 (en) | 2021-05-26 |
Family
ID=65812735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017167634A Active JP6876300B2 (en) | 2017-08-31 | 2017-08-31 | Predictor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6876300B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019041754A (en) * | 2017-08-31 | 2019-03-22 | 株式会社Nttドコモ | Prediction device and prediction method |
KR102559223B1 (en) * | 2021-07-19 | 2023-07-26 | 주식회사 디앤피바이오텍 | Preterm birth risk prediction apparatus based on machine learning using bacterial risk score |
-
2017
- 2017-08-31 JP JP2017167634A patent/JP6876300B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019045264A (en) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101788030B1 (en) | System and method for risk diagnosis on oral disease and oral care | |
Galibourg et al. | Comparison of different machine learning approaches to predict dental age using Demirjian’s staging approach | |
Chang et al. | Assessment of critical exposure and outcome windows in time-to-event analysis with application to air pollution and preterm birth study | |
US10638965B2 (en) | Method and system for monitoring stress conditions | |
JP6988895B2 (en) | Disease onset risk prediction system, disease onset risk prediction method and disease onset risk prediction program | |
Yu et al. | Joint modeling for cognitive trajectory and risk of dementia in the presence of death | |
JP6876300B2 (en) | Predictor | |
CN110706822B (en) | Health management method based on logistic regression model and decision tree model | |
US20210196428A1 (en) | Artificial Intelligence (AI) based Decision-Making Model for Orthodontic Diagnosis and Treatment Planning | |
CN112967810A (en) | New coronavirus pneumonia severe prediction system and method | |
JPWO2008111349A1 (en) | Survival analysis system, survival analysis method, and survival analysis program | |
Murray et al. | Applying artificial intelligence to determination of legal age of majority from radiographic data | |
US11961204B2 (en) | State visualization device, state visualization method, and state visualization program | |
JP2019041754A (en) | Prediction device and prediction method | |
Sathyavathi et al. | Human age estimation using deep convolutional neural network based on dental images (orthopantomogram) | |
Mutegeki et al. | Interpretable machine learning-based triage for decision support in emergency care | |
Rosma et al. | The use of artificial intelligence to identify people at risk of oral cancer: empirical evidence in Malaysian University | |
US20230229937A1 (en) | Ai training data creation support system, ai training data creation support method, and ai training data creation support program | |
KR102288592B1 (en) | Method and system to predict the progression of periodontitis | |
CN109994211B (en) | Modeling method for chronic kidney disease worsening risk based on EHR data | |
Al Diabat et al. | Ensemble learning model for screening autism in children | |
Shojaei et al. | Constructing Machine Learning models for Orthodontic Treatment Planning: A comparison of different methods | |
Dong et al. | Readmission prediction of diabetic patients based on AdaBoost-RandomForest mixed model | |
Gil-Herrera et al. | Rough set theory based prognostication of life expectancy for terminally ill patients | |
JP2022551325A (en) | diagnostic tool |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20170915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170915 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210416 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6876300 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE Ref document number: 6876300 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |