KR102678794B1 - 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법 - Google Patents
질량 스펙트럼을 이용한 질병 진단 시스템 및 방법 Download PDFInfo
- Publication number
- KR102678794B1 KR102678794B1 KR1020230123442A KR20230123442A KR102678794B1 KR 102678794 B1 KR102678794 B1 KR 102678794B1 KR 1020230123442 A KR1020230123442 A KR 1020230123442A KR 20230123442 A KR20230123442 A KR 20230123442A KR 102678794 B1 KR102678794 B1 KR 102678794B1
- Authority
- KR
- South Korea
- Prior art keywords
- mass spectrum
- disease
- machine learning
- blood sample
- nth
- Prior art date
Links
- 238000001819 mass spectrum Methods 0.000 title claims abstract description 549
- 201000010099 disease Diseases 0.000 title claims abstract description 330
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 330
- 238000003745 diagnosis Methods 0.000 title claims abstract description 146
- 238000000034 method Methods 0.000 title abstract description 49
- 210000004369 blood Anatomy 0.000 claims abstract description 192
- 239000008280 blood Substances 0.000 claims abstract description 192
- 238000010801 machine learning Methods 0.000 claims abstract description 129
- 239000003550 marker Substances 0.000 claims abstract description 65
- 238000012805 post-processing Methods 0.000 claims abstract description 62
- 238000012360 testing method Methods 0.000 claims abstract description 32
- 238000012790 confirmation Methods 0.000 claims abstract description 14
- 210000002966 serum Anatomy 0.000 claims description 64
- 239000011159 matrix material Substances 0.000 claims description 29
- 210000001124 body fluid Anatomy 0.000 description 41
- 239000010839 body fluid Substances 0.000 description 41
- 201000008827 tuberculosis Diseases 0.000 description 21
- 239000002253 acid Substances 0.000 description 17
- 238000010586 diagram Methods 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 16
- 208000004104 gestational diabetes Diseases 0.000 description 15
- 150000002500 ions Chemical class 0.000 description 14
- 239000000463 material Substances 0.000 description 14
- 241000894006 Bacteria Species 0.000 description 13
- 206010006187 Breast cancer Diseases 0.000 description 13
- 208000026310 Breast neoplasm Diseases 0.000 description 13
- 206010012289 Dementia Diseases 0.000 description 11
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 11
- 206010028980 Neoplasm Diseases 0.000 description 11
- 206010033128 Ovarian cancer Diseases 0.000 description 11
- 206010061535 Ovarian neoplasm Diseases 0.000 description 11
- 238000009826 distribution Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 239000012530 fluid Substances 0.000 description 9
- HUJXHFRXWWGYQH-UHFFFAOYSA-O sinapine Chemical compound COC1=CC(\C=C\C(=O)OCC[N+](C)(C)C)=CC(OC)=C1O HUJXHFRXWWGYQH-UHFFFAOYSA-O 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- NZNMSOFKMUBTKW-UHFFFAOYSA-N Cyclohexanecarboxylic acid Natural products OC(=O)C1CCCCC1 NZNMSOFKMUBTKW-UHFFFAOYSA-N 0.000 description 7
- AFVLVVWMAFSXCK-VMPITWQZSA-N alpha-cyano-4-hydroxycinnamic acid Chemical compound OC(=O)C(\C#N)=C\C1=CC=C(O)C=C1 AFVLVVWMAFSXCK-VMPITWQZSA-N 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 230000035935 pregnancy Effects 0.000 description 7
- 241000711573 Coronaviridae Species 0.000 description 6
- 238000001574 biopsy Methods 0.000 description 6
- 238000009795 derivation Methods 0.000 description 6
- 230000005684 electric field Effects 0.000 description 6
- 208000014540 Functional gastrointestinal disease Diseases 0.000 description 5
- 208000018522 Gastrointestinal disease Diseases 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 206010012601 diabetes mellitus Diseases 0.000 description 5
- 238000002405 diagnostic procedure Methods 0.000 description 5
- 150000004676 glycans Chemical class 0.000 description 5
- 241000699670 Mus sp. Species 0.000 description 4
- 206010036590 Premature baby Diseases 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000013077 target material Substances 0.000 description 4
- 239000000439 tumor marker Substances 0.000 description 4
- 208000025721 COVID-19 Diseases 0.000 description 3
- 238000003795 desorption Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 3
- 201000011461 pre-eclampsia Diseases 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- QGNCLSQOOODALH-UHFFFAOYSA-N 2-cyano-3-hydroxy-3-phenylprop-2-enoic acid Chemical compound OC(=O)C(C#N)=C(O)C1=CC=CC=C1 QGNCLSQOOODALH-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 206010014733 Endometrial cancer Diseases 0.000 description 2
- 206010014759 Endometrial neoplasm Diseases 0.000 description 2
- 241001508003 Mycobacterium abscessus Species 0.000 description 2
- 241000186367 Mycobacterium avium Species 0.000 description 2
- 241000186363 Mycobacterium kansasii Species 0.000 description 2
- 208000005107 Premature Birth Diseases 0.000 description 2
- 208000001647 Renal Insufficiency Diseases 0.000 description 2
- 208000017442 Retinal disease Diseases 0.000 description 2
- 206010038923 Retinopathy Diseases 0.000 description 2
- 206010039101 Rhinorrhoea Diseases 0.000 description 2
- 208000006011 Stroke Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000009534 blood test Methods 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000001678 irradiating effect Effects 0.000 description 2
- 201000006370 kidney failure Diseases 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 208000010125 myocardial infarction Diseases 0.000 description 2
- 208000010753 nasal discharge Diseases 0.000 description 2
- 150000002894 organic compounds Chemical class 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- UFMNTAVTSIJODG-UHFFFAOYSA-N [N+](=O)([O-])C1=CC(=CC=2C(N=C(SC=21)N1CCC(CC1)CN1CCC(CC1)C(F)(F)F)=O)C(F)(F)F Chemical compound [N+](=O)([O-])C1=CC(=CC=2C(N=C(SC=21)N1CCC(CC1)CN1CCC(CC1)C(F)(F)F)=O)C(F)(F)F UFMNTAVTSIJODG-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 210000004696 endometrium Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000003325 tomography Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
- G01N33/6851—Methods of protein analysis involving laser desorption ionisation mass spectrometry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Urology & Nephrology (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Hematology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Cell Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Optics & Photonics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
Abstract
질량 스펙트럼을 이용한 질병 진단 시스템 및 방법이 제공된다. 본 발명의 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 시스템은, 임의의 혈액 샘플에 대한 질량 스펙트럼을 획득하는 질량 스펙트럼 획득부; 상기 질량 스펙트럼에 대한 후처리를 수행하고, 후처리된 질량 스펙트럼인 규격화 질량 스펙트럼을 생성하는 질량 스펙트럼 후처리부; 상기 규격화 질량 스펙트럼을 통해 기계학습을 수행하고 상기 기계학습 결과 상기 제n질병의 적어도 하나의 마커를 획득하는 진단 기준 정보 획득부; 및 상기 피검자 혈액 샘플로부터 획득되는 피검자 규격화 질량 스펙트럼과 상기 마커를 비교하고, 기 설정된 기준을 만족하는 경우, 상기 피검자 혈액 샘플로부터 상기 제n질병이 진단된 것으로 판단하여 제n질병 진단 정보를 생성하는 질병 진단부;를 포함하며, 상기 임의의 혈액 샘플은 학습용 혈액 샘플 및 진단용 혈액 샘플로 구분되고, 상기 학습용 혈액 샘플은, 선행 검사를 통한 제n 질병의 확진 여부에 따라 결정되는 제n 질병 확진자 및 제n 질병 비확진자의 혈액 샘플을 포함하며, 상기 진단용 혈액 샘플은, 상기 선행 검사가 수행되지 않아 상기 제n 질병의 확진 여부를 판단할 수 없는 피검자 혈액 샘플을 포함한다.
Description
본 발명은 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법에 관한 것으로, 특히, 혈액 샘플의 질량 스펙트럼을 획득하고, 획득한 질량 스펙트럼을 학습하여 특정 질병 여부를 진단할 수 있는 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법에 관한 것이다.
현재 질병 진단의 대표적인 진단 방법으로는 혈액검사, 영상검사 및 조직 검사 등이 사용되고 있다.
혈액검사의 대표적인 진단으로는 혈액 내의 당 수치를 이용한 당뇨 진단이 있다. 그 외 혈액 내의 암표지자를 통해 암 발생 여부를 유추할 수 있다. 난소암의 종양표지자인 CA125가 대표적이며, 자궁경부암의 경우 종양표지자로 SCC를 이용한다. 그러나, 이런 종양표지자는 암진단의 정확도가 매우 떨어진다. 실제 임상적으로도 종양표지자만으로 암을 진단하기보다는 종양표지자 수치가 오르는가 여부를 통해 난소암 또는 자궁경부암의 재발 가능성을 파악하는데 이용한다.
영상검사로는 초음파 검사, CT(computerized tomography), MRI(magnetic resonance imaging), PET- CT 등이 있다. 이러한 영상검사는 진단비용이 비싸고, 촬영과 진단이 바로 이루어지지 않는 단점이 있다. 촬영이 제대로 이루어지지 못하는 경우에 피검자를 다시 소환하여 촬영해야 하는 불편이 있고, 진단의사의 능력에 따라 위양성 또는 위음성 결과가 나오는 단점이 있다.
마지막으로 조직검사는 영상검사 등에 의해 암이 의심되는 경우에 종양으로 의심되는 부분의 세침검사 또는 수술 후 종양을 현미경으로 분석하여 실제 암조직에 해당하는가 여부를 진단할 수 있다. 이러한 조직검사는 실제로 암이 의심되는 부위를 도려내어 검사해야 하기 때문에 실제 암이 아닌 부위를 도려내여 검사하는 경우에 암이 있음에도 암이 아닌 것으로 오진단하는 경우도 있다. 또한, 자궁내막암과 같이 자궁 내막을 긁어 조직검사가 필요한 경우에, 임신이 필요한 미혼 여성이 조직검사를 꺼려하는 경우가 많아 자궁 내막암이 상당히 진행된 경우에 발견되는 경우가 많은 단점이 있다.
상기와 같은 종래 기술의 문제점을 해결하기 위해, 본 발명의 일 실시예는 위양성 및 위음성 가능성, 피검자의 검사 거부 가능성을 낮추고 혈액 샘플을 이용하여 질병 진단을 신속하게 수행할 수 있는 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법을 제공하고자 한다.
위와 같은 과제를 해결하기 위한 본 발명의 일 측면에 따르면, 질량 스펙트럼을 이용한 질병 진단 시스템이 제공된다. 상기 질량 스펙트럼을 이용한 질병 진단 방법은, 임의의 혈액 샘플에 대한 질량 스펙트럼을 획득하는 질량 스펙트럼 획득부; 상기 질량 스펙트럼에 대한 후처리를 수행하고, 후처리된 질량 스펙트럼인 규격화 질량 스펙트럼을 생성하는 질량 스펙트럼 후처리부; 상기 규격화 질량 스펙트럼을 통해 기계학습을 수행하고 상기 기계학습 결과 상기 제n질병의 적어도 하나의 마커를 획득하는 진단 기준 정보 획득부; 및 상기 피검자 혈액 샘플로부터 획득되는 피검자 규격화 질량 스펙트럼과 상기 마커를 비교하고, 기 설정된 기준을 만족하는 경우, 상기 피검자 혈액 샘플로부터 상기 제n질병이 진단된 것으로 판단하여 제n질병 진단 정보를 생성하는 질병 진단부;를 포함하며, 상기 임의의 혈액 샘플은 학습용 혈액 샘플 및 진단용 혈액 샘플로 구분되고, 상기 학습용 혈액 샘플은, 선행 검사를 통한 제n 질병의 확진 여부에 따라 결정되는 제n 질병 확진자 및 제n 질병 비확진자의 혈액 샘플을 포함하며, 상기 진단용 혈액 샘플은, 상기 선행 검사가 수행되지 않아 상기 제n 질병의 확진 여부를 판단할 수 없는 피검자 혈액 샘플을 포함한다.
상기 질량 스펙트럼 획득부는, 상기 학습용 혈액 샘플을 이용하여 제n 질량 스펙트럼을 획득하고, 상기 제n 질량 스펙트럼은 상기 학습용 혈액 샘플이 상기 제n 질병 확진자의 혈액 샘플인 경우, 제n-1 또는 제n-3 질량 스팩트럼을 포함하며, 상기 학습용 혈액 샘플이 상기 제n 질병 비확진자의 혈액 샘플인 경우 제n-2 또는 제 n-4 질량 스펙트럼을 포함할 수 있다.
상기 제n-1 및 제n-2 질량 스펙트럼은, 상기 혈액 샘플이 혈청인 경우의 질량 스펙트럼이고, 상기 제n-3 및 제n-4 질량 스펙트럼은, 상기 혈액 샘플이 혈장인 경우의 질량 스펙트럼을 포함할 수 있다.
상기 후처리는, 상기 질량 스펙트럼을 기 설정된 분자량 범위로 구분하고, 각 분자량 범위에 대응하는 평균 강도값을 획득하는 처리를 포함할 수 있다.
상기 진단 기준 정보 획득부는, 상기 규격화 질량 스펙트럼 중 상기 학습용 혈액 샘플을 이용하여 획득되는 학습용 규격화 질량 스펙트럼을 이용하여 상기 기계학습을 수행하고, 상기 기계학습 결과를 이용하여 상기 마커를 획득할 수 있다.
상기 기계학습은, 제n-1 규격화 질량 스펙트럼 내지 제n-4 규격화 질량 스펙트럼 각각에 대해 수행되며, 상기 기계학습 결과는 제n-1 기계학습 결과 또는 제n-3 기계학습 결과 및 제n-2 기계학습 결과 또는 제n-4 기계학습 결과 중 어느 하나를 포함할 수 있다.
상기 제n-1 기계학습 결과 및 상기 제n-2 기계학습 결과를 비교한 제1 비교 결과 또는 상기 제n-3 기계학습 결과 및 상기 제n-4 기계학습 결과를 비교한 결과를 이용하여 상기 적어도 하나의 마커를 획득할 수 있다.
상기 마커는 상기 기계학습 결과의 비교를 통해 획득되며, 상기 각 분자량 범위에 대응하는 상기 평균 강도값을 동일한 범위끼리 비교하고, 비교 결과 그 차이가 기 설정된 범위를 벗어나는 경우, 해당 범위를 제n질병 마커로 획득할 수 있다.
본 발명의 일 측면에 따르면, 질량 스펙트럼을 이용한 질병 진단 방법이 제공된다. 상기 질량 스펙트럼을 이용한 질병 진단 방법은, 질량 스펙트럼 획득부를 이용하여 임의의 혈액 샘플에 대한 질량 스펙트럼을 획득하는 질량 스펙트럼 획득 단계; 질량 스펙트럼 후처리부를 이용하여 상기 질량 스펙트럼에 대한 후처리를 수행하고, 후처리된 질량 스펙트럼인 규격화 질량 스펙트럼을 생성하는 질량 스펙트럼 후처리 단계; 진단 기준 정보 획득부를 이용하여 상기 규격화 질량 스펙트럼을 통해 기계학습을 수행하고 상기 기계학습 결과 상기 제n질병의 적어도 하나의 마커를 획득하는 진단 기준 정보 획득 단계; 및 질병 진단부를 이용하여 상기 피검자 혈액 샘플로부터 획득되는 피검자 규격화 질량 스펙트럼과 상기 마커를 비교하고, 기 설정된 기준을 만족하는 경우, 상기 피검자 혈액 샘플로부터 상기 제n질병이 진단된 것으로 판단하여 제n질병 진단 정보를 생성하는 질병 진단 단계;를 포함하며, 상기 임의의 혈액 샘플은 학습용 혈액 샘플 및 진단용 혈액 샘플로 구분되고, 상기 학습용 혈액 샘플은, 선행 검사를 통한 제n 질병의 확진 여부에 따라 결정되는 제n 질병 확진자 및 제n 질병 비확진자의 혈액 샘플을 포함하며, 상기 진단용 혈액 샘플은, 상기 선행 검사가 수행되지 않아 상기 제n 질병의 확진 여부를 판단할 수 없는 피검자 혈액 샘플을 포함한다.
본 발명의 일 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법은, 위양성 및 위음성 가능성, 피검자의 검사 거부 가능성을 낮추고 혈액 샘플을 이용하여 질병 진단을 신속하게 수행할 수 있는 효과가 있다.
도 1은 본 발명의 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 시스템의 블록도이다.
도 2는 본 발명의 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 방법의 순서도이다.
도 3은 본 발명의 실시예에서 MALDI-TOF 질량 분석법에 의해 도출된 질량 스펙트럼의 일 실시예이다.
도 4는 본 발명의 일 실시예에 따른 질량 스펙트럼의 X축값(m/z) 구간을 설정하는 과정의 예시도이다.
도 5는 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 데이터에 기반한 csv파일의 예시도이다.
도 6은 도 5의 csv파일에 기반한 질량 스펙트럼이다.
도 7은 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 csv 파일에 기반한 질량 스펙트럼이다.
도 8은 본 발명의 실시예에서 유방암을 진단받지 않은 정상인 혈청과 난소암을 진단받은 환자의 혈청에 기반한 질량 스펙트럼을 도시한 것이다.
도 9는 본 발명의 실시예에서 임신성 당뇨를 진단받지 않은 정상인 혈장과 임신성 당뇨를 진단은 환자의 혈장에 기반한 질량 스펙트럼을 도시한 것이다.
도 10은 본 발명의 실시예에서 코로나를 확진받지 않은 정상인 콧물 시료(nasal fluid)와 코로나를 확진받은 환자의 콧물 시료(nasal fluid)에 기반한 질량 스펙트럼을 도시한 것이다.
도 11은 본 발명의 실시예에서 코로나 진단용 질병 마커(marker)의 신뢰도를 나타낸 것이다.
도 12는 본 발명의 실시예에서 치매를 진단받지 않은 정상 쥐의 혈청과 치매를 진단받은 쥐의 혈청에 기반한 질량 스펙트럼을 도시한 것이다.
도 13은 본 발명의 일 실시예에 따른 (a) 샘플 미탑재, (b) 겐티스산 샘플 및 (c) N결합 글라이칸 샘플의 질량 스펙트럼을 나타낸 도이다.
도 14는 도 13의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 15는 본 발명의 일 실시예에 따른 알파시아노 히드록시시나믹 산(CHCA) 컨디션에서 (a) 샘플 미탑재, (b) CHCA 샘플 및 (c) 시나핀 산 샘플의 질량 스펙트럼을 나타낸 도이다.
도 16은 도 15의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 17은 본 발명의 일 실시예에 따른 시나핀 산 컨디션에서 (a) 샘플 미탑재, (b) CHCA 샘플 및 (c) 시나핀 산 샘플의 질량 스펙트럼을 나타낸 도이다.
도 18은 도 17의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 19는 본 발명의 일 실시예에 따른 사람 혈청 컨디션에서 (a) 정상 상태 샘플, (b) 유방암 진단 샘플 및 (c) 기능성 위장장애 진단 샘플의 질량 스펙트럼을 나타낸 도이다.
도 20은 도 19의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 21은 본 발명의 일 실시예에 따른 사람 혈장 컨디션에서 (a) 임신 상태 진단 샘플, (b) 자간전증 진단 샘플, (c) 임신성 당뇨병 진단 샘플 및 (d) 미숙아 진단 샘플의 질량 스펙트럼을 나타낸 도이다.
도 22는 도 21의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 23은 본 발명의 일 실시예에 따른 결핵균을 같은 종의 (a) 제1 strain (b) 제2 strain 및 (c) 제3 strain에 대한 질량 스펙트럼을 나타낸 도이다.
도 24는 본 발명의 일 실시예에 따른 비결핵항산균 중 (a) 미코박테리움 압세수스(Mycobacterium abscessus), (b) 미코박테리움복합체(Mycobacterium avium) 및 (c) 미코박테리움 칸사시(Mycobacterium kansasii)에 대한 질량 스펙트럼을 나타낸 도이다.
도 25는 본 발명의 일 실시예에 따른 모의실험 중, 규격화를 위한 질량값 범위를 설정하고, 각 설정범위에 따른 재현성을 확인한 실험 결과에 대한 도이다.
도 2는 본 발명의 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 방법의 순서도이다.
도 3은 본 발명의 실시예에서 MALDI-TOF 질량 분석법에 의해 도출된 질량 스펙트럼의 일 실시예이다.
도 4는 본 발명의 일 실시예에 따른 질량 스펙트럼의 X축값(m/z) 구간을 설정하는 과정의 예시도이다.
도 5는 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 데이터에 기반한 csv파일의 예시도이다.
도 6은 도 5의 csv파일에 기반한 질량 스펙트럼이다.
도 7은 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 csv 파일에 기반한 질량 스펙트럼이다.
도 8은 본 발명의 실시예에서 유방암을 진단받지 않은 정상인 혈청과 난소암을 진단받은 환자의 혈청에 기반한 질량 스펙트럼을 도시한 것이다.
도 9는 본 발명의 실시예에서 임신성 당뇨를 진단받지 않은 정상인 혈장과 임신성 당뇨를 진단은 환자의 혈장에 기반한 질량 스펙트럼을 도시한 것이다.
도 10은 본 발명의 실시예에서 코로나를 확진받지 않은 정상인 콧물 시료(nasal fluid)와 코로나를 확진받은 환자의 콧물 시료(nasal fluid)에 기반한 질량 스펙트럼을 도시한 것이다.
도 11은 본 발명의 실시예에서 코로나 진단용 질병 마커(marker)의 신뢰도를 나타낸 것이다.
도 12는 본 발명의 실시예에서 치매를 진단받지 않은 정상 쥐의 혈청과 치매를 진단받은 쥐의 혈청에 기반한 질량 스펙트럼을 도시한 것이다.
도 13은 본 발명의 일 실시예에 따른 (a) 샘플 미탑재, (b) 겐티스산 샘플 및 (c) N결합 글라이칸 샘플의 질량 스펙트럼을 나타낸 도이다.
도 14는 도 13의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 15는 본 발명의 일 실시예에 따른 알파시아노 히드록시시나믹 산(CHCA) 컨디션에서 (a) 샘플 미탑재, (b) CHCA 샘플 및 (c) 시나핀 산 샘플의 질량 스펙트럼을 나타낸 도이다.
도 16은 도 15의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 17은 본 발명의 일 실시예에 따른 시나핀 산 컨디션에서 (a) 샘플 미탑재, (b) CHCA 샘플 및 (c) 시나핀 산 샘플의 질량 스펙트럼을 나타낸 도이다.
도 18은 도 17의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 19는 본 발명의 일 실시예에 따른 사람 혈청 컨디션에서 (a) 정상 상태 샘플, (b) 유방암 진단 샘플 및 (c) 기능성 위장장애 진단 샘플의 질량 스펙트럼을 나타낸 도이다.
도 20은 도 19의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 21은 본 발명의 일 실시예에 따른 사람 혈장 컨디션에서 (a) 임신 상태 진단 샘플, (b) 자간전증 진단 샘플, (c) 임신성 당뇨병 진단 샘플 및 (d) 미숙아 진단 샘플의 질량 스펙트럼을 나타낸 도이다.
도 22는 도 21의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 23은 본 발명의 일 실시예에 따른 결핵균을 같은 종의 (a) 제1 strain (b) 제2 strain 및 (c) 제3 strain에 대한 질량 스펙트럼을 나타낸 도이다.
도 24는 본 발명의 일 실시예에 따른 비결핵항산균 중 (a) 미코박테리움 압세수스(Mycobacterium abscessus), (b) 미코박테리움복합체(Mycobacterium avium) 및 (c) 미코박테리움 칸사시(Mycobacterium kansasii)에 대한 질량 스펙트럼을 나타낸 도이다.
도 25는 본 발명의 일 실시예에 따른 모의실험 중, 규격화를 위한 질량값 범위를 설정하고, 각 설정범위에 따른 재현성을 확인한 실험 결과에 대한 도이다.
이하, 본 개시의 일부 실시예들을 예시적인 도면을 참조하여 상세하게 설명한다. 각 도면의 구성 요소들에 참조부호를 부가함에 있어서, 동일한 구성 요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가질 수 있다. 또한, 본 실시예들을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 기술 사상의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략할 수 있다. 본 명세서 상에서 언급된 "포함한다", "갖는다", "이루어진다" 등이 사용되는 경우 "~만"이 사용되지 않는 이상 다른 부분이 추가될 수 있다. 구성 요소를 단수로 표현한 경우에 특별한 명시적인 기재 사항이 없는 한 복수를 포함하는 경우를 포함할 수 있다.
또한, 본 개시의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질, 차례, 순서 또는 개수 등이 한정되지 않는다.
구성 요소들의 위치 관계에 대한 설명에 있어서, 둘 이상의 구성 요소가 "연결", "결합" 또는 "접속" 등이 된다고 기재된 경우, 둘 이상의 구성 요소가 직접적으로 "연결", "결합" 또는 "접속" 될 수 있지만, 둘 이상의 구성 요소와 다른 구성 요소가 더 "개재"되어 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다. 여기서, 다른 구성 요소는 서로 "연결", "결합" 또는 "접속" 되는 둘 이상의 구성 요소 중 하나 이상에 포함될 수도 있다.
구성 요소들이나, 동작 방법이나 제작 방법 등과 관련한 시간적 흐름 관계에 대한 설명에 있어서, 예를 들어, "~후에", "~에 이어서", "~다음에", "~전에" 등으로 시간적 선후 관계 또는 흐름적 선후 관계가 설명되는 경우, "바로" 또는 "직접"이 사용되지 않는 이상 연속적이지 않은 경우도 포함할 수 있다.
한편, 구성 요소에 대한 수치 또는 그 대응 정보(예: 레벨 등)가 언급된 경우, 별도의 명시적 기재가 없더라도, 수치 또는 그 대응 정보는 각종 요인(예: 공정상의 요인, 내부 또는 외부 충격, 노이즈 등)에 의해 발생할 수 있는 오차 범위를 포함하는 것으로 해석될 수 있다.
도 1은 본 발명의 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 시스템의 블록도이다. 본 발명의 일 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 시스템(1)은, 혈액 샘플 또는 체액 샘플에 대한 질량 스펙트럼을 획득하고, 질량 스펙트럼에 대한 후처리를 수행하며, 후처리된 질량 스펙트럼을 학습하여 임의의 혈액 샘플 또는 체액 샘플에 대한 질병 진단을 수행하도록 형성된다. 이를 위해 본 발명의 일 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 시스템(1)은 도 1에 도시된 바와 같이 질량 스펙트럼 획득부(11), 질량 스펙트럼 후처리부(13), 진단 기준 정보 획득부(15) 및 질병 진단부(17)를 포함하도록 형성될 수 있다.
본 발명의 질량 스펙트럼 획득부(11)는 임의의 혈액 샘플 또는 체액 샘플에 대한 질량 스펙트럼을 획득하도록 형성된다. 본 발명의 일 실시예에서 질량 스펙트럼 획득부(11)는 일 예로 말디토프 질량 분석기를 이용하여 질량 스펙트럼을 획득하도록 형성될 수 있다. 말디토프 질량 분석기는 매트릭스 보조 레이저 탈착/이온화 비행시간 분석형(Matrix Assisted Laser Desorption/Ionization Time of Flight, MALDI-TOF)으로, 시료에 특정 물질을 혼합하고, 혼합된 시료에 레이저를 방출하여 시료의 이온화를 시킨 후 전하를 띤 이온들이 검출기에까지 도달하는 시간을 측정하여 질량 스펙트럼을 생성하는 장치이다. 본 발명의 일 실시예에서는 상술한 말디토프 질량 분석기를 이용하지만, 이는 하나의 실시예에 불과하며, 다른 질량 스펙트럼을 생성하는 장치를 사용할 수도 있다.
상술한 질량 스펙트럼 획득부(11)에서 질량 스펙트럼을 획득하기 위해 사용되는 임의의 혈액 샘플 또는 체액 샘플은 학습용 혈액/체액 샘플 또는 진단용 혈액/체액 샘플일 수 있다. 학습용 혈액/체액 샘플은, 선행 검사를 통한 제n 질병의 확진 여부에 따라 결정되는 제n 질병 확진자 및 제n 질병 비확진자의 혈액/체액 샘플을 포함할 수 있고, 진단용 혈액/체액 샘플은, 선행 검사가 수행되지 않아 제n 질병의 확진 여부를 판단할 수 없는 피검자 혈액/체액 샘플을 포함할 수 있다.
본 발명의 질량 스펙트럼 획득부(11)는 학습용 혈액/체액 샘플을 이용하여 제n 질량 스펙트럼을 획득하고, 제n 질량 스펙트럼은 학습용 혈액/체액 샘플이 제n 질병 확진자의 혈액/체액 샘플인 경우, 제n-1 또는 제n-3 질량 스팩트럼을 포함하며, 학습용 혈액/체액 샘플이 제n 질병 비확진자의 혈액 샘플인 경우 제n-2 또는 제 n-4 질량 스펙트럼을 포함하도록 형성될 수 있다. 여기서, 제n-1 및 제n-2 질량 스펙트럼은, 혈액 샘플이 혈청인 경우의 질량 스펙트럼이고, 제n-3 및 제n-4 질량 스펙트럼은, 혈액 샘플이 혈장인 경우의 질량 스펙트럼일 수 있다.
상술한 내용을 보다 쉽게 설명하면 다음과 같다. 본 발명의 질량 스펙트럼 획득부(11)는 제1질병에 대하여 학습용 혈액 샘플을 이용하여 제1 질량 스펙트럼을 획득할 수 있다. 질량 스펙트럼 획득부(11)는 학습용 혈액 샘플 중 제1질병에 대한 확진자인 제1질병 확진자의 혈액 샘플을 이용하여 제1-1 질량 스펙트럼 또는 제1-3 질량 스펙트럼을 획득할 수 있다.
또, 질량 스펙트럼 획득부(11)는 학습용 혈액 샘플 중 제1질병에 대한 비확진자인 제1질병 비확진자의 혈액 샘플을 이용하여 제1-2 질량 스펙트럼 또는 제1-4 질량 스펙트럼을 획득할 수 있다. 여기서, 제1 질병의 확진 여부는 선행되는 검사를 통해 정확하게 결정되며, 확진 여부가 판단되지 않은 사람의 경우 비확진자에 해당하지 않는다. 제1 질병은 통상적인 진단 방법 또는 조직검사 등을 통해 진단받은 질병을 의미하며, 일 예로 당뇨, 치매, 임신성 당뇨, 조산 등을 포함할 수 있다.
제1-1 질량 스펙트럼 및 제1-2 질량 스펙트럼은 혈액 샘플로 혈청을 이용하여 획득되는 질량 스펙트럼일 수 있고, 제1-3 질량 스펙트럼 및 제1-4 질량 스펙트럼은 혈액 샘플로 혈장을 이용하여 획득되는 질량 스펙트럼일 수 있다.
상술한 제1질병에 대한 질량 스펙트럼인 제1질병 스펙트럼은 복수의 학습용 혈액 샘플을 이용하여 획득될 수 있다.
또, 본 발명의 질량 스펙트럼 획득부(11)는 상술한 제1질병에 대한 질량 스펙트럼과 마찬가지로 제2질병에 대해서도 복수의 질량 스펙트럼을 획득할 수 있다. 여기서 제2질병 질량 스펙트럼은 제2질병의 확진자 및 비확진자의 혈액 샘플로부터 획득되는 질량 스펙트럼일 수 있다. 유사한 방법으로 본 발명의 질량 스펙트럼 획득부(11)는 제n질병에 대한 스펙트럼인 제n질병 질량 스펙트럼으로 제n질병의 확진자의 혈액/체액 샘플을 이용하여 획득되는 제n-1 및 제n-3 질량 스펙트럼과 제n질병의 비확진자의 혈액/체액 샘플을 이용하여 획득되는 제n-2 및 제n-4 질량 스펙트럼을 포함하여 획득하도록 형성될 수 있다.
본 발명의 일 실시예에서 각 질병에 대한 질량 스펙트럼은 복수의 확진자 및 비확진자로부터 획득될 수 있으며, 획득되는 제n질병 질량 스펙트럼의 개수가 증가할수록 후술되는 기계학습 결과의 정확도가 증가할 수 있다.
본 발명의 일 실시예에서 혈액 샘플은 혈청 및 혈장을 모두 의미할 수 있으며, 상술한 설명에서는 혈청과 혈장을 분리하여 질량 스펙트럼을 각각 획득하는 것으로 설명하였지만 제n-5 질량 스펙트럼 및 제n-6 질량 스펙트럼은 각각 혈청과 혈장을 모두 포함하는 확진자 및 비확진자의 혈액 샘플로부터 획득되는 질량 스펙트럼일 수도 있다.
또한, 질량 스펙트럼 획득부(11)는 진단용 혈액/체액 샘플을 통해 진단 대상자의 질량 스펙트럼을 획득하도록 형성될 수도 있다. 여기서 진단 대상자는 임의의 질병의 확진 여부를 선행 검사를 통해 확인하지 않은 사람일 수 있으며, 진단 대상자의 혈액/체액 샘플을 통해 획득되는 피검자 질량 스펙트럼은 본 발명의 일 실시예에서는 학습용 데이터로 사용되지 않을 수 있다. 또, 피검자 질량 스펙트럼은 제1 피검자 스펙트럼 내지 제3 피검자 스펙트럼 중 적어도 하나를 포함하도록 정의될 수 있으며, 제1 피검자 스펙트럼은 진단용 혈액 샘플이 혈청인 경우의 질량 스펙트럼을 의미하고, 제2 피검자 스펙트럼은 진단용 혈액 샘플이 혈장인 경우의 질량 스펙트럼을 의미하며, 제3 피검자 스펙트럼은 혈청과 혈장을 모두 포함하는 혈액 샘플로부터 도출되는 질량 스펙트럼을 의미할 수 있다.
본 발명에서 도출되는 질량 스펙트럼의 X축은, 혈액/체액 샘플에 포함되는 다양한 종류들의 생체 성분들의 질량 대 전하비(m/z)를 의미하며, 이는 분자량(Dalton)을 의미한다. 또, 질량 스펙트럼의 Y축은, 혈액/체액 샘플에 포함되는 다양한 종류의 생체 성분들의 함유량(intensity)을 의미할 수 있다. 본 발명의 일 실시예에 따른 MALDI-TOF 질량 분석법에 의해 도출된 질량 스펙트럼의 일 예시인 도 3을 참고하면, X축의 16,000에 대응되는 Y축의 85%는 16,000 분자량에 대응되는 물질(일 예로 물질 A)의 함유량이 85%인 것을 의미한다.
본 발명의 일 실시예에 따르면, 제1확진자 및 제1비확진자의 혈액으로부터 혈청과 혈장을 분리할 수 있다. 일 예로 채혈한 혈액의 응고를 위해 일정시간동안 저온에 놓아두었다가 원심분리를 통해 혈액 샘플로부터 혈청을 분리할 수 있으며, 이러한 혈청/혈장 분리 방법은 일반적으로 널리 사용되는 다양한 방식을 이용할 수도 있다.
본 발명의 일 실시예에 따른 질량 스펙트럼 획득부(11)는 분리된 혈청을 소정의 혼합 플레이트에서 기 설정된 물질과 혼합하여 질량 스펙트럼을 획득하도록 형성될 수 있다. 여기서 기 설정된 물질은 매트릭스 물질로, 매트릭스 물질은 레이저로부터 에너지를 흡수하여 쉽게 이온화 될 수 있는 물질로 말디토프 질량 분석기를 통해 질량 스펙트럼을 획득하기 위해 사용되는 물질일 수 있다. 말디토프 질량 분석기는 매트릭스를 이용한 이온 전달 과정에서 시료를 간접적으로 이온화 하도록 구성된다. 본 발명의 일 실시예에서 매트릭스 물질은 레이저에 의해 쉽게 여(excitation)되는 구조를 갖는 유기화합물일 수 있다.
질량 스펙트럼 획득부(11)는 혼합 플레이트에서 혼합된 물질이 포함된 영역에 레이저를 조사하여 혈청의 생체 성분을 이온화 할 수 있다. 이온화된 혈청의 생체성분은 전기장 하에서 이동되어 검출기에 의해 검출될 수 있다. 검출기는 이온화 된 혈청의 생체성분을 포함하는 혼합 플레이트로부터 이격된 위치에 배치될 수 있으며, 이온화된 혈청의 생체성분들은 전기장에 의하여 가속되어 검출기 방향으로 이동될 수 있다. 이때, 이온들이 이동하는 공간은 정확한 측정을 위해 진공으로 유지될 수 있다.
질량 스펙트럼 획득부(11)는 이온화된 혈청의 생체성분들의 검출기 도달시간을 측정함으로써, 혈청의 생체 성분들의 질량 스펙트럼을 도출할 수 있다. 혈청 생체성분으로부터 생성된 이온들은 전기장에 의해 가속되어 이동하는 동안 질량 대 전하비에 따라 분리된다. 따라서, 각각의 이온이 검출기에 도달하는 시간을 이용하여 해당 이온의 질량 대 전하비를 특정할 수 있다. 이러한 과정을 통해 복수의 이온들에 대해 수행함으로써 복수의 이온들의 질량 대 전하비 및 이의 세기를 질량 스펙트럼 형태로 도출해낼 수 있다.
또, 본 발명의 질량 스펙트럼 획득부(11)는 분리된 혈장 샘플로부터 혈장을 구성하는 생체 성분들을 상술한 방법과 동일한 방법으로 질량 스펙트럼 형태로 도출해 낼 수 있다.
나아가, 본 발명의 일 실시예에 따른 질량 스펙트럼 획득부(11)는 기 설정된 물질에 대한 질량 스펙트럼인 베이스 질량 스펙트럼을 더 획득하도록 형성될 수 있다. 기 설정된 물질은 상술한 바와 같이 본 발명의 일 실시예에서 말디토프 질량 분석기를 이용하기 때문에 본 발명의 일 실시예에서는 매트릭스 물질로 정의될 수 있다.
본 발명의 일 실시예의 질량 스펙트럼 획득부(11)는 제n질병 질량 스펙트럼 및 피검자 질량 스펙트럼을 획득하기 위해 임의의 혈액/체액 샘플에 매트릭스를 혼합하는 전처리를 수행하기 때문에, 본 발명의 후술되는 진단 기준 정보 획득부(15)에서 매트릭스로 인해 발생할 수 있는 오차를 보정하기 위해 매트릭스만을 이용하여 획득하는 질량 스펙트럼인 베이스 질량 스펙트럼을 더 획득하도록 형성될 수도 있다.
한편, 본 발명의 일 실시예에서 질량 스펙트럼 획득부(11)는 학습용 질량 스펙트럼을 보다 많이 획득하기 위해 적대적 생성 신경망(GAN)을 이용하여 학습용 질량 스펙트럼을 획득하도록 형성될 수 있다. 여기서, 적대적 생성 신경망을 이용하여 생성되는 학습용 질량 스펙트럼은 바람직하게는 비확진자의 질량 스펙트럼일 수 있으며, 제m-2 및 제m-4 질량 스펙트럼으로 정의될 수 있다.
제m-2 및 제m-4 질량 스펙트럼은 선행 검사에서 획득된 다양한 부가 정보를 이용하여 적대적 생성 신경망(GAN)을 통해 생성될 수 있으며, 적대적 생성 신경망의 학습을 위해 기 획득되는 제n-2 및 제n-4 질량 스펙트럼을 이용할 수 있다. 적대적 생성 신경망을 통해 생성되는 제m-2 및 제m-4 질량 스펙트럼은 후술되는 진단 정보 생성부(15)에서 수행되는 기계학습의 데이터로 사용될 수도 있다.
질량 스펙트럼 후처리부(13)는 질량 스펙트럼에 대한 후처리를 수행하고, 후처리 된 질량 스펙트럼인 규격화 질량 스펙트럼을 생성하도록 형성된다. 여기서, 후처리는 질량 스펙트럼을 기 설정된 분자량 범위로 구분하고, 각 분자량 범위에 대응하는 평균 강도값을 획득하는 처리일 수 있다. 본 발명의 일 실시예에서 기 설정된 분자량 범위는 바람직하게는 5 분자량(m/z) 범위일 수 있으며, 평균 강도값은 해당 분자량 범위 별로 획득되는 값으로 해당 분자량 범위 내의 각 분자량 별 함유량(진폭)의 평균값일 수 있다.
질량 스펙트럼 후처리부(13)는 질량 스펙트럼들의 X축 값(분자량, m/z)을 기 설정한 기준에 따라 범위를 설정하여 구간을 설정하고, 각 구간에 해당하는 대표 Y축값(intensity)을 연산하여 규격화 질량 스펙트럼을 생성한다. 이러한 규격화 질량 스펙트럼은, 후처리가 수행되지 않은 질량 스펙트럼에 비해 1/5의 데이터 양을 가지기 때문에 처리 속도가 증가하는 효과를 가질 수 있다.
도 4에는 본 발명의 일 실시예에 따른 질량 스펙트럼의 X축값(m/z) 구간을 설정하는 과정의 예시가 도시되고 있다. 도 4를 참고하면, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부(13)는 데이터화 된 질량 스펙트럼에서 X축을 각 5m/z 질량값 범위로 구분하고 각 범위에 포함되는 Y축의 값인 분자량 별 함유량의 산술평균을 획득할 수 있다. 여기서 획득되는 산술평균인 평균 강도값은 해당 범위의 대표 Y축값으로 설정될 수 있다.
보다 상세하게는 도 4와 같은 본 발명의 질량 스펙트럼은 5m/z 질량값으로 구간이 설정될 수 있으며, 일 예로 제1 구간은 질량값이 2000m/z 이상 2005m/z 미만으로 설정될 수 있고, 제2 구간은 2005m/z 이상 2010m/z 미만으로 설정될 수 있으며, 제3 구간은 2010m/z 이상 2015m/z의 질량값 범위로 설정될 수 있다. 본 발명의 질량 스펙트럼 후처리부(13)는 상술한 방법으로 나머지 X축에 대해서도 구간을 설정할 수 있다.
이수 본 발명의 질량 스펙트럼 후처리부(13)는 각 구간에 포함되는 X축 값의 개수를 획득한다. 도 4의 실시예에서 제1 구간에 해당하는 X축 값(질량값)은 모두 11개이며, 제2 구간에 해당되는 X축 값(질량 값)은 10개, 제3 구간에 해당되는 X축 값(질량 값)은 10개로 나타난다. 질량 스펙트럼 후처리부(13)는 각 구간의 X축 값의 개수를 획득하면, 각 구간에 포함되는 각 질량값에 대응하는 Y축값의 합을 획득하도록 형성된다.
제1 구간의 질량값이 11개이며, 각 질량값에 대응하는 함유량(Y축 값)은 각각 713.036473, 714.449364, 718.159696, 721.247946, 721.581995, 719.516345, 720.554283, 719.954358, 717.345025, 716.622388, 718.549988로 나타나며, 이들의 합은 7901.017861이다. 따라서, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부(13)는 제1 구간의 Y축 평균값인 평균 강도값으로 718.274351을 획득할 수 있으며, 획득한 평균 강도 값을 대표 Y축값으로 설정할 수 있다.
같은 방식으로, 같은 제2 구간에 해당되는 X축값은 2005m/z 이상 2010m/z 미만이며, 제2 구간에 해당되는 X축값은 모두 10개로 나타난다. 따라서, 질량 스펙트럼 후처리부(13)는 제2 구간에 해당되는 Y축값인 717.2734431, 713.3279136, 708.9136926, 709.2716024, 713.3926782, 715.8145345, 718.4136415, 720.0549136, 717.1967481, 714.416982을 획득하여 총합 7148.076150을 계산하고, 평균을 계산하여 제2구간의 대표 Y축값으로 714.807615를 획득할 수 있다.
같은 방식을 반복하면 도 4의 실시예에서 제3 구간의 대표 Y축값은 707.810649으로 획득되며, 제4 구간의 대표 Y축값은 698.355865로 획득될 수 있다.
한편, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부(13)는 각 구간별로 대표 X축 값(대표 분자량)을 더 정의하도록 형성될 수 있다. 본 발명의 바람직한 실시예에서 대표 X축 값은 각 범위를 구성하는 가장 작은 분자량일 수 있다. 즉, 제1구간의 경우 2000m/z가 대표 X축 값으로 설정될 수 있고, 제2구간은 2005m/z가 대표 X축 값으로 설정될 수 있으며, 제3구간은 2010m/z가 대표 X축 값으로 설정되며, 제4구간은 2015m/z가 대표 X축 값으로 설정될 수 있다.
상술한 후처리를 통해 도출되는 규격화 질량 스펙트럼은, 분석을 원하는 타겟 물질의 표준시료를 사용하지 않고 소정 구간의 평균을 구한 후 그 평균 값을 인공지능 패턴 분석 데이터로 사용하도록 형성되기 때문에 기존의 질량 분석기에서 사용되는 타겟 물질의 표준 시료를 사용하지 않아도 되는 효과를 가진다.
또한, X축값(m/z) 측정 시 좌/우로 500 내지 5000ppm 단위의 측정 오차가 발생하더라도 측정 오차가 각 구간 범위에 포함되어 측정 오차에 대한 별도의 보정을 수행하지 않을 수 있다는 장점을 가진다.
상술한 설명에서는 각 구간을 5m/z로 구분하였으나, 이는 본 발명의 하나의 실시예에 불과하며 사용자의 설정에 따라 구간 범위가 조절될 수 있다.
도 5에는 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 데이터에 기반한 csv파일의 예시도가 도시되고 있으며 도 6에는 도 5의 csv파일에 기반한 질량 스펙트럼이 도시되고 있고, 도 7에는 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 csv 파일에 기반한 질량 스펙트럼이 도시되고 있다.
도 6에 도시된 질량 스펙트럼과 도 7에 도시된 질량 스펙트럼은 그 패턴이 동일하게 나타난다. 따라서, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부(15)는 구간별 대표 Y축값을 연산하여 처리된 질량 스펙트럼을 활용하여 질병용 마커를 추출할 수 있다.
진단 기준 정보 획득부(15)는 규격화 질량 스펙트럼을 이용하여 기계학습을 수행하고, 기계학습 결과 제n질병의 적어도 하나의 마커를 획득하도록 형성된다. 진단 기준 정보 획득부(15)는 기계학습을 수행하기 위해 규격화 질량 스펙트럼 중 학습용 혈액 샘플을 이용하여 획득되는 학습용 규격화 질량 스펙트럼을 이용하여 기계학습을 수행할 수 있으며, 기계학습의 결과를 이용하여 마커를 획득할 수 있다.
여기서, 기계학습은 일 예로, 각 질량 스펙트럼 별로 수행될 수 있으며, 각 질량 스펙트럼은 같은 분류의 확진자 또는 비확진자 및 같은 분류의 혈액 샘플을 통해 획득되는 질량 스펙트럼일 수 있다.
보다 상세히 설명하면 기계학습은 제n질병과 관련된 혈액 샘플로부터 획득된 질량 스펙트럼들을 후처리하여 획득되는 제n질병의 규격화 질량 스펙트럼들 각각에 대하여 수행될 수 있다. 제n질병의 규격화 질량 스펙트럼들은 제n-1 규격화 질량 스펙트럼 내지 제n-4 규격화 질량 스펙트럼으로 표현되며, 이는 상술한 바와 같이 제n질병의 확진자/비확진자의 혈청/혈장으로부터 획득되는 질량 스펙트럼에 각각 후처리가 수행되어 획득되는 규격화 질량 스펙트럼일 수 있다.
여기서, 기계학습 결과는 제n-1 규격화 질량 스펙트럼의 기계학습 결과인 제n-1 기계학습 결과 또는 제n-3 규격화 질량 스펙트럼의 기계학습 결과인 제n-3 기계학습 결과 중 어느 하나와, 제n-2 규격화 질량 스펙트럼의 기계학습 결과인 제n-2 기계학습 결과 또는 제n-4 규격화 질량 스펙트럼의 기계학습 결과인 제n-4 기계학습 결과 중 어느 하나를 포함하여 출력될 수 있다. 본 발명의 바람직한 실시예에서는 제n-1 기계학습 결과가 출력되는 경우 제n-2 기계학습 결과가 함께 출력되고, 제n-3 기계학습 결과가 출력되는 경우 제n-4 기계학습 결과가 함께 출력될 수 있다. 이는 제n-1 및 제n-2가 혈청 샘플을 이용하며, 제n-3 및 제n-4가 혈장 샘플을 이용하기 때문으로, 동일한 샘플의 기계학습 결과를 서로 비교하여야 후술되는 마커를 정확하게 획득할 수 있기 때문이다.
또, 상술한 기계학습 결과는, 베이스 규격화 질량 스펙트럼의 기계학습 결과를 이용하여 매트릭스로 인해 발생하는 질량 스펙트럼의 오차를 보정한 결과일 수도 있다. 본 발명의 일 실시예에서는 말리토프 질량 분석기를 이용하여 질량 스펙트럼을 도출한다. 이를 위해 혈액 샘플에는 높은 이온화 정도를 가지는 물질인 매트릭스가 혼합되게 된다. 레이저의 조사를 통해 이온화되는 혈액 샘플에는 이러한 매트릭스들이 포함될 수 있으며, 매트릭스들은 혈액 샘플의 질량 스펙트럼을 도출하기 위해 필수적인 구성으로 사용될 수밖에 없지만, 그와 동시에 혈액 샘플의 질량 스펙트럼에 함께 검출되어 질량 스펙트럼에 노이즈(오차)를 발생시킬 수 있다는 문제점이 존재한다.
따라서, 본 발명의 일 실시예에서는 이러한 매트릭스로 인해 발생하는 노이즈를 제거하여 보다 정확한 마커를 획득하기 위해 베이스 규격화 질량 스펙트럼의 기계학습 결과를 획득하고, 기계학습 결과를 제n질병 규격화 질량 스펙트럼의 기계학습 결과에서 제거하여 순수한 혈액 샘플로부터 도출될 것으로 예상되는 기계학습 결과인 보정된 기계학습 결과를 획득하여 기계학습 결과로 사용할 수도 있다.
진단 기준 정보 획득부(15)는 제n-1 기계학습 결과 및 제n-2 기계학습 결과를 비교한 제1 비교 결과 또는 제n-3 기계학습 결과 및 제n-4 기계학습 결과를 비교한 결과인 제2 비교 결과를 이용하여 적어도 하나의 마커를 획득하도록 형성된다. 제1 비교 결과는 제n-1 기계학습 결과와 제n-2 기계학습 결과에서 두 결과에의 각 분자량 범위에 대응하는 평균 강도 값을 동일한 범위끼리 비교하고, 비교 결과 그 차이가 기 설정된 범위를 벗어나는 경우, 해당 범위를 제 n질병 마커로 획득하도록 형성될 수 있다.
본 발명의 일 실시예에서 진단 기준 정보 획득부(15)는 제1 비교 결과 또는 제2 비교 결과만을 이용하여 제n 질병 마커를 획득하도록 형성될 수도 있지만, 제1비교 결과와 제2비교 결과를 모두 이용하여 제n질병 마커를 획득하도록 형성될 수도 있다.
또, 본 발명의 일 실시예에서 진단 기준 정보 획득부(15)는 제n질병 마커를 기 설정된 범위를 이용하여 제n질병의 중증도를 결정하기 위한 중증도 정보를 더 생성할 수도 있다. 중증도 정보는 특정 질병을 나타내는 분자량의 피크 값에 따라 해당 질병의 중증도를 결정하기 위한 정보이다. 본 발명의 일 실시예에서 진단 기준 정보 획득부(15)는 선행 검사가 수행된 제n질병 확진자의 중증도를 기계학습하여 도출되는 중증도 학습 결과를 획득하고, 중증도 학습 결과를 기 설정된 범위로 구분할 수 있다. 기 설정된 범위는 정상, 경증, 중등증 및 중증으로 구분될 수 있다. 정상의 경우에는 제n질병 비확진자의 정보를 이용하여 해당 마커의 피크값의 평균을 통해 획득될 수 있다.
이를 이용하면, 본 발명의 일 실시예의 시스템(1)은, 단순히 제n질병의 확진 여부만을 판단하는 것을 넘어 해당 질병의 확진 판정이 수행되는 경우 해당 질병이 어느 정도 진행되었는지도 확인할 수 있는 효과를 가진다.
본 발명의 일 실시예에 따른 질병 진단부(17)는 피검자 혈액 샘플로부터 획득되는 피검자 규격화 질량 스펙트럼과 마커를 비교하고, 기 설정된 기준을 만족하는 경우, 피검자 혈액 샘플로부터 제n질병이 진단된 것으로 판단하여 제n질병 진단 정보를 생성하도록 형성될 수 있다.
여기서, 피검자 규격화 질량 스펙트럼은, 피검자 혈액 샘플로부터 획득되는 제1 피검자 질량 스펙트럼 또는 제2 피검자 질량 스펙트럼에 대해 후처리를 진행하여 획득되는 제1 피검자 규격화 질량 스펙트럼 또는 제2 피검자 규격화 질량 스펙트럼을 포함할 수 있다.
질병 진단부(17)는 피검자 규격화 질량 스펙트럼을 획득하면, 기계학습 결과를 통해 도출된 복수의 마커를 이용하여 피검자 규격화 질량 스펙트럼과의 비교를 수행한다. 이때, 피검자 규격화 질량 스펙트럼이 복수의 마커 모두와 일치하지 않는 경우, 해당 피검자가 건장한 상태로 질병에 확진되지 않은 것으로 판단할 수 있다. 또, 피검자 규격화 질량 스펙트럼이 복수의 마커 중 적어도 하나와 일치하는 경우, 질병 진단부(17)는 일치하는 모든 마커들을 획득하여 확진 분석용 요인으로 설정할 수 있다. 질병 진단부(17)는 확진 분석용 요인들을 이용하여 피검자가 어떤 질병에 확진되었는지를 판단한다. 복수의 마커는 각 질병들로부터 획득되며, 질병 진단부(17)는 모든 마커들을 이용하여 피검자 규격화 질량 스펙트럼에 대응하는 대응 마커들을 획득한다. 이후, 질병 진단부(17)는 대응 마커들과 일치하는 질병을 선택하고, 피검자가 해당 질병에 확진된 것으로 질병 진단 정보를 생성할 수 있다.
또, 질병 진단부(17)는 상술한 중증도 정보를 이용하여 피검자가 확진된 질병의 현재 중증도를 예측하도록 형성될 수도 있다. 질병 진단부(17)는 확진 질병을 확인하면, 해당 질병의 현재 중증도를 상술한 기 설정된 중증도 범위를 이용하여 예측할 수 있으며, 이를 통해 질병 진단부(17)에서는 현재 질병 및 중증도(진행 정도)를 포함하는 질병 진단 정보를 생성할 수 있다.
나아가, 질병 진단부(17)는 제n질병 사이의 관계를 이용하여 합병증 위험 여부를 더 판단하도록 형성될 수도 있다. 본 발명의 질병 진단부(17)는 제n질병들 사이에서 합병증을 유발할 수 있는 질병과, 해당 질병을 통해 발생할 수 있는 합병증 질병을 서로 연결하는 합병증 연결 정보를 획득할 수 있다.
일 예로 진단 질병이 당뇨인 경우, 심근경색, 뇌졸중, 망막증, 신부전 등과 같은 질병이 합병증으로 발생할 수 있다. 이러한 질병들을 더 도출하기 위해 본 발명의 질병 진단부(17)는 합병증 연결 정보를 이용하여 확진 질병으로부터 도출될 수 있는 합병증과 관련된 마커를 획득하고, 해당 마커에 대한 추가적인 확인을 수행할 수 있다. 해당 마커들의 피크가 상술한 중증도 범위에 포함되는 경우, 질병 진단부(17)는 해당 합병증이 존재하는 것으로 확인하여 합병증 확진 정보를 더 생성할 수도 있다.
하지만, 합병증을 의미하는 피크의 경우, 중증도 범위에서 정상 범위에 포함될 수도 있다. 이 경우, 질병 진단부(17)는 정상 범위에 포함되는 복수의 피크값(비확진자)을 획득하고, 확률 분포를 확인할 수 있다. 여기서 사용되는 확률 분포는 정규분포일 수 있으며, 질병 진단부(17)는 확률 분포를 이용하여 정상 범위 내에 질병 주의 범위를 더 생성할 수 있다. 질병 주의 범위는 정규 분포에서 기 설정된 표준편차 배수 범위를 벗어나는 범위로 형성될 수 있으며, 두 개의 범위 중 높은 범위에 대하여 질병 주의 범위를 생성할 수 있다.
질병 진단부(17)는 합병증을 의미하는 피크의 Y축값이 질병 주의 범위에 포함되는 경우, 해당 합병증이 발생할 가능성이 높은 합병증 주의 진단 정보를 더 생성하여 질병 진단 정보에 포함하도록 형성될 수도 있다.
도 2는 본 발명의 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 방법의 순서도이다. 본 발명의 일 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 방법(10)은, 혈액 샘플 또는 체액 샘플에 대한 질량 스펙트럼을 획득하고, 질량 스펙트럼에 대한 후처리를 수행하며, 후처리된 질량 스펙트럼을 학습하여 임의의 혈액 샘플 또는 체액 샘플에 대한 질병 진단을 수행하도록 형성된다. 이를 위해 본 발명의 일 실시예에 따른 질량 스펙트럼을 이용한 질병 진단 방법(10)은 도 2에 도시된 바와 같이 질량 스펙트럼 획득 단계(S11), 질량 스펙트럼 후처리 단계(S13), 진단 기준 정보 획득 단계(S15) 및 질병 진단 단계(S17)를 포함하도록 형성될 수 있다.
본 발명의 질량 스펙트럼 획득 단계(S11)는 질량 스펙트럼 획득부를 이용하여 임의의 혈액 샘플 또는 체액 샘플에 대한 질량 스펙트럼을 획득하도록 형성된다. 본 발명의 일 실시예에서 질량 스펙트럼 획득 단계(S11)는 일 예로 말디토프 질량 분석기를 이용하여 질량 스펙트럼을 획득하도록 형성될 수 있다. 말디토프 질량 분석기는 매트릭스 보조 레이저 탈착/이온화 비행시간 분석형(Matrix Assisted Laser Desorption/Ionization Time of Flight, MALDI-TOF)으로, 시료에 특정 물질을 혼합하고, 혼합된 시료에 레이저를 방출하여 시료의 이온화를 시킨 후 전하를 띤 이온들이 검출기에까지 도달하는 시간을 측정하여 질량 스펙트럼을 생성하는 장치이다. 본 발명의 일 실시예에서는 상술한 말디토프 질량 분석기를 이용하지만, 이는 하나의 실시예에 불과하며, 다른 질량 스펙트럼을 생성하는 장치를 사용할 수도 있다.
상술한 질량 스펙트럼 획득 단계(S11)에서 질량 스펙트럼을 획득하기 위해 사용되는 임의의 혈액 샘플 또는 체액 샘플은 학습용 혈액/체액 샘플 또는 진단용 혈액/체액 샘플일 수 있다. 학습용 혈액/체액 샘플은, 선행 검사를 통한 제n 질병의 확진 여부에 따라 결정되는 제n 질병 확진자 및 제n 질병 비확진자의 혈액/체액 샘플을 포함할 수 있고, 진단용 혈액/체액 샘플은, 선행 검사가 수행되지 않아 제n 질병의 확진 여부를 판단할 수 없는 피검자 혈액/체액 샘플을 포함할 수 있다.
본 발명의 질량 스펙트럼 획득 단계(S11)는 학습용 혈액/체액 샘플을 이용하여 제n 질량 스펙트럼을 획득하고, 제n 질량 스펙트럼은 학습용 혈액/체액 샘플이 제n 질병 확진자의 혈액/체액 샘플인 경우, 제n-1 또는 제n-3 질량 스팩트럼을 포함하며, 학습용 혈액/체액 샘플이 제n 질병 비확진자의 혈액 샘플인 경우 제n-2 또는 제 n-4 질량 스펙트럼을 포함하도록 형성될 수 있다. 여기서, 제n-1 및 제n-2 질량 스펙트럼은, 혈액 샘플이 혈청인 경우의 질량 스펙트럼이고, 제n-3 및 제n-4 질량 스펙트럼은, 혈액 샘플이 혈장인 경우의 질량 스펙트럼일 수 있다.
상술한 내용을 보다 쉽게 설명하면 다음과 같다. 본 발명의 질량 스펙트럼 획득 단계(S11)는 제1질병에 대하여 학습용 혈액 샘플을 이용하여 제1 질량 스펙트럼을 획득할 수 있다. 질량 스펙트럼 획득 단계(S11)는 학습용 혈액 샘플 중 제1질병에 대한 확진자인 제1질병 확진자의 혈액 샘플을 이용하여 제1-1 질량 스펙트럼 또는 제1-3 질량 스펙트럼을 획득할 수 있다.
또, 질량 스펙트럼 획득 단계(S11)는 학습용 혈액 샘플 중 제1질병에 대한 비확진자인 제1질병 비확진자의 혈액 샘플을 이용하여 제1-2 질량 스펙트럼 또는 제1-4 질량 스펙트럼을 획득할 수 있다. 여기서, 제1 질병의 확진 여부는 선행되는 검사를 통해 정확하게 결정되며, 확진 여부가 판단되지 않은 사람의 경우 비확진자에 해당하지 않는다. 제1 질병은 통상적인 진단 방법 또는 조직검사 등을 통해 진단받은 질병을 의미하며, 일 예로 당뇨, 치매, 임신성 당뇨, 조산 등을 포함할 수 있다.
제1-1 질량 스펙트럼 및 제1-2 질량 스펙트럼은 혈액 샘플로 혈청을 이용하여 획득되는 질량 스펙트럼일 수 있고, 제1-3 질량 스펙트럼 및 제1-4 질량 스펙트럼은 혈액 샘플로 혈장을 이용하여 획득되는 질량 스펙트럼일 수 있다.
상술한 제1질병에 대한 질량 스펙트럼인 제1질병 스펙트럼은 복수의 학습용 혈액 샘플을 이용하여 획득될 수 있다.
또, 본 발명의 질량 스펙트럼 획득 단계(S11)는 상술한 제1질병에 대한 질량 스펙트럼과 마찬가지로 제2질병에 대해서도 복수의 질량 스펙트럼을 획득할 수 있다. 여기서 제2질병 질량 스펙트럼은 제2질병의 확진자 및 비확진자의 혈액 샘플로부터 획득되는 질량 스펙트럼일 수 있다. 유사한 방법으로 본 발명의 질량 스펙트럼 획득 단계(S11)는 제n질병에 대한 스펙트럼인 제n질병 질량 스펙트럼으로 제n질병의 확진자의 혈액/체액 샘플을 이용하여 획득되는 제n-1 및 제n-3 질량 스펙트럼과 제n질병의 비확진자의 혈액/체액 샘플을 이용하여 획득되는 제n-2 및 제n-4 질량 스펙트럼을 포함하여 획득하도록 형성될 수 있다.
본 발명의 일 실시예에서 각 질병에 대한 질량 스펙트럼은 복수의 확진자 및 비확진자로부터 획득될 수 있으며, 획득되는 제n질병 질량 스펙트럼의 개수가 증가할수록 후술되는 기계학습 결과의 정확도가 증가할 수 있다.
본 발명의 일 실시예에서 혈액 샘플은 혈청 및 혈장을 모두 의미할 수 있으며, 상술한 설명에서는 혈청과 혈장을 분리하여 질량 스펙트럼을 각각 획득하는 것으로 설명하였지만 제n-5 질량 스펙트럼 및 제n-6 질량 스펙트럼은 각각 혈청과 혈장을 모두 포함하는 확진자 및 비확진자의 혈액 샘플로부터 획득되는 질량 스펙트럼일 수도 있다.
또한, 질량 스펙트럼 획득 단계(S11)는 진단용 혈액/체액 샘플을 통해 진단 대상자의 질량 스펙트럼을 획득하도록 형성될 수도 있다. 여기서 진단 대상자는 임의의 질병의 확진 여부를 선행 검사를 통해 확인하지 않은 사람일 수 있으며, 진단 대상자의 혈액/체액 샘플을 통해 획득되는 피검자 질량 스펙트럼은 본 발명의 일 실시예에서는 학습용 데이터로 사용되지 않을 수 있다. 또, 피검자 질량 스펙트럼은 제1 피검자 스펙트럼 내지 제3 피검자 스펙트럼 중 적어도 하나를 포함하도록 정의될 수 있으며, 제1 피검자 스펙트럼은 진단용 혈액 샘플이 혈청인 경우의 질량 스펙트럼을 의미하고, 제2 피검자 스펙트럼은 진단용 혈액 샘플이 혈장인 경우의 질량 스펙트럼을 의미하며, 제3 피검자 스펙트럼은 혈청과 혈장을 모두 포함하는 혈액 샘플로부터 도출되는 질량 스펙트럼을 의미할 수 있다.
본 발명에서 도출되는 질량 스펙트럼의 X축은, 혈액/체액 샘플에 포함되는 다양한 종류들의 생체 성분들의 질량 대 전하비(m/z)를 의미하며, 이는 분자량(Dalton)을 의미한다. 또, 질량 스펙트럼의 Y축은, 혈액/체액 샘플에 포함되는 다양한 종류의 생체 성분들의 함유량(intensity)을 의미할 수 있다. 본 발명의 일 실시예에 따른 MALDI-TOF 질량 분석법에 의해 도출된 질량 스펙트럼의 일 예시인 도 3을 참고하면, X축의 16,000에 대응되는 Y축의 85%는 16,000 분자량에 대응되는 물질(일 예로 물질 A)의 함유량이 85%인 것을 의미한다.
본 발명의 일 실시예에 따르면, 제1확진자 및 제1비확진자의 혈액으로부터 혈청과 혈장을 분리할 수 있다. 일 예로 채혈한 혈액의 응고를 위해 일정시간동안 저온에 놓아두었다가 원심분리를 통해 혈액 샘플로부터 혈청을 분리할 수 있으며, 이러한 혈청/혈장 분리 방법은 일반적으로 널리 사용되는 다양한 방식을 이용할 수도 있다.
본 발명의 일 실시예에 따른 질량 스펙트럼 획득 단계(S11)는 분리된 혈청을 소정의 혼합 플레이트에서 기 설정된 물질과 혼합하여 질량 스펙트럼을 획득하도록 형성될 수 있다. 여기서 기 설정된 물질은 매트릭스 물질로, 매트릭스 물질은 레이저로부터 에너지를 흡수하여 쉽게 이온화 될 수 있는 물질로 말디토프 질량 분석기를 통해 질량 스펙트럼을 획득하기 위해 사용되는 물질일 수 있다. 말디토프 질량 분석기는 매트릭스를 이용한 이온 전달 과정에서 시료를 간접적으로 이온화 하도록 구성된다. 본 발명의 일 실시예에서 매트릭스 물질은 레이저에 의해 쉽게 여(excitation)되는 구조를 갖는 유기화합물일 수 있다.
질량 스펙트럼 획득 단계(S11)는 혼합 플레이트에서 혼합된 물질이 포함된 영역에 레이저를 조사하여 혈청의 생체 성분을 이온화 할 수 있다. 이온화된 혈청의 생체성분은 전기장 하에서 이동되어 검출기에 의해 검출될 수 있다. 검출기는 이온화 된 혈청의 생체성분을 포함하는 혼합 플레이트로부터 이격된 위치에 배치될 수 있으며, 이온화된 혈청의 생체성분들은 전기장에 의하여 가속되어 검출기 방향으로 이동될 수 있다. 이때, 이온들이 이동하는 공간은 정확한 측정을 위해 진공으로 유지될 수 있다.
질량 스펙트럼 획득 단계(S11)는 이온화된 혈청의 생체성분들의 검출기 도달시간을 측정함으로써, 혈청의 생체 성분들의 질량 스펙트럼을 도출할 수 있다. 혈청 생체성분으로부터 생성된 이온들은 전기장에 의해 가속되어 이동하는 동안 질량 대 전하비에 따라 분리된다. 따라서, 각각의 이온이 검출기에 도달하는 시간을 이용하여 해당 이온의 질량 대 전하비를 특정할 수 있다. 이러한 과정을 통해 복수의 이온들에 대해 수행함으로써 복수의 이온들의 질량 대 전하비 및 이의 세기를 질량 스펙트럼 형태로 도출해낼 수 있다.
또, 본 발명의 질량 스펙트럼 획득 단계(S11)는 분리된 혈장 샘플로부터 혈장을 구성하는 생체 성분들을 상술한 방법과 동일한 방법으로 질량 스펙트럼 형태로 도출해 낼 수 있다.
나아가, 본 발명의 일 실시예에 따른 질량 스펙트럼 획득 단계(S11)는 기 설정된 물질에 대한 질량 스펙트럼인 베이스 질량 스펙트럼을 더 획득하도록 형성될 수 있다. 기 설정된 물질은 상술한 바와 같이 본 발명의 일 실시예에서 말디토프 질량 분석기를 이용하기 때문에 본 발명의 일 실시예에서는 매트릭스 물질로 정의될 수 있다.
본 발명의 일 실시예의 질량 스펙트럼 획득 단계(S11)는 제n질병 질량 스펙트럼 및 피검자 질량 스펙트럼을 획득하기 위해 임의의 혈액/체액 샘플에 매트릭스를 혼합하는 전처리를 수행하기 때문에, 본 발명의 후술되는 진단 기준 정보 획득 단계(S15)에서 매트릭스로 인해 발생할 수 있는 오차를 보정하기 위해 매트릭스만을 이용하여 획득하는 질량 스펙트럼인 베이스 질량 스펙트럼을 더 획득하도록 형성될 수도 있다.
질량 스펙트럼 후처리 단계(S13)는 질량 스펙트럼 후처리부를 이용하여 질량 스펙트럼에 대한 후처리를 수행하고, 후처리 된 질량 스펙트럼인 규격화 질량 스펙트럼을 생성하도록 형성된다. 여기서, 후처리는 질량 스펙트럼을 기 설정된 분자량 범위로 구분하고, 각 분자량 범위에 대응하는 평균 강도값을 획득하는 처리일 수 있다. 본 발명의 일 실시예에서 기 설정된 분자량 범위는 바람직하게는 5 분자량(m/z) 범위일 수 있으며, 평균 강도값은 해당 분자량 범위 별로 획득되는 값으로 해당 분자량 범위 내의 각 분자량 별 함유량(진폭)의 평균값일 수 있다.
질량 스펙트럼 후처리 단계(S13)는 질량 스펙트럼들의 X축 값(분자량, m/z)을 기 설정한 기준에 따라 범위를 설정하여 구간을 설정하고, 각 구간에 해당하는 대표 Y축값(intensity)을 연산하여 규격화 질량 스펙트럼을 생성한다. 이러한 규격화 질량 스펙트럼은, 후처리가 수행되지 않은 질량 스펙트럼에 비해 1/5의 데이터 양을 가지기 때문에 처리 속도가 증가하는 효과를 가질 수 있다.
도 4에는 본 발명의 일 실시예에 따른 질량 스펙트럼의 X축값(m/z) 구간을 설정하는 과정의 예시가 도시되고 있다. 도 4를 참고하면, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리 단계(S13)는 데이터화 된 질량 스펙트럼에서 X축을 각 5m/z 질량값 범위로 구분하고 각 범위에 포함되는 Y축의 값인 분자량 별 함유량의 산술평균을 획득할 수 있다. 여기서 획득되는 산술평균인 평균 강도값은 해당 범위의 대표 Y축값으로 설정될 수 있다.
보다 상세하게는 도 4와 같은 본 발명의 질량 스펙트럼은 5m/z 질량값으로 구간이 설정될 수 있으며, 일 예로 제1 구간은 질량값이 2000m/z 이상 2005m/z 미만으로 설정될 수 있고, 제2 구간은 2005m/z 이상 2010m/z 미만으로 설정될 수 있으며, 제3 구간은 2010m/z 이상 2015m/z의 질량값 범위로 설정될 수 있다. 본 발명의 질량 스펙트럼 후처리 단계(S13)는 상술한 방법으로 나머지 X축에 대해서도 구간을 설정할 수 있다.
이수 본 발명의 질량 스펙트럼 후처리 단계(S13)는 각 구간에 포함되는 X축 값의 개수를 획득한다. 도 4의 실시예에서 제1 구간에 해당하는 X축 값(질량값)은 모두 11개이며, 제2 구간에 해당되는 X축 값(질량 값)은 10개, 제3 구간에 해당되는 X축 값(질량 값)은 10개로 나타난다. 질량 스펙트럼 후처리 단계(S13)는 각 구간의 X축 값의 개수를 획득하면, 각 구간에 포함되는 각 질량값에 대응하는 Y축값의 합을 획득하도록 형성된다.
제1 구간의 질량값이 11개이며, 각 질량값에 대응하는 함유량(Y축 값)은 각각 713.036473, 714.449364, 718.159696, 721.247946, 721.581995, 719.516345, 720.554283, 719.954358, 717.345025, 716.622388, 718.549988로 나타나며, 이들의 합은 7901.017861이다. 따라서, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리 단계(S13)는 제1 구간의 Y축 평균값인 평균 강도값으로 718.274351을 획득할 수 있으며, 획득한 평균 강도 값을 대표 Y축값으로 설정할 수 있다.
같은 방식으로, 같은 제2 구간에 해당되는 X축값은 2005m/z 이상 2010m/z 미만이며, 제2 구간에 해당되는 X축값은 모두 10개로 나타난다. 따라서, 질량 스펙트럼 후처리 단계(S13)는 제2 구간에 해당되는 Y축값인 717.2734431, 713.3279136, 708.9136926, 709.2716024, 713.3926782, 715.8145345, 718.4136415, 720.0549136, 717.1967481, 714.416982을 획득하여 총합 7148.076150을 계산하고, 평균을 계산하여 제2구간의 대표 Y축값으로 714.807615를 획득할 수 있다.
같은 방식을 반복하면 도 4의 실시예에서 제3 구간의 대표 Y축값은 707.810649으로 획득되며, 제4 구간의 대표 Y축값은 698.355865로 획득될 수 있다.
한편, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리 단계(S13)는 각 구간별로 대표 X축 값(대표 분자량)을 더 정의하도록 형성될 수 있다. 본 발명의 바람직한 실시예에서 대표 X축 값은 각 범위를 구성하는 가장 작은 분자량일 수 있다. 즉, 제1구간의 경우 2000m/z가 대표 X축 값으로 설정될 수 있고, 제2구간은 2005m/z가 대표 X축 값으로 설정될 수 있으며, 제3구간은 2010m/z가 대표 X축 값으로 설정되며, 제4구간은 2015m/z가 대표 X축 값으로 설정될 수 있다.
상술한 후처리를 통해 도출되는 규격화 질량 스펙트럼은, 분석을 원하는 타겟 물질의 표준시료를 사용하지 않고 소정 구간의 평균을 구한 후 그 평균 값을 인공지능 패턴 분석 데이터로 사용하도록 형성되기 때문에 기존의 질량 분석기에서 사용되는 타겟 물질의 표준 시료를 사용하지 않아도 되는 효과를 가진다.
또한, X축값(m/z) 측정 시 좌/우로 500 내지 5000ppm 단위의 측정 오차가 발생하더라도 측정 오차가 각 구간 범위에 포함되어 측정 오차에 대한 별도의 보정을 수행하지 않을 수 있다는 장점을 가진다.
상술한 설명에서는 각 구간을 5m/z로 구분하였으나, 이는 본 발명의 하나의 실시예에 불과하며 사용자의 설정에 따라 구간 범위가 조절될 수 있다.
도 5에는 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 데이터에 기반한 csv파일의 예시도가 도시되고 있으며 도 6에는 도 5의 csv파일에 기반한 질량 스펙트럼이 도시되고 있고, 도 7에는 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부에서 후처리된 csv 파일에 기반한 질량 스펙트럼이 도시되고 있다.
도 6에 도시된 질량 스펙트럼과 도 7에 도시된 질량 스펙트럼은 그 패턴이 동일하게 나타난다. 따라서, 본 발명의 일 실시예에 따른 질량 스펙트럼 후처리부(15)는 구간별 대표 Y축값을 연산하여 처리된 질량 스펙트럼을 활용하여 질병용 마커를 추출할 수 있다.
진단 기준 정보 획득 단계(S15)는 진단 기준 정보 획득부를 통해 규격화 질량 스펙트럼을 이용하여 기계학습을 수행하고, 기계학습 결과 제n질병의 적어도 하나의 마커를 획득하도록 형성된다. 진단 기준 정보 획득 단계(S15)는 기계학습을 수행하기 위해 규격화 질량 스펙트럼 중 학습용 혈액 샘플을 이용하여 획득되는 학습용 규격화 질량 스펙트럼을 이용하여 기계학습을 수행할 수 있으며, 기계학습의 결과를 이용하여 마커를 획득할 수 있다.
여기서, 기계학습은 일 예로, 각 질량 스펙트럼 별로 수행될 수 있으며, 각 질량 스펙트럼은 같은 분류의 확진자 또는 비확진자 및 같은 분류의 혈액 샘플을 통해 획득되는 질량 스펙트럼일 수 있다.
보다 상세히 설명하면 기계학습은 제n질병과 관련된 혈액 샘플로부터 획득된 질량 스펙트럼들을 후처리하여 획득되는 제n질병의 규격화 질량 스펙트럼들 각각에 대하여 수행될 수 있다. 제n질병의 규격화 질량 스펙트럼들은 제n-1 규격화 질량 스펙트럼 내지 제n-4 규격화 질량 스펙트럼으로 표현되며, 이는 상술한 바와 같이 제n질병의 확진자/비확진자의 혈청/혈장으로부터 획득되는 질량 스펙트럼에 각각 후처리가 수행되어 획득되는 규격화 질량 스펙트럼일 수 있다.
여기서, 기계학습 결과는 제n-1 규격화 질량 스펙트럼의 기계학습 결과인 제n-1 기계학습 결과 또는 제n-3 규격화 질량 스펙트럼의 기계학습 결과인 제n-3 기계학습 결과 중 어느 하나와, 제n-2 규격화 질량 스펙트럼의 기계학습 결과인 제n-2 기계학습 결과 또는 제n-4 규격화 질량 스펙트럼의 기계학습 결과인 제n-4 기계학습 결과 중 어느 하나를 포함하여 출력될 수 있다. 본 발명의 바람직한 실시예에서는 제n-1 기계학습 결과가 출력되는 경우 제n-2 기계학습 결과가 함께 출력되고, 제n-3 기계학습 결과가 출력되는 경우 제n-4 기계학습 결과가 함께 출력될 수 있다. 이는 제n-1 및 제n-2가 혈청 샘플을 이용하며, 제n-3 및 제n-4가 혈장 샘플을 이용하기 때문으로, 동일한 샘플의 기계학습 결과를 서로 비교하여야 후술되는 마커를 정확하게 획득할 수 있기 때문이다.
또, 상술한 기계학습 결과는, 베이스 규격화 질량 스펙트럼의 기계학습 결과를 이용하여 매트릭스로 인해 발생하는 질량 스펙트럼의 오차를 보정한 결과일 수도 있다. 본 발명의 일 실시예에서는 말리토프 질량 분석기를 이용하여 질량 스펙트럼을 도출한다. 이를 위해 혈액 샘플에는 높은 이온화 정도를 가지는 물질인 매트릭스가 혼합되게 된다. 레이저의 조사를 통해 이온화되는 혈액 샘플에는 이러한 매트릭스들이 포함될 수 있으며, 매트릭스들은 혈액 샘플의 질량 스펙트럼을 도출하기 위해 필수적인 구성으로 사용될 수밖에 없지만, 그와 동시에 혈액 샘플의 질량 스펙트럼에 함께 검출되어 질량 스펙트럼에 노이즈(오차)를 발생시킬 수 있다는 문제점이 존재한다.
따라서, 본 발명의 일 실시예에서는 이러한 매트릭스로 인해 발생하는 노이즈를 제거하여 보다 정확한 마커를 획득하기 위해 베이스 규격화 질량 스펙트럼의 기계학습 결과를 획득하고, 기계학습 결과를 제n질병 규격화 질량 스펙트럼의 기계학습 결과에서 제거하여 순수한 혈액 샘플로부터 도출될 것으로 예상되는 기계학습 결과인 보정된 기계학습 결과를 획득하여 기계학습 결과로 사용할 수도 있다.
진단 기준 정보 획득 단계(S15)는 제n-1 기계학습 결과 및 제n-2 기계학습 결과를 비교한 제1 비교 결과 또는 제n-3 기계학습 결과 및 제n-4 기계학습 결과를 비교한 결과인 제2 비교 결과를 이용하여 적어도 하나의 마커를 획득하도록 형성된다. 제1 비교 결과는 제n-1 기계학습 결과와 제n-2 기계학습 결과에서 두 결과에의 각 분자량 범위에 대응하는 평균 강도 값을 동일한 범위끼리 비교하고, 비교 결과 그 차이가 기 설정된 범위를 벗어나는 경우, 해당 범위를 제 n질병 마커로 획득하도록 형성될 수 있다.
본 발명의 일 실시예에서 진단 기준 정보 획득 단계(S15)는 제1 비교 결과 또는 제2 비교 결과만을 이용하여 제n 질병 마커를 획득하도록 형성될 수도 있지만, 제1비교 결과와 제2비교 결과를 모두 이용하여 제n질병 마커를 획득하도록 형성될 수도 있다.
또, 본 발명의 일 실시예에서 진단 기준 정보 획득 단계(S15)는 제n질병 마커를 기 설정된 범위를 이용하여 제n질병의 중증도를 결정하기 위한 중증도 정보를 더 생성할 수도 있다. 중증도 정보는 특정 질병을 나타내는 분자량의 피크 값에 따라 해당 질병의 중증도를 결정하기 위한 정보이다. 본 발명의 일 실시예에서 진단 기준 정보 획득 단계(S15)는 선행 검사가 수행된 제n질병 확진자의 중증도를 기계학습하여 도출되는 중증도 학습 결과를 획득하고, 중증도 학습 결과를 기 설정된 범위로 구분할 수 있다. 기 설정된 범위는 정상, 경증, 중등증 및 중증으로 구분될 수 있다. 정상의 경우에는 제n질병 비확진자의 정보를 이용하여 해당 마커의 피크값의 평균을 통해 획득될 수 있다.
이를 이용하면, 본 발명의 일 실시예의 방법(10)은, 단순히 제n질병의 확진 여부만을 판단하는 것을 넘어 해당 질병의 확진 판정이 수행되는 경우 해당 질병이 어느 정도 진행되었는지도 확인할 수 있는 효과를 가진다.
본 발명의 일 실시예에 따른 질병 진단 단계(S17)는 질병 진단부를 이용하여 피검자 혈액 샘플로부터 획득되는 피검자 규격화 질량 스펙트럼과 마커를 비교하고, 기 설정된 기준을 만족하는 경우, 피검자 혈액 샘플로부터 제n질병이 진단된 것으로 판단하여 제n질병 진단 정보를 생성하도록 형성될 수 있다.
여기서, 피검자 규격화 질량 스펙트럼은, 피검자 혈액 샘플로부터 획득되는 제1 피검자 질량 스펙트럼 또는 제2 피검자 질량 스펙트럼에 대해 후처리를 진행하여 획득되는 제1 피검자 규격화 질량 스펙트럼 또는 제2 피검자 규격화 질량 스펙트럼을 포함할 수 있다.
질병 진단 단계(S17)는 피검자 규격화 질량 스펙트럼을 획득하면, 기계학습 결과를 통해 도출된 복수의 마커를 이용하여 피검자 규격화 질량 스펙트럼과의 비교를 수행한다. 이때, 피검자 규격화 질량 스펙트럼이 복수의 마커 모두와 일치하지 않는 경우, 해당 피검자가 건장한 상태로 질병에 확진되지 않은 것으로 판단할 수 있다. 또, 피검자 규격화 질량 스펙트럼이 복수의 마커 중 적어도 하나와 일치하는 경우, 질병 진단 단계(S17)는 일치하는 모든 마커들을 획득하여 확진 분석용 요인으로 설정할 수 있다. 질병 진단 단계(S17)는 확진 분석용 요인들을 이용하여 피검자가 어떤 질병에 확진되었는지를 판단한다. 복수의 마커는 각 질병들로부터 획득되며, 질병 진단 단계(S17)는 모든 마커들을 이용하여 피검자 규격화 질량 스펙트럼에 대응하는 대응 마커들을 획득한다. 이후, 질병 진단 단계(S17)는 대응 마커들과 일치하는 질병을 선택하고, 피검자가 해당 질병에 확진된 것으로 질병 진단 정보를 생성할 수 있다.
또, 질병 진단 단계(S17)는 상술한 중증도 정보를 이용하여 피검자가 확진된 질병의 현재 중증도를 예측하도록 형성될 수도 있다. 질병 진단 단계(S17)는 확진 질병을 확인하면, 해당 질병의 현재 중증도를 상술한 기 설정된 중증도 범위를 이용하여 예측할 수 있으며, 이를 통해 질병 진단 단계(S17)에서는 현재 질병 및 중증도(진행 정도)를 포함하는 질병 진단 정보를 생성할 수 있다.
나아가, 질병 진단 단계(S17)는 제n질병 사이의 관계를 이용하여 합병증 위험 여부를 더 판단하도록 형성될 수도 있다. 본 발명의 질병 진단 단계(S17)는 제n질병들 사이에서 합병증을 유발할 수 있는 질병과, 해당 질병을 통해 발생할 수 있는 합병증 질병을 서로 연결하는 합병증 연결 정보를 획득할 수 있다.
일 예로 진단 질병이 당뇨인 경우, 심근경색, 뇌졸중, 망막증, 신부전 등과 같은 질병이 합병증으로 발생할 수 있다. 이러한 질병들을 더 도출하기 위해 본 발명의 질병 진단 단계(S17)는 합병증 연결 정보를 이용하여 확진 질병으로부터 도출될 수 있는 합병증과 관련된 마커를 획득하고, 해당 마커에 대한 추가적인 확인을 수행할 수 있다. 해당 마커들의 피크가 상술한 중증도 범위에 포함되는 경우, 질병 진단 단계(S17)는 해당 합병증이 존재하는 것으로 확인하여 합병증 확진 정보를 더 생성할 수도 있다.
하지만, 합병증을 의미하는 피크의 경우, 중증도 범위에서 정상 범위에 포함될 수도 있다. 이 경우, 질병 진단 단계(S17)는 정상 범위에 포함되는 복수의 피크값(비확진자)을 획득하고, 확률 분포를 확인할 수 있다. 여기서 사용되는 확률 분포는 정규분포일 수 있으며, 질병 진단 단계(S17)는 확률 분포를 이용하여 정상 범위 내에 질병 주의 범위를 더 생성할 수 있다. 질병 주의 범위는 정규 분포에서 기 설정된 표준편차 배수 범위를 벗어나는 범위로 형성될 수 있으며, 두 개의 범위 중 높은 범위에 대하여 질병 주의 범위를 생성할 수 있다.
질병 진단 단계(S17)는 합병증을 의미하는 피크의 Y축값이 질병 주의 범위에 포함되는 경우, 해당 합병증이 발생할 가능성이 높은 합병증 주의 진단 정보를 더 생성하여 질병 진단 정보에 포함하도록 형성될 수도 있다.
이하에서는 도 8 내지 도 12에 도시되고 있는 다양한 실시예를 이용하여 본 발명의 시스템 및 방법(1, 10)에서 마커를 추출하는 과정에 대하여 설명하도록 한다.
<실시예 1: 유방암 진단용 마커 도출>
도 8은 본 발명의 실시예에서 유방암을 진단받지 않은 정상인 혈청과 난소암을 진단받은 환자의 혈청에 기반한 질량 스펙트럼을 도시한 것이다.
도 8을 참조하면, 유방암을 진단받지 않은 정상인 혈청에 기반한 질량 스펙트럼(Normal Blood Serum, 붉은색 X표)과 유방암을 진단받은 환자의 혈청에 기반한 질량 스펙트럼(Breast Cancer Blood Serum, 하늘색 동그라미)은 상이한 패턴을 보이는 것을 알 수 있다. 본 발명은 이러한 질량 스펙트럼 차이를 이용하여 피검자의 유방암 가능성을 진단할 수 있다.
<실시예 2: 난소암 진단용 마커 도출>
계속해서 도 8을 참조하면, 난소암을 진단받지 않은 정상인 혈청에 기반한 질량 스펙트럼(Normal Blood Serum, 붉은색 X표)과 난소암을 진단받은 환자의 혈청에 기반한 질량 스펙트럼(Ovarian Cancer Blood Serum, 연두색 삼각형)은 상이한 패턴을 보이는 것을 알 수 있다. 본 발명은 이러한 질량 스펙트럼 차이를 난소암의 마커로 이용하여 피검자의 난소암 가능성을 진단할 수 있다.
<실시예 3: 임신성 당뇨 진단용 마커 도출>
도 9는 임신성 당뇨를 진단받지 않은 정상 임산부의 혈장과 임신성 당뇨를 진단은 임산부의 혈장에 기반한 질량 스펙트럼을 도시한 것이다.
도 9를 참조하면, 임신성 당뇨를 진단받지 않은 임산부의 혈장에 기반한 질량 스펙트럼(control)과 임신성 당뇨를 진단받은 임산부의 혈장에 기반한 질량 스펙트럼(Disease)은 상이한 패턴을 보이는 것을 알 수 있다. 본 발명은 이러한 질량 스펙트럼 차이를 임신성 당뇨의 마커로 이용하여 피검자인 임산부의 임신성 당뇨 가능성을 진단할 수 있다.
<실시예 4: 코로나 진단용 마커 도출>
콧물 시료(nasal fluid)로부터 질량 스펙트럼을 얻는 과정은 역시 매트릭스 보조 레이저 탈착/이온화 비행시간 분석형 (Matrix Assisted Laser Desorption/Ionization Time of Flight; MALDI-TOF) 질량 분석법에 의하여 수행될 수 있다.
질량 스펙트럼 획득부(11)는 환자의 콧물 시료(nasal fluid)로부터 질량 스펙트럼을 도출할 수 있다. 또한, 정상인의 콧물 시료(nasal fluid)로부터 질량 스펙트럼을 도출할 수 있다.
환자와 정상인의 콧물 시료(nasal fluid)로부터의 질량 스펙트럼 도출 과정, 데이터 처리 과정 및 마커 도출 과정 중 혈액분리 과정을 제외하고는 앞서 설명한 것과 동일하므로 상세한 설명은 생략한다.
여기서 환자(positive)라 함은 콧물 시료(nasal fluid) 기반 PCR 검사를 통해 코로나를 확진받은 자를 의미하며, 정상인(negative)은 PCR 검사를 통해 코로나로 확진받지 않은 자를 의미한다.
도 10을 참조하면, 코로나를 확진받은 환자의 콧물 시료에 기반한 질량 스펙트럼(positive, 붉은색 X)과 코로나를 확진받지 않은 정상인(negative, 파란색 원)의 콧물 시료에 기반한 질량 스펙트럼은 상이한 패턴을 보이는 것을 알 수 있다. 본 발명은 이러한 질량 스펙트럼 차이를 코로나의 마커로 이용하여 피검자의 코로나 확진 가능성을 진단할 수 있다.
도 11을 참조하면, 코로나 음성 판정을 받은 정상인 219명의 콧물 시료(nasal fluid) 기반 질량 스펙트럼과 코로나 양성 판정을 받은 환자 301명의 콧물 시료(nasal fluid) 기반 질량 스펙트럼에 기반하여 코로나 진단용 질병 마커(marker)에 해당되는 질병 질량 스펙트럼을 자동으로 도출하였다. 이렇게 도출된 마커를 통해 총 6500명의 피검자를 대상으로 코로나 가능성 여부를 진단하였다. 진단결과를 실제 PCR 검사결과와 대조하였다.
그 결과, 본 발명의 질병 질량 스펙트럼 기반의 진단결과에 따른 코로나 음성의 위양성률을 1.7%였고, 코로나 양성의 위음성률은 0.5%로 전체 신뢰도는 97.7% 이상이었다.
<실시예 5: 실험용 쥐의 치매 진단용 마커 도출>
도 12는 치매를 진단받지 않은 정상 쥐의 혈청과 치매를 진단받은 쥐의 혈청에 기반한 질량 스펙트럼을 도시한 것이다.
도 12를 참조하면, 치매를 진단받지 않은 정상 쥐의 혈청에 기반한 질량 스펙트럼(control)과 치매를 진단받은 쥐의 혈청에 기반한 질량 스펙트럼(Treat)은 상이한 패턴을 보이는 것을 알 수 있다. 본 발명은 이러한 질량 스펙트럼 차이를 치매 진단의 마커로 이용하여 실험용 쥐의 치매가능성을 진단할 수 있다.
본 실시예에 의하면 실시예 1 내지 실시예 3에 나타난 혈액 기반 질병 마커를 통해, 1회의 검사만으로 피검자의 난소암, 유방암, 임신성 당뇨 가능성을 확률적 표현으로 동시에 진단할 수 있는 장점이 있다.
또한, 본 발명의 실시예 4에 따르면 혈액뿐만 아니라 콧물 시료를 기반으로 질병 마커를 도출하여 대규모 전염병 유행시 신속하게 진단검사를 진행할 수 있는 장점이 있다.
한편, 도 13 내지 도 22에는 본 발명의 시스템 및 방법을 이용하여 생성되는 질량 스펙트럼의 예시가 도시되고 있다. 도 13은 본 발명의 일 실시예에 따른 (a) 샘플 미탑재, (b) 겐티스산 샘플 및 (c) N결합 글라이칸 샘플의 질량 스펙트럼을 나타낸 도이고, 도 14는 도 13의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
본 발명의 일 실시예에서는 샘플을 탑재하지 않은 경우(도 13a), 겐티스산(Super-dHB) 샘플을 탑재한 경우(도 13b) 및 N결합 글라이칸 샘플을 탑재한 경우(도 13c)에 대한 질량 스펙트럼 그래프를 보여주고 있으며, 여기서 도 13c의 N결합 글라이칸 샘플의 경우 남성의 시그마 혈청을 상술한 시스템 및 방법의 혈액 샘플로 하여 포함하고 있는 것을 의미한다. 겐티스 산과 N결합 글라이칸은 도 13 및 도 14에서는 혈액 샘플에 혼합되는 특정 물질로 사용되었다.
도 13a를 살펴보면, 아무 샘플도 포함되지 않는 경우, 질량 스펙트럼 그래프는 유의미한 정보를 제공하지 않는 다량의 노이즈를 포함하는 결과를 도출하고 있지만, 도 13b 및 도 13c에서는 각각 겐티스 산의 질량 스펙트럼과 N결합 글라이칸 및 시그마 혈장의 질량 스펙트럼이 도출되는 것을 확인할 수 있다.
각 조건에 따라 도출된 질량 스펙트럼 그래프를 서로 비교할 수 있도록 도 14에서는 3차원 그래프에 세가지 질량 스펙트럼 그래프를 모두 표현하고 있다. 도 14를 참고하면, 겐티스 산의 질량 스펙트럼은 가벼운 질량값(600 내지 100달톤)에서 피크를 가지는 것으로 확인되었으며, N결합 글라이칸을 포함하는 혈장 샘플의 질량 스펙트럼은 겐티스 산의 질량 스펙트럼보다 무거운 질량값(1200 내지 2200달톤)에서 피크를 가지는 것으로 확인되었다.
또, 도 15는 본 발명의 일 실시예에 따른 알파시아노 히드록시시나믹 산(CHCA) 컨디션에서 (a) 샘플 미탑재, (b) CHCA 샘플 및 (c) 시나핀 산 샘플의 질량 스펙트럼을 나타낸 도이고, 도 16은 도 15의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다. 도 17은 본 발명의 일 실시예에 따른 시나핀 산 컨디션에서 (a) 샘플 미탑재, (b) CHCA 샘플 및 (c) 시나핀 산 샘플의 질량 스펙트럼을 나타낸 도이고, 도 18은 도 17의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 15 내지 도 18은 혈액 샘플 대용으로 들어가는 샘플의 종류가 서로 다르게 설정되어 두 질량 스펙트럼 그래프들을 비교하기 위한 실험이다. 실험 결과를 확인하면, CHCA를 특정 물질로 사용하는 경우(도 15 및 도 16)에 비해 시나핀 산 샘플을 특정 물질로 사용하는 경우(도 17 및 도 18)에서 피크가 명확하게 나타나는 것을 확인할 수 있으며, 따라서 본 발명의 일 실시예에서는 시나핀 산을 특정 물질로 사용하도록 하게 함으로써 질량 스펙트럼의 선명도를 증가시킬 수 있는 것을 확인할 수 있다.
한편, 도 19는 본 발명의 일 실시예에 따른 사람 혈청 컨디션에서 (a) 정상 상태 샘플, (b) 유방암 진단 샘플 및 (c) 기능성 위장장애 진단 샘플의 질량 스펙트럼을 나타낸 도이고, 도 20은 도 19의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 19 및 도 20을 참고하면, 정상 상태(도 19a)와 비교하여 유방암 진단 샘플(도 19b)과 기능성 위장 장애 샘플(도 19c)은 질량 스펙트럼의 형태가 다르게 나타나는 것을 확인할 수 있다. 즉, 본 발명의 일 실시예에 따른 시스템 및 방법에서는 정상 상태의 혈액 샘플을 이용하여 도출되는 질량 스펙트럼을 이용하여 정상 상태가 아닌 질병을 가진 상태를 판단할 수 있다.
유방암 진단 샘플(도 19b)의 질량 스펙트럼과 기능성 위장 장애 샘플(도 9c)의 질량 스펙트럼은 대부분의 피크가 유사하게 나타나는 것을 확인할 수 있다. 하지만, 기능성 위장 장애 샘플(도 19c)의 경우 약 17000달톤에서 피크가 존재하는 반면, 유방암 진단 샘플(도 19b)의 해당 위치에서의 피크가 존재하지 않는 것을 확인할 수 있으며, 이는 질량 스펙트럼의 비교가 이루어지고 있는 도 20에서 보다 분명하게 나타난다.
이러한 피크를 단순 질량 스펙트럼의 비교를 통해 확인하는 것이 용이하지 않기 때문에 본 발명의 시스템 및 방법에서는 상술한 바와 같이 그룹핑 달톤 및 그룹핑 진폭을 설정하는 후처리 된 질량 스펙트럼을 획득하고, 획득한 후처리 된 질량 스펙트럼을 비교함으로써 보다 명확한 질량 스펙트럼의 비교를 통해 질병 진단을 수행하도록 형성될 수 있다.
마지막으로, 도 21은 본 발명의 일 실시예에 따른 사람 혈장 컨디션에서 (a) 임신 상태 진단 샘플, (b) 자간전증 진단 샘플, (c) 임신성 당뇨병 진단 샘플 및 (d) 미숙아 진단 샘플의 질량 스펙트럼을 나타낸 도이고, 도 22는 도 21의 질량 스펙트럼을 3D화 하여 각 샘플들을 비교한 질량 스펙트럼 그래프이다.
도 21 및 도 22는 혈장을 혈액 샘플로 사용하여 임신 상태에서 임신과 관련된 질병 진단이 가능한지를 판단하기 위해 질량 스펙트럼을 비교하고 있다. 도 21 및 도 22를 참고하면, 임신 상태 샘플, 자간전증 진단 샘플, 임신성 당뇨병 진단 샘플 및 미숙아 진단 샘플은 질량 스펙트럼이 유사한 형태로 나타나는 것을 확인할 수 있다. 이는, 임신 상태에서 발생하는 질병으로 임신 상태에서 혈장에 포함되는 분자들이 발생시키는 피크들이 개시되는 것을 의미한다. 이때, 도 21 및 도 22를 참고하면, 각 피크들의 크기가 다른 것을 확인할 수 있다. 본 발명의 일 실시예에서는 이러한 피크들의 크기를 비교하여 동일한 분자량의 피크를 생성하는 경우에도 각 질병을 진단할 수 있는 효과를 가진다.
또, 도면에는 도시되고 있지 않지만, 본 발명의 일 실시예에 따른 시스템 및 방법은, 질량 스펙트럼을 이용하여 결핵균과 비결핵항산균을 구분할 수도 있다. 항산균은 일반적인 세균들과 달리 염색과정에서 산을 첨가해도 녹지 않고 견딜 수 있는 능력을 가지고 있기 때문에 산을 견딘다는 의미로 항산균으로 지칭된다. 이러한 항산균에 포함되는 대표적인 균이 결핵균이며, 결핵균이 아닌 다른 항산균을 비결핵항산균으로 구분하고 있다.
본 발명의 일 실시예에 따른 시스템 및 방법은, 먼저, 결핵균에 감염되어 결핵에 확진받은 결핵 질병 확진자와 결핵 질병 비확진자의 혈액 샘플을 각각 복수개 획득하고, 획득한 혈액 샘플을 이용하여 학습을 수행함으로써 결핵 질량 스펙트럼을 획득할 수 있다.
결핵 질량 스펙트럼은 상술한 바와 같이 결핵-1 및 결핵-3 질량 스펙트럼이 결핵 확진자의 혈액 샘플을 통해 획득되는 질량 스펙트럼이고, 결핵-2 및 결핵-4 질량 스펙트럼이 결핵 비확진자의 혈액 샘플을 이용하여 획득되는 질량 스펙트럼일 수 있다. 나아가, 결핵-1 및 결핵-2 질량 스펙트럼은 혈액 샘플로 혈청 샘플을 이용하여 획득되는 질량 스펙트럼일 수 있고, 결핵-3 및 결핵-4 질량 스펙트럼은 혈액 샘플로 혈장 샘플을 이용하여 획득되는 질량 스펙트럼일 수 있다.
결핵 질량 스펙트럼을 획득하면, 본 발명의 일 실시예에 따른 시스템 및 방법은, 결핵 질량 스펙트럼을 규격화하고 학습하여 결핵 질병에 대한 마커를 획득하도록 형성된다. 이후, 본 발명의 일 실시예에 따른 시스템 및 방법은 피검자의 혈액 샘플에 대한 질량 스펙트럼을 획득하고, 획득한 질량 스펙트럼을 규격화한 후 기 획득한 결핵 마커의 존재 여부를 확인하여 피검자가 결핵균에 감염되었는지, 아니면 결핵균이 아닌 다른 항산균에 감염되었는지를 구분하여 진단하도록 형성될 수도 있다.
이러한 결핵균과 비결핵항산균의 차이를 확인할 수 있는 그래프가 도 23 및 도 24에 도시되고 있다. 도 23은 본 발명의 일 실시예에 따른 결핵균을 같은 종의 (a) 제1 strain (b) 제2 strain 및 (c) 제3 strain에 대한 질량 스펙트럼을 나타낸 도이고, 도 24는 본 발명의 일 실시예에 따른 비결핵항산균 중 (a) 미코박테리움 압세수스(Mycobacterium abscessus), (b) 미코박테리움복합체(Mycobacterium avium) 및 (c) 미코박테리움 칸사시(Mycobacterium kansasii)에 대한 질량 스펙트럼을 나타낸 도이다.
도 23의 결핵균 질량 스펙트럼과 도 24의 비결핵항산균의 질량 스펙트럼은, 서로 피크가 나타나는 질량값에서 차이가 존재한다. 따라서, 상술한 바와 같이 규격화 된 질량 스펙트럼을 이용하여 결핵균의 마커인 결핵 질병 마커를 획득하고, 결핵 질병 마커를 비결핵항산균의 규격화 된 질량 스펙트럼에 대입하게되면, 피검자가 비결핵항산균에 확진(감염) 된 것을 확인할 수 있다.
한편, 도 24에서는 동일한 종인 결핵균에 대하여 서로 다른 제 1 내지 제3 strain의 질량 스펙트럼을 획득하였다. 이러한 도 24의 결과에서는 제1 내지 제3 질량 스펙트럼이 모두 일부 차이가 있는 것으로 나타나고 있다. 도 24에 도시된 바와 같이 동일한 병원균에 대해서도 일부 차이가 나타날 수 있기 때문에, 본 발명에서는 상술한 바와 같이 단순히 질량 스펙트럼의 비교를 통해 확진 여부를 도출하지 않고 규격화 질량 스펙트럼을 획득하고, 획득한 규격화 질량 스펙트럼으로부터 질병 마커를 획득하는 방법을 선정하였다.
본 발명에서는 분석 재현성 유지율이 가장 중요하며, 여기서 분석 재현성 유지율은, 동일한 병원균에 대한 질량 스펙트럼의 분석 과정에서 얼마나 동일한 질병 마커가 재현되는지를 의미한다. 도 25는 본 발명의 일 실시예에 따른 모의실험 중, 규격화를 위한 질량값 범위를 설정하고, 각 설정범위에 따른 재현성을 확인한 실험 결과에 대한 도이다.
복수의 질량 스펙트럼을 획득하고, 질량 스펙트럼을 구성하는 X축인 질량값을 다양한 범위로 설정하여 마커의 재현성, 다시 말해 해당 질병의 특성이 규격화 된 질량 스펙트럼에서 얼마나 잘 재현되는지를 확인한 모의실험 결과가 도 25에 도시되고 있다. 도 25를 참고하면, 1unit 즉, 규격화를 하지 않은 경우에는 질병의 특성이 56% 재현되었으며, 2unit으로 규격화 한 경우에는 질병의 특성이 76% 재현되었다. 또, 3unit으로 규격화를 수행한 경우에는 87%의 재현성을 보였으며, 4unit으로 규격화 한 경우에는 92%의 재현성을 확인할 수 있었다.
본 발명에서 바람직한 실시예로 사용하고 있는 5unit의 경우에는, 가장 높은 98.5%의 재현성을 나타내었으며, 10unit에서는 오히려 그 재현성이 감소하여 85%의 재현성을 나타내는 것을 확인하였다. 즉, 본 발명을 도출하기 위해서는 단순히 질량값을 그룹화한다는 개념만으로는 본 발명과 같은 최대한의 재현성을 나타내는 규격화 기준을 도출하기 어려움이 자명하다.
본 발명에서는 특정 질병에 대한 질량 스펙트럼을 단순히 기계학습하여, 그 결과를 피검자의 질량 스펙트럼과 비교하여 질병의 확진 여부를 결정하는 것이 아니라, 질량 스펙트럼을 먼저 획득하고, 획득한 질량 스펙트럼에 대하여 규격화라는 후처리(기계학습을 위한 데이터 전처리) 과정을 더 수행함으로서, 최초 획득된 질량 스펙트럼에 대한 처리 없이 기계학습이 수행되어 발생할 수 있는 과적합, 노이즈 증폭 등의 문제점을 제거할 수 있는 효과를 가지고 있다.
또, 본 발명의 경우에는 기계학습 결과와 피검자의 질량 스펙트럼을 단순 비교하는 것이 아니라, 기계학습 결과로부터 해당 질병의 특징인 질병 마커를 도출하고, 도출된 마커를 피검자의 질량 스펙트럼(바람직하게는 규격화 된 피검자의 질량 스펙트럼)과의 비교를 수행함으로써, 역시, 최초 획득되는 피검자의 질량 스펙트럼에 포함되는 다양한 노이즈로 인해 발생할 수 있는 오진을 감소시킬 수 있는 효과를 가진다.
또한, 본 발명의 다른 실시예에서는 기계학습을 수행하기 전, 질량 스펙트럼을 획득하기 위해 혼합되는 매트릭스로 인해 발생할 수 있는 오차(노이즈)를 제거하기 위해 매트릭스만을 이용하여 획득되는 베이스 질량 스펙트럼을 획득하고, 이를 규격화하여 제거하는 과정을 더 수행하도록 함으로써 도출되는 질병 마커의 정확성을 높일 수 있는 효과를 가진다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
1: 질량 스펙트럼을 이용한 질병 진단 시스템
11: 질량 스펙트럼 획득부
13: 질량 스펙트럼 후처리부
15: 진단 정보 생성부
17: 질병 진단부
11: 질량 스펙트럼 획득부
13: 질량 스펙트럼 후처리부
15: 진단 정보 생성부
17: 질병 진단부
Claims (9)
- 임의의 혈액 샘플에 대한 질량 스펙트럼을 획득하는 질량 스펙트럼 획득부;
상기 질량 스펙트럼에 대한 후처리를 수행하고, 후처리된 질량 스펙트럼인 규격화 질량 스펙트럼을 생성하는 질량 스펙트럼 후처리부;
상기 규격화 질량 스펙트럼을 통해 기계학습을 수행하고 상기 기계학습 결과 제n질병의 적어도 하나의 마커를 획득하는 진단 기준 정보 획득부; 및
피검자 혈액 샘플로부터 획득되는 피검자 규격화 질량 스펙트럼과 상기 마커를 비교하고, 기 설정된 기준을 만족하는 경우, 상기 피검자 혈액 샘플로부터 상기 제n질병이 진단된 것으로 판단하여 제n질병 진단 정보를 생성하는 질병 진단부;를 포함하며,
상기 임의의 혈액 샘플은 학습용 혈액 샘플 및 진단용 혈액 샘플로 구분되고,
상기 학습용 혈액 샘플은,
선행 검사를 통한 제n 질병의 확진 여부에 따라 결정되는 제n 질병 확진자 및 제n 질병 비확진자의 혈액 샘플을 포함하며,
상기 진단용 혈액 샘플은,
상기 선행 검사가 수행되지 않아 상기 제n 질병의 확진 여부를 판단할 수 없는 피검자 혈액 샘플을 포함하고,
상기 질량 스펙트럼 획득부는,
상기 임의의 혈액 샘플에 대한 질량 스펙트럼을 획득하기 위해 상기 임의의 혈액 샘플과 혼합되는 매트릭스만을 이용하여 획득하는 질량 스펙트럼인 베이스 질량 스펙트럼을 더 획득하도록 형성되고,
상기 진단 기준 정보 획득부는,
상기 베이스 질량 스펙트럼에 대한 기계학습을 수행하고, 상기 규격화 질량 스펙트럼에 대한 기계학습 결과에서 상기 베이스 질량 스펙트럼에 대한 기계학습 결과를 제외하여 노이즈가 제거된 기계학습 결과를 이용하여 상기 제n 질병의 적어도 하나의 마커를 획득하며,
상기 제n 질병에 대한 마커인 제n 질병 마커와 상기 제n 질병 마커의 기 설정된 범위를 이용하여 제n 질병의 중증도를 결정하기 위한 중증도 정보를 더 생성하며,
선행 검사가 수행된 제n질병 확진자의 중증도를 기계학습하여 도출되는 중증도 학습 결과를 획득하며, 상기 중증도 학습 결과를 기 설정된 범위로 구분하여 중증도 범위로 출력하고,
상기 중증도는 상기 제n 질병 마커의 피크 값을 이용하여 생성되며,
상기 질병 진단부는,
상기 제n질병 진단 정보를 통해 상기 제n 질병의 확진이 확인되면, 상기 제n 질병의 현재 중증도를 상기 중증도 범위를 이용하여 상기 제n 질병에 대한 중증도인 현재 중증도 정보 및 상기 제n질병 진단 정보를 포함하는 질병 진단 정보를 생성 및 출력하며,
복수의 제n질병들 사이에서 합병증을 유발할 수 있는 질병 및 상기 합병증을 유발할 수 있는 질병을 통해 발생할 수 있는 합병증 질병을 서로 연결하는 합병증 연결 정보를 획득하고, 상기 합병증 연결 정보에 포함되는 상기 합병증 질병들 각각에 대한 마커인 합병증 마커를 획득하며, 상기 제n질병에 대하여 확진 정보를 획득한 경우, 상기 제n질병의 상기 합병증 마커를 통해 상기 합병증의 확진 여부를 판단하여 상기 질병 진단 정보에 포함시키고,
상기 합병증 마커의 피크값이 기 설정된 질병 주의 범위에 포함되는 경우, 상기 합병증 마커에 대응하는 합병증의 발생 가능성이 높다는 것을 의미하는 합병증 주의 진단 정보를 더 생성하여 상기 질병 진단 정보에 포함시키고,
상기 후처리는,
상기 질량 스펙트럼을 5m/z 분자량 범위로 구분하고, 구분된 각각의 5m/z 범위에 대응하는 평균 강도값을 획득하는 처리를 포함하여, 98.5%의 재현성이 나타나는 것을 특징으로 하는, 질량 스펙트럼을 이용한 질병 진단 시스템. - 제 1항에 있어서,
상기 질량 스펙트럼 획득부는,
상기 학습용 혈액 샘플을 이용하여 제n 질량 스펙트럼을 획득하고,
상기 제n 질량 스펙트럼은 상기 학습용 혈액 샘플이 상기 제n 질병 확진자의 혈액 샘플인 경우, 제n-1 또는 제n-3 질량 스팩트럼을 포함하며,
상기 학습용 혈액 샘플이 상기 제n 질병 비확진자의 혈액 샘플인 경우 제n-2 또는 제 n-4 질량 스펙트럼을 포함하는 질량 스펙트럼을 이용한 질병 진단 시스템. - 제 2항에 있어서,
상기 제n-1 및 제n-2 질량 스펙트럼은,
상기 혈액 샘플이 혈청인 경우의 질량 스펙트럼이고,
상기 제n-3 및 제n-4 질량 스펙트럼은,
상기 혈액 샘플이 혈장인 경우의 질량 스펙트럼을 포함하는 질량 스펙트럼을 이용한 질병 진단 시스템. - 삭제
- 제 3항에 있어서,
상기 진단 기준 정보 획득부는,
상기 규격화 질량 스펙트럼 중 상기 학습용 혈액 샘플을 이용하여 획득되는 학습용 규격화 질량 스펙트럼을 이용하여 상기 기계학습을 수행하고, 상기 기계학습 결과를 이용하여 상기 마커를 획득하는 질량 스펙트럼을 이용한 질병 진단 시스템. - 제 5항에 있어서,
상기 기계학습은, 제n-1 규격화 질량 스펙트럼 내지 제n-4 규격화 질량 스펙트럼 각각에 대해 수행되며, 상기 기계학습 결과는 제n-1 기계학습 결과 또는 제n-3 기계학습 결과 및 제n-2 기계학습 결과 또는 제n-4 기계학습 결과 중 어느 하나를 포함하는 질량 스펙트럼을 이용한 질병 진단 시스템. - 제 6항에 있어서,
상기 제n-1 기계학습 결과 및 상기 제n-2 기계학습 결과를 비교한 제1 비교 결과 또는 상기 제n-3 기계학습 결과 및 상기 제n-4 기계학습 결과를 비교한 결과를 이용하여 상기 적어도 하나의 마커를 획득하는 질량 스펙트럼을 이용한 질병 진단 시스템. - 제 7항에 있어서,
상기 마커는 상기 기계학습 결과의 비교를 통해 획득되며, 상기 각 분자량 범위에 대응하는 상기 평균 강도값을 동일한 범위끼리 비교하고, 비교 결과 그 차이가 기 설정된 범위를 벗어나는 경우, 해당 범위를 제n질병 마커로 획득하는 질량 스펙트럼을 이용한 질병 진단 시스템. - 질량 스펙트럼 획득부를 이용하여 임의의 혈액 샘플에 대한 질량 스펙트럼을 획득하는 질량 스펙트럼 획득 단계;
질량 스펙트럼 후처리부를 이용하여 상기 질량 스펙트럼에 대한 후처리를 수행하고, 후처리된 질량 스펙트럼인 규격화 질량 스펙트럼을 생성하는 질량 스펙트럼 후처리 단계;
진단 기준 정보 획득부를 이용하여 상기 규격화 질량 스펙트럼을 통해 기계학습을 수행하고 상기 기계학습 결과 제n질병의 적어도 하나의 마커를 획득하는 진단 기준 정보 획득 단계; 및
질병 진단부를 이용하여 피검자 혈액 샘플로부터 획득되는 피검자 규격화 질량 스펙트럼과 상기 마커를 비교하고, 기 설정된 기준을 만족하는 경우, 상기 피검자 혈액 샘플로부터 상기 제n질병이 진단된 것으로 판단하여 제n질병 진단 정보를 생성하는 질병 진단 단계;를 포함하며,
상기 임의의 혈액 샘플은 학습용 혈액 샘플 및 진단용 혈액 샘플로 구분되고,
상기 학습용 혈액 샘플은,
선행 검사를 통한 제n 질병의 확진 여부에 따라 결정되는 제n 질병 확진자 및 제n 질병 비확진자의 혈액 샘플을 포함하며,
상기 진단용 혈액 샘플은,
상기 선행 검사가 수행되지 않아 상기 제n 질병의 확진 여부를 판단할 수 없는 피검자 혈액 샘플을 포함하고,
상기 질량 스펙트럼 획득 단계는,
상기 임의의 혈액 샘플에 대한 질량 스펙트럼을 획득하기 위해 상기 임의의 혈액 샘플과 혼합되는 매트릭스만을 이용하여 획득하는 질량 스펙트럼인 베이스 질량 스펙트럼을 더 획득하도록 형성되고,
상기 진단 기준 정보 획득 단계는,
상기 베이스 질량 스펙트럼에 대한 기계학습을 수행하고, 상기 규격화 질량 스펙트럼에 대한 기계학습 결과에서 상기 베이스 질량 스펙트럼에 대한 기계학습 결과를 제외하여 노이즈가 제거된 기계학습 결과를 이용하여 상기 제n 질병의 적어도 하나의 마커를 획득하며,
상기 제n 질병에 대한 마커인 제n 질병 마커와 상기 제n 질병 마커의 기 설정된 범위를 이용하여 제n 질병의 중증도를 결정하기 위한 중증도 정보를 더 생성하며,
선행 검사가 수행된 제n질병 확진자의 중증도를 기계학습하여 도출되는 중증도 학습 결과를 획득하며, 상기 중증도 학습 결과를 기 설정된 범위로 구분하여 중증도 범위로 출력하고,
상기 중증도는 상기 제n 질병 마커의 피크 값을 이용하여 생성되며,
상기 질병 진단 단계는,
상기 제n질병 진단 정보를 통해 상기 제n 질병의 확진이 확인되면, 상기 제n 질병의 현재 중증도를 상기 중증도 범위를 이용하여 상기 제n 질병에 대한 중증도인 현재 중증도 정보 및 상기 제n질병 진단 정보를 포함하는 질병 진단 정보를 생성 및 출력하며,
복수의 제n질병들 사이에서 합병증을 유발할 수 있는 질병 및 상기 합병증을 유발할 수 있는 질병을 통해 발생할 수 있는 합병증 질병을 서로 연결하는 합병증 연결 정보를 획득하고, 상기 합병증 연결 정보에 포함되는 상기 합병증 질병들 각각에 대한 마커인 합병증 마커를 획득하며, 상기 제n질병에 대하여 확진 정보를 획득한 경우, 상기 제n질병의 상기 합병증 마커를 통해 상기 합병증의 확진 여부를 판단하여 상기 질병 진단 정보에 포함시키고,
상기 합병증 마커의 피크값이 기 설정된 질병 주의 범위에 포함되는 경우, 상기 합병증 마커에 대응하는 합병증의 발생 가능성이 높다는 것을 의미하는 합병증 주의 진단 정보를 더 생성하여 상기 질병 진단 정보에 포함시키고,
상기 후처리는,
상기 질량 스펙트럼을 5m/z 분자량 범위로 구분하고, 구분된 각각의 5m/z 범위에 대응하는 평균 강도값을 획득하는 처리를 포함하여, 98.5%의 재현성이 나타나는 것을 특징으로 하는, 질량 스펙트럼을 이용한 질병 진단 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230123442A KR102678794B1 (ko) | 2023-09-15 | 2023-09-15 | 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230123442A KR102678794B1 (ko) | 2023-09-15 | 2023-09-15 | 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102678794B1 true KR102678794B1 (ko) | 2024-06-26 |
Family
ID=91689413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230123442A KR102678794B1 (ko) | 2023-09-15 | 2023-09-15 | 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102678794B1 (ko) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090012313A (ko) * | 2006-03-29 | 2009-02-03 | 칸젠 바이오테크날러지즈, 인코포레이티드 | 질병을 예측하는 장치 및 방법 |
US20150283206A1 (en) * | 2014-04-04 | 2015-10-08 | Biodesix, Inc. | Treatment selection for lung cancer patients using mass spectrum of blood-based sample |
KR20180120615A (ko) * | 2017-04-27 | 2018-11-06 | 숭실대학교산학협력단 | Maldi-tof 질량분석법을 기반으로 하는 혈액 단백질 및 대사체 핑거프린팅을 이용한 초고속 질병 진단 시스템 |
KR20190081825A (ko) * | 2017-12-29 | 2019-07-09 | 재단법인대구경북과학기술원 | 질량 분석 및 기계 학습을 활용하는 암 결정기 및 암 결정기가 수행하는 방법 |
KR20200028917A (ko) | 2020-03-06 | 2020-03-17 | 충남대학교산학협력단 | N-당사슬 이성질체의 상대정량을 이용한 질병 스크리닝 방법 |
KR102380684B1 (ko) * | 2021-11-09 | 2022-04-01 | 주식회사 셀키 | Ai 기반으로 질량 스펙트럼에 따른 당펩타이드 분석을 통해 암 특이적 바이오마커를 결정하는 방법 및 장치 |
-
2023
- 2023-09-15 KR KR1020230123442A patent/KR102678794B1/ko active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090012313A (ko) * | 2006-03-29 | 2009-02-03 | 칸젠 바이오테크날러지즈, 인코포레이티드 | 질병을 예측하는 장치 및 방법 |
US20150283206A1 (en) * | 2014-04-04 | 2015-10-08 | Biodesix, Inc. | Treatment selection for lung cancer patients using mass spectrum of blood-based sample |
KR20180120615A (ko) * | 2017-04-27 | 2018-11-06 | 숭실대학교산학협력단 | Maldi-tof 질량분석법을 기반으로 하는 혈액 단백질 및 대사체 핑거프린팅을 이용한 초고속 질병 진단 시스템 |
KR20190081825A (ko) * | 2017-12-29 | 2019-07-09 | 재단법인대구경북과학기술원 | 질량 분석 및 기계 학습을 활용하는 암 결정기 및 암 결정기가 수행하는 방법 |
KR20200028917A (ko) | 2020-03-06 | 2020-03-17 | 충남대학교산학협력단 | N-당사슬 이성질체의 상대정량을 이용한 질병 스크리닝 방법 |
KR102380684B1 (ko) * | 2021-11-09 | 2022-04-01 | 주식회사 셀키 | Ai 기반으로 질량 스펙트럼에 따른 당펩타이드 분석을 통해 암 특이적 바이오마커를 결정하는 방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hu et al. | The importance of experimental design in proteomic mass spectrometry experiments: some cautionary tales | |
CN110312462B (zh) | 受试者为医疗或兽医检查所做准备的改进或相关的改进 | |
CN104704344A (zh) | 使用cpd数据进行白血病分类 | |
CN114414704B (zh) | 评估甲状腺结节恶性程度或概率的系统、模型及试剂盒 | |
JP2022001875A (ja) | 小児がん検査用尿中代謝物マーカー | |
CN102138069A (zh) | 便携式基于等离子体的诊断设备和诊断方法 | |
CN109791133B (zh) | 用于诊断直结肠癌的装置 | |
US20200264161A1 (en) | Cancer risk evaluation method and cancer risk evaluation system | |
US11125687B2 (en) | Method and device for identifying fragmented red blood cells, blood cell analyzer and analysis method | |
KR102678794B1 (ko) | 질량 스펙트럼을 이용한 질병 진단 시스템 및 방법 | |
KR101223270B1 (ko) | 대장암 진단용 저질량 이온 결정 방법, 이를 이용하여 대장암 진단을 위한 정보를 제공하는 방법, 및 이를 위한 연산 장치 | |
JP6565801B2 (ja) | 質量分析データ処理装置、質量分析装置、質量分析データ処理方法、及び質量分析データ処理用プログラム | |
US11137405B2 (en) | Lung cancer detection method and detection kit | |
Mezerji et al. | The diagnostic value of surface markers in acute appendicitis; A diagnostic accuracy study | |
CN110779946A (zh) | 活检组织代谢物的检测试剂在制备前列腺癌诊断试剂上的应用及试剂盒和定性定量分析方法 | |
CN113960130B (zh) | 一种采用开放式离子源诊断甲状腺癌的机器学习方法 | |
US11380532B2 (en) | Method for imaging mass spectrometry and imaging mass spectrometer | |
RU2582979C1 (ru) | Способ уточнения стадии распространенного рака шейки матки | |
KR101439977B1 (ko) | 위암 진단 장치 | |
Fernandez-Quilez et al. | Prostate Age Gap (PAG): An MRI surrogate marker of aging for prostate cancer detection | |
US20150066376A1 (en) | Non-invasive prenatal testing method based on whole-genome tendency scoring | |
Ramamoorthy et al. | Beta-validation of a non-invasive method for simultaneous detection of early-stage female-specific cancers | |
KR101739703B1 (ko) | Trail 기반 뇌염 감별진단 방법 및 장치 | |
KR101439981B1 (ko) | 유방암 진단 장치 | |
US20230343573A1 (en) | Mass spectrometer |