CN109686401B - 一种识别异源低频基因组信号唯一性的方法及其应用 - Google Patents
一种识别异源低频基因组信号唯一性的方法及其应用 Download PDFInfo
- Publication number
- CN109686401B CN109686401B CN201811566958.1A CN201811566958A CN109686401B CN 109686401 B CN109686401 B CN 109686401B CN 201811566958 A CN201811566958 A CN 201811566958A CN 109686401 B CN109686401 B CN 109686401B
- Authority
- CN
- China
- Prior art keywords
- calculating
- sample
- heterologous
- sample group
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 239000000523 sample Substances 0.000 claims abstract description 57
- 239000013068 control sample Substances 0.000 claims abstract description 19
- 238000007476 Maximum Likelihood Methods 0.000 claims abstract description 8
- 238000001514 detection method Methods 0.000 claims abstract description 4
- 238000005070 sampling Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 239000013074 reference sample Substances 0.000 claims description 3
- 238000005094 computer simulation Methods 0.000 claims description 2
- 230000011987 methylation Effects 0.000 claims description 2
- 238000007069 methylation reaction Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 230000001605 fetal effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000035935 pregnancy Effects 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 230000002513 anti-ovulatory effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及生物学领域,尤其涉及一种识别异源低频基因组信号唯一性的方法及其应用。所述方法包括以下步骤:S1、样本选择:S2、获得特征值;S3、计算h:不依赖对照样本组C',采用最大似然估计计算低频异源基因组总浓度p1;依赖对照样本组C',采用最大似然估计计算低频信号浓度p2,h=p2/p1;S4、计算k、Δk:计算获得的所有k,求其标准差为Sk,Δk=2Sk;S5、判定异源信号的唯一性:异源信号的个数为n,若h=p2/p1∈[k‑Δk,k+Δk],则n=1,否则n>1。通过将生命科学和计算机科学相结合,本发明公开了一种新的识别基因组异源信号唯一性的方法,该方法准确率高,可重复性且成本低,可用于识别基因组样品中,除真实的低频信号之外是否含有外源污染,从而提高检测结果的准确率。
Description
技术领域
本发明涉及生物学领域,尤其涉及一种识别异源低频基因组信号唯一性的方法及其应用。
背景技术
NIPT(无创产前诊断)和肿瘤液态活检技术,都是基于识别外周血游离DNA的异源信号。NIPT一般需要孕妇外周血游离DNA中来自胎儿的信号超过百分之四,肿瘤液态活检可以检测到低于千分之一的来自于肿瘤组织的DNA。然而实际生产过程中,会面临异源信号来源大于一个的问题。NIPT中4%的小信号可能含有采样或者生产过程中引入的其他污染信号,造成假阴性的结果,这些都是本领域技术人员所不期望看到。
近年来,随着芯片技术和第二代高通量测序技术的发展,生物信息研究人员已针对这两种不同的技术开发了许多相对应的软件用于检测基因组的结构性变异。然而如何利用生物信息学来发明一种识别异源低频基因组信号唯一性的方法至今还未报道过。
发明内容
本发明通过将生命科学和计算机科学相结合,发明了一种新的识别异源低频基因组信号唯一性的方法,该方法准确率高,可重复性且成本低,解决了现有技术中NIPT等技术中出现的假阴性问题。
本发明的具体方案如下:
本发明一方面公开了一种识别异源低频基因组信号唯一性的方法,包括以下步骤:
S1、样本选择:获得一组含异源信号的样本组T、一组随机不含异源信号的对照样本组C、待检样本x和对照样本组C';
S2、获得特征值:得到样本组T、对照样本组C、对照样本组C'、待检样本x中所有样本的每个特征点W的值;
S3、计算h:不依赖对照样本组C',采用最大似然估计计算低频异源基因组总浓度p1;依赖对照样本组C',采用最大似然估计计算低频信号浓度p2,h=p2/p1;
S4、计算k、Δk:对样本组T和对照样本组C进行抽样,获得一一对应的样本对{Ti,Ci},计算对应的p1和p2;其中,
k=∑i(p2,i/p1,i)/100;
计算获得的所有k,求其标准差为Sk,Δk=2Sk;
S5、判定异源信号的唯一性:异源信号的个数为n,
优选的,所述特征点W包括SNP、INDEL和甲基化位点中的一种或者其任意组合。
优选的,在S2中,所述特征值采用二代测序技术测得;
优选的,在S2中,所述特征值采用芯片技术、数字PCR或者一代测序技术测得。
优选的,若所述样本组T、对照样本组C、对照样本组C'均只有一个样本,则采取反复抽样的方法。
若样本组C和C’难以获得,可以根据已有的特征位点在人群中的频率,使用哈迪-温伯格定律进行模拟生成样本。
优选的,每次抽取其中75%-85%的特征值位点。更优选的,每次抽取其中80%的特征值位点。
优选的,所述特征点的值通过实验数据检测获得。
优选的,所述特征点的值通过计算模拟得到。
本发明第二个方面公开了上述的方法在生物学领域中的应用。
优选的,对于正常样本来说,所述方法可用于区分样本的数据是否被污染。
优选的,对于孕妇来说,所述方法可用于判断怀孕为单胎还是异卵双胎。
优选的,对于肿瘤患者来说,所述方法可用于判断肿瘤信号是一个来源还是多个来源。
本发明具有如下优点或者有益效果:
通过将生命科学和计算机科学相结合,本发明公开了一种新的识别异源低频基因组信号唯一性的方法,该方法准确率高,可重复性且成本低,可用于识别基因组样品中,除真实的低频信号之外是否含有外源污染,从而提高检测结果的准确率。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制。
图1为本发明实施例1中p2值的分布示意图;
图2为本发明实施例1中p1和p2的分布示意图;
图3是本发明实施例2中p1和p2的分布示意图,其中点o代表了样本组T的结果,点*代表待检样本x的结果。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于本发明而不用于限制本发明的范围。
实施例1
本实施例公开了一种识别异源低频基因组信号唯一性的方法,包括以下步骤:
S1、样本选择:样本组T只有一个样本,编号2018110747S,样本为孕妇血浆游离DNA样本,单胎,孕周为18周。样本组C只有一个样本,编号2018110747F,样本为血液DNA样本,为胎儿生父。待检样本x为异卵双胎孕妇血浆游离DNA样本,编2018042088S,孕周13周。对照样本组C'中只有一个样本,编号2018042088F,样本为毛发DNA样本,为胎儿生父。
S2、获得特征值:使用二代测序技术测得样本组T、对照样本组C、对照样本组C'和待检样本x这4个样本的6000个SNP位点上各个等位基因的出现次数;
S3、计算h:不依赖对照样本组C',采用最大似然估计计算p1,计算胎儿DNA在孕妇血浆游离DNA中的比例p1=0.487;依赖对照样本组C',采用最大似然估计计算p2,,采用抽样方法获得足够样本数。每次抽取其中80%的SNP位点,共抽取100次,获得100个样本。p2=∑w∈C′p2(w)/100=0.051。通过R语言数据处理,100个抽样的p2图形如图1所示;
h=p2/p1=0.51/0.487=1.047;
S4、计算k、Δk:样本组T只有一个样本,对照样本组C也只有一个样本,对T和C进行反复抽样,每次抽取80%个特征点,共100次,获得一一对应的样本对{Ti,Ci},计算对应的p1和p2;通过R语言数据处理,结果如图2所示,
k=∑i(p2,i/p1,i)/100=0.985;
计算获得的所有k,求其标准差为Sk,Δk=2Sk=0.0215x2=0.04;
S5、判定异源信号的唯一性:h=1.047>k+Δk=0.985+0.04=1.025,结果表明待检样本中含有超过一个异源信号。
本实施例公开了一种新的识别异源低频基因组信号唯一性的方法,该方法准确率高,可重复性且成本低。
实施例2
本实施例公开了一种识别异源低频基因组信号唯一性的方法,包括以下步骤:
S1、样本选择:选取p1∈(0.064;0.068)的孕妇血浆游离DNA样本10个,构成样本组T,选取97个男性血液样本构成样本组C,选择C'=C,选择编号2018052905样本为待检样本x;
S2、特征值获得:使用二代测序技术测得T、C、x这些样本的6000个SNP位点上各个等位基因的出现次数;
S3、计算h;通过R语言数据处理,样本组T和待测样本x的计算结果如图3所示:
样本x的p1=0.0644;p2=(∑w∈C′p2(w))/97=0.0369;
h=p2/p1=0.0369/0.0644=0.573;
S4、计算k、Δk;
k=∑i(p2,i/p1,i)/970=0.489;
Δk=0.015×2=0.03;
其中p2,i表示第i个T样本组中样本和C样本组计算所得p2。
S5、判定异源信号的唯一性:h=0.573>k+Δk=0.489+0.03=0.519;
说明待检样本x中含有超过一个异源信号。
以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。
Claims (7)
1.一种识别异源低频基因组信号唯一性的方法,其特征在于,包括以下步骤:
S1、样本选择:获得一组含异源信号的样本组T、一组随机不含异源信号的对照样本组C、待检样本x和对照样本组C';
S2、获得特征值:得到样本组T、对照样本组C、对照样本组C'、待检样本x中所有样本的每个特征点W的值;
S3、计算h:不依赖对照样本组C',采用最大似然估计计算异源低频基因组总浓度p1;依赖对照样本组C',采用最大似然估计计算低频信号浓度p2,h=p2/p1;
S4、计算k、Δk:对样本组T和对照样本组C进行抽样,获得一一对应的样本对{Ti,Ci},计算对应的p1和p2;其中,
k=∑i(p2,i/p1,i)/100;
计算获得的所有k,求其标准差为Sk,Δk=2Sk;
S5、判定异源信号的唯一性:异源信号的个数为n,
2.根据权利要求1所述的方法,其特征在于,所述特征点W包括SNP、INDEL和甲基化位点中的一种或者其任意组合。
3.根据权利要求1所述的方法,其特征在于,在S2中,所述特征值采用二代测序技术测得。
4.根据权利要求1所述的方法,其特征在于,若所述样本组T、对照样本组C、对照样本组C'均只有一个样本,则采取反复抽样的方法。
5.根据权利要求4所述的方法,其特征在于,每次抽取其中75%-85%的特征值位点。
6.根据权利要求1所述的方法,其特征在于,所述特征点的值通过实验数据检测获得。
7.根据权利要求1所述的方法,其特征在于,所述特征点的值通过计算模拟获得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811566958.1A CN109686401B (zh) | 2018-12-19 | 2018-12-19 | 一种识别异源低频基因组信号唯一性的方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811566958.1A CN109686401B (zh) | 2018-12-19 | 2018-12-19 | 一种识别异源低频基因组信号唯一性的方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109686401A CN109686401A (zh) | 2019-04-26 |
CN109686401B true CN109686401B (zh) | 2022-08-05 |
Family
ID=66188509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811566958.1A Active CN109686401B (zh) | 2018-12-19 | 2018-12-19 | 一种识别异源低频基因组信号唯一性的方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109686401B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103534591A (zh) * | 2010-10-26 | 2014-01-22 | 利兰·斯坦福青年大学托管委员会 | 通过测序分析进行的非侵入性胎儿遗传筛选 |
WO2014209597A2 (en) * | 2013-06-28 | 2014-12-31 | Ariosa Diagnostics, Inc. | Massively parallel sequencing of random dna fragments for determination of fetal fraction |
CN106460070A (zh) * | 2014-04-21 | 2017-02-22 | 纳特拉公司 | 检测染色体片段中的突变和倍性 |
CN107254514A (zh) * | 2017-05-12 | 2017-10-17 | 苏州人人基因科技有限公司 | 检测异源cfDNA的SNP分子标记及检测方法、用途 |
CN108875307A (zh) * | 2018-06-29 | 2018-11-23 | 上海欧易生物医学科技有限公司 | 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3088532B1 (en) * | 2009-12-22 | 2019-10-30 | Sequenom, Inc. | Processes and kits for identifying aneuploidy |
-
2018
- 2018-12-19 CN CN201811566958.1A patent/CN109686401B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103534591A (zh) * | 2010-10-26 | 2014-01-22 | 利兰·斯坦福青年大学托管委员会 | 通过测序分析进行的非侵入性胎儿遗传筛选 |
WO2014209597A2 (en) * | 2013-06-28 | 2014-12-31 | Ariosa Diagnostics, Inc. | Massively parallel sequencing of random dna fragments for determination of fetal fraction |
CN106460070A (zh) * | 2014-04-21 | 2017-02-22 | 纳特拉公司 | 检测染色体片段中的突变和倍性 |
CN107254514A (zh) * | 2017-05-12 | 2017-10-17 | 苏州人人基因科技有限公司 | 检测异源cfDNA的SNP分子标记及检测方法、用途 |
CN108875307A (zh) * | 2018-06-29 | 2018-11-23 | 上海欧易生物医学科技有限公司 | 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109686401A (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220010371A1 (en) | Rapid aneuploidy detection | |
JP6534191B2 (ja) | コピー数変動を決定することにおける検出の感度を向上させるための方法 | |
JP5938484B2 (ja) | ゲノムのコピー数変異の有無を判断する方法、システム及びコンピューター読み取り可能な記憶媒体 | |
IL249095B1 (en) | Detection of subchromosomal aneuploidy in the fetus and variations in the number of copies | |
CN105844116B (zh) | 测序数据的处理方法和处理装置 | |
US20080108071A1 (en) | Methods and Systems to Determine Fetal Sex and Detect Fetal Abnormalities | |
CN105825076B (zh) | 消除常染色体内和染色体间gc偏好的方法及检测系统 | |
EP3171288A1 (en) | Method for prediction of fetal monogenic genetic variations using maternal serum dna | |
EP3023504A1 (en) | Method and device for detecting chromosomal aneuploidy | |
KR101678962B1 (ko) | 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법 | |
CN108197428B (zh) | 一种并行动态规划的下一代测序技术拷贝数变异检测方法 | |
KR101963245B1 (ko) | 다중 Z-score에 기반한 비침습적 산전 검사 방법 및 장치 | |
CN109686401B (zh) | 一种识别异源低频基因组信号唯一性的方法及其应用 | |
CN108229099B (zh) | 数据处理方法、装置、存储介质及处理器 | |
WO2024011929A1 (zh) | 检测胎儿染色体非整倍体异常的方法、装置及存储介质 | |
US20220101947A1 (en) | Method for determining fetal fraction in maternal sample | |
KR20190114351A (ko) | 비침습적 산전 검사에 의한 태아 염색체의 미세결실 또는 미세증폭의 확인 방법 | |
CN107723343A (zh) | 一种基因定量分析的方法 | |
KR102519739B1 (ko) | 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치 | |
KR102532991B1 (ko) | 태아의 염색체 이수성 검출방법 | |
CN109321641A (zh) | 一种基于dna片段富集及测序技术的产前无创胎儿染色体检测系统 | |
WO2025005892A1 (en) | Method and system for detecting tumour presence from mapping metrics of free circulating dna fragments | |
EP4511838A1 (en) | Method and system for detecting tumour presence from mapping metrics of free circulating dna fragments | |
Peng et al. | Impact of In Vitro Cell Subculture on Mosaicism: Comparative Analysis of Chromosome Microarray and Karyotype Results | |
Wang et al. | Development of a Multiplex ddPCR Detection Method for Accurate Non-Invasive Prenatal Testing of Trisomy 21 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |