Nothing Special   »   [go: up one dir, main page]

KR20100020960A - 자궁내막증과 연관된 유전자 마커 및 이의 용도 - Google Patents

자궁내막증과 연관된 유전자 마커 및 이의 용도 Download PDF

Info

Publication number
KR20100020960A
KR20100020960A KR1020097025865A KR20097025865A KR20100020960A KR 20100020960 A KR20100020960 A KR 20100020960A KR 1020097025865 A KR1020097025865 A KR 1020097025865A KR 20097025865 A KR20097025865 A KR 20097025865A KR 20100020960 A KR20100020960 A KR 20100020960A
Authority
KR
South Korea
Prior art keywords
dna
endometriosis
homo sapiens
snp
polynucleotide
Prior art date
Application number
KR1020097025865A
Other languages
English (en)
Inventor
케네쓰 워드
한스 알버트슨
Original Assignee
주노 바이오사이언스, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주노 바이오사이언스, 엘엘씨 filed Critical 주노 바이오사이언스, 엘엘씨
Publication of KR20100020960A publication Critical patent/KR20100020960A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 자궁내막증 및 자궁내막증 발생 위험과 연관된 신규한 유전자 마커, 사람 개체가 자궁내막증 발생 위험에 있는지 또는 자궁내막증을 가지는지를 결정하는 방법 및 재료에 관계한다.

Description

자궁내막증과 연관된 유전자 마커 및 이의 용도{GENETIC MARKERS ASSOCIATED WITH ENDOMETRIOSIS AND USE THEREOF}
관련 출원에 대한 교차 참고문헌
본 출원은 35 USC § 119(e) 규정에 의해 2008년 3월 27일자 출원된 미국 특허 출원 12/056,754을 우선권 주장하며, 이 출원은 동규정하에 2007년 6월 11일자 출원된 미국 가특허출원 60/943,193을 우선권으로 주장하며, 이 두 출원은 모두 전문을 참고문헌으로 첨부한다.
발명의 분야
본 발명은 자궁내막증(ENDOMETRIOSIS) 진단 및 치료에 관계한다. 특히, 본 발명은 사람의 게놈에서 특정 단일 염기 변형(single nucleotide polymorphisms: SNPs) 및 자궁내막증 및 연관 병리학에서의 이들의 연관성에 관한 것이다.
발명의 배경
자궁내막증은 일예로 자가면역 자궁내막증, 약한 자궁내막증, 중증 자궁내막증 또는 심각한 자궁내막증을 말한다. 본 발명의 목적에서, 자궁내막증 용어는 이들 질환중 임의의 것을 설명하는데 이용된다.
가장 보편적으로 정의하자면 자궁내막증은 자궁의 외측(자궁내부 또는 eutopic 보다는 자궁외[ectopic] 내막조직)에서 자궁내막증(선과 기질)의 존재로 정의된다. 복부의 복막 표면상, 흉부, 배꼽 및 수술전 절개 부위에서 임플란트(임플란트들은 내장, 자궁 또는 방광으로 뻗어갈 수도 있다)가 확인되기는 하였지만, 가장 공통되는 부위는 난소, 골반 복막(pelvic peritoneum), 더글라스와(pouch of Douglas), 질직장중격(rectovaginal septum)이다. (Child TJ, Tan SL (2001) Endometriosis: aetiology, pathogenesis and treatment. Drugs 61:1735-1750; Giudice et al. (1998) Status of current research on Endometriosis. The Journal of reproductive medicine 43:252-262).
자궁내막증은 흔한 부인과 질환이다. 징조는 알기 힘들다. 모든 여성의 약 14%(1-43% 범주)에 영향을 주며, 여성의 40-60%는 골반 통증을, 불임 여성의 30%-50%가 앓고 있는 것으로 예상되었다(Di Blasio et al. (2005) Genes of Endometriosis. Minerva ginecologica 57:225-236; Schindler AE (2004) Pathophysiology, diagnosis and treatment of Endometriosis. Minerva ginecologica 56:419-435).
질병 정의 및 대조군 선별과 관련된 방법학적 문제들로 인하여 자궁내막증의 유전에 대한 연구가 방해를 받아왔다. 이 나라에서 1970년대 1000명의 백인 여성(15세~49세) 당 1.6명이라고 제시되었으며, 퇴원 자료에 근거한 좀더 최근 연구에서는 자궁내막증으로 최초 진단을 받은 경우는 퇴원하는 15~44세 여성 1000명중 1.3명이었다. 흑인에서 자궁내막증 비율이 더 낮고, 동양인의 경우는 백인보다 조금 더 높은 비율을 가진다는 것이 임상적인 결과이다. 별도의 작업에서 다유전성 /다중요소 유전이 제시되었다(Vigano P, Somigliana E, Vignali M, Busacca M, Blasio AM (2007) Genes of Endometriosis: current status and prospects. Front Biosci 12:3247-3255). Affected sib-pair studies have also performed (Kennedy et al. (2001) Affected sib-pair analysis in Endometriosis. Human reproduction update 7:411-418; Treloar et al. (2005) Genomewide linkage study in 1,176 affected sister pair families identifies a significant susceptibility locus for Endometriosis on chromosome 10q26. Am J Hum Genet 77:365-376).
변형을 가지는 특정 유전자와 자궁내막증과의 연관성에 대해 조사하였다. 일부 연합 연구에 의하면 GALT (갈락토오즈 대사에 관련된 유전자), GSTM1 및 NAT2 (해독 효소를 인코드하는 유전자)가 질병 민감성 유전자로써 관련있다는 것이었다. 최근 발견이 GSTM1 및 NAT2의 연관성에 대한 증거로 추가되었으나, GALT의 역할은 여전히 의문으로 남는다. p21 유전자 코돈 31 아르기닌/세린 변형은 자궁내막증에 관여하지 않는다.
아릴하이드로카본 수용체(AHR) 유전자 및 관련 유전자의 변형을 검사하였고, 최소 한 가지 연구에서, 연관은 발견되지 않았다. 그러나, 많은 유전자 및 유행병학 연구 계획안들은 샘플 크기, 표현형 정의의 일관성, 대조군 집단 선택 등에 있어서 부적합하였다. 자궁내막증 발생에 관련된 게놈 변화를 확인하기 위하여(Gogusevet al. (1999). "Detection of DNA copy number changes in human Endometriosis by comparative genome hybridization." HumGenet105(5):444-51), 대비 게놈 하이브리드 반응을 통하여 내막 조직들을 비교하여, 내막증환자의 경우 50%에서 1p 와 22q 손실이 감지되었다. 추가로 공통적으로 손실된 것에는 7p(22%)가 포함된다. 염색체 1, 7, 및 22상에 결손된 부분들에 대해 프로브를 이용한 이원-색깔 FISH는 CGH 데이터를 뒷받침한다. Treloar et al. (Treloar et al. (2005). "Genomewide linkage study in 1,176 affected sister pair families identifies a significant susceptibility locus for Endometriosis on chromosome 10q26." AmJHumGenet77(3):365-76)은 1,176개 패밀리(호주의 931개 가족, 영국의 245개 가족)의 연결(linkage) 연구를 실시하였는데, 각 패밀리에는 최소 2명의 질병이 있는 구성원이 있고, 통상 자매가 쌍으로 감염되며, 외과적으로 진단을 받은 병을 가지고 있다. 이들에서 10q26 (maximum lod 수치 = 3.09; genomewide P = 0.047)상에 유의적인 연결 부분이 확인되었고, 20p13상에 또 다른 부분의 암시적인 연결과; 8개 다른 염색체상에 약한 피크들이 관찰되었다.
자궁내막증은 유전적으로 유전되는 질환이다. DNA 서열에 유전자 변화는 유전되는 표현형과 종종 연관되어 복합 질환으로 가는 경향이 있다. 단일 염기 변형이 유전자 서열 변화의 가장 흔한 형태이다. 따라서, 자궁내막증 위험과 연관된 단일 염기 변형 (SNPs)과 같은 특정 유전자 돌연변이의 감지 및 분석을 이용하여 자궁내막증의 위험을 결정, 자궁내막증의 존재 또는 자궁내막증의 진행을 결정할 수 있다. 자궁내막증을 예측하는 유전자 마커를 생명 초기에 유전자타입하여, 다양한 위험 인자들 및 치료에 대해 개별 반응을 예측할 수 있다. 민감성 유전자의 유전자 분석에 의해 밝혀진 유전자 성향으로 유전자타입과 환경 인자들간에 상호작 용의 통합 평가를 제공함으로써, 진단 테스트들의 예측값을 상승적으로 증가시키는 결과를 제공할 수 있다. 따라서, 사전-증후 및 초기 증후 유전자 테스트는 늦게 외과적인 개입 치료에서 초기 예방 치료로의 전형적인 변화의 초석이 될 수 있을 것으로 기대된다.
따라서, 자궁내막증의 예측, 자궁내막증의 진행, 특히, 자궁내막증을 가지는 것으로 인지되는 개체에서 치료 결정에 지표가 되는 신규한 유전자 마커가 긴급하게 필요하다. 이와 같은 유전자 마커는 기존의 위험 인자들 및 바이오마커를 이용하여 현재 평가될 수 있는 집단과 비교하였을 때 훨씬 더 많은 집단에서 자궁내막증을 예후할 수 있을 것이다. 예를 들면, 유전자 테스트의 이용으로 자궁내막증의 조기 진단 및 예후 뿐만 아니라 질병으로 진행을 완화시키기 위한 조기 임상적 중재를 가능하게 할 것이다. 이와 같은 유전자 마커들을 이용하여 신규한 치료 방법이 관여하는 임상 시도를 선택할 수도 있을 것이다. 자궁내막증과 연관된 유전자 마커의 발견으로 자궁내막증의 치료 중재 또는 예방 치료를 위한 신규한 표적을 제공할 수도 있고, 자궁내막증 치료를 위한 신규한 치료제의 개발도 가능할 것이다.
발명의 요약
본 발명은 신규한 SNPs 동정, 이와 같은 SNPs의 독특한 복합 및 자궁내막증 및 관련 병리에 연관된 SNPs의 단상형(haplotype)의 동정에 관계한다. 여기에서 설명된 변형(polymorphisms)은 자궁내막증 및 관련 병리의 진단 및 치료에 이용할 수 있는 진단시약의 고안 및 치료제의 고안을 위한 표적에 직접적으로 유용하다.
자궁내막증에 연관된 SNPs의 동정에 근거하여, 본 발명은 또한 이들 변이체들을 감지하는 방법 뿐만 아니라 이와 같은 작업을 수행하는데 필요한 감지 시약의 고안 및 준비 방법도 제공한다. 본 발명은 특히 자궁내막증에 관여하는 유전자 서열에서 신규한 SNPs를 제공하고, 테스트 샘플에서 이와 같은 SNPs를 감지하는 방법, 자궁내막증이 발생될 변형 위험을 가지는 개체를 확인하는 방법 및 여기에서 설명하는 SNPs 또는 이에 인코드된 산물의 존재에 근거하여 자궁내막증의 치료에 더 반응을 잘 하는 또는 반응이 적은 개체를 확인하는 방법도 제공한다.
본 발명의 한 구체예에서, 자궁내막증과 대립유전자의 유의적인 연합을 가지는 표 1-2에서 제시하는 것과 같은 SNPs 또는 표 1과 2, 그리고 표 3-96에 제시된 것과 같은 나열된 SNPs과 동일한 LD 블락내에 공동 위치한 SNPs를 제공한다.
표 1-196에서는 본 발명의 SNPs 동정 정보를 제공하는데, SNP “rs”는 동정 번호(참고 SNP 또는 RefSNP 획득 ID 번호) 또는 “SNP-A” 동정 번호( Affymetrix, Santa Clara, CA에서 사용된), 염색체 번호 및 SNPs의 염기 위치 번호가 포함된다.
본 발명의 특정 구체예에서, 자궁내막증과 연관된 사람 게놈의 자연-생성 SNPs가 제공된다. 이와 같은 SNPs는 자궁내막증의 진단 및/또는 치료에 다양한 용도를 가질 것이다. 본 발명의 한 측면은 뉴클레오티드 서열을 포함하는 분리된 핵산에 관계하는데, 이때 최소 한 가지 뉴클레오티드가 표 1 또는 2에 공개된 SNP이다. 또 다른 구체예에서, 본 발명의 핵산은 증폭된 폴리뉴클레오티드이며, SNP-포함 핵산 주형의 증폭에 의해 생성된다.
본 발명의 또 다른 구체예에서, 자연 생성되는 인접 뉴클레오티드 서열(DNA 또는 mRNA일 수도 있는)에서 SNP을 감지하기 위한 시약을 제공한다. 특히, 이와 같은 시약은 하이브리드 반응 프로브 또는 소요의 SNP의 특정 감지에 유용한 증폭 프라이머 형태가 될 수도 있다.
또한 본 발명에서는 SNP 감지시약을 포함하는 키트와 감지 시약을 이용하여 여기에서 제시하는 SNPs를 감지하는 방법도 제공한다. 특정 구체예에서, 본 발명은 여기에서 설명하는 SNP 대립형질의 존부를 감지함으로써, 자궁내막증의 발생 위험이 증가 또는 감소된 개체를 확인하는 방법도 제공한다. 또 다른 구체예에서, 여기에서 설명하는 SNP 대립형질 존부를 감지함으로써 자궁내막증 진단 방법도 제공한다. 또 다른 구체예에서, 여기에서 설명하는 SNP 대립형질 존부를 감지함으로써 자궁내막증의 세분하는 방법도 제공한다.
또 다른 구체예에서, 본 발명은 SNP 감지 시약을 포함하는 키트, 감지 시약 및 비-유전적 임상 요인 질문지를 이용하여 여기에서 공개된 SNPs를 감지하는 방법도 제공한다. 한 구체예에서, 의료 병력 신체 검사 및 다른 임상 발견에 근거하여 의료진에 의해 질문지가 완성될 수도 있다. 또 다른 구체예에서, 질문지에는 자궁내막증 발생 위험에 연관된 것으로 알려진 임의 다른 비-유전적 임상 인자들이 포함될 수도 있다.
본 발명의 많은 다른 용도 및 장점들은 여기에서 설명된 적절한 구체예의 상세한 설명에 근거하여 당업자에게 명백할 것이다. 토론의 명확함을 목적으로, 본 발명을 하기 비-제한적 실시예에서 설명할 것이다.
정의
“단상형(Haplotype)”은 연관 비평형 블록(linkage disequilibrium block)에서 발생되는 동일 염색체상에 유전자형 복합을 의미한다. 단상형은 연쇄 비평형 블록의 마커로 이용되고, 동시에 블록내에 유전자형의 배열에 대한 정도를 제공한다. 따라서, 태그로 이용되는 특정 SNPs의 타이핑만으로 블록내에 위치한 SNPs의 모든 유전자형이 밝혀질 수 있다. 따라서, 단상형의 이용으로 질병과 약물 민감성과 연관된 후보 유전자를 동정한다.
“연관 비평형(linkage disequilibrium)” 또는 “LD”는 주어진 염색체 부분내에 두 개 또는 그 이상의 상이한 SNP 부위에서 대립유전자 (선택적 뉴클레오티드[alternative nucleotides]) 또는 유전자 마커의 특정 복합이 일정하게(non-randomly) 공동-유전되고, 상이한 SNP 부위들에서 대립유전자의 복합은 주어진 집단에서 대립유전자로부터 단상형의 무작위 형성 빈도 또는 각 대립유전자의 별도 발생 빈도보다는 다소 빈번히 발생한다는 것을 의미한다. “LD”는 “연관(linkage)”과는 상이한데, 이는 염색체상에 두 개 또는 그 이상의 유전자 좌(loci)에서 이들간에 제한된 재조합으로 연합된 것을 말한다. LD는 두 개 또는 그 이상의 상이한 SNP에서 대립유전자간에 임의 일정한(non-random) 유전자 연합을 말하기도 한다. 따라서, SNP가 다른 SNP들과 LD에 있다면, 제 1 SNP의 특정 대립유전자는 대립유전자가 LD내에 있는 이들 SNP에 있눈 대립형질을 종종 예측된다. LD는 일반적으로 염색체를 따라 두 개 유전자 좌의 물리적으로 근접하기 때문이다. 여기에서, SNP 부위들중 하나를 유전자 형태를 결정하면(genotyping) LD에 있는 다른 SNP 부위를 유전자 형태와 거의 동일한 정보를 제공할 것이다. LD는 유전자간에 상호작용의 적합성 또는 집단 구조, 동종번식(inbreeding) 및 추계학(stochastic) 효과와 같은 비-적응성 프로세스(non-adaptive process)로 인한 것이다.
일부 SNP들이 다른 것들에 비해 더 많이 연합되어(가령, 더 강한 LD내에서)있는 결과로 두 개 또는 그이상의 SNP 사이에는 다양한 정도의 LD를 만날 수 있을 것이다. 또한, 염색체를 따라 LD가 차지하는 물리적 거리는 게놈의 상이한 부위들 사이에서 달라지고, 따라서 발생되는 LD에 필수적인 두 개 또는 그 이상의 SNP 부위간에 물리적 분리 또는 게놈의 상이한 부분들 사이에서 달라질 수 있을 것이다. 카프카스인들에서 평균 LD 블록 크기는 수백 kb에 걸쳐 통상 16.3kb로 평가된다. LD 블록은 인종간에 그 크기가 다양할 수 있을 것이다(The International HapMap Consortium "A haplotype map of the human genome." Nature(2005)437:1299-1320.). 대략적으로, LD는 D 프라임 값이 1, LOD 수치가 2.0이상 또는 r-제곱 값(r-squared value)은 0.8이상인 SNP로 정의될 수 있을 것이다.
“연관 비평형 블록” 또는 “LD 블록”은 서로 근접하게 위치하고, 블록으로 전달되는 다중 SNP를 포함하는 게놈 부분을 의미한다.
“D 프라임” 또는 “D’”(“연관 비평형 척도” 또는 “연관 비평형 매개변수”라고도 함)은 예측된 대립유전자 빈도로부터 관찰된 대립유전자 빈도의 편차를 의미하고, 생물측정 시스템이 상이한 개체간을 얼마나 잘 구별하는지의 통계학적 척도가 됨을 의미한다. D’값이 클수록, 생물측정 시스템은 개체간 구별을 더 잘한다.
“LOD 수치(score)”는 “odd 대수(logarithm of the odd)” 수치, 즉, 특정 염색체상에 함께 유전될 것 같은 두 개 유전자 좌(locus)가 물리적으로 충분히 가까이 있는지( 또는 “연관”되어 있는지)의 통계학적 측정치을 말한다. 3이상의 LOD 수치는 연관의 유의적인 증거로 일반적으로 간주된다.
“R-제곱” 또는 “r2”(“상관계수[correlation coefficient]”라고도 함)는 두 마커가 연관된 정도의 통계학적 척도이다. r 제곱값이 1.0 부근이면 마커는 서로 밀접하게 연관된 것이다. r 제곱은 1.0을 초과할 수 없다. D 프라임 및 LOD 수치는 LD에서 상기 SNP 정의를 따른다. 그러나, r 제곱은 좀더 복잡한 패턴을 나타내고, 이는 LD내 SNP에서 약 0.0003 내지 1.0 사이에서 다양할 수 있다.
본 발명은 자궁내막증과 연관된 SNP, SNP를 포함하는 핵산 분자, 여기에서 설명된 SNP를 감지하는 방법 및 시약들, 감지 시약 개발에 이들 SNP의 용도, 및 이와 같은 시약들을 이용하는 검사 또는 키트를 제공한다. 여기에서 설명된 SNP는 자궁내막증의 진단, 스크리닝 및 자궁내막증에 걸리기 쉬운 지의 성향 평가와 자궁내막증의 진행의 평가에 유용하다. 또한, 이와 같은 SNP는 개체 치료 계획 및 자궁내막증 치료에서 사용이 가능한 장치의 임상 시험안을 결정하는데 유용하다. 또한, 이와 같은 SNP와 이를 인코드하는 산물은 치료제 개발에 유용한 표적이 된다. 또한, 다른 비-유전적 임상 인자들과 복합된 SNP는 자궁내막증 진단, 자궁내막증의 스크리닝, 자궁내막증에 걸리기 쉬운 지의 성향 평가, 자궁내막증의 진행 위험 평가, 개체 치료 계획 및 자궁내막증 치료에서 사용이 가능한 장치의 임상 시도 고안을 결정하는데 유용하다.
SNPs
여기에서 사용된 바와 같이, “SNP”는 DNA에서 단일 염기 변형을 말한다. SNP는 인구당 1/100 또는 1/1000 미만으로 다양한 매우 보존된 서열에 선행하거나 서열 다음에 온다. 개체는 각 SNP 위치에서 대립유전자에 대해 동질접합체이거나 이질접합체일 수 있다. 일부 경우에, SNP는 “cSNP”로 나타내기도 하는데, 이는 SNP를 포함하는 뉴클레오티드 서열이 아미노산 “코딩”서열이라는 것을 표시하는 것이다.
SNP는 변형 부위에 한 뉴클레오티드가 다른 뉴클레오티드로의 치환에 의해 발생할 수도 있다. 치환은 변이(transitions) 또는 교차형 염기변이(transversions)일 수도 있다. 변이는 하나의 퓨린 뉴클레오티드가 또다른 퓨린 뉴클레오티드로의 대체 또는 하나의 피리미딘이 또다른 피리미딘으로 대체를 말한다. 교차형 염기변이는 퓨린이 피리미딘으로 또는 그 역으로의 대체를 말한다. SNP는 단일 염기 삽입 또는 결손 변이체가 될 수 있으며, 이는 “indel”으로 표시한다.
동의적 코드 변화 또는 침묵 돌연변이 SNP (“SNP”,“변형”, “돌연변이”, “돌연변이체”, “변이” 및 “변이체”는 호환된다)는 유전자의 축퇴로 인한 아미노산의 변화로 결과된 것은 아니다. 하나의 아미노산을 코드하는 코돈을 상이한 아미노산을 코드하는 코드(즉, 비-동의적 코돈 변화)로 변화된 치환을 미스센스 돌연변이라고 한다. 무의미-돌연변이(nonsense mutation)는 정지 코돈이 형성되는 비-동의적 코돈 변화를 결과하여, 폴리펩티드쇄의 시기상조적 종료를 유도하여 절두형 단백질이 생성된다. 통독(read-through) 돌연변이는 정지 코돈을 파괴시키는 비-동의적 코돈 변화의 또 다른 형태로, 연장된 폴리펩티드 산물이 결과된다. 코딩 DNA 단편에서 발생되는 indel는 틀이동 돌연변이(frameshift mutation)를 일으킨다. SNP가 이중-, 삼중, 또는 사중-대립유전자일 수 있으나, 대부분은 이중-대립유전자이며, 따라서, 흔히 “이중[(di) 또는 (di)]-대립유전자 마커”라고도 한다.
여기에서 사용된 바와 같이, SNPs 및 SNP 유전자타입에는 개별 SNPs 및/또는 단상형이 포함되는데, 일반적으로 함께 유전되는 SNP 군이다. 단상형은 개별 SNP와 비교하였을 때, 질병 또는 다른 표현형 효과와 더 강력한 상관관계를 가질 수 있고, 따라서 일부 경우에 진단학적 정확성을 강화시킬 수도 있다.
원인성(causative) SNP는 유전자 발현 또는 유전자 산물의 기능에 변화를 주는 SNP로써, 가망 임상적 표현형의 전조가 된다. 이와 같은 종류에는 폴리펩티드 산물을 인코드하는 유전자 즉, cSNP 부분내에 속하는 SNP가 포함되다. 이들 SNP는 폴리펩티드 산물의 아미노산 서열 변화(즉, 비-동의적 코돈 변화)를 결과하여 결손적 발현 또는 다른 변이 단백질을 발생시킬 수도 있다. 더욱이, 무의미 돌연변이 경우에, SNP는 폴리펩티드 산물의 조기 종료를 유도할 수도 있다. 이와 같은 변이 산물로 병리학적 상태, 예를 들면, 유전적 자궁내막증이 결과될 수도 있다.
원인성 SNP는 반드시 코딩 지역에서만 발생되지는 않는다: 원인성 SNP는 예를 들면, 핵산에 의해 인코드된 단백질의 발현, 구조 및/또는 활성에 궁극적으로 영향을 주는 임의 유전자 지역에서 발생될 수 있다. 이와 같은 유전자 지역에는 전사 인자 결합 도메인에서 SNP와 같이 전사에 관련된 부분, 프로모터 부분에서 SNP, 결함 스프라이싱의 원인이 되는 인트론-엑손 경계에 SNP와 같은 전사 프로세싱에 관련된 부분, 또는 폴리아데닐 시그날 부분과 같은 mRNA 프로세싱 시그날 서열 및 miRNA 인지 부위에 SNP에 관련된 부분들이 포함된다. 그럼에도 불구하고, 원인성 SNP가 아닌 일부 SNP도 질병-원인 서열과 밀접하게 연관되어, 따라서 질병-원인 서열과 차별된다. 이런 상황에서, SNP 존재는 자궁내막증의 존재, 또는 자궁내막증에 걸리기 쉬운 성형 또는 자궁내막증 발생에 위험 증가와 연관된다. 비록 원인성은 아니지만, 이와 같은 SNP는 자궁내막증의 진단, 자궁내막증에 걸리기 쉬운 성향 스크리닝, 자궁내막증 진행 위험 및 기타 용도에 유용하다.
SNP와 특정 질환의 연합 연구는 자궁내막증과 같은 관심 질환을 가진 개체의 생물학적 시료에서 SNP 대립유전자의 존재 또는 빈도를 결정하고, 이를 바람직하게는 유사한 나이와 인종의 대조군(즉, 질병이 없는 개체; 대조군은 “건강한” 또는 “정상” 개체라고 칭하기도 함)과 비교하는 것과 관련된다. 환자 및 대조군의 적절한 선택이 SNP 연관 연구의 성공에 관건이다. 따라서, 잘 파악된 표현형을 가지는 개체집단이 상당히 바람직하다.
질병이 있는 개체에서 얻은 조직 샘플 또는 생물학적 시료에서 SNP를 스크리닝하고, 이를 대조군 샘플과 비교하여, 자궁내막증과 연관된 병리등과 같이 특정 병리학적 상태에 대해 선별된다. 관심 질병(또는 표현형)과 하나 또는 그이상의 SNP 사이에서 일단 통계학적으로 유의적인 연관성이 확립되면, SNP 주변 부위는 병리학적 상태 또는 표현형에 영향을 주는 원인성 유전자 좌/서열(즉, 원인성 SNP/돌연변이 유전자, 조절 부위등)을 확인하기 위해 선택적으로 완전하게 스크리닝할 수도 있다. 연합 연구는 일반 집단에서 실행될 수 있고, 질병이 있는 가족내 관련 개체(연관 연구)들에서 실행되는 연구로 제한되지 않는다. 진단 또는 예후 목적으로, 특정 SNP 부위가 자궁내막증과 같은 질병 진단에 유용한 것으로 발견되면, 이 SNP와 LD에 있는 다른 SNP도 질병을 진단하는데 유용할 것으로 기대된다.
연관 비평형은 인간 게놈에서 독립적으로 분리되지 않은 염색체 단편을 따라 SNP 블록(즉, 비-임의로 공동-유전되는)으로 설명된다. 이들 블록의 출발(5’ 말단) 과 종료(3’말단)는 주어진 데이터베이스에서 연관 비평형에 이용된 기준, 가령, 연관 비평형을 결정하는데 이용되는 D’또는 r 제곱 수치에 따라 다양할 수 있다.
표 1과 2에서는 자궁내막증과 연관된 환자군-대조군 연구(case-control studies)에서 나타난 SNP를 설명한다. 표 1에서는 특히, 모두 유의적으로 자궁내막증과 연관이 있는 것으로 나타낸 500K GeneChip으로부터, 서로 50kb 또는 그 미만으로 위치한 두 개 또는 그이상의 SNP 군을 보여준다(“앵커[anchors]”라고 함). 표 2에서는 SNP가 자궁내막증과 상당한 연관이 있지만, 그러나 500K GeneChip상에 존재하고 50kb내에 위치한 다른 SNP는 자궁내막증과 유의적으로 연관된 SNP가 없다는 것을 보여준다(“싱글톤[singletons]”이라고 함). 표 1과 2에서는 “dbSNPrsID”으로 이름을 붙인 컬럼에 각 SNP에 대한 동정 정보를 제공한다(NCBI 참조 SNP 식별자, “Chr”(SNP가 위치한 염색체; “23”번호를 가진 염색체는 “X”염색체와 호환 사용됨), “위치”(지정 염색체상에 염기쌍의 위치), “P-Value”(PLINK로 계산된 p-값), “OR”(문제의 SNP에서 Odds 비율), “F_A”(자궁내막증에 걸린 경우에서 환자에서 관찰되는 소수(minor) 대립유전자 빈도), “F_U”(대조군 개체에서 관찰되는 소수(minor) 대립유전자 빈도), 그리고 “FlankSequence” (문제의 SNP 주변 DNA 서열). SNP에서 관찰된 두 개 대립유전자 변이체는 서열 중간에 []으로 나타내었다.
표 3-196는 상기 표 1과 2에서 확인된 Anchor 및 Singleton SNPs의 각 주변 연관 비평형 블록을 정의한다. 연관 비평형 블록들은 디폴트 세팅하에 Haploview 컴퓨터 연산에 의해 제시된 기준에 근거하여 확인되었다.(Barrett JC, Fry B, Maller J, Daly MJ. “Haploview: analysis and visualization of LD and haplotype maps.” Bioin포멧ics, vol. 21, pp 263-265, 2005).
각 표 3-196는 첫줄에 표1 또는 표 2의 anchor 및 singleton을 하나 또는 그 이상의 SNP 앞에 기재하였고, 여기에는 anchor 및 singleton SNP을 포함하는, 연관 비평형 블록에 상응하는 하나 또는 그 이상의 SNP 리스트를 포함하는데, 이들은 표안에 굵은 글자체로 강조하였다. 간혹, 고유 anchor 또는 singleton 마커 자체가 SNP 리스트에 존재하지 않을 수도 있는데, 이 경우, 이웃하는 SNP의 rsID 및 염기쌍 위치를 굵은 글자체로 강조하였다. 표에서는 각 SNP에 대해 염색체, 염기쌍의 물리적 위치, 소수 대립유전자 빈도 및 관찰된 대립유전자를 나타내었다. 드물게, SNP가 연관 비평형 블록 밖에 있을 경우, 리스트는 비워두었다.
표 1-196에서 SNP는 개별적으로 유용하거나 또는 표 1-196에서 다른 SNP들중 하나와 복합하여 유용하거나 또는 다른 SNP 중 하나가 연관된 단상형에 유용할 수 있을 것이다. 연관 비평형 블록들은 전체 게놈(genomewide) 유전자 집단 연구들로부터 결정할 수 있으며, 이 결과는 개별적인 데이터베이스 및 공개 데이터베이스에서 구하며, 예를 들면, Haploview 소프트웨어(Barrett JC, Fry B, Maller J, Daly MJ. Haploview: analysis and visualization of LD and haploty maps. Bioinformatics. 2005 Jan15)를 이용하여 시각적으로 또는 표로 나타낼 수 있다. 표 1-196에서 설명하는 연관 비평형 블록들은 International HapMap Consortium data release 21에 근거하여 Haploview version 4를 이용하여 확인되었다.
본 발명에 따르면, 자궁내막증 발생과 밀접하게 연관된 단일 염기 변형을 확인하고, 자궁내막증과 연관된 SNP과 연관 비평형인 것(자궁내막증과 동일한 연관 비평형 블록내에 있는)으로 밝혀진 SNP를 확인하기 위한 전체-게놈 환자-대조군 방식을 이용하는 연구에서 SNP들을 확인하였고, 바로 추측할 수 있는 단상형(가령, 공동-유전되는 SNP 군)을 제공할 수 있다. 따라서, 본 발명은 자궁내막증과 연관된 개별 SNP 뿐만 아니라, 자궁내막증과 연관된 유전자 부위들에서 SNP와 단상형 복합, 테스트 샘플에서 이들 변형을 확인하는 방법, 자궁내막증을 가지는 또는 발생될 위험이 있는 개체를 결정하는 방법, 자궁내막증의 임상적 세분 방법을 제공한다.
본 발명은 자궁내막증과 연관된 SNP를 제공할 뿐만 아니라 당분야에 이미 공지된 그러나 자궁내막증과 연관이 있는 것으로는 알려지지 않은 SNP도 제공한다. 따라서, 본 발명은 신규한 조성물 및 여기에서 설명하고 있는 SNP에 근거한 방법 및 자궁내막증과 연관하여(예를 들면, 자궁내막증을 진단하기 위한) 공지의 그러나 기존에 비-연관된 SNP를 이용하는 신규한 방법을 제공한다.
본 발명의 특정 SNP 대립유전자는 자궁내막증을 가지는 또는 발생 위험의 증가와 연관되거나 또는 자궁내막증을 가지는 또는 발생 위험이 감소되는 것과 연관될 수 있다. 감소된 위험과 연관된 SNP 대립유전자는 “보호성(protective)” 대립유전자라고 부를 수 있으며, 증가된 위험과 연관된 SNP 대립유전자는 “민감성(susceptibility)” 대립유전자, “위험 인자(risk factors)”, 또는 “고-위험(high-risk)” 대립유전자라고 부를 수 있을 것이다. 따라서, 개체가 자궁내막증이 있거나 자궁내막증 발생할 위험이 증가된(즉, 민감성 대립유전자) SNP 대립유전자를 보유하고 있는지를 결정하기 위해 특정 SNP를 검사하고, 다른 SNP들을 검사하여 자궁내막증을 가지거나 또는 자궁내막증 발생 위험이 감소됨을 표지하는 SNP 대립유전자(예를 들면, 보호성 대립유전자)를 가지는 지를 결정할 수 있을 것이다. 유사하게, 본 발명의 특정 SNP 대립유전자는 특정 치료에 감소된 또는 증가된 반응으로 연합될 수도 있다. 여기에서 이용된 용어“변경된(altered)”은 이들 두 가능성(즉, 증가 또는 감소된 위험/가능성)을 모두 포함하는 것으로 이용된다.
당업자는 핵산 분자는 이중-가닥 분자이며, 한 가닥의 특정 부위는 상보적 가닥의 상응하는 부위를 언급한다는 것을 바로 인지할 것이다. SNP 위치, SNP 대립유전자, 뉴클레오티드 서열을 정의함에 있어서, 핵산 분자의 한 가닥상에 특정 부위에서 아데닌, 티민 (우리딘), 시토신, 또는 구아닌은 핵산의 상보 가닥상에 상응하는 부위에 상보적인 티민 (우리딘), 아데닌, 구아닌, 또는 시토신 (차례로 각각)으로 한정된다. 따라서, 특정 SNP 위치, SNP 대립유전자, 또는 뉴클레오티드 서열를 언급하기 위해 어느 가닥이건 한 가닥만을 언급할 수 있다. 프로브와 프라이머는 이들중 한 가닥에 하이브리드되도록 고안될 수도 있고, 여기에서 언급된 SNP 유전자 타이핑(genotyping)은 이들 가닥중 하나를 일반적으로 표적으로 삼을 수 있다. 명세서를 통하여,SNP 위치를 확인함에 있어서, 단지 편의를 위해 포워드(forward) 또는 “센스(sense)” 가닥을 언급한다. 내생성 핵산 서열이 이중 나선형으로 존재하기 때문에(이중나선은 두 개의 상보적인 핵산 가닥을 포함한다), 여기에서 설명되는 SNP들은 대응 핵산 서열과 “리버스(reverse)” 또는 “안티센스” 핵산 가닥과 연합된 SNP를 가질 것으로 이해할 것이다. 이와 같은 상보적 핵산 서열, 및 이들 서열에 존재하는 상보적 SNPs들 또한 본 발명의 범위에 포함된다.
분리된 핵산 분자
본 발명은 표 1-196에서 나타낸 하나 또는 그 이상의 SNP를 포함하는 분리된 핵산 분자를 제공한다. 표 1과 2는 전후관계(context) 핵산 서열을 제공한다. 표 3-196는 rs 동정(identification) 번호만을 제공하나, 이와 같은 SNP에 전후관계 서열은 당분야에 공지되어 있어, 표에서는 나타내지 않는다. 분리된 핵산 분자는 표 1-196에서 확인된 하나 또는 그 이상의 SNP를 포함한다. 표 1-196에 표시된 하나 또는 그 이상의 SNP를 포함하는 분리된 핵산 분자는 본 명세서에 “SNP-포함 핵산 분자”로 언급된 것과 호환될 수 있다. 본 발명의 분리된 핵산 분자는 또한 프로브와 프라이머 (“SNP 감지 시약” 부분에서 더욱 상세하게 설명됨)도 포함하는데, 핵산 분자는 명시된 SNPs, 그리고 분리된 전장 유전자, 전사체, cDNA 분자, 및 이의 단편를 검사하는데 이용하고, 그리고 인코드된 단백질을 발현시키는 목적에도 이용할 수 있다.
여기에서 사용된 바와 같이, “분리된 핵산 분자”는 본 발명의 SNP를 포함하는 분자 또는 상보적 서열을 가지는 핵산과 같이 이와 같은 분자에 하이브리드되는 분자를 일반적으로 말하는데, 분자는 핵산 분자의 천연 소스에 존재하는 대부분의 다른 핵산들로부터 분리된다. 더욱이, “분리된” 핵산 분자 예를 들면, 본 발명의 SNP를 포함하는 cDNA 분자는 다른 세포 물질, 또는 재조합 기술에 의해 만들어지는 경우 배양 배지, 또는 화학적으로 합성되는 경우 화학 전구물질 또는 다른 화학물질이 실질적으로 포함되지 않는다. 핵산 분자는 다른 코딩 또는 조절 서열과 융합될 수 있으며, 여전히 “분리된”것으로 간주한다. 동물에서 자연적으로는 발생되지 않는, 유전자 전이 동물(사람이 아닌)에 존재하는 핵산 분자도 “분리된”것으로 간주한다. 예를 들면, 벡터에 포함된 재조합 DNA 분자도 “분리된”것으로 간주한다. “분리된” DNA 분자의 추가 예로 이형성 숙주 세포에 유지된 재조합 DNA 분자와 용액내 정제된(부분적으로 또는 실질적으로) DNA 분자도 포함된다. 분리된 RNA 분자에는 본 발명의 SNP-함유 DNA 분자의 in vivo 또는 in vitro RNA 전사체도 포함된다. 본 발명에 따른 분리된 핵산 분자에는 합성에 의해 만들어진 분자도 포함된다.
일반적으로, 분리된 SNP-함유 핵산 분자는 본 발명에서 설명되는 하나 또는 그 이상의 SNP 위치와 SNP 위치의 양측중 하나에 측면 뉴클레오티드 서열을 포함한다. 측면 서열은 SNP 부위 및/또는 이형성 뉴클레오티드 서열과 자연적으로 연합된 뉴클레오티드 잔기들을 포함할 수 있다. 측면 서열은 SNP 위치의 양측 중 어느 쪽에든 최대 약 100개, 60개, 50개, 30개, 25개, 20개, 15개, 10개, 8개 또는 4개 뉴클레오티드(또는 이 범위내 임의 길이)가 될 수 있을 것이다.
전장 유전자 및 전체 단백질-코딩 서열에서, SNP 측면 서열은 SNP의 양측중 어느 한 쪽상에 약 5 KB, 4 KB, 3 KB, 2 KB, 1 KB 가 될 수 있으나 이에 국한되지는 않는다. 더욱이, 이와 같은 경우에, 분리된 핵산 분자는 엑손 서열(단백질-코딩 및/또는 넌-코딩 엑손 서열을 포함)을 포함하나, 인트론 서열도 포함할 수 있다. 따라서, 임의 단백질 코딩 서열은 접해있거나 인트론에 의해 분리되어 있을 수 있다. 중요한 것은 핵산이 멀리 있는 그리고 중요하지 않는 측면 서열로부터 떨어져 있고, 재조합 단백질 발현, SNP 위치 검사를 위한 프로브 및 프라이머 준비, 그리고 SNP-포함 핵산 서열에 특이적인 다른 용도와 같이 여기에서 설명된 특정 조작 또는 용도에 맞도록 적절한 길이를 가진다는 것이다.
분리된 SNP-포함 핵산 분자는 예를 들면, 전장의 유전자 또는 전사체, 예를 들면 게놈 DNA로부터 분리된(가령, 크로닝 또는 PCR 증폭에 의해) 유전자, cDNA 분자, 또는 mRNA 전사체 분자를 포함할 수 있다. 더욱이, 여기에서 설명하는 하나 또는 그 이상의 SNP를 포함하는 전장 유전자 및 전사체의 단편들도 본 발명에 포함되며, 이와 같은 단편들은 예를 들면, 특정 기능 도메인 또는 항원성 에피토프와 같은 단백질의 임의 부분을 발현시키는데 이용될 수도 있다.
따라서, 본 발명은 표 1-196에서 설명하는 SNP에 연접하는 핵산 서열 단편들, 최소 약 8개 또는 그 이상의, 좀더 바람직하게는 최소 약 12개 또는 그 이상의, 좀더 바람직하게는 최소 약 16개 또는 그이상의 뉴클레오티드에서 연접하는 뉴클레오티드 서열을 포함한다. 또한, 단편은 길이가 최소 약 18개, 20개, 22개, 25개, 30개, 40개, 50개, 60개, 100개, 250개 또는 500개 (또는 이범위안에 임의 수치)를 포함할 수 있다. 단편의 길이는 이들의 의도하는 용도에 기초할 것이다. 예를 들면, 단편은 폴리뉴클레오티드 프로브 또는 프라이머로 유용할 수 있을 것이다. 이와 같은 단편들은 폴리뉴클레오티드 프로브의 합성을 위해 표 1-196에 SNP들중 하나를 포함하는 뉴클레오티드 서열을 이용하여 분리될 수 있다. 라벨된 프로브를 cDNA 라이브러리, 게놈 DNA 라이브러리, 또는 mRNA를 스크리닝하는데 이용하여 코딩 부분에 상응하는 핵산을 분리할 수 있을 것이다. 추가로, 프라이머는 유전자의 특정 부위의 클로닝 또는 하나 또는 그 이상의 SNP를 검사하는 목적등의 증폭 반응에 이용할 수도 있다.
본 발명의 분리된 핵산 분자는 다양한 핵산 증폭 방법중에 하나의 산물인 SNP-포함 폴리뉴클레오티드를 포함하는데, 이러한 증폭 방법들은 핵산 샘플에서 관심 폴리뉴클레오티드의 복사체 수를 증가시키는데 이용된다. 이와 같은 증폭 방법들은 당분야에 잘 공지되어 있고, 이 방법에는 중합효소 쇄 반응(PCR) (U.S. Pat. Nos. 4,683,195; and 4,683,202; PCR Technology: Principles and Applications for DNA 증폭, ed. H. A. Erlich, Freeman Press, NY, N.Y., 1992), 리가제 쇄 반응(LCR) (Wu and Wallace, 게놈s 4:560, 1989; Landegren et al., Science 241:1077, 1988), 가닥 치환 증폭(SDA) (U.S. Pat. Nos. 5,270,184; and 5,422,252), 전사-개입 증폭 (TMA) (U.S. Pat. No. 5,399,491), 연관된 선형 증폭(LLA) (U.S. Pat. No. 6,027,923), 및 이와 유사한 방법, 그리고 등온 증폭 방법, 가령, 핵산 서열 기초한 증폭(NASBA), 및 자가-지연 서열 복제(Guatelli et al., Proc. Natl. Acad. Sci. USA 87: 1874, 1990)등이 포함되나 이에 국한되지는 않는다. 이와 같은 방법에 근거하여, 당업자는 여기에서 제공되는 SNP의 5' 및 3' 임의 적절한 부분에서 프라이머를 바로 디자인할 수 있을 것이다. 이와 같은 프라이머들을 이용하여 서열내 관심의 SNP를 포함하는 길이의 DNA를 증폭할 수 있을 것이다.
여기에서 사용된 바와 같이, 본 발명의“증폭된 폴리뉴클레오티드”는 SNP-포함 핵산 분자로, 이 양은 in vitro에서 실행된 임의 핵산 증폭 방법으로 테스트 샘플에서 출발 양과 비교하였을 때, 최소 2배 증가된 것이다. 다른 적절한 구체예에서, 증폭된 폴리뉴클레오티드는 테스트 샘플에서 출발 양과 비교하였을 때, 최소 10배, 50배, 100배, 1000배 또는 10,000배 증가된다. 전형적인 PCR 증폭에서, 관심 폴리뉴클레오티드는 증폭안된 게놈 DNA양에 비하여 최소 5000배 증폭되나, 검사에 필요한 정확한 양의 증폭은 후속 감지 방법의 감도에 따라 달라진다.
일반적으로, 증폭된 폴리뉴클레오티드는 최소 길이가 약 16개 뉴클레오티드이다. 좀더 일반적으로, 증폭된 폴리뉴클레오티드는 최소 길이가 약 20개 뉴클레오티드이다. 적절한 구체예에서, 증폭된 폴리뉴클레오티드는 최소 길이가 약 30개 뉴클레오티드이다. 본 발명의 더욱 적절한 구체예에서, 증폭된 폴리뉴클레오티드는 최소 길이가 약 32개, 40개, 45개, 50개 또는 60개 뉴클레오티드이다. 본 발명의 또 다른 구체예에서, 증폭된 폴리뉴클레오티드는 최소 길이가 약 100개, 200개 또는 300개 뉴클레오티드이다. 본 발명의 증폭된 폴리뉴클레오티드의 전장은 엑손, 인트론 또는 전체 유전자만큼의 길이가 될 수 있는데, 관심 잔기의 SNP, 증폭된 산물은 일반적으로 1,000개 뉴클레오티드를 넘지 않는다(비록 특정 증폭 방법들은 길이가 1000개 이상의 뉴클레오티드로된 증폭된 산물을 만들기도 하지만). 좀더 바람직하게는 증폭된 폴리뉴클레오티드는 최소 길이가 약 600개를 넘지 않는 뉴클레오티드이다. 증폭된 폴리뉴클레오티드의 길이와는 상관없이, 관심 SNP는 서열을 따라 임의 부위에 위치할 수 있을 것이다.
본 발명의 특정 구체예에서, 증폭된 산물은 최소 약 201개 뉴클레오티드이며, 표 1-196에 나타낸 뉴클레오티드 서열중 하나를 포함한다. 산물은 이의 5' 말단 또는 3' 말단 또는 이들 양단에 추가 서열을 보유할 수도 있다. 또 다른 구체예에서, 증폭된 산물은 길이가 약 101개 뉴클레오티드이며, 여기에 개시된 SNP를 포함한다. 일반적으로, SNP는 증폭된 산물의 중앙(즉, 길이가 201개 뉴클레오티드인 증폭된 산물의 101 위치에, 또는 길이가 101개 뉴클레오티드인 증폭된 산물의 51 위치에)에 위치하거나 증폭된 산물의 중앙으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 12개, 15개 또는 20개 뉴클레오티드 내에 위치한다(그러나, 상기에서 명시된 바와 같이, 관심 SNP는 증폭된 산물의 길이를 따라 임의 위치에 있을 수 있다).
본 발명은 여기에서 개시된 하나 또는 그 이상의 SNP를 포함하는, 구성하는 또는 필수적으로 구성하는 분리된 핵산 분자 또는 이의 SNP-포함 단편들을 제공한다.
따라서, 본 발명은 표 1-196에 나타난 SNP중 하나를 포함하는 임의 뉴클레오티드 서열로 구성된 핵산 분자를 제공한다. 뉴클레오티드 서열이 핵산 분자의 완전한 뉴클레오티드 서열인 경우에, 핵산 분자는 뉴클레오티드 서열로 구성된다.
본 발명은 표 1-196에 나타난 SNP중 임의의 것을 필수 성분으로 하는 핵산 분자도 제공한다. 이와 같은 뉴클레오티드 서열이 표 1-196에 개시된 SNP 중 임의의 하나만을 포함하고, 자궁내막증과 연관된 다른 SNP가 없는 경우 핵산 분자는 뉴클레오티드 서열을 필수 성분으로 포함한다. 다만, 자궁내막증과 연관된 임의 추가 SNP가 포함안된 뉴클레오티드 서열이 추가 포함될 수는 있다.
본 발명은 표 1-196에 나타낸 SNP 중 임의의 것을 포함하는 핵산 분자를 제공한다. 뉴클레오티드 서열이 핵산 분자의 최종 뉴클레오티드 서열의 최소 일부분인 경우, 핵산 분자는 뉴클레오티드 서열을 포함한다. 이와 같은 방식에서, 핵산 분자는 뉴클레오티드 서열만으로 구성되거나 자연적으로 연합된 추가 뉴클레오티드 잔기를 가질 수 있거나 이형성 뉴클레오티드 서열을 가질 수 있다. 이와 같은 핵산 분자는 한 개 내지 몇 개의 추가 뉴클레오티드를 가질 수도 있고 또는 더 많은 뉴클레오티드를 추가로 가질 수도 있다. 이들 핵산 분자의 다양한 타입을 어떻게 만들고, 분리하는 지에 대한 간단한 설명은 당분야에 공지된 것이다. (Sambrook and Russell, 2000, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, NY).
분리된 핵산 분자는 RNA형태, 예를 들면 mRNA이거나 또는 cDNA 및 게놈 DNA를 포함하는 DNA 형태가 될 수 있으며, 분자 클로닝을 통하여 얻거나 또는 화학적 합성 기술에 의해 또는 이들 복합 방법을 통하여 만들 수 있을 것이다. (Sambrook and Russell, 2000, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, NY). 더우기, 분리된 핵산 분자, 특히 SNP 감지 시약들, 가령, 프로브와 프라이머는 부분적으로 또는 완전하게, 펩티드 핵산(PNA)과 같은 하나 또는 그 이상의 핵산 유사체 타입의 형태가 될 수 있다.(U.S. Pat. Nos. 5,539,082; 5,527,675; 5,623,049; 5,714,331). 핵산, 특히 DNA는 이중 가닥 또는 단일 가닥이 될 수도 있다. 단일-가닥 핵산은 코딩 가닥 (센스 가닥) 또는 상보적 비-코딩 가닥 (안티센스 가닥)이 될 수도 있다. DNA, RNA, 또는 PNA 단편들은 사람 게놈(DNA 또는 RNA의 경우) 또는 단일 뉴클레오티드, 짧은 올리고뉴클레오티드 링커들로부터 어셈블리되거나 또는 일련의 올리고뉴클레오티드로부터 어셈블리되어 합성 핵산 분자를 제공한다. 핵산 분자는 기준으로써 여기에서 제공되는 서열을 이용하여 바로 합성될 수 있는데; 올리고뉴클레오티드 및 PNA 올리고머 합성 기술은 당분야에 잘 공지되어 있다(see, e.g., Corey, “Peptide nuclei acids: expanding the scope of nuclei acid recognition,” Trends Biotechnol. 1997 June;15(6):224-9, and Hyrup et al., “Peptide nuclei acids (PNA): synthesis, properties and potential applications,” Bioorg Med Chem. 1996 January; 4(1):5-23).
본 발명은 변형된, 합성 또는 비-자연적으로 발생되는 뉴클레오티드 또는 구조 성분들 또는 당분야에 공지된 다른 대안/변형 핵산 화학성질을 포함하는 핵산 유사체를 포함한다. 이와 같은 핵산 유사체는 예를 들면 표 1-196에서 확인된 하나 또는 그 이상의 SNP를 감지하기 위한 감지 시약들(가령, 프라이머/프로브)로 유용하다. 더욱이, 이와 같은 유사체를 포함하는 키트/시스템(비드, 어레이 등)도 본 발명에 포함된다.
핵산의 결합 성질 및/또는 안정성을 개선시키는 핵산 변형의 추가 예로써 이노신과 같은 염기 유사체, 삽입체(intercalators:U.S. Pat. No. 4,835,263) 그리고 소수 그루브 결합제(U.S. Pat. No. 5,801,115)의 이용도 포함된다. 따라서, 핵산 분자, SNP-포함 핵산 분자, SNP 감지 시약들 (가령, 프로브 및 프라이머), 올리고뉴클레오티드/폴리뉴클레오티드에는 PNA 올리고머와 다른 핵산 유사체도 포함된다. 당분야에 공지된 핵산 유사체 및 대안/변형 핵산 화학적 성질의 또 다른 예는 Current Protocols in Nucleic Acids Chemistry, John Wiley & Sons, N.Y. (2002)에서 설명하고 있다.
자연 발생 대립유전자 변이체(뿐만 아니라 오르소로그[orthologs] 및 파라로그[paralogs]) 및 돌연변이생성 기술에 의해 만들어진 합성 변이체와 같이, 표 1-196에 개시된 추가 SNP 변이체들도 당분야에 공지된 방법으로 확인하고 및/또는 만들 수 있다. 이와 같은 변이체들은 표 1-196에 개시된 SNP 또는 이의 단편에 접한 핵산 서열과 최소 70-80%, 80-85%, 85-90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 상동성을 가지는, 그리고 표 1-196에 개시된 신규한 SNP 대립유전자를 포함하는 뉴클레오티드 서열을 포함할 수 있다. 따라서, 본 발명은 표 1-196에 나타낸 서열과 비교하였을 때 어느 정도의 서열 변이를 가지나, 여기에서 개시된 신규한 SNP 대립유전자를 포함하는 분리된 핵산 분자를 특별히 고려한다. 환언하면, 여기에서 개시된 신규한 SNP 대립유전자를 분리된 핵산 분자가 포함하는 한, 신규한 SNP 대립유전자의 측면에 위치한 핵산 분자의 다른 부분들은 특정 게놈과 표 1-196에 나열된 SNP 주변 전후 서열로부터 어느 정도 변화될 수 있다.
서열 상동성을 공유하는 두 분자간 두 개 뉴클레오티드 서열의 상동성 비율을 결정하기 위해, 최적의 비교 목적으로 배열한다(즉, 최적의 배열을 위하여 제1과 제2 핵산 서열에 갭을 도입할 수 있고, 비교 목적으로 비-상동성 서열을 무시할 수 있다). 적절한 구체예에서, 비교 목적으로 기준 서열의 최소 30%, 40%, 50%, 60%, 70%, 80%, 또는 90% 그 이상을 배열한다. 상응하는 뉴클레오티드 위치에서 뉴클레오티드를 비교한다. 제1 서열에 한 위치에 뉴클레오티드가 제2 서열에 상응하는 위치의 뉴클레오티드와 동일한 경우, 분자는 그 위치에서 동일하다 (여기에서 사용된 바와 같이, 핵산 “동일성(identity)”은 핵산 “상동성(homology)”와 등가이다). 두 서열간에 동일성 비율은 두 서열의 최적 배열을 위해 도입할 필요가 있는 갭의 수, 각 갭의 길이를 고려하여, 서열에 의해 공유되는 동일한 위치의 수에 대한 함수다.
서열의 비교와 두 서열간에 동일성 비율의 결정은 수학 연산을 이용하여 이루어질 수 있다. (Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part 1, Griffin, A. M., and Griffin, H. G., eds., Humana Press, N. J., 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; and Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991).
한 특정 구체예에서, 두 뉴클레오티드 서열 사이에 동일성 비율은 GCG 소프트웨어 패키지의 GAP 프로그램(Devereux, J., et al., Nucleic Acids Res. 12(1):387 (1984)), NWSgapdna, CMP 매트릭스 및 40, 50, 60, 70, 또는 80의 갭 웨이트 그리고 1, 2, 3, 4, 5, 또는 6의 길이 웨이트를 이용하여 결정한다. 또 다른 구체예에서, 두 뉴클레오티드 서열간에 동일성 비율은 ALIGN 프로그램 (version 2.0)에 결합된 E. Myers 및 W. Miller (CABIOS, 4:11-17 (1989))의 알고리즘과 PAM120 weight residue table, 갭 길이 패널티 12, 갭 페널티 4를 이용하여 결정한다.
본 발명의 뉴클레오티드 서열을 “쿼리(query) 서열”로 이용하여 다른 패밀리 구성원 또는 관련 서열을 확인하기 위해 서열 데이터베이스에 대한 조사를 실행할 수도 있다. 이와 같은 조사는 Altschul, et al. (J. Mol. Biol. 215:403-10 (1990))의 NBLAST 및 XBLAST 프로그램 (version 2.0)을 이용하여 실행한다. BLAST 뉴클레오티드 조사는 NBLAST 프로그램, 수치=100, wordlength=12를 이용하여 본 발명의 핵산 분자에 상동성인 뉴클레오티드 서열을 얻는다. 비교 목적으로 갭이 삽입된 배열을 얻기 위하여, Altschul et al. (Nucleic Acids Res. 25(17):3389-3402 (1997))에서 설명하는 Gapped BLAST를 이용할 수도 있다. BLAST 와 갭이 삽입된 BLAST 프로그램을 이용하면, 각 프로그램(가령, XBLAST 및 NBLAST)의 디폴트 변수들을 이용할 수 있다. BLAST에 추가하여, 다른 연구 및 당분야에 이용되는 서열 비교 프로그램의 예로는 FASTA (Pearson, Methods Mol. Biol. 25, 365-389 (1994)) 및 KERR (Dufresne et al., Nat Biotechnol 2002 December; 20(12):1269-71)이 포함되나 이에 국한되지는 않는다. 생물 정보학 기술에 관한 추가 정보는 Current Protocols in Bioinformatics, John Wiley & Sons, Inc., N.Y.을 참고한다. 유사하게, 표 1-196에 나열된 SNP에 연합하여 확인된 개별 유전자 산물은 자궁내막증 진행의 원인 또는 자궁내막증 진행을 조절할 수 있는 특정 조절 경로에 있는 다른 단백질들과 함께 참여하는 것으로 보인다. 이와 같은 유전자들과 이들의 산물이 진단 및 치료 중재에 후보물질이 될 수도 있다.
본 발명은 또한 표 1-196에 개시된 핵산 분자의 비-코딩 단편들을 제공한다. 적절한 비-코딩 단편들에는 프로모터 서열, 인헨서 서열, 인트론 서열, 5' 비-해독된 부분(UTRs), 3' 비해독된 부분, 유전자 조절 서열 그리고 유전자 종료 서열이 포함되나 이에 국한시키지는 않는다. 이와 같은 단편들은 이형성 유전자 발현 조절 및 유전자 조절 물질의 동정을 위한 스크린 개발에 유용하다.
SNP 감지 시약들
본 발명의 특정 측면에서, 여기에서 개시된 SNP를 이용하여 SNP 감지 시약들을 고안할 수 있다. 여기에서 사용된 바와 같이, “SNP 감지 시약”은 여기에서 개시된 특정 표적 SNP 위치를 특이적으로 감지하고, 표적 SNP 위치의 특정 뉴클레오티드(대립유전자)에 특이적인 시약이다(즉, 감지 시약은 표적 SNP 위치에 상이한 선택적 뉴클레오티드 사이를 구별하여, 표적 SNP 위치에 존재하는 뉴클레오티드의 동정을 결정할 수 있다). 전형적으로, 이와 같은 감지 시약은 서열 특이적 방식으로 상보적 염기-짝짓기에 의해 SNP-포함 핵산 분자에 하이브리드되어, 테스트 샘플에 있는 당분야에 공지된 다른 핵산 서열로부터 표적 변이체 서열을 구별한다. 감지 시약의 예를 들면, 여기에서 설명하는 하나 또는 그 이상의 SNP를 포함하는 표적 핵산에 하이브리드되는 프로브다. 적절한 구체예에서, 이와 같은 프로브는 표적 SNP 위치에서 상이한 뉴클레오티드를 가지는 다른 핵산들로부터, 동일한 표적 SNP 위치에 특정 뉴클레오티드(대립유전자)를 가지는 핵산을 구별할 수 있다. 또한, 감지 시약은 SNP 위치에 5' 및/또는 3'의 특정 부분, 특히 여기에서 개시된 SNP에서 제공되는 전후 서열에 상응하는 부분에 하이브리드될 수도 있다. 감지 시약의 또 다른 예는 표적 폴리뉴클레오티드의 상보적 가닥을 따라 이어진 뉴클레오티드의 개시 점으로 작용하는 프라이머가 된다. 여기에서 제공된 SNP 서열 정보는 본 발명의 임의 SNP를 증폭시키기 위해(가령, PCR을 이용하여), 프라이머의 디자인, 가령, 대립유전자-특이적 프라이머를 디자인하는데도 유용하다.
본 발명의 한 가지 적절한 구체예에서, SNP 감지 시약은 합성 폴리뉴클레오티드 분자, 예를 들면, 분리된 또는 합성 DNA 또는 RNA 폴리뉴클레오티드 프로브 또는 프라이머 또는 PNA 올리고머, 또는 여기에서 확인된 SNP을 포함하는 표적 핵산 분자의 단편에 하이브리드되는 DNA, RNA 및/또는 PNA의 복합물이다. 뉴클레오티드 형태의 감지 시약에는 변형된 염기 유사체, 삽입체 또는 소수 그루브 결합제를 선택적으로 포함할 수 있다. 프로브와 같은 다중 감지 시약들은 SNP 감지 키트를 만들기 위하여 고형 서포트(가령, 어레이 또는 비드)에 고정되거나 또는 용액(가령, PCR, RT-PCR, TaqMan 검사 또는 프라이머-연장 반응과 같은 효소 반응을 위한 프로브/프라이머 세트)에 공급될 수도 있다.
프로브 또는 프라이머는 일반적으로 실질적으로 정제된 올리고뉴클레오티드이다. 이와 같은 올리고뉴클레오티드는 표적 핵산 분자에서 엄격한 조건(스트린젼트 조건)하에서 최소 약 8개, 10개, 12개, 16개, 18개, 20개, 22개, 25개, 30개, 40개, 50개, 60개, 100개 (또는 이사이에 임의 숫자) 또는 그 이상의 연속 뉴클레오티드에 하이브리드되는 상보적 뉴클레오티드 서열의 일부를 일반적으로 포함한다. 특정 검사에 따라, 연속 뉴클레오티드에는 원하는 검사를 실행하기 위해, 표적 SNP 위치를 포함하거나, 또는 SNP 위치에 5' 및/또는 3'에 충분히 근접한 특정 부위가 될 수 있다.
다른 적절한 프라이머 및 프로브 서열은 여기에서 설명된 뉴클레오티드 서열을 이용하여 바로 결정할 수 있을 것이다. 당업자는 이와 같은 프라이머 및 프로브를 본 발명의 SNP의 유전자형 결정을 위한 시약으로 바로 이용하여, 임의 키트/시스템 포맷에 결합시킬 수 있음을 인지할 것이다.
표적 SNP-포함 서열에 특이적인 프로브 또는 프로모터를 만들기 위해, 유전자/전사체 및/또는 관심 SNP의 주변 전후 서열을 뉴클레오티드 서열의 5' 또는 3'에서 시작하는 컴퓨터 알고리즘을 이용하여 일반적으로 검사한다. 전형적인 알고리즘으로 유전자/SNP 전후 서열에 유일하고, 하이브리드에 적합한 범위내에 GC 함량을 가지고, 하이브리드 반응을 간섭하는 예측된 2차 구조가 없고, 및/또는 다른 원하는 성질을 가지거나 다른 원치않는 성질은 가지지 않는, 정해진 길이의 올리고머를 확인할 것이다.
본 발명의 프라이머 또는 프로브는 일반적으로 최소 약 8개 뉴클레오티드 길이를 가진다. 본 발명의 한 구체예에서, 프라이머 또는 프로브는 일반적으로 최소 약 10개 뉴클레오티드 길이를 가진다. 적절한 구체예에서, 프라이머 또는 프로브는 일반적으로 최소 약 12개 뉴클레오티드 길이를 가진다. 좀더 적절한 구체예에서, 프라이머 또는 프로브는 일반적으로 최소 약 16개, 17개, 18개, 19개, 20개, 21개 22개, 23개, 24개 또는 25 개 뉴클레오티드 길이를 가진다. 프로브의 최대 길이는 감지되는 표적 서열과 같은 길이를 가질 수 있지만, 이용되는 검사 타입에 따라 일반적으로 길이는 약50개, 60개, 65개 또는 70개 뉴클레오티드 미만이 된다. 프라이머의 경우, 일반적으로 약 30개 미만의 뉴클레오티드 길이를 가진다. 본 발명의 특정 적절한 구체예에서, 프라이머 또는 프로브는 약 18개 내지 약 28개 뉴클레오티드 범위내의 길이를 가진다. 그러나, 다른 구체예에서, 핵산 어레이 및 프로브가 기질에 고정된 다른 구체예에서, 프로브는 30-70개, 75개, 80개, 90개, 100개 또는 그 이상의 뉴클레오티드와 같이 더 길 수도 있다(하기“SNP 감지 키트 및 시스템”부분 참고).
SNPs를 분석하기 위하여, 선택적 SNP 대립유전자에 특이적인 올리고뉴클레오티드를 이용하는 것이 적절할 수 있다. 표적 서열에서 단일 뉴클레오티드 변이를 감지하는 올리고뉴클레오티드를 “대립유전자-특이적 올리고뉴클레오티드”, “대립유전자-특이적 프로브”, 또는 “대립유전자-특이적 프라이머”라고 부를 수도 있다. 변형을 분석하기 위한 대립유전자-특이적 프로브의 디자인과 이용은 Mutation Detection A Practical Approach, ed. Cotton et al. Oxford University Press, 1998; Saiki et al., Nature 324, 163-166 (1986); Dattagupta, EP235,726; and Saiki, WO 89/11548에 설명되어 있다.
각 대립유전자-특이적 프라이머 또는 프로브의 디자인은 표적 핵산 분자에 SNP 위치의 측면 뉴클레오티드 서열의 정확한 조성, 프라이머 또는 프로브의 길이와 같은 다른 변수들과 같은 변수에 따라 달라지며, 프라이머 및 프로브를 이용하는데 있어서 또 다른 변수는 프로브 또는 프라이머와 표적 서열 사이에 하이브리드 반응이 실행되는 조건의 스트린젼시(엄격성:stringency)이다. 더 엄격한 조건은 더 낮은 이온 강도의 완충액 및/또는 더 높은 반응 온도를 이용하고, 안정적인 듀플렉스를 만들기 위해, 프로브/프라이머와 표적 서열 간에 좀더 완전한 일치를 요구하는 경향이 있다. 그러나, 엄격성이 너무 높으면, 하이브리드반응이 전혀 일어나지 않을 수 있다. 대조적으로, 낮은 엄격성은 더 높은 이온 강도의 완충액 및/또는 더 낮은 반응 온도를 이용하고, 프로브/프라이머와 표적 서열 사이에 미스매취 염기가 더 많은 안정적인 듀플렉스 형성을 허용한다. 대립유전자-특이적 프로브를 이용하는 높은 엄격성 하이브리드 반응 조건의 예는 다음과 같지만 이에 한정시키지는 않는다: 5×표준 염 인산염 EDTA (SSPE), 0.5% NaDodSO4(SDS)를 포함하는 용액으로 55℃에서 사전 하이브리드 반응, 프로브를 동일한 용액 및 동일한 온도에서 표적 핵산 분자로 항온처리하고, 55℃ 또는 실온에서 2×SSPE, 0.1% SDS를 포함하는 용액으로 세척한다.
대립유전자-특이적 프라이머 연장 반응에 이용되는 중간정도(Moderate) 엄격성 하이브리드반응 조건은 예를 들면, 약 50 mM KCl을 포함하는 용액, 약 46℃ 온도를 이용할 수 있다. 선택적으로, 반응은 60℃와 같은 상승된 온도에서 실시할 수도 있다. 또 다른 구체예에서, 두 개 프로브가 표적 서열에 완전히 상보적이면 두 개 프로브가 결찰된 올리고뉴클레오티드 결찰 검사(OLA) 반응에 적절한 중간정도의 엄격성 하이브리드반응 조건은 46℃ 온도에서 약 100mM KCl을 포함하는 용액을 이용하는 것이다.
하이브리드반응에 기초한 검사에서, 대립유전자-특이적 프로브는 한 개체의 표적 DNA 단편에 하이브리드되나 또 다른 개체의 상응하는 단편에는 하이브리드되지 않도록 고안될 수 있는데, 그 이유는 두 개체에 각 DNA 단편에는 상이한 변형 형태(가령, 선택적 SNP 대립유전자/뉴클레오티드)가 존재하기 때문이다. 하이브리드 반응 조건은 대립유전자사이에 하이브리드 반응 강도에서 상당한 감지가능한 차이가 있고, 따라서, 프로브가 대립유전자의 하나에만 하이브리드되거나 대립유전자 하나에만 유의적으로 더 강하게 하이브리드되도록 충분히 엄격해야 한다. 프로브는 프로브의 서열을 따라 임의 위치에 SNP 부위가 배열될 수 있는, SNP 부위를 포함하는 표적 서열에 하이브리드되도록 고안될 수 있는데, 프로브는 바람직하게는 표적 서열의 일부분에 하이브리드되도록 디자인되는 것이 바람직한데, 이때 SNP 부위는 프로브의 중앙 위치에 배열된다(가령, 프로브의 어느 한쪽 말단으로부터 최소 3개 뉴클레오티드의 위치가 되는 프로브내 위치). 이와 같은 프로브의 디자인으로 상이한 대립형질간에 하이브리드 반응은 잘 구분된다.
또 다른 구체예에서, 프로브 또는 프라이머는 SNP가 프로브 또는 프라이머의 5' 최말단 또는 3' 최말단과 일치되도록 표적 DNA 단편에 하이브리드되게 고안될 수도 있다. 올리고뉴클레오티드 결찰 검사(U.S. Pat. No. 4,988,617)에 사용하기에 특히 유용한 특정 적절한 구체예에서, 프로브의 3’최말단 뉴클레오티드는 표적 서열에서 SNP 위치와 일치된다(align with).
올리고뉴클레오티드 프로브와 프라이머도 당분야에 공지된 방법에 의해 준비될 수 있다. 화학적 합성 방법에는 포스포트리에스테르 방법(Narang et al., 1979, Methods in Enzymology 68:90); 포스포디에스테르 방법(Brown et al., 1979, Methods in Enzymology 68:109), 디에틸포스파미데이트 방법(Beaucage et al., 1981, Tetrahedron Letters 22:1859); 고형 서포트 방법(U.S. Pat. No. 4,458,066)을 포함되나 이에 국한시키지는 않는다.
대립유전자-특이적 프로브는 종종 쌍으로 이용되고(또는 다소 경우가 흔하지는 않지만 3개 또는 4개 세트로 이용되는데, 예를 들면, SNP 위치가 각각 3개 또는 4개 대립유전자를 가지는 것으로 공지되거나 또는 표적 SNP 대립유전자를 위한 핵산 분자의 두 가닥을 검사하기 위해), 이와 같은 쌍은 SNP 위치에서 대립형질 변이체를 나타내는 한 개 뉴클레오티드 미스메치를 제외하고는 동일하다. 일반적으로, 쌍의 한 구성부는 좀더 흔한 SNP 대립유전자(가령, 표적 집단에서 더 빈빈헌 대립유전자)를 가지는 표적 서열의 참조 형에 완벽하게 매치되고, 쌍의 다른 구성부는 다소 덜 흔한 SNP 대립유전자(가령, 표적 집단에서 드문 대립유전자)를 가지는 표적 서열의 형태에 완벽하게 매치된다. 어레이의 경우에, 상이한 다중 변형을 동시에 분석하기 위해 동일한 서포트에 다중의 프로브 쌍을 고정시킬 수도 있다.
PCR-계 검사 검사의 한 가지 타입에서, 대립유전자-특이적 프라이머는 표적 핵산 분자상에서 SNP 위치와 오버랩되고, 프라이머가 완벽한 상보성을 보이는 한 개 대립형질의 증폭만을 준비시키는 부분에 하이브리드된다.(Gibbs, 1989, 핵산 Res. 17:2427-2448). 전형적으로, 프라이머의 3'-최말단 뉴클레오티드는 표적 핵산 분자의 SNP 위치와 배열되고, 이에 상보적이다. 이 프라이머는 말단 부위에 하이브리드되는 제2 프라이머와 함께 이용된다. 증폭은 두 개 프라이머로부터 진행되어, 테스트 샘플에 대립형질이 존재하는지는 표시하는 감지가능한 산물을 생산한다. 대조군은 통상 두 번째 프라이머 쌍으로 실행하는데, 이중 하나는 변형 부위에서 단일 염기 미스메취를 보이고, 다른 하나는 말단 부위에 완벽한 상보성을 보인다. 단일-염기 미스매취는 증폭을 저해하거나 실질적으로 증폭 효과를 감소시켜, 감지가능한 산물이 형성되지 않거나 더 적은 양으로 또는 더 느리게 형성된다. 미스매치가 올리고뉴클레오티드의 3'-최말단 위치에 있을 때(즉, 올리고뉴클레오티드의 3'-최말단 위치가 표적 SNP 위치와 나란히 배열), 방법이 가장 효율적으로 적용되는데, 그 이유는 이 위치가 프라이머로부터 연장에 가장 불안정하기 때문이다(WO 93/22456). 이와 같은 PCR-계 검사를 하기에서 설명하는 TaqMan 검사의 일부로 이용할 수도 있다.
본 발명의 특이적 구체예에서, 본 발명의 프라이머에는 표적 SNP-포함 핵산 분자의 단편에 실질적으로 상보적인 서열을 포함하는데, 단, 프라이머의 3'-최말단에서 세 개 뉴클레오티드 위치중 하나에서 미스매취된 뉴클레오티드를 가지고, 미스매치된 뉴클레오티드는 SNP 부위에서 특정 대립유전자와 염기쌍을 형성하지는 않는다. 적절한 구체예에서, 프라이머에서 미스매치된 뉴클레오티드는 프라이머의 3'-최말단 위치에서 마지막 뉴클레오티드로부터 두 번째 뉴클레오티드이다. 좀더 바람직한 구체예에서, 프라이머에서 미스매치된 뉴클레오티드는 프라이머의 3'-최말단 위치에서 마지막 뉴클레오티드이다.
본 발명의 또 다른 구체예에서, 본 발명의 SNP 감지 시약은 감지가능한 시그날을 방출하는 형광 리포트 염료로 라벨된다. 바람직한 리포터 염료는 형광 염료이지만, 감지 시약, 가령 올리고뉴클레오티드 프로브 또는 프라이머에 부착될 수 있는 임의 리포터 염료도 본 발명에 유용하다. 이와 같은 염료에는 Acridine, AMCA, BODIPY, Cascade Blue, Cy2, Cy3, Cy5, Cy7, Dabcyl, Edans, Eosin, Erythrosin, Fluorescein, 6-Fam, Tet, Joe, Hex, Oregon Green, Rhodamine, Rhodol Green, Tamra, Rox, 및 Texas Red이 포함되나 이에 국한시키지는 않는다.
본 발명의 또 다른 구체예에서, 감지 시약은 Tamra와 같은 소멸염료(quencher dye)로 라벨시킬 수 있는데, 특히 시약은 TaqMan (U.S. Pat. Nos. 5,210,015 and 5,538,848) 또는 Molecular Beacon 프로브 (U.S. Pat. Nos. 5,118,801 and 5,312,728), 또는 다른 줄기없는(stemless) 또는 선형 표지(beacon) 프로브 (Livak et al., 1995, PCR 방법 Appl. 4:357-362; Tyagi et al., 1996, Nature Biotechnology 14: 303-308; Nazarenko et al., 1997, Nucl. Acids Res. 25:2516-2521; U.S. Pat. Nos. 5,866,336 and 6,117,635)와 같은 자가-소멸 프로브로 이용될 때 이와 같은 소멸염료로 라벨시킬 수 있다.
본 발명의 감지 시약들은 스트렙토아비딘 결합을 위한 바이오틴, 집코드 쌍과 같은 또 다른 상보적 올리고뉴클레오티드에 결합하기 위한 올리고뉴클레오티드를 포함하나 이에 국한되지 않는 다른 라벨도 포함할 수 있다.
본 발명은 여기에서 확인된 SNP 뉴클레오티드를 포함하지 않거나 또는 이에 상보적인 뉴클레오티드 것을 포함하지 않지만 여기에서 개시된 하나 또는 그 이상의 SNP를 검사하는데 이용되는 시약들도 고려된다. 예를 들면, 여기에서 제공되는 표적 SNP 위치에 직접적으로 하이브리드되지 않지만 측면에 있는 프라이머는 프라이머 연장 반응에 유용하며, 이때 프라이머는 표적 SNP 위치(가령, 표적 SNP 부위로부터 하나 또는 그 이상의 뉴클레오티드 내에)에 인접한 부위에 하이브리드된다. 프라이머 연장 반응 동안, 프라이머는 특정 뉴클레오티드(대립유전자)가 표적 SNP 부위에 있다면, 일반적으로 표적 SNP 부위를 지나서 연장될 수는 없고, 어느 SNP 대립유전자가 표적 SNP 부위에 있는지를 결정하기 위해 프라이머 연장 산물을 바로 감지할 수 있을 것이다. 예를 들면, ddNTP가 연장 산물에 일단 결합되면, 프라이머 연장을 종료시키기 위하여, 특정 ddNTPs가 프라이머 연장 반응에 일반적으로 이용된다. (프라이머 연장 산물의 3'최말단에 ddNTP [이때 ddNTP는 여기에서 개시된 SNP에 상응하며]를 포함하는 프라이머 연장 산물도 본 발명에 포함되는 조성물이다). 따라서, SNP 부위에 인접한 지역에 있는 핵산 분자에 결합하는 시약들도 비록 결합된 서열에 SNP 부위 자체를 반드시 포함하지는 않지만, 본원 발명에 포함된다.
SNP 감지 키트 및 시스템
당업자는 여기에서 제공하는 SNP 및 연합 서열 정보에 근거하여, 본 발명의 임의 SNP를 개별적으로 또는 복합적으로 검사하기 위해 개발되어 이용될 수 있으며, 이와 같은 감지 시약들은 당분야에 이미 확립된 키트 또는 시스템 포맷 중 하나에 바로 결합시킬 수 있다는 것을 인지할 것이다. SNP 감지 시약들의 내용에서 사용된 바와 같이, 용어“키트” 및 “시스템”은 다중 SNP 감지 시약들의 복합 또는 하나 또는 그 이상의 감지 시약들과 다른 타입의 요소 또는 성분(가령, 다른 타입의 생화학 시약들, 컨테이너, 시판을 목적으로 하는 패키지, SNP 감지 시약들을 부착시키는 기질, 전자 하드 웨어 성분 등)들과 복합된 형태를 말한다. 따라서, 본 발명에는 패키지된 프로브 및 프라이머 세트 (가령, TaqMan 프로브/프라이머 세트), 핵산 분자 어레이/마이크로어레이, 하나 또는 그 이상 SNPs를 감지하기 위한 하나 또는 그 이상의 프로브, 프라이머 또는 다른 감지 시약들을 포함하는 비드를 포함되나 이에 국한시키지는 않는 SNP 감지 키트 및 시스템을 제공한다. 키트/시스템은 선택적으로 다양한 전자 하드웨어 성분들을 선택적으로 포함할 수 있는데: 예를 들면, 다양한 제조업자에 의해 제공되는 어레이 (“DNA 칩”) 및 마이크로유체 시스템 (“lab-on-a-chip” 시스템)은 하드웨어 성분들을 포함한다. 다른 키트/시스템 (가령, 프로브/프라이머 세트)은 전자 하드웨어 성분들을 포함하지 않을 수도 있지만, 하나 또는 그 이상의 용기에 포장된 하나 또는 그 이상 SNP 감지 시약들 (선택적으로 다른 생화학 시약들과 함께)을 포함할 수도 있다.
일부 구체예에서, SNP 감지 키트는 하나 또는 그 이상 감지 시약들 및 SNP 포함 핵산 분자의 증폭 및/또는 감지와 같은 검사 또는 반응을 실행하는데 필수적인 다른 성분들(가령, 완충액, DNA 중합효소 또는 리게이즈와 같은 효소, 쇄 연장 뉴클레오티드 가령, 데옥시뉴클레오티드 트리포스페이트, 그리고 Sanger-type DNA 서열화 반응의 경우 쇄 종료 뉴클레오티드, 포지티브 콘트롤 서열, 네가티브 콘트롤 서열, 및 기타)를 일반적으로 포함한다. 키트에는 표적 핵산의 양을 측정하는 매체와 이 양을 표준과 비교하는 매체를 추가로 포함되며, 관심 SNP-포함 핵산 분자를 감지하는데 이용되는 키트를 사용하는 지침서를 포함할 수 있다. 본 발명의 구체예에서, 키트는 여기에서 설명된 하나 또는 그 이상 SNP를 감지하기 위해 하나 또는 그 이상 검사를 실시하는데 필수적인 시약을 포함한다. 적절한 구체예에서, SNP 감지 키트/시스템은 핵산 어레이, 또는 마이크로유동/lab-on-a-chip 시스템을 포함하는 구획화된(compartmentalized) 키트 형태이다.
SNP 감지 키트/시스템은 예를 들면 각 표적 SNP 위치에 또는 그 부근에 핵산 분자에 하이브리드되는 하나 또는 그 이상 프로브, 또는 프로브 쌍을 포함할 수 있다. 다중 쌍의 대립유전자-특이적 프로브가 키트/시스템에 포함되어, 다수의 SNP를 동시에 검사하고, 최소한 하나는 본 발명의 SNP이다. 일부 키트/시스템에서, 대립유전자-특이적 프로브를 어레이 또는 비드와 같은 기질에 고정시켰다. 예를 들면, 동일한 기질은 최소 1개; 10개; 100개; 1000개; 10,000개; 100,000개; 500,000개 (또는 이 범위내에 임의 수) 또는 실질적으로 모든 SNP를 감지하기 위한 대립유전자-특이적 프로브를 포함할 수 있다.
여기에서 이용된 용어“어레이,” “마이크로어레이,” 및 “DNA 칩”은 유리, 플라스틱, 종이, 나일론 또는 다른 형태의 막, 필터, 칩 또는 임의 다른 적절한 고형 서포트와 같은 기질에 고정된 별개의 폴리뉴클레오티드 어레이를 말하는 것으로 호환되어 사용된다. 폴리뉴클레오티드는 기질상에서 바로 합성되거나 또는 기질로부터 별도로 합성된 후 기질에 부착될 수 있다. 한 구체예에서, 마이크로어레이를 U.S. Pat. No. 5,837,832, Chee et al., PCT application WO95/11995 (Chee et al.), Lockhart, D. J. et al. (1996; Nat. Biotech. 14: 1675-1680) 및 Schena, M. et al. (1996; Proc. Natl. Acad. Sci. 93: 10614-10619)에서 설명하는 방법에 따라 준비하여 사용한다; 여기 명시된 문헌들은 참고문헌으로 전문 첨부된다. 다른 구체예에서, 이와 같은 어레이를 Brown et al., U.S. Pat. No. 5,807,522에서 설명하는 방법에 따라 만든다.
핵산 어레이는 다음 문헌들에서 검토할 수 있다: Zammatteo et al., “New chips for molecular biology and diagnostics”, Biotechnol Annu Rev. 2002;8:85-101; Sosnowski et al., “Active microelectronic array system for DNA hybridization, genotyping and pharmacogenomic applications”, Psychiatr Genet. 2002 December; 12(4):181-92; Heller, “DNA microarray technology: devices, 시스템, and applications”, Annu Rev Biomed Eng. 2002;4:129-53. Epub 2002 Mar 22; Kolchinsky et al., “Analysis of SNPs and other genome variations using gel-based chips”, Hum Mutat. 2002 April;19(4):343-60; and McGall et al., “High-density genechip oligonucleotide probe arrays", Adv Biochem Eng Biotechnol. 2002;77:21-42.
대립유전자-특이적 프로브와 같은 임의 수의 프로브를 어레이에 채우고, 각 프로브 또는 프로브 쌍을 상이한 SNP 위치에 하이브리드시킬 수 있다. 폴리뉴클레오티드 프로브 경우, 광-지시 화학 공정(light-directed chemical process)을 이용하여 기질상에 지정된 부위에서 합성할 수 있다(또는 별도로 합성한 후, 지정된 부위에 고정시킨다). 각 DNA 칩은 예를 들면, 격자형 패턴으로 배열되고, 초소형화된(가령, 동전 크기로) 수천 내지 수만개의 개별 합성 폴리뉴클레오티드 프로브를 포함힌다. 적절하게는, 프로브는 정렬된, 어드레스로 불러낼 수 있는 어레이내에 고형 서포트에 부착된다.
마이크로어레이는 고형 서포트에 고정된 독특한 단일 가닥의 폴리뉴클레오티드 다수를 포함할 수 있다. 일반적으로, 폴리뉴클레오티드는 길이가 적절하게는 약 6-60개 뉴클레오티드, 좀더 바람직하게는 약 15-30개 뉴클레오티드, 가장 바람직하게는 길이가 약 18-25개 뉴클레오티드이다. 특정 타입의 마이크로어레이 또는 다른 감지 키트/시스템의 경우, 길이가 단지 7-20개 뉴클레오티드인 올리고뉴클레오티드를 사용하는 것이 바람직할 수도 있다. 화학적발광 감지 기술과 함께 이용되는 어레이와 같은 다른 타입의 어레이에서, 바람직한 프로브 길이는 예를 들면, 약 15-80개 뉴클레오티드, 적절하게는 길이가 약 50-70개 뉴클레오티드, 좀더 바람직하게는 약 55-65개 뉴클레오티드, 가장 바람직하게는 약 60개 뉴클레오티드 길이가 된다. 마이크로어레이 또는 감지 키트는 표적 SNP 부위의 공지된 5'또는 3' 서열을 커버하는 폴리뉴클레오티드, 유전자/전사체의 전장 서열을 커버하는 연속폴리뉴클레오티드; 표적 유전자/전사체 서열의 길이를 따라 특정 부위에서 선택된 독특한 폴리뉴클레오티드 또는 여기에서 개시된 하나 또는 그 이상 SNP에 상응하는 특정 부위를 포함할 수 있다. 마이크로어레이 또는 감지 키트에 이용되는 폴리뉴클레오티드는 관심의 SNP 또는 SNPs에 특이적이거나(가령, 표적 SNP 부위의 특정 SNP 대립유전자에 특이적이거나 상이한 다중 SNP 부위의 특정 SNP 대립유전자에 특이적) 또는 관심의 변형 유전자/전사체 또는 유전자들/전사체들에 특이적일 수도 있다.
폴리뉴클레오티드 어레이에 근거한 하이브리드반응 검사는 완벽하게 매치된 그리고 미스매치된 표적 서열 변이체에 프로브의 하이브리드 반응 안정성의 차이에 의존한다. SNP 유전자 타이핑의 경우, 하이브리드 반응 검사에 이용되는 엄격성 조건들이 충분히 높아, 하나의 SNP 위치에서 서로 상이한 핵산 분자도 구별해낼 수 있다(가령, 전형적인 SNP 하이브리드반응 검사는 한 개 특정 뉴클레오티드가 SNP 위치에 존재하는 경우에만 하이브리드반응이 일어나고, 선택적 뉴클레오티드가 그 SNP 위치에 존재하는 경우에는 일어나지 않도록 고안되된다). 이와 같은 높은 엄격성 조건은 SNP 감지를 위해 대립유전자-특이적 프로브의 핵산 어레이를 이용하는 경우 바람직할 수 있다. 이와 같은 높은 엄격성 조건은 선행 단락에서 설명되었고, 당분야에 잘 공지되어 있으며, 예를 들면, Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6.에서도 찾아볼 수 있다.
다른 구체예에서, 어레이는 화학적발광 감지 기술과 함께 이용된다. 다음의 특허 및 특허 출원(모두 전문을 참고문헌으로 첨부함)들은 화학적발광 감지에 속하는 추가 정보를 제공한다: U.S. 특허출원 Ser. Nos. 10/620,332 and 10/620,333는 마이크로어레이 감지를 위한 화학적발광 방법을 설명하고; U.S. Pat. Nos. 6,124,478, 6,107,024, 5994073, 5981768, 5871958, 5843681, 5800999, 및5773628는 화학적발광 감지를 실행하는 방법 및 디옥세탄 조성물을 설명하고; 그리고 U.S. 공개 출원 US2002/0110828에서는 마이크로어레이 콘트롤을 위한 방법 및 조성물을 제공한다.
본 발명의 한 가지 구체예에서, 핵산 어레이는 길이가 약 15-25개 뉴클레오티드의 프로브 어레이를 포함할 수 있다. 추가 구체예에서, 핵산 어레이는 임의 수의 프로브를 포함할 수 있는데, 이때 최소 하나의 프로브는 표 1에서 설명된 하나 또는 그 이상 SNP를 감지할 수 있거나 및/또는 최소 하나의 프로브는 여기에서 설명된 것에서 선택된 서열중 하나의 단편, 이에 상보적인 서열을 포함하고, 이때 단편은 최소 8개의 연속 뉴클레오티드, 바람직하게는 10개, 12개, 15개, 16개, 18개, 20개, 더욱 바람직하게는 22개, 25개, 30개, 40개, 47개, 50개, 55개, 60개, 65개, 70개, 80개, 90개, 100개, 또는 그 이상의 연속 뉴클레오티드(또는 이 범위내에 임의 수)를 포함하고, 그리고 SNP를 포함한다(또는 이에 상보적이다). 일부 구체예에서, SNP 부위에 상보적인 뉴클레오티드는 프로브 중앙으로부터 5개, 4개, 3개, 2개 또는 1개 뉴클레오티드내에 있고, 더욱 적절하게는 프로브의 중앙에 있다.
폴리뉴클레오티드 프로브는 PCT 출원 WO95/251116 (Baldeschweiler et al.: 전문을 참고문헌으로 첨부)에서 설명하는 것과 같이 화학 커플링 과정과 잉크 제트 응용 장치를 이용하여 기질의 표면 위에서 합성할 수 있다. 또 다른 측면에서, 진공 시스템, 열, UV, 기계 또는 화학적 결합 과정을 이용하여, 도트 (또는 슬롯) 블롯에 유사한 “gridded” 어레이는 기질의 표면에 cDNA 단편들 또는 올리고뉴클레오티드를 배열하고 연결시키는데 이용할 수 있을 것이다. 상기에서 설명하는 것과 같이, 어레이는 손으로 또는 이용가능한 장치(슬롯 블롯 또는 도트 블롯 장치), 재료들(임의 적절한 고형 서포트), 그리고 기계(로봇 장치를 포함)를 이용하여 만들 수 있는데, 8개, 24개, 96개, 384개, 1536개, 6144개 또는 그 이상의 폴리뉴클레오티드를 포함할 수 있고, 또는 시판되는 이용가능한 장치의 효과적인 이용으로 임의 다른 수치의 뉴클레오티드를 포함할 수도 있다.
이와 같은 어레이 또는 다른 키트/시스템을 이용하여, 본 발명은 테스트 샘플내에 여기에서 개시된 SNP를 확인하는 방법을 제공한다. 이와 같은 방법들은 일반적으로 본 발명의 최소 하나의 SNP 위치에 상응하는 하나 또는 그 이상의 프로브를 포함하는 어레이와 테스트 샘플의 핵산들을 항온처리하고, 테스트 샘플의 핵산이 하나 또는 그 이상의 프로브에 결합하는 지를 검사하는 것과 관계한다. 테스트 샘플과 SNP 감지 시약 (또는 이와 같은 감지 시약을 이용하는 키트/시스템)을 항온처리하는 조건은 다양하다. 항온처리 조건들은 검사에 이용되는 포맷, 이용되는 감지 방법, 검사에 이용되는 감지 시약들의 타입 및 성질등과 같은 인자들에 따라 달라진다. 당업자는 흔히 이용되는 하이브리드반응, 증폭 및 어레이 검사 포맷들중 임의 것을 여기에서 개시하고 있는 SNP를 감시하기 위해 용이하게 조절할 수 있다는 것을 인지할 것이다.
본 발명의 SNP 감지 키트/시스템은 SNP-포함 핵산 분자의 연속 증폭 및/또는 감지를 위해 테스트 샘플로부터 핵산을 준비하는데 이용되는 성분들을 포함한다. 이와 같은 샘플 준비 성분들을 이용하여 DNA 및/또는 RNA, 임의 체액으로부터 추출물을 포함하는 핵산 추출물을 만들 수 있다. 본 발명의 적절한 구체예에서, 체액은 혈액, 타액 또는 구강점막세포 체집(buccal swab)이다. 상기 설명된 방법들에서 이용된 테스트 샘플은 검사 포멧, 감지 방법의 성질, 검사되는 테스트 샘플로 이용되는 특이적 조직, 세포 또는 추출물과 같은 인자들에 따라 다양할 수 있을 것이다. 핵산들을 준비하는 방법들은 당분야에 공지되어 있으며, 이용되는 시스템과 필적되는 샘플을 얻기위해 용이하게 조절할 수 있을 것이다.
본 발명의 SNP 중 하나를 감지하기 위한 핵산 및 시약들을 준비하기 위해, 시약에 추가하여 키트의 또 다른 형태에서, 키트는 나이, 성별 또는 자궁내막증과 연관된 것으로 알려진 임의 다른 비-유적적 임상 인자들에 대한 질문지를 포함할 수 있다.
본 발명에 의해 고려되는 또 다른 형태의 키트는 구획화된 키트이다. 구획화된 키트는 별도 용기에 시약들이 포함된 임의 키트를 포함한다. 이와 같은 용기는 예를 들면, 작은 유리 용기, 플라스틱 용기, 플라스틱, 유리 또는 종이 스트립 또는 실리카와 같은 에레이 물질을 포함한다. 이와 같은 용기들을 이용하면 한 격실로부터 다른 격실로 시약을 효과적으로 옮길 수 있어, 테스트 샘플과 시약들이 교차 오염되지 않고 또는 한 용기로부터 키트에 포함되지 않은 다른 용기로의 교차 오염이 없으며, 각 용기의 물질 또는 용액은 한 격실로부터 다른 격실로 또는 다른 용기로 정량적인 방식으로 첨가될 수 있다. 이와 같은 용기는 테스트 샘플을 수용할 수 있는 하나 또는 그 이상 용기, 본 발명의 하나 또는 그 이상 SNP를 감지하기 위해 최소 한 가지 프로브 또는 다른 SNP 감지시약을 포함하는 하나 또는 그 이상 용기, 세척 시약들(예를 들면, 인산염 완충액, 트리스-완충액 등)을 포함하는 하나 또는 그 이상 용기, 결합된 프로브 또는 다른 SNP 감지 시약의 존재를 밝히는데 이용되는 시약들을 포함하는 하나 또는 그 이상 용기가 포함될 수 있다. 키트는 격실 및/또는 시약들 예를 들면, 프라이머 연장 반응, 하이브리드반응, 결찰, 전기영동(적절하게는 모세관 전기영동), 질량 스텍트로메터 및/또는 레이져-유도된 형광 감지와 같은 다른 효소 반응을 위한 시약들을 선택적으로 포함할 수 있다. 키트는 또한 키트 사용 지침서를 포함할 수 있다. 예시적인 격실화된 키트는 당분야에 공지된 마이크로 유체 장치를 포함할 수 있다(예를 들면,, Weigl et al., “Lab-on-a-chip for drug development”, Adv Drug Deliv Rev. 2003 Feb. 24;55(3):349-77). 이와 같은 마이크로유체 장치에서, 용기는 마이크로유체 “격실”, “쳄버”, 또는 “채널”이라고 부를 수도 있다.
마이크로유체 장치(“lab-on-a-chip” 시스템, 생의약 마이크로-전기-기전 시스템 (bioMEMs), 또는 다중성분 집적 시스템이라고도 부름)는 SNP를 분석하기 위해 본 발명의 예시적인 키트/시스템이다. 이와 같은 시스템은 단일 기능 장치에서 프로브/표적 하이브리드반응, 핵산 증폭, 그리고 모세관 전기영동 반응과 같은 공정을 최소화하고 격실화한다. 이와 같은 마이크로유체 장치는 일반적으로 시스템의 최소 한 측면에서 감지 시약들을 이용하고, 이와 같은 감지 시약들은 본 발명의 하나 또는 그 이상 SNPs를 감지하는데 이용될 수 있다. 마이크로유체 시스템의 한 예가 U.S. Pat. No. 5,589,136에 개시되어 있으며, 이 특허에서는 칩상에 PCR 증폭과 모세관 전기영동을 통합한 것을 설명한다. 예시적인 마이크로유체 시스템은 마이크로칩상에 포함된 유리, 실리콘, 석영 또는 플라스틱 웨이퍼상에 고안된 마이크로채널 패턴을 포함한다. 이동부가 없는 기능성 마이크로 벨브 및 펌프를 만들기 위하여, 마이크로칩의 상이한 부분들을 통하여 제공되는 전기, 전기삼투 또는 유체력으로 샘플의 이동이 조절될 수 있다. 전압을 다양하게 하여 마이크로-머신 채널간에 교차점에서 유체 이동을 조절하고, 마이크로칩의 상이한 부분들에 펌핑을 위한 유체 이동 속도를 변화시키는 매체로 이용할 수도 있다. 예를 들면 U.S. Pat. No. 6,153,073, Dubrow et al., 및 U.S. Pat. No. 6,156,181, Parce et al.을 참고한다.
SNP의 유전자 타이핑을 위하여, 예를 들면, 마이크로유체 시스템은 핵산 증폭, 프라이머 연장, 모세관 전기영동 및 레이져 유도된 형광 감지와 같은 감지 방법을 통합할 수도 있다.
핵산 분자의 용도
본 발명의 핵산 분자는 자궁내막증 진단 및 치료등에 다양한 용도를 가진다. 예를 들면, 핵산 분자는 메신져 RNA, 전사체, cDNA, 게놈 DNA, 증폭된 DNA 또는 표 1-196에서 개시된 SNP 중 하나를 포함하는 다른 핵산 분자 및 이들의 오르소로그(orthologs)에서 SNPs의 유전자 타이핑을 위한 하이브리드 반응 프로브로 유용하다.
프로브는 본 발명의 SNP를 포함하는 핵산 분자의 전장을 따라 임의 뉴클레오티드 서열에 하이브리드할 수 있다. 바람직하게는 본 발명의 프로브는 SNP를 포함하는 표적 서열의 일부분에 하이브리드한다. 더욱 적절하게는, 프로브는 SNP 부위에 존재하는 하나의 뉴클레오티드에 의해 표적 서열로부터 변화된 다른 뉴클레오티드 서열로부터 표적 서열을 구별짓는 서열 특이적 방식으로 SNP-포함 표적 서열에 하이브리드된다. 이와 같은 프로브는 테스트 샘플내에 SNP-포함 핵산의 존재를 감지하는데 특히 유용하거나 또는 특정 SNP 부위에 뉴클레오티드(대립유전자)를 결정하는데 유용하다(가령, SNP 부위의 유전자 타이핑).
핵산 하이브리드반응 프로브는 핵산 발현의 존재, 발현 수준, 형태 및/또는 분포를 결정하는데 이용될 수도 있다. 발현 수준이 결정되는 핵산은 DNA 또는 RNA가 될 수 있다. 따라서, 여기에서 설명하는 프로브 특이성을 이용하여 주어진 세포, 조직 또는 유기체에서 존재, 발현 및/또는 유전자 복사체의 수를 측정할 수 있다. 이와 같은 용도는 정상 수준에 대해 유전자 발현의 감소 또는 증가와 연관된 질환의 진단에 관련된다. mRNA를 감지하는 in vitro 기술에는 Northern 블롯 하이브리드반응 및 in situ 하이브리드반응이 포함된다. DNA 감지를 위한 in vitro 기술에는 Southern 블롯 하이브리드반응 및 in situ 하이브리드반응 (Sambrook and Russell, 2000, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, N.Y.)이 포함된다.
프로브는 변이 개체에서 얻은 세포 샘플에서 변이체 단백질을 인코드하는 핵산(가령, mRNA)의 수준을 측정하여 단백질이 발현되는 세포 또는 조직을 동정하는 진단 테스트 키트의 일부로 또는 관심의 SNP를 폴리뉴클레오티드가 포함하는 지를 결정하는 키트의 일부로 이용될 수 있다.
따라서, 본 발명의 핵산 분자는 하이브리드 반응 프로브로 이용하여, 여기에서 설명하는 SNP를 감지하여, 변형을 가진 개체가 자궁내막증의 위험에 있는지 또는 초기 단계의 자궁내막증을 가지고 있는 지를 결정할 수 있다. 자궁내막증과 연관된 SNP의 감지는 활성 자궁내막증 및/또는 자궁내막증에 걸리기 쉬운 유전적 경향에 대한 진단 및/또는 예후 매체를 제공한다.
본 발명의 핵산 분자는 핵산 분자의 임의 주어진 부분, 특히 본 발명의 SNP를 포함하는 부분을 증폭시키는 프라이머로도 유용하다.
본 발명의 핵산 분자는 본 발명의 핵산 분자의 유전자 조절 부분을 포함하는 벡터를 작제하는 것에도 유용하다. 또한, 본 발명의 핵산 분자는 siRNA(작은 간섭 RNA)의 형태로 치료요법적 용도도 가진다.
SNP 유전자 타이핑( genotyping ) 방법
본 발명의 SNP로 특징되는 핵산 분자에 SNP 위치와 같은 하나 또는 그 이상SNP 위치에 특정 뉴클레오티드(가령, 대립유전자)의 존재를 결정하는 과정을 SNP 유전자 타이핑이라고 한다. 본 발명은 자궁내막증 또는 관련 병리학의 스크리닝에 이용하기 위한 또는 이와 같은 질환에 걸리기 쉬운 경향인지를 결정하거나 또는 치료에 반응성을 결정하거나 도는 게놈 매핑 또는 SNP 관련 분석을 위한 방법을 제공한다.
당분야에 공지된 방법으로 관심의 임의 주어진 유전자 부분(가령, SNP 위치)에 대립유전자가 존재하는지를 결정하기 위해 핵산 샘플들을 유전자 타이핑할 수 있다. 이웃 서열을 이용하여 키트 포맷에서 선택적으로 실행될 수 있는 올리고뉴클레오티드 프로브와 같은 SNP 감지 시약을 디자인할 수 있다. 예시적인 SNP 유전자 타이핑 방법들은 Chen et al., “Single nucleotide polymorphism genotyping: biochemistry, protocol, cost and throughput”, Pharmacogenomics J. 2003;3(2):77-96; Kwok et al., “Detection of single nucleotide polymorphisms”, Curr Issues Mol. Biol. 2003 April;5(2):43-60; Shi, “Technologies for individual genotyping: detection of genetic polymorphisms in drug targets and endometriosis genes”, Am J Pharmacogenomics. 2002;2(3):197-205; and Kwok, “Methods for genotyping single nucleotide polymorphisms" Annu Rev Genomes Hum Genet 2001;2:235-58에 설명되어 있다. 다량-처리 SNP 유전자 타이핑에 대한 예시는 Marnellos, “High-throughput SNP analysis for gene association studies”, Curr Opin Drug Discov Devel. 2003 May;6(3):317-21에서 설명하고 있다. 통상적인 SNP 유전자타이핑 방법에는 TaqMan 검사, 분자 베콘 검사, 핵산 어레이, 대립유전자-특이적 프라이머 연장, 대립유전자-특이적 PCR, 어레이된 프라이머 연장, 상동성 프라이머 연장 검사, 질량 분석기를 이용한 감지와 프라이머 연장, 단일동위원소 dNTPs 유무와 함께 질량 분석기(U.S. Pat. No. 6,734,294), 피로시퀀싱(pyrosequencing), 유전자 어레이상에 분급된 다중(multiplex) 프라이머 연장, 롤링 서클 증폭과 결찰, 상동성 결찰, OLA (U.S. Pat. No. 4,988,167), 유전자 어레이상에 분급된 다중 결찰, 제한-단편 길이 변형, 단일 염기 연장-tag 검사, 그리고 Invader 검사를 포함되나 이에 국한시키지는 않는다. 이와 같은 방법들은 발광 또는 화학적발광 감지, 형광 감지, 시간 분해(time-resolved) 형광 감지, 형광 공명 에너지 전달, 형광 편광, 질량 분광, 전자분무 질량 분광, 전기 감지와 같은 감지 기전과 복합하여 사용할 수 있다. 변형을 감지하는 다양한 방법은 RNA/RNA 또는 RNA/DNA 듀플렉스에서 미스매치된 염기를 감지하기 위해 절단 물질로부터 보호를 이용하는 방법(Myers et al., Science 230:1242 (1985); Cotton et al., PNAS 85:4397 (1988); and Saleeba et al., Meth. Enzymol. 217:286-295 (1992)), 변이체와 와일드 타입핵산 분자의 전기영동 이동성의 비교(Orita et al., PNAS 86:2766 (1989); Cotton et al., Mutat. Res. 285:125-144 (1993); and Hayashi et al., Genet. Anal. Tech. Appl. 9:73-79 (1992)), 그리고 변성 그래디언트 겔 전기영동(DGGE)을 이용하여 변성물 그래디언트를 포함하는 폴리아크릴아미드 겔에서 변형 또는 와일드 타입 단편들의 이동을 검사하는 방법(Myers et al., Nature 313:495 (1985))을 포함되나 이에 국한시키지는 않는다. 특정 위치에서 서열 변화는 RNase 및 S1 보호 또는 화학적 절단 방법과 같은 뉴클라제 보호 검사를 이용하여 평가할 수 있다.
바람직한 구체예에서, SNP 유전자 타이핑은 5' 뉴클라제 검사 (U.S. Pat. Nos. 5,210,015 and 5,538,848)로도 공지된 TaqMan 검사를 이용하여 실행한다. TaqMan 검사는 PCR 동안 특이적 증폭된 산물의 축적을 감지한다. TaqMan 검사는 형광 리포트 염료 및 소멸(quencher) 염료로 라벨된 올리고뉴클레오티드 프로브를 이용한다. 리포터 염료는 적정 파장에서 빛의 투사에 의해 여기되고(excited), 형광 공명 에너지 전달(FRET)이라고 불리는 과정을 통하여 동일한 프로브에 있는 소멸 염료로 에너지를 전달한다. 프로브에 부착되었을 때, 여기된 리포트 염료는 시그날을 방출하지 않는다. 고유 프로브에서 리포트 염료에 소멸 염료의 접근으로 리포트에 대한 감소된 형광을 유지한다. 리포터 염료와 소멸 염료는 각각 5' 최말단 및 3' 최말단에 있을 수 있고, 이 역도 가능할 수 있다. 선택적으로, 리포터 염료는 5' 또는 3' 최말단에 있을 수 있고, 소멸염료는 내주 뉴클레오티드에 부착될 수 있으며, 이 역도 가능하다. 또 다른 구체예에서, 리포터 염료과 소멸염료는 리포터 염료가 감소되도록 서로 일정 거리를 두고, 내부 뉴클레오티드에 부착될 수도 있다.
PCR 동안, DNA 중합효소의 5' 뉴클라제 활성은 프로브를 절단하여, 리포트와 소멸 염료를 분리시켜, 리포트 형광의 증가를 결과한다. PCR 산물의 축적은 리포트 형광 증가를 모니터함으로써 직접적으로 감지된다. DNA 중합효소는 PCR 동안에 증폭된 표적 SNP 포함 주형에 프로브가 하이브리드된다면 리포트 염료와 소멸 염료 사이에서 프로브를 절단하고, 프로브는 특정 SNP 대립유전자가 존재하는 경우에만 표적 SNP 부위에 하이브리드되도록 고안된다.
적절한 TaqMan 프라이머 및 프로브 서열은 여기에서 제공하는 SNP와 연합된 핵산 서열정보를 이용하여 바로 결정할 수 있을 것이다. 다수의 컴퓨터 프로그램 예를 들면, Primer Express (Applied Biosystem, Foster City, Calif.)은 최적의 프라이머/프로브 세트를 신속하게 얻는데 이용될 수 있을 것이다. 당업자는 본 발명의 SNP를 감지하기 위해 이와 같은 프라이머와 프로브를 이용하여 자궁내막증 및 관련 병리학의 진단 검사를 할 수 있고, 이를 키트 포맷에 바로 결합시킬 수 있다는 것을 인지할 것이다. 본 발명은 또한 Molecular Beacon 프로브의 이용(U.S. Pat. Nos. 5,118,801 and 5,312,728) 및 다른 변이 포멧(U.S. Pat. Nos. 5,866,336 and 6,117,635)과 같은 당분야에 잘 알려진 Taqman 검사의 변형도 포함한다.
본 발명의 SNP의 유전자 타이핑의 또 다른 적절한 방법은 OLA내에 두 개 올리고뉴클레오티드 프로브(참고 U.S. Pat. No. 4,988,617)를 이용하는 것이다. 이 방법에서, 하나의 프로브는 SNP 부위와 나란히 배열된 3' 최말단을 가진 표적 핵산 단편에 하이브리드된다. 두번째 프로브는 제1 프로브의 3'에 표적 핵산 분야의 인접 단편에 하이브리드된다. 두 개의 병치된(juxtaposed) 프로브는 표적 핵산 분자에 하이브리드되고, 제1 프로브의 3'최말단 뉴클레오티드가 완벽한 상보성이 있다면 리게이즈와 같은 연결 물질 존재하에 SNP 부위에 결찰된다. 미스매치가 있다면, 결찰(ligation)은 일어나지 않을 것이다. 반응 후에, 결찰된 프로브를 표적 핵산 분자로부터 분리하고, SNP의 존재 표지 물질로 감지된다.
다음의 특허, 특허 출원 및 공개된 국제 특허 출원(참고문헌으로 전문 첨부됨)에서는 다양한 타입의 OLA를 실행하는 기술에 관한 추가 정보를 제공한다: U.S. Pat. Nos. 6,027,889, 6,268,148, 5494810, 5830711, 그리고 6054564에서는 SNP 감지를 실행하기 위한 OLA 전략을 설명하고; WO 97/31256 및 WO 00/56927에서는 보편적 어레이를 이용하여 SNP 감지를 실행하기 위한 OLA 전략을 설명하는데, 이때 집코드 서열은 하이브리드반응 프로브중 하나에 도입시킬 수 있고, 생성된 산물, 또는 증폭된 산물은 보편적 집코드 어레이에 하이브리드된다; U.S. 출원 US01/17329 (및 09/584,905)는 OLA (똔느 LDR)와 이어서 PCR을 설명하는데, 이때 집코드는 OLA 프로브에 결합시키고, 증폭된 PCR 산물은 전기영동 또는 보편적 집코드 어레이 리드아웃(readout)으로 결정한다; U.S. 출원 60/427,818, 60/445,636, 및 60/445,494는 OLA와 이어 PCR을 통하여 다중 SNP 감지를 위한 SNPlex 방법 및 소프트웨어를 설명하는데, 이때 집코드는 OLA 프로브상에 결합되며, 증폭된 PCR 산물은 zipchute 시약으로 하이브리드되고, SNP 동정은 zipchute의 전기영동에 의한 리드아웃(readout)으로부터 결정된다. 일부 구체예에서, OLA은 PCR(또는 다른 핵산 증폭 방법)에 선행하여 실행된다. 다른 구체예에서, PCR (또는 다른 핵산 증폭 방법)은 OLA에 선행하여 실행된다.
SNP 유전자 타이핑의 또 다른 방법은 질량 분석기에 근거한다. 질량 분석기는 DNA의 4개 뉴클레오티드 각각의 독특한 질량을 이용한다. SNPs는 선택적 SNP대립유전자를 가지는 핵산 질량의 차이를 측정함으로써 명확하게 유전자타이핑될 수 있다. MALDI-TOF (Matrix Assisted Laser Desorption Ionization-Time of Flight) 질량 분석기 기술은 SNP와 같은 분자량을 매우 정확하게 결정하는 경우에 바람직하다. SNP 분석을 위한 다양한 방법이 질량 분석기를 기초하여 개발되어왔다. SNP 유전자 타이핑의 바람직한 질량 분석기 기초한 방법에는 전통적인 겔-기초한 포맷 및 마이크로어레이와 같은 다른 방법과 복합하여 이용될 수도 있는 프라이머 연장 검사를 포함한다.
다음의 문헌은 SNP 유전자 타이핑을 위한 질량 분석기-기초한 방법을 설명하는 추가 정보를 제공한다: Bocker, “SNP and mutation discovery using base-specific cleavage and MALDI-TOF mass spectrometry”, Bioinformatics. 2003 July;19 Suppl 1:144-153; Storm et al., “MALDI-TOF mass spectrometry-based SNP genotyping”, Methods Mol. Biol. 2003;212:241-62; Jurinke et al., “The use of Massarrary technology for high throughput genotyping", Adv Biochem Eng Biotechnol. 2002;77:57-74; and Jurinke et al., “Automated genotyping using the DNA MassArray technology”, Methods Mol. Biol. 2002; 187:179-92.
본 발명의 SNP 유전자 타이핑의 좀더 바람직한 방법은 증폭된 핵산의 직접적 분석을 위한 전기분무질량분석법(electrospray mass spectrometr)을 이용하는 것이다. (U.S. Pat. No. 6,734,294 참고). 한 측면에서, 이 방법은 증폭된 핵산 산물이 산소 (O), 탄소 (C), 질소 (N) 또는 이들 요소들의 복합 동위원소가 풍부할 수 있다. 적절한 구체예에서, 증폭된 핵산은 O16, C12 및 N14 요소에서 99.9%이상의 수준으로 동위원소적으로 충부하다. 증폭된, 동위원소적으로 풍부한 산물은 핵산 조성과 이에 상응하는 SNP 유전자 타이핑을 결정하기 위해 전기분무 질령 분석으로 분석할 수 있다. 동위원소적으로 풍부한 증폭된 산물은 질량 스펙트럼에서 감도 및 정확성에서 상응하는 증가를 결과한다. 본 발명의 또 다른 측면에서, 동위원소적으로 풍부하지 않은 증폭된 핵산도 전기분무 질량 분석으로 결정된 조성 및 SNP 유전자 타입을 가질 수 있다.
직접 DNA 서열화에 의해 SNP가 평가될 수도 있다. 질량 분석기를 이용한 서열화를 포함하여(가령, PCT International Publication No. WO94/16101; Cohen et al., Adv. Chromatogr. 36:127-162 (1996); and Griffin et al., Appl. Biochem. Biotechnol. 38:147-159 (1993)) 다양한 자동화된 서열화 과정을 이용할 수 있다 ((1995) Biotechniques 19:448). 본 발명의 핵산 서열은 당업자가 자동화된 서열화 과정을 위한 프라이머를 바로 고안할 수 있도록 한다. 시판용 기구 예를 들면, Applied Biosystem 377, 3100, 3700, 3730, and 3730x1 DNA Analyzers (Foster City, Calif.)는 자동화된 서열화를 위해 당업자가 흔히 이용하는 것이다.
SNP 유전자 타이핑은 사람 개체로부터 생물학적 샘플(가령, 조직, 세포, 유체, 분비물 등의 샘플)을 수거하고, 핵산(가령, 게놈 DNA, mRNA 또는 이둘다)를 샘플 세포로부터 분리하고, 표적 핵산 부분의 하이브리드 반응 및 증폭이 일어나는 조건하에 표적 SNP를 포함하는 분리된 핵산 부분에 특이적으로 하이브리드되는 하나 또는 그 이상의 프라이머에 핵산을 접촉시키고, 관심의 SNP 위치에 존재하는 뉴클레오티드를 결정하고, 또는 일부 검사에서는 증폭 산물의 존부를 결정(검사는 특정 SNP 대립유전자가 존재하거나 없는 경우에만 하이브리드 반응 및/또는 증폭이 일어나도록 고안될 수도 있다)하는 단계를 포함한다. 일부 검사에서, 증폭 산물의 크기를 감지하고, 대조군 샘플의 길이와 비교하고; 예를 들면 결손 및 삽입은 정상 유전자 타입과 비교하여 증폭된 산물의 크기 변화로 감지될 수 있다.
SNP 유전자 타이핑은 하기에서 설명하는 것과 같이, 다양한 실질적인 용도에 이용된다. 이와 같은 용도의 예로 SNP-자궁내막증 연관 분석, 자궁내막증 예후 스크리닝, 자궁내막증 진단, 자궁내막증 예후, 자궁내막증 진행 모니터링, 개별 유전자형에 기초한 치료 전략의 결정, 자궁내막증 치료를 위해 최소한의 침투성 장비와 같은 치료를 위한 임상 시도에서 환자군 형성 등이 포함되나 이에 국한시키지는 않는다.
SNP 와 표현형 특성간에 유전자 연합 분석
자궁내막증 진단, 자궁내막증 예후 스크리닝, 자궁내막증 예후, 자궁내막증 치료 및 여기에서 설명하는 다른 용도를 위한 SNP 유전자 타이핑은 하나 또는 그 이상 SNP와 관심의 특정 표현형 특성간에 초기 유전자 연합을 확립하는데 의지한다.
유전자 연합 연구에서, 테스트될 관심사는 특정 대립유전자 또는 SNP 또는 대립유전자의 복합 또는 몇가지 SNP로부터 단상형이다. 따라서, 샘플 개체로부터 조직 견본(가령, 타액)을 수거하여, 게놈 DNA를 관심의 SNP에 대해 유전자 타입핑할 수 있다. 관심의 표현형 특징에 추가하여, 특징의 결과에 영향을 줄 수 있는 기타 정보 예를 들면, 인구통계학적 정보(가령, 나이, 성별, 인종 등), 임상적 정보 및 환경적 정보 등을 수집하여 샘플 세트를 추가 특징화시키고, 정의할 수 있을 것이다. 특이적으로, 자궁내막증 유전자 연합 연구에서, 체중 지수, 나이, 식이요법 등과 같은 임상적 정보를 수집할 수 있을 것이다. 많은 경우에, 이와 같은 인자들은 질병 및/또는 SNP 대립유전자 빈도와 연관있는 것으로 알려져 있다. 유사하게 유전자-환경 및/또는 유전자-유전자간의 상호작용도 있다. 유전자-환경 및 유전자-유전자 상호작용(예를 들면, 두 개의 다른 유전자에서 이들 둘의 민감성 대립유전자의 존재의 효과가 복합된 두 개 유전자에서 개별 대립유전자의 효과보다 크다)을 처리하기 위한 분석 방법은 하기에서 설명한다.
모든 관련 표현형 및 유전자형 정보를 수득한 후에, 대립유전자 또는 개별 표현형의 특징을 가진 유전자형의 존재간에 임의 유의적 상관관계가 있는지를 결정하기 위해 통계학적 분석을 실행한다. 적절하게는 유전자 연합을 위한 통계학적 테스트를 실시하기 전에 데이터 검사 및 클리닝을 우선 실행한다. 샘플의 유행병학적 그리고 임상적 데이터는 표와 그래프를 이용한 통계학적 설명으로 요약할 수 있을 것이다. 데이터 완성, 모순된 엔트리 및 아웃라이어(outlier)를 점검하여 데이터 유효성을 실행하는 것이 바람직하다. Chi-squared 테스트를 이용하여 별개의 그리고 연속 변수들에 대해 환자와 대조군에서의 유의적 차이를 점검할 수 있을 것이다. 유전자 타이핑의 질을 확인하기 위해, Hardy-Weinberg 비평형 테스트를 환자와 대조군에서 별도로 실행할 수도 있다. 개별 마커에 대해 환자와 대조군 모두에서 Hardy-Weinberg 평형 (HWE)의 유의편차는 유전자 타이핑 에러의 표지가 될 수 있다. HWE가 대부분의 마커에서 위배되면, 이는 집단의 하위구조를 더 조사해야한다는 표시다. 그러나, 환자군에서의 Hardy-Weinberg 비평형은 관심 질병과 마커의 유전자 연합만을 나타낼 수 있다. (Genetic Data Analysis, Weir B., Sinauer (1990)).
단일 SNP의 대립유전자가 표현형 형질의 환자 또는 대조군 상태와 연합되는지를 테스트하기 위해, 당업자는 환자군과 대조군에서 대립유전자 빈도를 비교할 수 있을 것이다. 표준 chi-squared 테스트와 Fisher exact 테스트를 2×2 테이블 상에서 실시할 수 있을 것이다(2개 SNP 대립유전자×2개 결과-관심 범주의 형질에서). SNP 의 유전자형이 연합되는지를 테스트하기 위해, chi-squared 테스트를 3×2 테이블상에서 실시할 수도 있다(3개 유전자형×2개 결과). 실시하여 환자군과 대조군에서 세가지 유전자 타입(주요 동질접합체, 이질접합체, 소수 동질접합체)의 빈도를 비교하기 위한 유전자 타입 연합을 위한 Score 테스트를 실행할 수도 있고, 그리고 우성(대비 계수 2, -1, -1), 부가적(대비 계수 1, 0, -1) 및 열성(대비 계수 1, 1, -2)의 3가지 상이한 유전 방식을 이용하여 경향을 찾을 수 있다. 소수 대비 주요 대립유전자에 대한 Odd 비율, 와일드 타입 유전자형에 대한 이질접합체와 동일접합체 변이체의 Odd 비율은 원하는 신뢰 범위, 주로 95%로 계산된다. 현행 연구에서, 소프트웨어 알고리즘, PLINK을 이용하여, 매우 많은 수의 SNP와 환자군-대조군 개체에 대해 Hardy-Weinberg 평형, chi-square, p-값, odds-비율의 계산을 자동으로 할 수 있다. (Purcell et al. PLINK: a toolset for whole-genome association and population-based linkage analysis. American Journal of Human Genetics, 2007 in press).
혼동 효과(confounding effects)를 조절하고, 상호작용을 테스트하기 위하여, SAS 또는 R과 같은 통계학적 패키지를 이용한 다항 로지스틱 회귀 분석을 실행할 수도 있다. 로지스틱 회귀는 모델-빌딩 기술로써, 이때 양분된 결과(예를 들면, 특정 자궁내막증을 얻거나 그렇지 않는)와 독립 변수 세트(예를 들면, 상이하게 연합된 유잔자들의 유전자형과 연합된 인구학적 그리고 환경적 요인들) 사이에 상관관계를 설명하기 위해 최적의 피팅과 가장 깐깐한 모델이 만들어진다. 가장 흔한 모델은 odd 비율의 로짓 변환(logit transformation)이 변수들(주요 효과)과 이들의 교차-산물 조건(상호작용)의 선형 복합으로 표현된 것이다(Applied Logistic Regression, Hosmer and Lemeshow, Wiley (2000)). 특정 변수 또는 상호작용이 결과와 유의적으로 연합되었는 지를 테스트하기 위해, 모델에서 계수를 우선 예측하고, 0으로부터 출발의 통계학적 유의성에 대해 테스트하였다.
임의 시간에서 한 개 마커의 연합 테스트 실행에 추가하여, 단상형 연합 분석을 실행하여 밀접하게 서로 연관된 다수의 마커를 연구할 수도 있다. 단상형연합 테스트는 테스트된 마커가 질병의 원인 돌연변이는 아니지만 이와 같은 돌연변이와 연관 비평형에 있을 때 유전자형 또는 대립 형질 연합보다는 더 나을 것이다. 테스트는 자궁내막증이 단상형상에 대립유전자의 복합에 의한 것이라면 더 효과가 있을 것이다. 단상형 연합을 효과적으로 실행하기 위하여, 마커-마커 연관 비평형 매체, D' 와 r2은 단상형 구조를 밝히기 위해 유전자내 마커에 대해 일반적으로 계산된다. 연관 비평형에서 최근 연구에 따르면(Daly et al, Nature Genetics, 29, 232-235, 2001) 유전자내 SNPs는 블록 패턴으로 조직화되어 있고, 고도의 연관 비평형이 블록내에 존재하고, 블록간에는 연관 비평형이 거의 존재하지 않는다. 자궁내막증과 단상형 연합은 블록이 일단 밝혀진 이후 이와 같은 블록들을 이용하여 실행할 수 있다.
단상형 연합 테스트는 대립 유전자와 유전자형 연합 테스트와 유사한 방식으로 실행될 수 있다. 유전자에서 각 단상형은 다중 대립유전자 마커에 대립유전자와 유사하다. 당업자는 환자 및 대조군에서 단상형 빈도를 비교하거나 상이한 단상형 짝과 연합된 유전자를 테스트할 수 있다. “haplo.score”프로그램을 이용하여 단상형에서 스코어 테스트를 실시하는 것도 제안된 바 있다(Schaid et al, Am. J. Hum. Genet., 70, 425-434, 2002). 이 방법에서, 단상형을 우선 EM 알고리즘으로 추론하고, 다른 인자들의 조정을 허용하는 일반화된 선형 모델 (GLM) 프레임워크로 score 테스트를 실행한다.
유전자 연합 테스트의 실행에서 중요한 결정은 테스트 p 값이 유의적 연합이 선언될 수 있는 수준에 도달할 때 유의적 수준을 결정하는 것이다. 후속 확인 테스트에서 포지티브 히트가 이어지는 예비 분석에서, 조정안된 p값이 <0.1(레이언트 사이드상에서 유의적 수준)을 이용하여 자궁내막증의 특정 표현형 특징과 SNP의 유의적 연합에 대한 가설을 만들 수 있을 것이다. p-값 <0.05(당분야에 통상적으로 사용되는 유의 수준)은 자궁내막증과 연합된 것으로 간주되는 SNP에서 얻는 것이 적절하다. 연합을 선언하기 위해서 p-값이 <0.01 (스트린젼트 사이드상에 유의 수준)이 수득되는 것이 더욱 바람직하다. 오류 발견율(false discovery rates)을 조절하기 위한 순열검증(Permutation tests)을 추가 이용할 수도 있다. (Benjamini and Hochberg, Journal of the Royal Statistical Society, Series B 57, 1289-1300, 1995, Resampling-based Multiple Testing, Westfall and Young, Wiley (1993)). 다중성(multiplicity)을 제어하기 위한 이와 같은 방법은 테스트가 의존적이며, 오류 발견률의 제어가 실험별 오류율(experiment-wise error rates)의 조절과 반대로 충분한 경우에 바람직할 것이다.
통계학적으로 유의성이 있는 마커를 실험 단계에서 확인된 후에, 상이한 집단에서 얻은 샘플들을 이용한 복제 연구에서, 상이한 연구들의 증거를 복합함으로써 메타-분석을 실행할 수 있다(Modern Epidemiology, Lippincott Williams & Wilkins, 1998, 643-673). 이용가능하다면, 동일한 SNP에 대한 당분야에 공지된 연합 결과도 메타-분석에 포함될 수 있을 것이다.
유전자 타이핑과 자궁내막증 상태 분류 모두가 오류에 관계되어 있기 때문에 감도 분석을 실행하여 odd 비율과 p-값이 유전자 타이핑 및 자궁내막증 분류 오류률상에 다양한 추정치에 어떻게 변화되는지를 볼 수 있을 것이다.
유전적이든 아니든 개별 위험 인자들이 자궁내막증의 성향으로 발견되면, 그 다음 단계는 개체가 연합된 SNP와 다른 비-유전적 위험 인자들의 유전자형에 의존하는 카테고리(가령, 자궁내막증이거나 아니거나)를 예측하기 위한 분류/예측 과정을 셋업하는 것이다. 분리 형질에 대한 로지스틱 회귀와 연속 형질에 대한 선형 회귀는 이와 같은 작업에 표준 기술이다(Applied Regression Analysis, Draper and Smith, Wiley (1998)). 또한, 분류를 세팅하는데 다른 기술들도 이용할 수 있다. 이와 같은 기술에는 MART, CART, 신경 네트워크 및 상이한 방법들의 실행을 비교하는데 적절한 구별 분석이 포함되나 이에 국한시키지는 않는다.(The Elements of Statistical Learning, Hastie, Tibshirani & Friedman, Springer (2002)).
자궁내막증 진단 및 성향 스크리닝
유전형과 자궁내막증 관련 표현형 사이에 연관/관련상에 정보는 몇 가지 방법으로 이용할 수 있을 것이다. 예를 들면, 치료를 할 질병에 대한 성형과 하나 또는 그 이상 SNP 사이에 통계학적 유의성이 매우 큰 경우에, 개체에서 이와 같은 유전자형의 감지로 특정 치료를 정판하거나 또는 개체의 정규적인 모니터링의 제도를 정판할 수 있을 것이다. 미약하지만 SNP와 사람 질병사이에 여전히 통계학적 연합이 있는 경우, 즉각적인 치료 개입 또는 모니터링은 감응성 대립유전자 또는 SNP를 감지한 후에도 정판되지 않을 수도 있다.
본 발명의 SNP는 여러 가지 상이한 방식으로 개체에서 자궁내막증에 기여할 수 있다. 단백질 코딩 서열내에 약간의 변형이 일어나고, 단백질 구조에 영향을 주어 자궁내막증 표현형에 기여한다. 다른 변형이 넌-코딩 부분에 일어나면 복제, 전사 또는 해독에 영향을 통하여 간접적으로 표현형적인 효과를 발휘할 수도 있다. 단일 SNP가 하나의 표현형 형질보다 더 영향을 줄 수 있다. 유사하게, 하나의 표현형 형질은 상이한 유전자들에 있는 다중 SNP에 의해 영향을 받을 수 있을 것이다.
단상형은 특정 게놈 부분이 연관 비평형-계 SNP 연합 분석에서 특정 표현형에 영향을 주는 유전자 좌를 가지고 있는 지를 결정하기 위해 소수의 SNP를 유전자타이핑하는 것에 특히 유용하다.
연관 비평형 (LD)은 주어진 집단에서 각 대립유전자의 별도 발생 빈도로부터 예측되는 것이상의 빈도에서 두 개 또는 그 이상의 상이한 SNP 부위에 대립유전자(가령 선택적 뉴클레오티드)의 공동-유전을 말한다. 독립적으로 유전되는 두 개 대립유전자의 공동-발생의 예측 빈도는 두 번째 대립유전자의 빈도를 첫 번째 대립유전자의 빈도에 곱한 것이다. 예측 빈도에서 공동-발생되는 대립유전자를 “연관 평형”에 있다고 말한다. 대조적으로, LD 는 두 개 또는 그 이상의 상이한 SNP 위치에 대립유전자들 사이에 임의 비-임의(non-randomly) 유전자 연합을 말하는데, 이는 일반적으로 염색체를 따라 두 개 위치의 물리적 근접성으로 인한 것이다. LD는 주어진 염색체에서 두 개 또는 그 이상의 SNP가 서로 물리적으로 가까이 있을 때 발생하고, 따라서 이들 SNP 부위에서 대립유전자는 여러 세대동안 분리되지 않는 경향을 유지할 것이고, 결과적으로 한 SNP 부위에 특정 뉴클레오티드(대립유전자)는 근처의 다른 SNP 부위에 특정 뉴클레오티드(대립유전자)와 비-임의 연합을 보일 것이다. 그러므로, SNP 부위중 하나를 유전자 타이핑하면 LD에 있는 다른 SNP 부위의 유전자타이핑과 거의 동일한 정보를 제공할 것이다.
진단 목적으로, 특정 SNP 부위가 자궁내막증 진단에 유용한 것으로 발견되면, 당업자는 이 부위를 가진 LD에 있는 다른 SNP 부위도 이 질병 진단에 유용할 것임을 인지할 것이다. 일부 SNP가 다른 것보다 좀더 긴밀하게 연합된다는 결과(가령, 더 강한 LD에서)를 가지는 두 개 또는 그 이상의 SNP 사이에 다양한 정도의 LD를 만날 것이다. 또한, 염색체를 따라 LD가 연장된 이상의 물리적 거리는 게놈의 상이한 부분간에 다르기 때문에, LD 생성에 필수적인 두 개 또는 그 이상의 SNP 부위간에 물리적인 구별 정도는 게놈의 상이한 부분 사이에 다를 것이다.
진단용으로, 실질적인 질병 원인(원인성) 변형은 아니지만, 이와 같은 원인성 변형을 가진 LD에 있는 변형(가령, SNP 및/또는 단상형) 또한 유용할 것이다. 이와 같은 경우에, 원인성 변형을 가진 LD에 있는 변형의 유전자타입은 원인성 변형의 유전자 타입의 전조이며, 결과적으로 원인성 SNP에 영향을 받는 표현형(가령, 자궁내막증)의 전조이다. 따라서, 원인성 변형을 가진 LD에 있는 변형 마커는 진단 마커로 유용하며, 실질적인 변형이 공지된 경우 특히 유용하다.
사람 게놈에서 연관 비평형은 International HapMap Consortium, “A haplotype map of the human genome” Nature October 27 2005; 437:1299-1320; Wall et al., “haplotype blocks and linkage disequilibrium in the human genome”, Nat Rev Genet. 2003 August;4(8):587-97; Garner et al., “On selecting marker for association studies: patterns of linkage disequilibrium between two and three diallelic loci”, Genet Epidemiol. 2003 January;24(1):57-67; Ardlie et al., “Patterns of linkage disequilibrium in the human genome”, Nat Rev Genet. 2002 April;3(4):299-309 (erratum in Nat Rev Genet 2002 July;3(7):566); and Remm et al., “High-density genotyping and linkage disequilibrium in the human genome using chromosome 22 as a model”; Curr Opin Chem Biol. 2002 February;6(1):24-30을 통하여 리뷰할 수 있다.
특정 SNPs 및/또는 SNP 단상형과 자궁내막증 표현형, 가령, 자궁내막증에 기여 또는 연합으로 본 발명의 SNP는 특정 유전자형의 결과로써 감지가능한 형질, 가령 자궁내막증을 표현하는 개체 또는 개체의 유전자타입이 이와 같은 유전자 타입을 가지고 있지 않는 개체와 비교하였을 때 후속 시점에서 감지가능한 형질의 발전 위험이 증가 또는 감소된 개체를 확인할 수 있는 우수한 진단 테스트를 개발하는데 이용할 수 있다. 여기에서 설명한 것과 같이, 진단은 단일 SNP 또는 SNP 그룹에 근거할 수 있다. 다수의 SNP의 복합 감지(예를 들면, 표 1-196에서 제공된 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 24개, 25개, 30개, 32개, 48개, 50개, 64개, 96개, 100개 또는 그 사이의 임의 다른 수의 SNP 또는 이 이상의 수의 SNP)를 통하여 일반적으로 정확한 진단 가능성을 증가시킨다. 예를 들면, 자궁내막증과 관련된 것으로 알려진 단일 SNP의 존재는 자궁내막증을 가진 또는 발생 위험에 처한 1.5의 odd 비율을 나타내고, 반면에 다섯 개 SNP의 감지는, 이들 각각이 자궁내막증과 연관이 있는 경우, 개체가 자궁내막증을 가지고 있거나 발생 위험에 있는 9.5의 odd 비율을 나타낸다. 진단 정확성을 추가 증가시키기 위해 또는 성형 스크리닝의 정확성을 증가시키기 위해, 본 발명의 SNP 분석을 성별 및 나이와 같은 자궁내막증의 다른 위험 인자들 또는 다른 변형과 복합시킬 수도 있다.
물론, 자궁내막증 치료 또는 진단에 숙지된 당업자는 본 발명이 자궁내막증의 발생 위험에 있는(또는 다소 위험이 적은) 개체의 절대적인 동정을 제공하지는 못하나 통계학적으로 유의적 연합 결과에 근거하여 자궁내막증의 발생 가능성 또는 증가(또는 감소) 정도를 나타낼 수는 있다는 것을 인지할 것이다. 그러나, 이와 같은 정보는 초기 예방 치료의 시작 또는 하나 또는 그 이상의 유의적인 SNP 또는 SNP 단상형을 가지는 개체가 초기 단계에서 자궁내막증을 확인하고, 치료를 시작할 수 있도록 자궁내막증의 출현 또는 변화를 모니터하기 위해 정규적인 신체 검사를 받게하는데 이용될 수 있기 때문에 상당히 가치가 있다.
본 발명의 진단 기술은 테스트 개체가 감지가능한 형질의 발생 위험의 증가 또는 감소와 연합된 SNP 또는 SNP 패턴을 가지는지 또는 특정 변형/돌연변이의 결과로써 감지가능한 형질로 개체가 고통을 받는지를 결정하는 다양한 방법을 이용할 수 있고, 이와 같은 방법은 단상형, 가계연구, 단일 정자 DNA 분석 또는 체세포 하이브리드를 위한 개별 염색체 분석이 가능한 방법들을 포함한다. 본 발명의 진단을 이용하는 분석된 형질은 자궁내막증과 연관된 병리 및 질병에서 흔히 관찰되는 감지가능한 형질이 될 수 있다.
본 발명의 또 다른 측면은 개체가 하나 또는 그 이상의 형질의 발생 위험(또는 위험이 적은)에 있는지를 또는 개체가 특정 형질 원인 또는 형질-영향 대립유전자을 보유하는 결과로써 하나 또는 그 이상의 형질을 발현시키는지를 결정하는 방법에 관계한다. 이들 방법들은 일반적으로 하나 또는 그 이상 SNP에 뉴클레오티드가 존재하는 지를 결정하기 위해 개체로부터 핵산 샘플을 얻고, 핵산 샘플의 검사에 관련되는데. 이때 검사된 뉴클레오티드는 특정 형질 원인 또는 형질-영향 대립유전자를 보유한 결과로써 개체가 형질을 발현시킨다는 암시 또는 형질 발생의 위험의 증감을 암시한다.
본 발명의 SNP는 자궁내막증의 신규한 치료요법적 표적을 동정하는데 이용될 수도 있다. 예를 들면, 질병-연합된 변이체(“변이체 유전자들”) 또는 이들의 산물 뿐만 아니라 이들 변이체 유전자 또는 이의 산물과 상호작용하는 또는 이에 의해 직간접적으로 조절되는 유전자 및 이의 산물들도 자궁내막증 치료 또는 자궁내막증의 개시를 예방 또는 지연시키기 위한 치료제 개발의 표적이 될 수 있다. 치료제는 표적 유전자 또는 유전자 산물의 기능 또는 수준을 조절하는 소분자, 단백질, 단백질 단편들 또는 펩티드, 항체, 핵산 또는 이의 유도체 또는 모방체를 포함할 수 있을 것이다.
본 발명의 SNP/단상형은 약물 개발 과정의 많은 측면을 개선시키는데 이용될 수도 있다. 예를 들면, 이들의 SNP 유전자형에 근거하여 임상 시험을 위해 개체를 선별할 수 있다. 장치 또는 약물에 반응할 것으로 보이거나 이로부터 이익을 얻을 것으로 보이는 SNP 유전자형을 가진 개체는 임상 시험에 포함될 수 있을 것이며, 장치 또는 약물에 반응이 적거나 반응하지 않을 것으로 보이는 SNP 유전자형을 가지는 개체는 임상 시험으로부터 제거될 것이다. 이는 임상 시험의 안정성을 개선시킬 뿐만 아니라, 임상 시험이 통계적으로 유의적인 효과를 설명하는 기회를 보강할 것이다. 또한, 본 발명의 SNP는 기존에 개발된 장치 또는 약물이 임상 시험에서 왜 양호하게 실행되지 못하였는지를 설명할 수 있고, 임상 시험에서 기존에 잘 실행되지 못했던 약물로부터 실익을 얻을 수 있는 하위군을 확인하는데 도움이 되어, 이미 개발된 치료요법적 방법 또는 약물을 “구제”하고, 이들 방법 또는 약물을 자궁내막증 환자 군에 이용할 수 있도록 할 것이다.
약학 조성물
여기에서 설명하는 핵산 분자를 인코딩하는 자궁내막증-연합 단백질중 임의 것은 자궁내막증 및 관련 병을 치료하기 위한 치료제 표적(또는 이를 치료 화합물 자체로 이용)으로 이용할 수 있고, 본 내용으로 치료 화합물(가령, 소분자, 치료 단백질, RNAi, 및 안티센스 분자 등)은 이와 같은 치료 표적을 겨냥하여 개발될 수 있도록 한다.
SNP -포함 핵산 분자에 의해 인코드되는 변이체 단백질
본 발명은 SNP-포함 핵산 분자를 제공하는데, 이들중 일부는 당분야에 공지된 단백질(가령 와일드 타입)과 비교하였을 때 변이체 아미노산 서열을 가지는 단백질을 인코드한다. 이와 같은 변이체들을 여기에서 일반적으로 본 발명의 변이체 단백질/펩티드/폴리펩티드 또는 변형 단백질/펩티드/폴리펩티드라고 한다. 여기에서“단백질”, “펩티드”, 및 “폴리펩티드”는 서로 호환된다.
본 발명의 변이체 단백질은 예를 들면 여기에서 개시된 cSNP중 임의 위치에 비-동의성 뉴클레오티드 치환에 의해 인코드될 수도 있다. 또한, 변이체 단백질은이의 발현, 구조 및/또는 기능이 여기에서 개시된 SNP에 의해 변경될 수 있는데, 예를 들면 중단 코드를 만들거나 파괴하는 SNP, 스플라이싱에 영향을 주는 SNP 그리고 조절 요소 즉, 프로모터, 인헨서 또는 전사 인자 결합 도메인에 SNP에 의해 변경된 단백질을 포함한다.
변이체 단백질의 용도
본 발명의 변이체 단백질은 다양한 방법으로 이용될 수 있는데, 고처리량 스크리닝을 위한 다중 단백질 패널에서 변이체 단백질의 생물학적 활성을 검사하기 위하여; 항체를 만들거나 또 다른 타입의 면역 반응을 유도하기 위하여; 생물학적 유체에서 변이체 단백질(또는 이의 결합 파트너)의 정량적인 수준을 결정하기 위해 계획된 검사에서 시약(라벨된 시약 포함)으로 이용; 마커가 선호적으로 발현되는(구성적으로 또는 자궁내막증의 조직 분화 또는 발생 또는 자궁내막증 상태에서) 조직 또는 세포의 마커로 이용; 그리고 치료제를 스크리닝하기 위한 표적으로 이용; 사람 개체에 투여될 직접적인 치료요법제로의 용도 등이 포함되나 이에 국한시키지는 않는다. 여기에서 설명하는 임의 변이체 단백질은 시약 등급으로 개발되거나 연구 산물로써 시판하기 위한 키트 포맷으로 개발될 수도 있다. 상기 언급된 용도를 실행하는 방법은 당분야에 잘 공지되어 있다.(Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Sambrook and Russell, 2000, and Methods in Enzymology: Guide to Molecular Cloning Techniques, Academic Press, Berger, S. L. and A. R. Kimmel eds., 1987).
컴퓨터 관련된 구체예들
본 발명에서 제공되는 SNP는 이를 사용하기 위해 다양한 매체로 “제공”될 수 있다. 이 단락에서 이용된 바와 같이, “제공된”은 본 발명의 SNP 정보를 포함하는 분리된 핵산 이외에 제품(manufacture)를 말한다. 이와 같은 제품는 자연상태 또는 정제된 상태로 존재할 때 SNP 또는 이의 하위 세트를 검사하는데 바로 사용되지 않는 매체를 이용하여 제조물을 검사할 수 있도록 한 형태의 SNP 정보를 제공한다. 이와 같은 형태로 제공될 수 있는 SNP 정보에는 본 발명에 의해 제공되는 SNP 정보 예를 들면, 변형 핵산 및/또는 아미노산 서열 정보, 관찰된 SNP 대립유전자에 대한 정보, 선택적 코돈, 집단, 대립유전자 빈도, SNP 타입 및/또는 영향을 받은 단백질 또는 표 1 또는 2 또는 표 3-196에 있는 본 발명에서 제공되는 임의 다른 정보를 포함할 수도 있다.
이와 같은 구체예의 한 가지 응용에서, 본 발명의 SNP는 컴퓨터 판독가능한 매체상에 기록될 수도 있다. 여기에서 사용된 바와 같이, “컴퓨터 판독가능한 매체(computer readable medium)”는 컴퓨터에 의해 판독되고 바로 접근되는 임의 매체를 말한다. 이와 같은 매체에는 플로피 디스크, 하드 디스트 저장 매체, 마그네틱 데이프와 같은 자성 저장 매체; CD-ROM과 같은 광학 저장 매체; RAM 및 ROM와 같은 전기적 저장 매체등이 포함되나 이에 국한시키지는 않는다. 당업자는 현재 공지된 컴퓨터 판독가능한 매체중 임의 것을 어떻게 이용하여 본 발명의 뉴클레오티드 서열이 기록된 컴퓨터 판독가능한 매체를 포함하는 제품을 만드는지 바로 인지할 수 있을 것이다. 이와 같은 매체를 본 출원에 제공하는데, 즉, 본 출원에는 서열 리스트 ASCII 텍스트 포맷상에 기록된(또는 제공된) SNPs를 포함하는 핵산 서열( 및 인코드된 단백질 서열)과 상세한 SNP 및 서열 정보를 포함하는 첨부 표를 포함한 컴퓨터 판독가능한 매체가 포함된다.
여기에서 사용된 바와 같이, “기록된(recorded)”은 컴퓨터 판독가능한 매체상에 정보를 저장하는 과정을 말한다. 당업자는 본 발명의 SNP 정보를 포함하는 제품을 만들기 위하여 컴퓨터 판독가능한 매체상에 정보를 기록하는 현재 공지된 임의 방법을 용이하게 채택할 수 있을 것이다.
당업자는 다양한 데이터 저장 구조를 이용하여 본 발명의 뉴클레오티드 또는 아미노산 서열을 가지는 컴퓨터 판독가능한 매체를 만들 수 있다. 데이터 저장 구조의 선택은 저장된 정보에 접근하기 위해 선택되는 매체에 일반적으로 기초할 것이다. 또한, 다양한 데이터 처리 프로그램의 다양성 및 포맷을 이용하여 컴퓨터 판독가능한 매체상에 본 발명의 뉴클레오티드/아미노산 서열 정보를 저장할 수 있을 것이다. 예를 들면, 서열 정보는 워드 프로세스 텍스트 파일로 제공되고, WordPerfect 및 Microsoft Word와 같은 시판되는 소프트웨어에서 포멧되고, OB2, Sybase, Oracle, 또는 이와 유사한 것과 같은 데이터베이스 어플리케이션에 저장될 수도 있을 것이다. 당업자는 본 발명의 SNP를 기록한 컴퓨터 판독가능한 매체를 얻기 위하여 임의 수의 데이터 프로세서 구조 포맷(가령, 텍스트 파일 또는 데이터베이스)을 개조할 수 있을 것이다.
컴퓨터 판독가능한 매체에 본 발명의 SNP를 제공함으로써, 당업자는 다양한 목적으로 SNP 정보에 정기적으로 접근할 수 있다. 공개된 컴퓨터 소프트웨어는 당업자가 컴퓨터 판독가능한 매체에 제공된 서열 정보에 접근할 수 있도록 한다. 공개된 이용가능한 컴퓨터 소프트웨어의 예로는 BLAST (Altschul et at, J. Mol. Biol. 215:403-410 (1990)) 및 BLAZE (Brutlag et at, Comp. Chem. 17:203-207 (1993)) 서치 알고리즘이 포함된다.
본 발명은 또한 여기에서 제공되는 SNP 정보를 포함하는 시스템, 특히 컴퓨터 기반 시스템을 제공한다. 이와 같은 시스템은 다수의 SNP 위치, 다수의 개체로부터 SNP 유전자형상에 정보와 같은 정보를 보관 및/또는 분석하도록 고안될 수도 있다. 본 발명의 SNP 정보는 가치있는 정보원이 된다. 컴퓨터 기반 시스템에 저정된/분석된 본 발명의 SNP 정보를 집단에서 SNP 대립유전자의 빈도를 결정 또는 분석하고, 자궁내막증 유전자를 매핑하고, 유전자형-표현형 연합 연구, 단상형으로 SNP 그룹나누기, 특정 치료 반응에 SNP 단상형의 상관관계 또는 다양한 다른 생체정보, 약물유전체 연구 또는 약물 개발과 같은 컴퓨터-집중 어플리케이션에 이용할 수도 있을 것이다.
여기에서 사용된 바와 같이, “컴퓨터-기반 시스템”은 본 발명의 SNP 정보를 분석하는데 이용되는 하드웨어 수단(means), 소프트웨어 수단 및 데이터 저장 수단을 말한다. 본 발명의 컴퓨터 기반 시스템의 최소 하드웨어 수단은 일반적으로 중앙 처리 장치(CPU), 입력 수단, 출력 매체 및 데이터 저장 수단을 포함한다. 당업자는 현재 이용가능한 임의 한 가지 컴퓨터 기반 시스템이 본 발명의 사용에 적합하다는 것을 인지할 것이다. 이와 같은 시스템을 임의 추가 실험없이 CD-R에 제공된 SNP 정보 또는 이의 서브세티를 이용하여 본발명의 시스템으로 변화시킬 수 있을 것이다.
상기에서 명시된 바와 같이, 본 발명의 컴퓨터 기반 시스템은 본 발명의 SNP가 저장된 데이터 저장 수단과 서치 수단을 지원하고 실행하기 위한 필수 하드웨어 수단 및 소프트웨어 수단을 포함한다. 여기에서 사용된 바와 같이, “데이타 저장 수단”는 본 발명의 SNP 정보를 저장하는 메모리 또는 본 발명의 SNP 정보가 저장된 제품에 접근할 수 있는 메모리 접근 수단을 말한다.
여기에서 사용된 바와 같이, “서치수단”은 데이터 저장 수단내에 보관된 SNP 정보에 근거하여 표적 서열내 SNP를 동정하거나 분석하기 위해 컴퓨터 기반 시스템상에서 실행되는 하나 또는 그 이상 프로그램 또는 알고리즘을 말한다. 서치 수단을 이용하여 표적 서열내에 특정 SNP 위치에 어떤 뉴클레오티드가 있는지를 결정할 수 있을 것이다. 여기에서 사용된 바와 같이, “표적 서열”은 조사될 또는 의문의 SNP를 포함하는 임의 DNA일 수 있다.
여기에서 사용된 바와 같이, “표적 구조 모티프” 또는 “표적 모티프”는 SNP 위치를 포함하는 임의 선택된 서열 또는 SNP 위치를 포함하는 서열 복합으로, 이때 서열은 표적 모티프 폴딩시에 형성되는 3차원 모양에 근거하여 선택된다. 당분야에 공지된 다양한 표적 모티프들이 있다. 단백질 표적 모티프에는 효소 활성 부위 및 시그날 서열이 포함되나 이에 국한시키지는 않는다. 핵산 표적 모티프에는 프로모터 서열, 헤어핀 구조 및 유도성 발현 요소들(단백질 결합 서열)이 포함되나 이에 국한시키지는 않는다.
입력 및 출력 수단을 위한 다양한 구조적 포맷을 이용하여 본 발명의 컴퓨터 기반 시스템상에 정보를 입력하고 출력할 수도 있다. 출력 수단의 예시적인 포맷은 관심의 특정 SNP 위치에서 특정 뉴클레오티드 존부를 나타내는 디스플레이다. 이와 같은 프리젠테이션은 많은 SNP에 대해 동시에 신속하고, 이원적 스코어링 시스템을 제공할 수 있다.
연합 연구의 개요
자궁내막증은 자궁의 외측부위에서 자궁내막(선 및 기질)에 존재하는 것을 특징으로 하는 소모성 질환으로 전체 여성의 약 14%가 이 질환을 앓는 것으로 추측된다. 자궁내막증은 통증, 국소 염증, 반흔 및 출산력 감소를 흔히 유도한다. 본 실시예는 자궁내막증과 연관된 SNP 형태에 유전자 위치를 확인한다.
자궁내막증과 연관된 SNP를 동정하기 위해 게놈 전반 연합 연구(Genome Wide Association study)를 실행하였다. 연구에는 Affymetrix 500K GeneChip technology 플랫포옴을 이용하여 총 500,568명의 개체에서 유전자형 정보를 확인하였다. 500K GeneChip 시스템은 두 개의 별도 검사, 즉 Nsp와 Sty 칩으로 구성되는데, 각각 262,264 및 238,304개의 SNPs에 신호를 보내도록 계획되었다. 자궁내막증으로 진단된 170명의 개체를 테스트하고, 이를 Nsp 칩을 이용하여 테스트하고, 734명의 대조군 개체와 비교하며, 자궁내막증으로 진단을 받은 169개체는 Sty 칩을 이용하여 테스트하고, 738명의 대조군과 비교하였다. 유전자 연합을 테스트하기 위해 특정하게 개발된 통계학적 소프트웨어 툴(tool), PLINK를 이용하여 각 SNP에서 자궁내막증과 통계학적으로 유의적 연합을 보인 후보 SNP 세트를 동정하게 할 수 있는 p값을 계산하였다. 연구(환자 및 대조군)에 모든 멤버들은 동일한 지형적 지역에서 모집하였고, 카프카스 사람(Caucasian)이며 일반적으로 북서유럽 계통이다.
전체 게놈 스캐닝
Affymetrix GeneChip 500K 매핑(mapping) 어레이를 이용하여 전체 게놈을 스캔하였다. 간략하게 설명하면, 250ng 게놈 DNA를 NspI 또는 StyI 제한 엔도뉴클라제로 절단하고, 절단된 단편들을 보편적 서열(universal sequence)을 포함하는 어뎁터에 결찰시켰다. 결찰된 산물들은 중합효소 쇄 반응(PCR)을 이용하여 증폭시켜 길이가 250-2000bp의 단편들을 증폭시켰다. PCR 산물들을 정제하고, 표준 농도로 희석하였다. 추가로, PCR 산물들을 DNase 효소를 이용하여 길이가 약 25-150bp인 단편으로 만들었다. 이와 같은 단편을 만드는 과정으로 게놈 샘플의 복잡성이 감소되었다. 단편화된 PCR 산물들에 바이오틴/스트렙타아비딘 시스템으로 라벨을 붙여 마이크로어레이에 하이브리드시켰다. 하이브리드 반응 후에, 어레이를 착색시키고, 스트리젼트를 증가시키는 일련의 세척으로 비-특이적 결합들이 제거된다. 유전다타입은 Affymetrix GCS 3000 스캐너에서 형광 시그날 감지에 의해 결정되었다. 마지막으로 Affymetrix PowerTool 소프트웨어에 포함된 BRLMM 알고리즘을 이용하여 유전자형의 이름을 붙였다.
품질과 연합에 대한 SNPs 선별
SNP는 게놈에서 단일 뉴클레오티드 - 아데닌 (A), 티민 (T), 시토신 (C) 또는 구아닌 (G)이 개체가에 상이할 때 발생되는 DNA 서열 변이다. 이와 같은 변이 는 집단에서 최소 1% 발생되어야 SNP로 간주된다. 집단에서 1% 미만으로 발생되는 변이는 이들이 질병의 원인이 되건 아니건 간에 돌연변이로 간주된다. SNPs는 모든 인간 유전자 변이의 90%를 구성하고, 인간 게놈을 따라 매 300 내지 1000개 염기에서 발생한다. 평균, 매 3개 SNP중 2개는 시토신 (C)이 티민 (T)으로 대체된다. 개별 칩에 유요한 것으로 간주되는 데이터에서, 두 개 내부 품질 조절 수단이 이용되었다; SNP 유전자타입은 반드시 전체적인 콜 레이트(call rate)가 >93%이어야 하고, 샘플의 정확한 성은 X 염색채 SNP의 이형접합성에 근거하여 결정될 필요가 있었다. 또한, 모든 개체에서 최소 96% 콜 레이트를 가지지 않는 SNP는 유전자 타이핑 오류를 가질 가능성 때문에 제거하였다. 환자 및 대조군에서 1% 겉보기 변이 미만을 가지는 단형성(monomorphic)인 SNP들도 분석에서 제거되었다. 또한, 0.001의 p값 역치를 이용하여, 대조군에서만 Hardy-Weinberg 평형 테스트에 실패한 SNP들도 제거되었다. 이와 같은 SNP를 제거한 후에, 분석에는 382,851개 SNPs가 이용되었다. PLINK 및 Haploview 소프트웨어를 이용하여 유의성에 대해 유전자 타입을 분석하였다.
GeneChip 마이크로어레이는 피복된 석영 표면상에 특정 위치에서 화학적으로 합성된 작은 DNA 단편들 (프로브로 불린다)로 구성된다. 각 프로브가 합성되는 정확한 위치를 피쳐(feature)로 부르고, 수백만개의 피쳐들이 한 개 어레이에 포함될 수도 있다. 사람 SNP를 포함하는 것으로 공지된 서열을 제시하는 프로브는 신회성, 감응성 및 특이성에 근거하여 Affymetrix로 선별되었다. 이와 같은 기준에 추가하여, 거의 동일한 간격으로 사람 게놈을 커버하도록 프로브가 선택되었다.
자궁내막증 감염된 개체들의 동정
한명의 의사가 의료 기록을 검토한 후에 개체가 자궁내막증을 가지고 있다고 결정내렸다. 이 연구에서, 시각적으로 질병이 확인된(복강경 또는 다른 외과적 수단의 개입에 의해) 환자들만 환자군에 포함되었다. 대조군에는 자궁내막증의 전력이 없는 개체들이 포함되었다.
자궁내막증 연합된 SNPs
p-값으로 모든 남아있는 후보 SNP를 분류한 후에, p값이 0.001 또는 그 미만인 610개 SNPs를 프라이머 SNP로 선택하였다. 추가로, p값이 0.001 내지 0.005 사이의 2,048개 SNPs는 총 2,658개 자궁내막증 후보 SNP에 대한 서포팅 SNP로 선택하였다. 2,658개의 후보 SNP로부터 자궁내막증과 가장 강하게 연합된 SNP를 선별하기 위해, 두가지 연속 선별 단계를 이용하였다. 제1 선별, Anchor SNPs에는 2,658개의 후보 SNP 리스트에서 임의 SNP로부터 50kb이내에 위치한 값이 0.001 또는 이보다 강한 p값을 가진 임의 SNP들이 포함되었다. 제3의 SNP가 기존 SNP에 50kb 내에 위치한다면, 이 군은 새로운 SNP를 포함하기 위해 확장시켰다. 그룹에 추가 SNP가 추가되지 않을 때 까지 이와 같은 방법을 반복하여, 108개의 별도 Anchor Groups을 만들었다(표 1 참고). 두 번째 선별 단계에서, p값이 0.0001 또는 이보다 적은 나머지 88개 SNP들은 임의 이웃 SNP의 근접성 및 p값과 무관하게 선택되었다. 이와 같은 SNPs들은 싱글톤(Singleton) SNPs 라고 하였다(표 2 참고).
연관 비평형 블록
상기에서 설명한 것과 같이, 사람 게놈에는 아주 최소한의 재조합을 실행하 는 광범위한 연관 비평형 부분들이 포함된다. 그 결과, 표 1 및 표 2에 나열된 Anchor SNPs 또는 Singleton SNPs로써 동일한 LD 블록내에 위치한 임의 SNP는 정확한 진단학적 구별을 위한 단상형 정보와 원인성 돌연변이을 규명하는데 기여한다. 따라서, 연관 비평형에 의해, Anchor SNPs 또는 Singleton SNPs중 임의 것과 연관 비평형에 있는 것으로 결정된 추가 SNP 세트들을 표 3-196에 나타내었다. 특이적으로, Haploview 소프트웨어 패키지와 카프카스 사람들의 HapMap 데이타 세트(release 21)와 함께, 표 1 및 표 2에 나열된 108개 Anchor 블록과 88개 Singleton SNP 주변에서 LD 블록들을 동정하였다. 각 표 3-196는 표 1 및 표 2의 모든 SNP 주변 LD 블록내에 위치한 SNP를 나타낸다.
Figure 112009076496601-PCT00001
Figure 112009076496601-PCT00002
Figure 112009076496601-PCT00003
Figure 112009076496601-PCT00004
Figure 112009076496601-PCT00005
Figure 112009076496601-PCT00006
Figure 112009076496601-PCT00007
Figure 112009076496601-PCT00008
Figure 112009076496601-PCT00009
Figure 112009076496601-PCT00010
Figure 112009076496601-PCT00011
Figure 112009076496601-PCT00012
Figure 112009076496601-PCT00013
Figure 112009076496601-PCT00014
Figure 112009076496601-PCT00015
Figure 112009076496601-PCT00016
Figure 112009076496601-PCT00017
Figure 112009076496601-PCT00018
Figure 112009076496601-PCT00019
Figure 112009076496601-PCT00020
Figure 112009076496601-PCT00021
Figure 112009076496601-PCT00022
Figure 112009076496601-PCT00023
Figure 112009076496601-PCT00024
Figure 112009076496601-PCT00025
Figure 112009076496601-PCT00026
Figure 112009076496601-PCT00027
Figure 112009076496601-PCT00028
Figure 112009076496601-PCT00029
Figure 112009076496601-PCT00030
Figure 112009076496601-PCT00031
Figure 112009076496601-PCT00032
Figure 112009076496601-PCT00033
Figure 112009076496601-PCT00034
Figure 112009076496601-PCT00035
Figure 112009076496601-PCT00036
Figure 112009076496601-PCT00037
Figure 112009076496601-PCT00038
Figure 112009076496601-PCT00039
Figure 112009076496601-PCT00040
Figure 112009076496601-PCT00041
Figure 112009076496601-PCT00042
Figure 112009076496601-PCT00043
Figure 112009076496601-PCT00044
Figure 112009076496601-PCT00045
Figure 112009076496601-PCT00046
Figure 112009076496601-PCT00047
Figure 112009076496601-PCT00048
Figure 112009076496601-PCT00049
Figure 112009076496601-PCT00050
Figure 112009076496601-PCT00051
Figure 112009076496601-PCT00052
Figure 112009076496601-PCT00053
Figure 112009076496601-PCT00054
Figure 112009076496601-PCT00055
Figure 112009076496601-PCT00056
Figure 112009076496601-PCT00057
Figure 112009076496601-PCT00058
Figure 112009076496601-PCT00059
Figure 112009076496601-PCT00060
Figure 112009076496601-PCT00061
Figure 112009076496601-PCT00062
Figure 112009076496601-PCT00063
Figure 112009076496601-PCT00064
Figure 112009076496601-PCT00065
Figure 112009076496601-PCT00066
Figure 112009076496601-PCT00067
Figure 112009076496601-PCT00068
Figure 112009076496601-PCT00069
Figure 112009076496601-PCT00070
Figure 112009076496601-PCT00071
Figure 112009076496601-PCT00072
Figure 112009076496601-PCT00073
Figure 112009076496601-PCT00074
Figure 112009076496601-PCT00075
Figure 112009076496601-PCT00076
Figure 112009076496601-PCT00077
Figure 112009076496601-PCT00078
Figure 112009076496601-PCT00079
Figure 112009076496601-PCT00080
Figure 112009076496601-PCT00081
Figure 112009076496601-PCT00082
Figure 112009076496601-PCT00083
Figure 112009076496601-PCT00084
Figure 112009076496601-PCT00085
Figure 112009076496601-PCT00086
Figure 112009076496601-PCT00087
Figure 112009076496601-PCT00088
Figure 112009076496601-PCT00089
Figure 112009076496601-PCT00090
Figure 112009076496601-PCT00091
Figure 112009076496601-PCT00092
Figure 112009076496601-PCT00093
Figure 112009076496601-PCT00094
Figure 112009076496601-PCT00095
Figure 112009076496601-PCT00096
Figure 112009076496601-PCT00097
Figure 112009076496601-PCT00098
Figure 112009076496601-PCT00099
Figure 112009076496601-PCT00100
Figure 112009076496601-PCT00101
Figure 112009076496601-PCT00102
Figure 112009076496601-PCT00103
Figure 112009076496601-PCT00104
Figure 112009076496601-PCT00105
Figure 112009076496601-PCT00106
Figure 112009076496601-PCT00107
Figure 112009076496601-PCT00108
Figure 112009076496601-PCT00109
Figure 112009076496601-PCT00110
Figure 112009076496601-PCT00111
Figure 112009076496601-PCT00112
Figure 112009076496601-PCT00113
Figure 112009076496601-PCT00114
Figure 112009076496601-PCT00115
Figure 112009076496601-PCT00116
Figure 112009076496601-PCT00117
Figure 112009076496601-PCT00118
Figure 112009076496601-PCT00119
Figure 112009076496601-PCT00120
Figure 112009076496601-PCT00121
Figure 112009076496601-PCT00122
Figure 112009076496601-PCT00123
Figure 112009076496601-PCT00124
Figure 112009076496601-PCT00125
Figure 112009076496601-PCT00126
Figure 112009076496601-PCT00127
Figure 112009076496601-PCT00128
Figure 112009076496601-PCT00129
Figure 112009076496601-PCT00130
Figure 112009076496601-PCT00131
Figure 112009076496601-PCT00132
Figure 112009076496601-PCT00133
Figure 112009076496601-PCT00134
Figure 112009076496601-PCT00135
Figure 112009076496601-PCT00136
Figure 112009076496601-PCT00137
Figure 112009076496601-PCT00138
Figure 112009076496601-PCT00139
Figure 112009076496601-PCT00140
Figure 112009076496601-PCT00141
Figure 112009076496601-PCT00142
Figure 112009076496601-PCT00143
Figure 112009076496601-PCT00144
Figure 112009076496601-PCT00145
Figure 112009076496601-PCT00146
Figure 112009076496601-PCT00147
Figure 112009076496601-PCT00148
Figure 112009076496601-PCT00149
Figure 112009076496601-PCT00150
Figure 112009076496601-PCT00151
Figure 112009076496601-PCT00152
Figure 112009076496601-PCT00153
Figure 112009076496601-PCT00154
SEQUENCE LISTING <110> Juneau Biosciences, LLC. Ward, Kenneth Albertsen, Hans <120> Genetic Markers Associated With Endometriosis and Use Thereof <130> JBL-0001 <140> 12/056,754 <141> 2008-03-27 <150> 60/943,193 <151> 2007-06-11 <160> 492 <170> PatentIn version 3.5 <210> 1 <211> 33 <212> DNA <213> Homo sapiens <400> 1 taactgcact taattcyatg caggtaggaa act 33 <210> 2 <211> 33 <212> DNA <213> Homo sapiens <400> 2 acaccagtca attatcwctt ttgtcattgc cat 33 <210> 3 <211> 33 <212> DNA <213> Homo sapiens <400> 3 cctaactggt gtgggamtag cacgtctgaa ttc 33 <210> 4 <211> 33 <212> DNA <213> Homo sapiens <400> 4 ggcctgtctc caagtayggt caccttctga gtt 33 <210> 5 <211> 33 <212> DNA <213> Homo sapiens <400> 5 cctgaaattg aatggasagc ctgagtgcta caa 33 <210> 6 <211> 33 <212> DNA <213> Homo sapiens <400> 6 tccaccaaaa tcataarctc acttccaatg aag 33 <210> 7 <211> 33 <212> DNA <213> Homo sapiens <400> 7 ctactcttca caaacartcc tgagaagctg gat 33 <210> 8 <211> 33 <212> DNA <213> Homo sapiens <400> 8 aaagcaaaat acgacaraat agaacacaga aaa 33 <210> 9 <211> 33 <212> DNA <213> Homo sapiens <400> 9 ctaagggatt tatgtayaga ttgctaatgc cgt 33 <210> 10 <211> 33 <212> DNA <213> Homo sapiens <400> 10 atttataaat taaatckcat actgccaata aaa 33 <210> 11 <211> 33 <212> DNA <213> Homo sapiens <400> 11 aaaaactgga tctctaygtc atcctttgtc cct 33 <210> 12 <211> 33 <212> DNA <213> Homo sapiens <400> 12 gggcctgtgt tatgaawcct gtgcagtgga ttt 33 <210> 13 <211> 33 <212> DNA <213> Homo sapiens <400> 13 gtggggtgtt ggaaacrgtt cccaattagg agc 33 <210> 14 <211> 33 <212> DNA <213> Homo sapiens <400> 14 agtgaatcac agtgcaraac aaaaacacta aat 33 <210> 15 <211> 33 <212> DNA <213> Homo sapiens <400> 15 ttctaagtac aacagamcag gctgtttgca ata 33 <210> 16 <211> 33 <212> DNA <213> Homo sapiens <400> 16 atatattagt gaagtcsatg aaataaagga ttg 33 <210> 17 <211> 33 <212> DNA <213> Homo sapiens <400> 17 gagcctcttc attgccraga tctgattgtg caa 33 <210> 18 <211> 33 <212> DNA <213> Homo sapiens <400> 18 atgctggaag tatggaraca gtcaatgaaa act 33 <210> 19 <211> 33 <212> DNA <213> Homo sapiens <400> 19 atttctggca tggaaasatc attaaagaac caa 33 <210> 20 <211> 33 <212> DNA <213> Homo sapiens <400> 20 ctgatgtcag aattccraaa ttccaagtta ggg 33 <210> 21 <211> 33 <212> DNA <213> Homo sapiens <400> 21 ctcatcttcc tccccartat ggtctataag gtc 33 <210> 22 <211> 33 <212> DNA <213> Homo sapiens <400> 22 gagatgtctg gtgcaayaca ataggcacta aat 33 <210> 23 <211> 33 <212> DNA <213> Homo sapiens <400> 23 agagggcaat atttaawgac agaattttgg gtg 33 <210> 24 <211> 33 <212> DNA <213> Homo sapiens <400> 24 taataccgca ataaaayggg tcacacgaat ttt 33 <210> 25 <211> 33 <212> DNA <213> Homo sapiens <400> 25 aaattccttt ttgtcasaat ggatcagagt cat 33 <210> 26 <211> 33 <212> DNA <213> Homo sapiens <400> 26 accttttcat ccccccratg gataaactta tta 33 <210> 27 <211> 33 <212> DNA <213> Homo sapiens <400> 27 gccaaaaagc caaatgrcaa atgatagata ttt 33 <210> 28 <211> 33 <212> DNA <213> Homo sapiens <400> 28 cctttccttc tatcccyatt gcaccatgct gtc 33 <210> 29 <211> 33 <212> DNA <213> Homo sapiens <400> 29 tgtttgtcaa gtcacartat gagcaaatct atc 33 <210> 30 <211> 33 <212> DNA <213> Homo sapiens <400> 30 ccactctcca aatacarcat tctctcttac tct 33 <210> 31 <211> 33 <212> DNA <213> Homo sapiens <400> 31 atttctttga ttttaayggc taaacagtat tcc 33 <210> 32 <211> 33 <212> DNA <213> Homo sapiens <400> 32 tttgaaaaag ttcccartaa caatgacatt ttt 33 <210> 33 <211> 33 <212> DNA <213> Homo sapiens <400> 33 gagtgtatat tatttaratg gtcaccaaaa tct 33 <210> 34 <211> 33 <212> DNA <213> Homo sapiens <400> 34 gtgatctgga aagctasagt ttctcgtttc tgt 33 <210> 35 <211> 33 <212> DNA <213> Homo sapiens <400> 35 gttagcagac agcggarcta tgaattagac ttg 33 <210> 36 <211> 33 <212> DNA <213> Homo sapiens <400> 36 tcaggtccag tgaatcraaa tctgcatctt cac 33 <210> 37 <211> 33 <212> DNA <213> Homo sapiens <400> 37 tggggaggtg tgtctcraag ccaagggatg aca 33 <210> 38 <211> 33 <212> DNA <213> Homo sapiens <400> 38 aaacttttgt gatctaygta gtgcatcaca aat 33 <210> 39 <211> 33 <212> DNA <213> Homo sapiens <400> 39 cctgatgaag tttcacrctg tcccactcca gcc 33 <210> 40 <211> 33 <212> DNA <213> Homo sapiens <400> 40 aactgaaact gcagaartgg aaaccgtgga taa 33 <210> 41 <211> 33 <212> DNA <213> Homo sapiens <400> 41 aaccatgaat aatgaasaca tctaaatctc cta 33 <210> 42 <211> 33 <212> DNA <213> Homo sapiens <400> 42 gccagggctt aagagcyaag ttaatagccc tgg 33 <210> 43 <211> 33 <212> DNA <213> Homo sapiens <400> 43 agcctcagat ttcagargct aatcagaggt gac 33 <210> 44 <211> 33 <212> DNA <213> Homo sapiens <400> 44 acttttatgg aaacaaytaa accatggcac ttt 33 <210> 45 <211> 33 <212> DNA <213> Homo sapiens <400> 45 ctgtgtagta taattcraca gtgcaaacca cca 33 <210> 46 <211> 33 <212> DNA <213> Homo sapiens <400> 46 acttttcatt acctacygca gcaaatccaa aat 33 <210> 47 <211> 33 <212> DNA <213> Homo sapiens <400> 47 ttcagacgtc taggtcsatc acagacctac tga 33 <210> 48 <211> 33 <212> DNA <213> Homo sapiens <400> 48 aatattcttt gttttcycca cttaggatgg gat 33 <210> 49 <211> 33 <212> DNA <213> Homo sapiens <400> 49 aaatggcaga gaatgaract ttcaagtaat tgg 33 <210> 50 <211> 33 <212> DNA <213> Homo sapiens <400> 50 ttcttactag ctctgckaac ttggacagta act 33 <210> 51 <211> 33 <212> DNA <213> Homo sapiens <400> 51 ttccctgctg cgctgawaat tgactttccc tga 33 <210> 52 <211> 33 <212> DNA <213> Homo sapiens <400> 52 caagagcatc agcatarcag aacattaaaa tgg 33 <210> 53 <211> 33 <212> DNA <213> Homo sapiens <400> 53 acactgggat ttcttayagg ttgctccaca aag 33 <210> 54 <211> 33 <212> DNA <213> Homo sapiens <400> 54 ttatcagctt tactgaratt tctcatttgc tcc 33 <210> 55 <211> 33 <212> DNA <213> Homo sapiens <400> 55 gaaataaacc ttggacmgag aaaagcaggc aaa 33 <210> 56 <211> 33 <212> DNA <213> Homo sapiens <400> 56 gccccagcac taacatragt accccacaga gac 33 <210> 57 <211> 33 <212> DNA <213> Homo sapiens <400> 57 tcctattgga cactcayata gcacttatgc tat 33 <210> 58 <211> 33 <212> DNA <213> Homo sapiens <400> 58 ttcccaaagg cttttgraag agttgaaatt cat 33 <210> 59 <211> 33 <212> DNA <213> Homo sapiens <400> 59 ttggggaagg aaagagraga cagcaatcac agg 33 <210> 60 <211> 33 <212> DNA <213> Homo sapiens <400> 60 gactataaac ggctcasaat ggattgcaca ctg 33 <210> 61 <211> 33 <212> DNA <213> Homo sapiens <400> 61 acttcagatt atgagcraag gagaagccaa tgg 33 <210> 62 <211> 33 <212> DNA <213> Homo sapiens <400> 62 acttgccaac cagggaytaa agctattatc ttg 33 <210> 63 <211> 33 <212> DNA <213> Homo sapiens <400> 63 acttaattat tcagtayagt cctggaaatg ttt 33 <210> 64 <211> 33 <212> DNA <213> Homo sapiens <400> 64 aactatgttt cattcaygtt aatgctcaaa ttg 33 <210> 65 <211> 33 <212> DNA <213> Homo sapiens <400> 65 aggagagctg tcaccartaa cctgaccatg atg 33 <210> 66 <211> 33 <212> DNA <213> Homo sapiens <400> 66 gatttctcaa tggtagratc catcttctat tta 33 <210> 67 <211> 33 <212> DNA <213> Homo sapiens <400> 67 taaacaaagg gtaatamatt ggaagagcag tag 33 <210> 68 <211> 33 <212> DNA <213> Homo sapiens <400> 68 acaaaacaac atttacsctg aggaaggaac act 33 <210> 69 <211> 33 <212> DNA <213> Homo sapiens <400> 69 tgctttgctt tcagtarcat tagctgaagt aat 33 <210> 70 <211> 33 <212> DNA <213> Homo sapiens <400> 70 ttcaaaagat gacaacraaa tgacactttc taa 33 <210> 71 <211> 33 <212> DNA <213> Homo sapiens <400> 71 tttttctgat atttaaygta ccaacatatg ata 33 <210> 72 <211> 33 <212> DNA <213> Homo sapiens <400> 72 aaaatcacct ataggcrata atctggcata cat 33 <210> 73 <211> 33 <212> DNA <213> Homo sapiens <400> 73 aaaagttgtc tttaaartct tccaacaaaa agt 33 <210> 74 <211> 33 <212> DNA <213> Homo sapiens <400> 74 gtcctttgat gcagagyagt gtggtaccca gca 33 <210> 75 <211> 33 <212> DNA <213> Homo sapiens <400> 75 tccaagtggc cagttaraag tctaaaccag ggg 33 <210> 76 <211> 33 <212> DNA <213> Homo sapiens <400> 76 tatttcagat tgagaarcat tatgcaagat agc 33 <210> 77 <211> 33 <212> DNA <213> Homo sapiens <400> 77 gggaaaatgg tgcatascga ttaagtgacc tgt 33 <210> 78 <211> 33 <212> DNA <213> Homo sapiens <400> 78 agcaatattt gaagaartga agactaagaa tta 33 <210> 79 <211> 33 <212> DNA <213> Homo sapiens <400> 79 aaaaggagtg ttgacaraat caaaatattt gtt 33 <210> 80 <211> 33 <212> DNA <213> Homo sapiens <400> 80 tgtggatgga aactaastaa cttctagcaa agg 33 <210> 81 <211> 33 <212> DNA <213> Homo sapiens <400> 81 ttcttgtcga gcagaaracc agttgagacc act 33 <210> 82 <211> 33 <212> DNA <213> Homo sapiens <400> 82 ctgtgaatgt gtggacmctt acaacatttt atg 33 <210> 83 <211> 33 <212> DNA <213> Homo sapiens <400> 83 gacacttaga ctgaaaytat tgcccaagac ttg 33 <210> 84 <211> 33 <212> DNA <213> Homo sapiens <400> 84 aaattagcta agatggscaa tgtattgatc tag 33 <210> 85 <211> 33 <212> DNA <213> Homo sapiens <400> 85 acctataggt catttcrctc taaacttaaa aaa 33 <210> 86 <211> 33 <212> DNA <213> Homo sapiens <400> 86 ctgtgtagag caatgawtca caattatttt tgc 33 <210> 87 <211> 33 <212> DNA <213> Homo sapiens <400> 87 agaagacagt cgagctmaaa gatgggaaga taa 33 <210> 88 <211> 33 <212> DNA <213> Homo sapiens <400> 88 cctggccaaa tcttgaygtt aatatatctg ttt 33 <210> 89 <211> 33 <212> DNA <213> Homo sapiens <400> 89 ctcatactca catttaragt catttcttca ggg 33 <210> 90 <211> 33 <212> DNA <213> Homo sapiens <400> 90 gttcatacac ctagagwctc cttctatctg aag 33 <210> 91 <211> 33 <212> DNA <213> Homo sapiens <400> 91 ttctggtgtt ctgttayaca gtaggattgc tat 33 <210> 92 <211> 33 <212> DNA <213> Homo sapiens <400> 92 tatgtaagat gtaaggmagg actctatctg cag 33 <210> 93 <211> 33 <212> DNA <213> Homo sapiens <400> 93 ttctgcaagc aacatcraat ttttcaagat ctg 33 <210> 94 <211> 33 <212> DNA <213> Homo sapiens <400> 94 atggctttct tgaccartaa gtcttgttcc ttg 33 <210> 95 <211> 33 <212> DNA <213> Homo sapiens <400> 95 gtaagtccca gagataraag gcaccatttc tac 33 <210> 96 <211> 33 <212> DNA <213> Homo sapiens <400> 96 tcatcatttt attccaytca tttgtttgag tgt 33 <210> 97 <211> 33 <212> DNA <213> Homo sapiens <400> 97 agattatagc ctttaakaac acagacactt ata 33 <210> 98 <211> 33 <212> DNA <213> Homo sapiens <400> 98 acaaaccagt gagtgakaac catcctggat gcc 33 <210> 99 <211> 33 <212> DNA <213> Homo sapiens <400> 99 agtgctttgt ggacaarata actctttaat acc 33 <210> 100 <211> 33 <212> DNA <213> Homo sapiens <400> 100 gtcacttgtg aagtgayggg ccttaaatac cca 33 <210> 101 <211> 33 <212> DNA <213> Homo sapiens <400> 101 gaaggccgaa tatataygga atgaacgtgt caa 33 <210> 102 <211> 33 <212> DNA <213> Homo sapiens <400> 102 gctagtattg caaacakggt gaatgaagag cag 33 <210> 103 <211> 33 <212> DNA <213> Homo sapiens <400> 103 tttattttaa gcatctsaga actggtatca gcc 33 <210> 104 <211> 33 <212> DNA <213> Homo sapiens <400> 104 aatgaggcga caacatraaa cgaaggtaat gtg 33 <210> 105 <211> 33 <212> DNA <213> Homo sapiens <400> 105 tgcacaaaca tctgctwact tcatggccac caa 33 <210> 106 <211> 33 <212> DNA <213> Homo sapiens <400> 106 ttttcgattt ttggatkagg catactcaat ctg 33 <210> 107 <211> 33 <212> DNA <213> Homo sapiens <400> 107 accgttctga gcactgkagg agaaaaatga aaa 33 <210> 108 <211> 33 <212> DNA <213> Homo sapiens <400> 108 agaaatattc aggatgkaaa actcggagga tgc 33 <210> 109 <211> 33 <212> DNA <213> Homo sapiens <400> 109 gaggaccgaa gtggaaygct tgtagaggac tag 33 <210> 110 <211> 33 <212> DNA <213> Homo sapiens <400> 110 ttctgtgttt ctgggcmata aactagtgct atg 33 <210> 111 <211> 33 <212> DNA <213> Homo sapiens <400> 111 gtttagaaca ttgtacygaa aagtcttgag cca 33 <210> 112 <211> 33 <212> DNA <213> Homo sapiens <400> 112 ctcatgtggc tattgargaa gggcatagcg gct 33 <210> 113 <211> 33 <212> DNA <213> Homo sapiens <400> 113 gttcactgat gcttgaygct tattgcaggt ctg 33 <210> 114 <211> 33 <212> DNA <213> Homo sapiens <400> 114 tttctcatga tttccaygtg ttaagaataa cgc 33 <210> 115 <211> 33 <212> DNA <213> Homo sapiens <400> 115 tccattacct ccttcawctc tggcaacaca ata 33 <210> 116 <211> 33 <212> DNA <213> Homo sapiens <400> 116 atttgtgtgg tgaatayaat tctctccttc tta 33 <210> 117 <211> 33 <212> DNA <213> Homo sapiens <400> 117 ggcaaatgat gctgtcycat agttgcttta atg 33 <210> 118 <211> 33 <212> DNA <213> Homo sapiens <400> 118 agaaaagagg catttgyatt tctctaagaa tac 33 <210> 119 <211> 33 <212> DNA <213> Homo sapiens <400> 119 tgcaaatatt tctgtargat agagccctaa aaa 33 <210> 120 <211> 33 <212> DNA <213> Homo sapiens <400> 120 tcaaaagtac agtcacraga aatgttaggt gtt 33 <210> 121 <211> 33 <212> DNA <213> Homo sapiens <400> 121 catgtttcag gcactayggt acttgctggg aga 33 <210> 122 <211> 33 <212> DNA <213> Homo sapiens <400> 122 agggctgtaa atgctaygca agtggtatgt gcc 33 <210> 123 <211> 33 <212> DNA <213> Homo sapiens <400> 123 tggcattctt ttcccaycct catcgtaggt ata 33 <210> 124 <211> 33 <212> DNA <213> Homo sapiens <400> 124 atcatgtcct gccagartat ttactcccta caa 33 <210> 125 <211> 33 <212> DNA <213> Homo sapiens <400> 125 gattggtgtg catgtgycaa gcaaactagc aga 33 <210> 126 <211> 33 <212> DNA <213> Homo sapiens <400> 126 ctccctatct cctccgyaca gaaaccacaa taa 33 <210> 127 <211> 33 <212> DNA <213> Homo sapiens <400> 127 acttcttatg gtaacaytat gtttaggcaa act 33 <210> 128 <211> 33 <212> DNA <213> Homo sapiens <400> 128 atttccagtg aaagatkagc atgcttgtgt ttt 33 <210> 129 <211> 33 <212> DNA <213> Homo sapiens <400> 129 tccgtattta tccctamggc gtgccatcta taa 33 <210> 130 <211> 33 <212> DNA <213> Homo sapiens <400> 130 atattatggt tggattyaag gatgattagt acg 33 <210> 131 <211> 33 <212> DNA <213> Homo sapiens <400> 131 aatgcagaga aagtggwaag gtagtaaact agt 33 <210> 132 <211> 33 <212> DNA <213> Homo sapiens <400> 132 gcagggttgg ttcataytag agattgtgag gga 33 <210> 133 <211> 33 <212> DNA <213> Homo sapiens <400> 133 ttatttggta ctccaarctt ctgaagattt aaa 33 <210> 134 <211> 33 <212> DNA <213> Homo sapiens <400> 134 ggaacgtaga actgtaygaa gaggtcattt gag 33 <210> 135 <211> 33 <212> DNA <213> Homo sapiens <400> 135 tcttcaacac agtaccraaa ttgctagcca gag 33 <210> 136 <211> 33 <212> DNA <213> Homo sapiens <400> 136 atgagttggc ttaaaayagt aattcaagtc aca 33 <210> 137 <211> 33 <212> DNA <213> Homo sapiens <400> 137 gaaagaaaag ttaaacmaat tagcagagac acc 33 <210> 138 <211> 33 <212> DNA <213> Homo sapiens <400> 138 aggccatacc tttgaawtct cactgttcat atg 33 <210> 139 <211> 33 <212> DNA <213> Homo sapiens <400> 139 tatttgaaat tgaatgyaac gaatgatttt ata 33 <210> 140 <211> 33 <212> DNA <213> Homo sapiens <400> 140 ttacctgctt ttctaayctt atgtctcacc aca 33 <210> 141 <211> 33 <212> DNA <213> Homo sapiens <400> 141 cagagccgaa acccaasgaa acaagggaca agt 33 <210> 142 <211> 33 <212> DNA <213> Homo sapiens <400> 142 tgttaagaaa gaatgasatt gatctgtata tgg 33 <210> 143 <211> 33 <212> DNA <213> Homo sapiens <400> 143 atttcacaga aggtgaygtc ggcctttttg ata 33 <210> 144 <211> 33 <212> DNA <213> Homo sapiens <400> 144 gagtagcagg tgaagasaga tgaaccaagg atg 33 <210> 145 <211> 33 <212> DNA <213> Homo sapiens <400> 145 caaagtttca gcaatgsagg atcaatagaa gct 33 <210> 146 <211> 33 <212> DNA <213> Homo sapiens <400> 146 agggatacac agatgasaac acttaattca gaa 33 <210> 147 <211> 33 <212> DNA <213> Homo sapiens <400> 147 tggaaactta ggagacrgta gaaaagacac atg 33 <210> 148 <211> 33 <212> DNA <213> Homo sapiens <400> 148 atttctacta gtctgakaaa cccattcaag cca 33 <210> 149 <211> 33 <212> DNA <213> Homo sapiens <400> 149 agttaataaa tccatcraaa gcccgtcccc aaa 33 <210> 150 <211> 33 <212> DNA <213> Homo sapiens <400> 150 caacctgttg tctcacraag tgatctcctg cca 33 <210> 151 <211> 33 <212> DNA <213> Homo sapiens <400> 151 tgggcaggtg gaagacratg ggtcaaggat aag 33 <210> 152 <211> 33 <212> DNA <213> Homo sapiens <400> 152 atcaattctt ccttcaktaa tgcctcagaa aaa 33 <210> 153 <211> 33 <212> DNA <213> Homo sapiens <400> 153 aaagacaaat gaaatartaa gtctgtggta ttg 33 <210> 154 <211> 33 <212> DNA <213> Homo sapiens <400> 154 cgctcatacg aaatgaracc tgcctatgcc ttg 33 <210> 155 <211> 33 <212> DNA <213> Homo sapiens <400> 155 taaaatacaa ttgctarctg aaatctgcag tag 33 <210> 156 <211> 33 <212> DNA <213> Homo sapiens <400> 156 gaaggattgg acaataraag caatttaaat gtg 33 <210> 157 <211> 33 <212> DNA <213> Homo sapiens <400> 157 ggtgtggggt ggagaargtg ctagtagccc acc 33 <210> 158 <211> 33 <212> DNA <213> Homo sapiens <400> 158 tgtgttctcc ccgaaasttc tctctgtcct gtg 33 <210> 159 <211> 33 <212> DNA <213> Homo sapiens <400> 159 ccaaggctga aaatacygat actcaacaaa cag 33 <210> 160 <211> 33 <212> DNA <213> Homo sapiens <400> 160 ccattgtcat gctccartct gttcaagcct ttg 33 <210> 161 <211> 33 <212> DNA <213> Homo sapiens <400> 161 gcctggcctg cagaagracc acggagcgtt gtg 33 <210> 162 <211> 33 <212> DNA <213> Homo sapiens <400> 162 aatgtggagc aactacrgac atgcaaaatg ata 33 <210> 163 <211> 33 <212> DNA <213> Homo sapiens <400> 163 agataagaaa gtccaayaaa tgtggagcaa cta 33 <210> 164 <211> 33 <212> DNA <213> Homo sapiens <400> 164 ggaagccaca tcttgayaaa tgcagaggca att 33 <210> 165 <211> 33 <212> DNA <213> Homo sapiens <400> 165 catggcttca ccgcagyagt gcttttatta tta 33 <210> 166 <211> 33 <212> DNA <213> Homo sapiens <400> 166 ctcctggcag actcccycta gagctgcttt gag 33 <210> 167 <211> 33 <212> DNA <213> Homo sapiens <400> 167 gcaggcggaa cacaaastca ggagatcgag acc 33 <210> 168 <211> 33 <212> DNA <213> Homo sapiens <400> 168 acaacaagtg actacaycgt aatgagaaat aga 33 <210> 169 <211> 33 <212> DNA <213> Homo sapiens <400> 169 ttcacgtcct gagttayaaa ccctgcaggt ccc 33 <210> 170 <211> 33 <212> DNA <213> Homo sapiens <400> 170 cagttcatga tctggaygga ttgagtgaga tgc 33 <210> 171 <211> 33 <212> DNA <213> Homo sapiens <400> 171 aataaaaaga aaccaaytac tactacgtac aac 33 <210> 172 <211> 33 <212> DNA <213> Homo sapiens <400> 172 tcactgctca aggtccycaa gctttcccct ctt 33 <210> 173 <211> 33 <212> DNA <213> Homo sapiens <400> 173 ttttcaaggc tgaacartgg acttgctttt gga 33 <210> 174 <211> 33 <212> DNA <213> Homo sapiens <400> 174 cagcaatgag ttaccartat gtgaatttcc agc 33 <210> 175 <211> 33 <212> DNA <213> Homo sapiens <400> 175 ataaatgaga cgtgacygta ctttaaggag tgc 33 <210> 176 <211> 33 <212> DNA <213> Homo sapiens <400> 176 taatttagca gataggratc caaagaatat gtg 33 <210> 177 <211> 33 <212> DNA <213> Homo sapiens <400> 177 gttttaaagg tcagagyatg gcgtccattc aca 33 <210> 178 <211> 33 <212> DNA <213> Homo sapiens <400> 178 attaatgctt tgctctracc aactgggcaa atc 33 <210> 179 <211> 33 <212> DNA <213> Homo sapiens <400> 179 gtcagtcaag gtggaaratc actgcagggc aca 33 <210> 180 <211> 33 <212> DNA <213> Homo sapiens <400> 180 atgtacccat ttaaccygca acatcaccag gtg 33 <210> 181 <211> 33 <212> DNA <213> Homo sapiens <400> 181 aaggcctttt ctctggrcac aggcagggag agc 33 <210> 182 <211> 33 <212> DNA <213> Homo sapiens <400> 182 aatgtcgtct gcccagsaat gcagagtgta gat 33 <210> 183 <211> 33 <212> DNA <213> Homo sapiens <400> 183 gttttcttga aatacaktac tcactcttgg gat 33 <210> 184 <211> 33 <212> DNA <213> Homo sapiens <400> 184 ctctgggcac ctgacaygta taaactcacc aga 33 <210> 185 <211> 33 <212> DNA <213> Homo sapiens <400> 185 aggagactaa gcctcgraga agtgagttgt ttg 33 <210> 186 <211> 33 <212> DNA <213> Homo sapiens <400> 186 gattctaacc caaaccygat ggcaaaggct atc 33 <210> 187 <211> 33 <212> DNA <213> Homo sapiens <400> 187 taattttgct ttaccgmaga tttctaaact tta 33 <210> 188 <211> 33 <212> DNA <213> Homo sapiens <400> 188 gcatttgagc ttgctakaat aagactgact ttt 33 <210> 189 <211> 33 <212> DNA <213> Homo sapiens <400> 189 atcgacgtgg gactaascaa ggaacacttt cgt 33 <210> 190 <211> 33 <212> DNA <213> Homo sapiens <400> 190 aggaaactgg aggtgawgta tatttccatc acc 33 <210> 191 <211> 33 <212> DNA <213> Homo sapiens <400> 191 caggaatgag gggccaraga aatgtattat aaa 33 <210> 192 <211> 33 <212> DNA <213> Homo sapiens <400> 192 taatagattc ttttgargag cagattcttt ttt 33 <210> 193 <211> 33 <212> DNA <213> Homo sapiens <400> 193 cactggaaga tgaagasgta atgatcacat ttc 33 <210> 194 <211> 33 <212> DNA <213> Homo sapiens <400> 194 accaagattt caaagasgtg aataaaagct cac 33 <210> 195 <211> 33 <212> DNA <213> Homo sapiens <400> 195 ttcatatttt tggaaastga cttaatttct atg 33 <210> 196 <211> 33 <212> DNA <213> Homo sapiens <400> 196 cttcaagtga tacctcrgag agcctcaggt tct 33 <210> 197 <211> 33 <212> DNA <213> Homo sapiens <400> 197 aatagagatt atatgcycca acctaatatg agt 33 <210> 198 <211> 33 <212> DNA <213> Homo sapiens <400> 198 gaattagaag taaatgraaa ctcgtaacta cat 33 <210> 199 <211> 33 <212> DNA <213> Homo sapiens <400> 199 gatactatga aaatcartcc aaaacatcgt gat 33 <210> 200 <211> 33 <212> DNA <213> Homo sapiens <400> 200 tgtaatagaa agggtawctg agggtacaaa cat 33 <210> 201 <211> 33 <212> DNA <213> Homo sapiens <400> 201 gtaataaccg tttgtcmaat caatgaatga caa 33 <210> 202 <211> 33 <212> DNA <213> Homo sapiens <400> 202 tagttaaccc ttcaaasagt aggcatcctg ccc 33 <210> 203 <211> 33 <212> DNA <213> Homo sapiens <400> 203 tgggaatgtc tgtgggraag aagaggctct gct 33 <210> 204 <211> 33 <212> DNA <213> Homo sapiens <400> 204 aagactgata caggacraag ggtggctgtg gcc 33 <210> 205 <211> 33 <212> DNA <213> Homo sapiens <400> 205 ggtgcccaca cctatayaat gggggtaata aag 33 <210> 206 <211> 33 <212> DNA <213> Homo sapiens <400> 206 cctgtgctgg tcatccyctc actgcccctg cac 33 <210> 207 <211> 33 <212> DNA <213> Homo sapiens <400> 207 gaactcctga cttccarcct ggtgcttttc cta 33 <210> 208 <211> 33 <212> DNA <213> Homo sapiens <400> 208 gattttgatt gatgggycat atattagcct ggt 33 <210> 209 <211> 33 <212> DNA <213> Homo sapiens <400> 209 caccctctag ttgtgaratt caaaaatgtc tcc 33 <210> 210 <211> 33 <212> DNA <213> Homo sapiens <400> 210 catacaccaa tcagaarggg actgttcaga aaa 33 <210> 211 <211> 33 <212> DNA <213> Homo sapiens <400> 211 acctgcttgc ctgcaayatg agttttacac cat 33 <210> 212 <211> 33 <212> DNA <213> Homo sapiens <400> 212 cataaagcag agatgartaa aagccagagg gag 33 <210> 213 <211> 33 <212> DNA <213> Homo sapiens <400> 213 tctctggaac aatcacwgtc tttctctcgc tac 33 <210> 214 <211> 33 <212> DNA <213> Homo sapiens <400> 214 gatccatctt ttagcargag gtacatttcc tta 33 <210> 215 <211> 33 <212> DNA <213> Homo sapiens <400> 215 gacataaaag gttacayatt gtatgatgct act 33 <210> 216 <211> 33 <212> DNA <213> Homo sapiens <400> 216 aacttaatgg aatagamggt agcaaccaca cat 33 <210> 217 <211> 33 <212> DNA <213> Homo sapiens <400> 217 gtgtatactt gtgaggscat gagcatgatt aag 33 <210> 218 <211> 33 <212> DNA <213> Homo sapiens <400> 218 agtaaagctt aagacarctc tgcttcaaat tct 33 <210> 219 <211> 33 <212> DNA <213> Homo sapiens <400> 219 agataaaaat taaaagrctt agatcctgca ttc 33 <210> 220 <211> 33 <212> DNA <213> Homo sapiens <400> 220 agagattgat gtggtayatt tagctgaatt ttg 33 <210> 221 <211> 33 <212> DNA <213> Homo sapiens <400> 221 acaatttctc cttcackgcc agtttgagat aag 33 <210> 222 <211> 33 <212> DNA <213> Homo sapiens <400> 222 aactcactgg ggttacratg gatccaaaac caa 33 <210> 223 <211> 33 <212> DNA <213> Homo sapiens <400> 223 gagctttgcg attgtayaga aggggagtca agt 33 <210> 224 <211> 33 <212> DNA <213> Homo sapiens <400> 224 gaaaatcacc taattayagc aaatgccctg atg 33 <210> 225 <211> 33 <212> DNA <213> Homo sapiens <400> 225 ccaccgcgcc tggcgayaaa ttcttttaaa tat 33 <210> 226 <211> 33 <212> DNA <213> Homo sapiens <400> 226 aaatataata ctctaaycac caatgacaaa tac 33 <210> 227 <211> 33 <212> DNA <213> Homo sapiens <400> 227 ctccctgtgc tctttaragg tccaggagta ggc 33 <210> 228 <211> 33 <212> DNA <213> Homo sapiens <400> 228 gaccagtgag gcacaartga aggttttcta gcg 33 <210> 229 <211> 33 <212> DNA <213> Homo sapiens <400> 229 aaagtgcggg ctgctgraag cccagggatg gaa 33 <210> 230 <211> 33 <212> DNA <213> Homo sapiens <400> 230 aggaatggca gtttacycac aatttctgcc ctg 33 <210> 231 <211> 33 <212> DNA <213> Homo sapiens <400> 231 acaaagctct atgtcaycta aactgataat tat 33 <210> 232 <211> 33 <212> DNA <213> Homo sapiens <400> 232 tccttcttat ccaaacragg aagtcagtat tca 33 <210> 233 <211> 33 <212> DNA <213> Homo sapiens <400> 233 catctctttg ttcatcmctg aattctctct agt 33 <210> 234 <211> 33 <212> DNA <213> Homo sapiens <400> 234 tccatatcca ccacagmatc aaatgaaact gta 33 <210> 235 <211> 33 <212> DNA <213> Homo sapiens <400> 235 caagtgtttt gttcacrcac ctcaagagag gag 33 <210> 236 <211> 33 <212> DNA <213> Homo sapiens <400> 236 tctgccattt ccatcarcta ttactggaca tga 33 <210> 237 <211> 33 <212> DNA <213> Homo sapiens <400> 237 ttgaagatgc ttgctaracc aggaaatatg att 33 <210> 238 <211> 33 <212> DNA <213> Homo sapiens <400> 238 agactgcaag aagagaraac ctttaaactg atc 33 <210> 239 <211> 33 <212> DNA <213> Homo sapiens <400> 239 gagttgtgca atcatcrctg taacctaatt tta 33 <210> 240 <211> 33 <212> DNA <213> Homo sapiens <400> 240 ctgtcactga aagcccrcag ttctggagat gac 33 <210> 241 <211> 33 <212> DNA <213> Homo sapiens <400> 241 caggagaggt tgttacraga ggttgtcaag aag 33 <210> 242 <211> 33 <212> DNA <213> Homo sapiens <400> 242 aatggctgat ttgacasagt agacgcccat tgg 33 <210> 243 <211> 33 <212> DNA <213> Homo sapiens <400> 243 ttaaacccag taaggayctt gaacagtaga cat 33 <210> 244 <211> 33 <212> DNA <213> Homo sapiens <400> 244 ttgtagcttt caagacraga acaaagaaaa tgc 33 <210> 245 <211> 33 <212> DNA <213> Homo sapiens <400> 245 actgctgtat tccgaawctc tagaacgtct ggc 33 <210> 246 <211> 33 <212> DNA <213> Homo sapiens <400> 246 acatcttcac tctacayggt agcaaagtgc cag 33 <210> 247 <211> 33 <212> DNA <213> Homo sapiens <400> 247 agccctctca ctgttgraaa catggctgtc ttt 33 <210> 248 <211> 33 <212> DNA <213> Homo sapiens <400> 248 cctcaaacag cttacarcat gggcgaaaag gac 33 <210> 249 <211> 33 <212> DNA <213> Homo sapiens <400> 249 atccacaata tttaaayggc tgttttagtc act 33 <210> 250 <211> 33 <212> DNA <213> Homo sapiens <400> 250 tgtggataac caaactraca tgtggaatct gac 33 <210> 251 <211> 33 <212> DNA <213> Homo sapiens <400> 251 ttgtgcacag gaaagtsaat cagctgtgat ctc 33 <210> 252 <211> 33 <212> DNA <213> Homo sapiens <400> 252 aacatgtgag atgcaamtta gcgtattctt gaa 33 <210> 253 <211> 33 <212> DNA <213> Homo sapiens <400> 253 atcatagctg aacccaygag aatgaaagaa agg 33 <210> 254 <211> 33 <212> DNA <213> Homo sapiens <400> 254 gcaggcttct cagtaargaa cagacttggg gtg 33 <210> 255 <211> 33 <212> DNA <213> Homo sapiens <400> 255 tattccttcc ttctaaytga acatttttga ggc 33 <210> 256 <211> 33 <212> DNA <213> Homo sapiens <400> 256 caccctccat cggtaasaag atcaccaggc att 33 <210> 257 <211> 33 <212> DNA <213> Homo sapiens <400> 257 cctgtgcata tgctacrcca ggggtcctca acc 33 <210> 258 <211> 33 <212> DNA <213> Homo sapiens <400> 258 ctatattaac catagawtca tccataatag ttc 33 <210> 259 <211> 33 <212> DNA <213> Homo sapiens <400> 259 agccctgctg agattargtg aactccagtt gat 33 <210> 260 <211> 33 <212> DNA <213> Homo sapiens <400> 260 cagatgtaac actcaaytga agcattctca ggt 33 <210> 261 <211> 33 <212> DNA <213> Homo sapiens <400> 261 ttatataact tttggayata cagcctgatt tga 33 <210> 262 <211> 33 <212> DNA <213> Homo sapiens <400> 262 gttgttgaaa ggattamaat gacagagtaa ata 33 <210> 263 <211> 33 <212> DNA <213> Homo sapiens <400> 263 acagattgaa ttgctamaac atacaagact ggc 33 <210> 264 <211> 33 <212> DNA <213> Homo sapiens <400> 264 tgagaccagc tggaaayaga tactgaaatc ttg 33 <210> 265 <211> 33 <212> DNA <213> Homo sapiens <400> 265 caaaatgctt cacttaycaa agcaagattt cag 33 <210> 266 <211> 33 <212> DNA <213> Homo sapiens <400> 266 agagaaaggt gataacraaa tgaaagcata atc 33 <210> 267 <211> 33 <212> DNA <213> Homo sapiens <400> 267 ctatttaaga cagcaarcgt acattaagac taa 33 <210> 268 <211> 33 <212> DNA <213> Homo sapiens <400> 268 agaggagctt attttcyctt agtcagtttt gaa 33 <210> 269 <211> 33 <212> DNA <213> Homo sapiens <400> 269 taagaagaaa attttgratt ccaatagtga ctg 33 <210> 270 <211> 33 <212> DNA <213> Homo sapiens <400> 270 aaataagcca gaaaacyagc ggtcacatac aaa 33 <210> 271 <211> 33 <212> DNA <213> Homo sapiens <400> 271 aaggaagagt tttaaayggt agagtactat gtt 33 <210> 272 <211> 33 <212> DNA <213> Homo sapiens <400> 272 ttgttaccat tcccacrggt ttgagttagc tct 33 <210> 273 <211> 33 <212> DNA <213> Homo sapiens <400> 273 cctttcttca cccaggmcaa cgagtttgtg gaa 33 <210> 274 <211> 33 <212> DNA <213> Homo sapiens <400> 274 gttgcactaa gtgtcayata ccatgcaggt tgg 33 <210> 275 <211> 33 <212> DNA <213> Homo sapiens <400> 275 gtaactaata agtaaargag caagttatcc tgc 33 <210> 276 <211> 33 <212> DNA <213> Homo sapiens <400> 276 cctcagctgt aaaataygcc ttaagtttgg gtg 33 <210> 277 <211> 33 <212> DNA <213> Homo sapiens <400> 277 ggcactcttg ctatcartca tcctgtctcc aca 33 <210> 278 <211> 33 <212> DNA <213> Homo sapiens <400> 278 agttgaagat gtggacmcct gcagttgcta ctg 33 <210> 279 <211> 33 <212> DNA <213> Homo sapiens <400> 279 gatactagaa cagaacragg atcgcagcaa gaa 33 <210> 280 <211> 33 <212> DNA <213> Homo sapiens <400> 280 aacccttttg gtgtgcmaat tttggaatgc agt 33 <210> 281 <211> 33 <212> DNA <213> Homo sapiens <400> 281 aaagctgata gaaggayagc ttaccgagaa aaa 33 <210> 282 <211> 33 <212> DNA <213> Homo sapiens <400> 282 ttcatacaag gctatgyagg ggataggaag ata 33 <210> 283 <211> 33 <212> DNA <213> Homo sapiens <400> 283 gccagagaac ttgattsaaa agcaccccaa aga 33 <210> 284 <211> 33 <212> DNA <213> Homo sapiens <400> 284 tggagggcac acataaragt aatatggaag aac 33 <210> 285 <211> 33 <212> DNA <213> Homo sapiens <400> 285 aggcatattt ttcttayggt tggcacagat ata 33 <210> 286 <211> 33 <212> DNA <213> Homo sapiens <400> 286 aatctgtgtg cccaaamaat ccaaaatata taa 33 <210> 287 <211> 33 <212> DNA <213> Homo sapiens <400> 287 aatgacattt gctgcasgtt gataattagt ttt 33 <210> 288 <211> 33 <212> DNA <213> Homo sapiens <400> 288 tcatgctaaa gtctgaraac cattagccta tat 33 <210> 289 <211> 33 <212> DNA <213> Homo sapiens <400> 289 acgcacacac acgaaaraga atcttctgac tta 33 <210> 290 <211> 33 <212> DNA <213> Homo sapiens <400> 290 agtgcacgac ttccaaygtc ctggtggaaa tgt 33 <210> 291 <211> 33 <212> DNA <213> Homo sapiens <400> 291 gattaccaaa tgttcaraac tcagctcctg ccc 33 <210> 292 <211> 33 <212> DNA <213> Homo sapiens <400> 292 ttaacactgt tttgagsatt tgagatagat cag 33 <210> 293 <211> 33 <212> DNA <213> Homo sapiens <400> 293 ggattctaag ggctacratg aaagtctctg cta 33 <210> 294 <211> 33 <212> DNA <213> Homo sapiens <400> 294 tgaaaggttc gcaaaastag ctctgaagaa gtg 33 <210> 295 <211> 33 <212> DNA <213> Homo sapiens <400> 295 ctacagttgg ctggaamaaa ggaggatttg gga 33 <210> 296 <211> 33 <212> DNA <213> Homo sapiens <400> 296 cagcatgtga gaaggcygaa ttaaaaggaa ggt 33 <210> 297 <211> 33 <212> DNA <213> Homo sapiens <400> 297 aggatgacgc cttcacratg ggactggtag ctc 33 <210> 298 <211> 33 <212> DNA <213> Homo sapiens <400> 298 tagccatgaa attaccrcat catgaaacct tca 33 <210> 299 <211> 33 <212> DNA <213> Homo sapiens <400> 299 caggttcaca ctgtacract ccagaaggtg cca 33 <210> 300 <211> 33 <212> DNA <213> Homo sapiens <400> 300 tctaccagat gttgagyccc ttgaacctaa tgg 33 <210> 301 <211> 33 <212> DNA <213> Homo sapiens <400> 301 aagacttcta tcagacratc cctgaagttc ctt 33 <210> 302 <211> 33 <212> DNA <213> Homo sapiens <400> 302 catttgtttc ctgaaakttc tgattgttta aac 33 <210> 303 <211> 33 <212> DNA <213> Homo sapiens <400> 303 gaagttttaa catagcrcag gaaagaaggg cat 33 <210> 304 <211> 33 <212> DNA <213> Homo sapiens <400> 304 ctctaaaagt tacataytat agccttaact cac 33 <210> 305 <211> 33 <212> DNA <213> Homo sapiens <400> 305 gtcattacgc ccaaacragt caatttcaag gat 33 <210> 306 <211> 33 <212> DNA <213> Homo sapiens <400> 306 ggaaaatttg gctttcrgaa aatggctgac cta 33 <210> 307 <211> 33 <212> DNA <213> Homo sapiens <400> 307 tgcctaggta ggaaaasgaa acttagtgaa gga 33 <210> 308 <211> 33 <212> DNA <213> Homo sapiens <400> 308 ggtgtccctg tctggayggg tttagtcagc atc 33 <210> 309 <211> 33 <212> DNA <213> Homo sapiens <400> 309 gttcaagggc tgaaccwaag gacaaaagaa ggg 33 <210> 310 <211> 33 <212> DNA <213> Homo sapiens <400> 310 tatttagcat ttattargaa cctcctgtgg gct 33 <210> 311 <211> 33 <212> DNA <213> Homo sapiens <400> 311 tgttaccttt cctggayaca tgagggtttc ttt 33 <210> 312 <211> 33 <212> DNA <213> Homo sapiens <400> 312 ttttaatttt agcacargct gttacttcta caa 33 <210> 313 <211> 33 <212> DNA <213> Homo sapiens <400> 313 ttctagaaag atggccract aaagacacgc tca 33 <210> 314 <211> 33 <212> DNA <213> Homo sapiens <400> 314 gacttagaga atttcasaag agtagtagta caa 33 <210> 315 <211> 33 <212> DNA <213> Homo sapiens <400> 315 aagtgggaaa aactaaycaa cgtgcttgaa cat 33 <210> 316 <211> 33 <212> DNA <213> Homo sapiens <400> 316 taacggatgg gaaaaawtgg tttgtagatg gag 33 <210> 317 <211> 33 <212> DNA <213> Homo sapiens <400> 317 gcaaaatctg tgttcakgtt gagttaggtt atg 33 <210> 318 <211> 33 <212> DNA <213> Homo sapiens <400> 318 tgtcaatgtt atttaayccg aataagaaca tta 33 <210> 319 <211> 33 <212> DNA <213> Homo sapiens <400> 319 cattactctc aaagtaygcc agccctccca gat 33 <210> 320 <211> 33 <212> DNA <213> Homo sapiens <400> 320 ttggagggaa tacattsaaa cagtagcaaa ttt 33 <210> 321 <211> 33 <212> DNA <213> Homo sapiens <400> 321 actgtcagaa aataaaygac tgctcttcat aaa 33 <210> 322 <211> 33 <212> DNA <213> Homo sapiens <400> 322 tgaaaaatca ttcaaasaaa tttgtcttag tct 33 <210> 323 <211> 33 <212> DNA <213> Homo sapiens <400> 323 tattagttat ccatccraag aaactaagca gtg 33 <210> 324 <211> 33 <212> DNA <213> Homo sapiens <400> 324 atgggttcat aaatgcyagt cctagggtat ggc 33 <210> 325 <211> 33 <212> DNA <213> Homo sapiens <400> 325 ggtagctggt atgtgaract agagcccagg gaa 33 <210> 326 <211> 33 <212> DNA <213> Homo sapiens <400> 326 gccccagata atacaamaaa atggccaacg ttt 33 <210> 327 <211> 33 <212> DNA <213> Homo sapiens <400> 327 ttctgcaggc tgtaaakcat ttggaagaga agt 33 <210> 328 <211> 33 <212> DNA <213> Homo sapiens <400> 328 ccagctagag gggcaaytta aaggcatcag gta 33 <210> 329 <211> 33 <212> DNA <213> Homo sapiens <400> 329 tctctcctgc acatacygga ggactactgt gtt 33 <210> 330 <211> 33 <212> DNA <213> Homo sapiens <400> 330 ttcatcagag cagtggkaag gggtcttttg tga 33 <210> 331 <211> 33 <212> DNA <213> Homo sapiens <400> 331 agccaagaca ggatacrggt taggcacctc ctt 33 <210> 332 <211> 33 <212> DNA <213> Homo sapiens <400> 332 tataggattc aaatgakagc tttatttcaa ttt 33 <210> 333 <211> 33 <212> DNA <213> Homo sapiens <400> 333 agaaagttgt aggagcygca gtgggagctg gaa 33 <210> 334 <211> 33 <212> DNA <213> Homo sapiens <400> 334 tattttttcc actgaamtct tcagtccctc aaa 33 <210> 335 <211> 33 <212> DNA <213> Homo sapiens <400> 335 aaatgtaacc aggaaawgta atgttgatta caa 33 <210> 336 <211> 33 <212> DNA <213> Homo sapiens <400> 336 atcccagcca ttcttamcag cgggagttat caa 33 <210> 337 <211> 33 <212> DNA <213> Homo sapiens <400> 337 ctcagccgtg atgggakacc atggttgtgg aga 33 <210> 338 <211> 33 <212> DNA <213> Homo sapiens <400> 338 gacataaaag gcagtaraga ccgggcacag tgg 33 <210> 339 <211> 33 <212> DNA <213> Homo sapiens <400> 339 gagaaccact ggtccasgga agaacagtct tat 33 <210> 340 <211> 33 <212> DNA <213> Homo sapiens <400> 340 tcaagagtgg aagcagyaag agagttaaga ggc 33 <210> 341 <211> 33 <212> DNA <213> Homo sapiens <400> 341 atggcagcca gagctawctg atcaaatgta gag 33 <210> 342 <211> 33 <212> DNA <213> Homo sapiens <400> 342 gggaaatggg cagtaaygat cacgggaaat ttg 33 <210> 343 <211> 33 <212> DNA <213> Homo sapiens <400> 343 caagcccagc tgagacrcta tccttctggc ggt 33 <210> 344 <211> 33 <212> DNA <213> Homo sapiens <400> 344 tcattaattc aatttcmaat cccacactgc agc 33 <210> 345 <211> 33 <212> DNA <213> Homo sapiens <400> 345 gtgtaacatg gaaatamcag gtttagccaa cct 33 <210> 346 <211> 33 <212> DNA <213> Homo sapiens <400> 346 aggcactgag agagaawatt aggaagacaa cac 33 <210> 347 <211> 33 <212> DNA <213> Homo sapiens <400> 347 gtcagatttg cataagkaca caccacaagg ctg 33 <210> 348 <211> 33 <212> DNA <213> Homo sapiens <400> 348 tgcatctttg gacgaarcta gaaaagaagc tga 33 <210> 349 <211> 33 <212> DNA <213> Homo sapiens <400> 349 atgggccctt ttcagartaa aacatataga ctt 33 <210> 350 <211> 33 <212> DNA <213> Homo sapiens <400> 350 aagcggggaa ggggcaygga tatctttacc gca 33 <210> 351 <211> 33 <212> DNA <213> Homo sapiens <400> 351 gaggaatata gcaagamcct gcatctataa taa 33 <210> 352 <211> 33 <212> DNA <213> Homo sapiens <400> 352 catggtcaat tagtccrcac atactgttaa ctt 33 <210> 353 <211> 33 <212> DNA <213> Homo sapiens <400> 353 tacagtgagt aggaagwatt gtttgagtgg agc 33 <210> 354 <211> 33 <212> DNA <213> Homo sapiens <400> 354 attttatggc taattaraaa tgatgattgt tca 33 <210> 355 <211> 33 <212> DNA <213> Homo sapiens <400> 355 atgtggcctt atttagyaat ggtaccattt tgt 33 <210> 356 <211> 33 <212> DNA <213> Homo sapiens <400> 356 aactcaaact taaacasatg atgacttgca att 33 <210> 357 <211> 33 <212> DNA <213> Homo sapiens <400> 357 tgggatagat gcctaarcca tgatgcctgc cca 33 <210> 358 <211> 33 <212> DNA <213> Homo sapiens <400> 358 aataaaggct tgaacaytat ttgtctgttt ctg 33 <210> 359 <211> 33 <212> DNA <213> Homo sapiens <400> 359 ccttcacagg agttaakaga gtcctccaaa acc 33 <210> 360 <211> 33 <212> DNA <213> Homo sapiens <400> 360 aactgctttt attgacracc acataaaatc acc 33 <210> 361 <211> 33 <212> DNA <213> Homo sapiens <400> 361 ttcaaaaata gacagawata aatgatggtg ttg 33 <210> 362 <211> 33 <212> DNA <213> Homo sapiens <400> 362 gttgactggc tagtgaycct tcatgcccca gga 33 <210> 363 <211> 33 <212> DNA <213> Homo sapiens <400> 363 ataaaaacaa gatgaaygta accagccatg gct 33 <210> 364 <211> 33 <212> DNA <213> Homo sapiens <400> 364 atagcaaccc aaagcgwcat atgttcaagt taa 33 <210> 365 <211> 33 <212> DNA <213> Homo sapiens <400> 365 tgtgtggctt agaaaascat tagcctctag gga 33 <210> 366 <211> 33 <212> DNA <213> Homo sapiens <400> 366 caggctgatg atttgcract agtaaaaata ata 33 <210> 367 <211> 33 <212> DNA <213> Homo sapiens <400> 367 gaccatcaaa tacttayggc tagatgctcc agt 33 <210> 368 <211> 33 <212> DNA <213> Homo sapiens <400> 368 gtagacgagt taccctktct tcttccatgt acc 33 <210> 369 <211> 33 <212> DNA <213> Homo sapiens <400> 369 ttccccttgc tctgcawatc aggtcaaaca ctt 33 <210> 370 <211> 33 <212> DNA <213> Homo sapiens <400> 370 attaagtgct tagtgayctc tatgacagaa aag 33 <210> 371 <211> 33 <212> DNA <213> Homo sapiens <400> 371 caattagttg gagtcaytct agattttatt ttg 33 <210> 372 <211> 33 <212> DNA <213> Homo sapiens <400> 372 aaattaatga aggagaygat ttcaggataa cat 33 <210> 373 <211> 33 <212> DNA <213> Homo sapiens <400> 373 gtgttctggg tcattayata ttatgttact att 33 <210> 374 <211> 33 <212> DNA <213> Homo sapiens <400> 374 atcatcataa tttagamctt ttttgtgtgt gtt 33 <210> 375 <211> 33 <212> DNA <213> Homo sapiens <400> 375 atcccatgca gcaaaaycac tgttccttct tgt 33 <210> 376 <211> 33 <212> DNA <213> Homo sapiens <400> 376 gttggatatg agagcaytga attgtggagc tta 33 <210> 377 <211> 33 <212> DNA <213> Homo sapiens <400> 377 tttactgaca attacamgga tgcaaacaaa caa 33 <210> 378 <211> 33 <212> DNA <213> Homo sapiens <400> 378 cattttagaa ctgcacwcca cttacaaagg taa 33 <210> 379 <211> 33 <212> DNA <213> Homo sapiens <400> 379 gtatccatta caaaaamgtc aattgcaaat ggt 33 <210> 380 <211> 33 <212> DNA <213> Homo sapiens <400> 380 ttagagcttg aaactaygaa ttttgagtgg atg 33 <210> 381 <211> 33 <212> DNA <213> Homo sapiens <400> 381 agagattacc gtggccratc ttctatgagt gca 33 <210> 382 <211> 33 <212> DNA <213> Homo sapiens <400> 382 ggcctagtgc aggtagmagc tgggctaaag ttt 33 <210> 383 <211> 33 <212> DNA <213> Homo sapiens <400> 383 tgcttatttt tgttgcwatc agataatgcg tta 33 <210> 384 <211> 33 <212> DNA <213> Homo sapiens <400> 384 ggctgtttct caaatayatc actctgcaga aaa 33 <210> 385 <211> 33 <212> DNA <213> Homo sapiens <400> 385 actaactaga tgaatcrccc agtttttccc ttt 33 <210> 386 <211> 33 <212> DNA <213> Homo sapiens <400> 386 ctacccaaag gaaataygtc tgtatgcagg agg 33 <210> 387 <211> 33 <212> DNA <213> Homo sapiens <400> 387 tcagctcagg ctgttaygac aaaaatacca cag 33 <210> 388 <211> 33 <212> DNA <213> Homo sapiens <400> 388 ccattcgaac atatgcyaat gaaatgtgtg gaa 33 <210> 389 <211> 33 <212> DNA <213> Homo sapiens <400> 389 atgtccacgt cagaaakctg ctgaatatct tcg 33 <210> 390 <211> 33 <212> DNA <213> Homo sapiens <400> 390 gtaagtattt ccgctcycag gaagtctgca tta 33 <210> 391 <211> 33 <212> DNA <213> Homo sapiens <400> 391 atcacaatat caatacrgag gcttattgtg ttg 33 <210> 392 <211> 33 <212> DNA <213> Homo sapiens <400> 392 gtagacagta catcccraga aagagaggat tca 33 <210> 393 <211> 33 <212> DNA <213> Homo sapiens <400> 393 tttgcttccc atcctckagg tgcacagtgt cca 33 <210> 394 <211> 33 <212> DNA <213> Homo sapiens <400> 394 gtcatgtgac ctactcygaa aaaacacata att 33 <210> 395 <211> 33 <212> DNA <213> Homo sapiens <400> 395 tgacaatttt cacttgrcaa acatttattc ctt 33 <210> 396 <211> 33 <212> DNA <213> Homo sapiens <400> 396 gctatggcag tcctagmaca gtttcaattc ttc 33 <210> 397 <211> 33 <212> DNA <213> Homo sapiens <400> 397 aggaggaaga gagagakata cctcttgttt tct 33 <210> 398 <211> 33 <212> DNA <213> Homo sapiens <400> 398 ctttaatgca ctaaacygac tcagtgaaaa ttt 33 <210> 399 <211> 33 <212> DNA <213> Homo sapiens <400> 399 atgaacatat gagtacmggt atgtttttga tgt 33 <210> 400 <211> 33 <212> DNA <213> Homo sapiens <400> 400 ctgagaagtc gtgtggwcca acctttgctc att 33 <210> 401 <211> 33 <212> DNA <213> Homo sapiens <400> 401 ttctgagaaa atattgraga ccatctttat gcc 33 <210> 402 <211> 33 <212> DNA <213> Homo sapiens <400> 402 acaaaaacaa gcctacmata aaaaatgcca gtg 33 <210> 403 <211> 33 <212> DNA <213> Homo sapiens <400> 403 aggttggctc ttgttcyatt aacactgatg ctc 33 <210> 404 <211> 33 <212> DNA <213> Homo sapiens <400> 404 aaatttacta gaaaccraac aatgattgcc act 33 <210> 405 <211> 33 <212> DNA <213> Homo sapiens <400> 405 cagcagtgac ttctaartga ctatgtggag gag 33 <210> 406 <211> 33 <212> DNA <213> Homo sapiens <400> 406 atgaactaaa ttttggmatg acaaagacag aat 33 <210> 407 <211> 33 <212> DNA <213> Homo sapiens <400> 407 actggtaatg tatcacrcag gaaaaatggt aat 33 <210> 408 <211> 33 <212> DNA <213> Homo sapiens <400> 408 gttttgttgg atttcgkatt aactatactc act 33 <210> 409 <211> 33 <212> DNA <213> Homo sapiens <400> 409 acactttaaa ttttcayaat tgccttggac cat 33 <210> 410 <211> 33 <212> DNA <213> Homo sapiens <400> 410 gtttcactcc actaackaca cttggcttaa tcc 33 <210> 411 <211> 33 <212> DNA <213> Homo sapiens <400> 411 gactttcagt tttgtawccc tagagctgcc ttg 33 <210> 412 <211> 33 <212> DNA <213> Homo sapiens <400> 412 cccctatgcc acatcarcca tcgagcccgg tgc 33 <210> 413 <211> 33 <212> DNA <213> Homo sapiens <400> 413 aagtaatcat aacctcrcaa agcttgagag tgt 33 <210> 414 <211> 33 <212> DNA <213> Homo sapiens <400> 414 gaaaactgtg gtttaasagt gagaaaggat cat 33 <210> 415 <211> 33 <212> DNA <213> Homo sapiens <400> 415 ctaatccagc acccacratt aacataaagg aaa 33 <210> 416 <211> 33 <212> DNA <213> Homo sapiens <400> 416 ctaataaagc aacaaawcta ttttatgtca tgg 33 <210> 417 <211> 33 <212> DNA <213> Homo sapiens <400> 417 ttacaggatc ctaagtsaaa acggtcatcc gcc 33 <210> 418 <211> 33 <212> DNA <213> Homo sapiens <400> 418 ttgtccttat ccattasact tcattttaca gaa 33 <210> 419 <211> 33 <212> DNA <213> Homo sapiens <400> 419 atcaacaaat ggataamcat tataccacat gaa 33 <210> 420 <211> 33 <212> DNA <213> Homo sapiens <400> 420 gtggtacaag caggcaytag tttcatgggg gtc 33 <210> 421 <211> 33 <212> DNA <213> Homo sapiens <400> 421 acctttatct cacatayagt ctctttcaat agc 33 <210> 422 <211> 33 <212> DNA <213> Homo sapiens <400> 422 ggttgaggta ctatgarctc acatttagga ttt 33 <210> 423 <211> 33 <212> DNA <213> Homo sapiens <400> 423 tttttccaat ccattaraaa tcattctgta tta 33 <210> 424 <211> 33 <212> DNA <213> Homo sapiens <400> 424 agcaaactca gaataaytga aattgcaata gca 33 <210> 425 <211> 33 <212> DNA <213> Homo sapiens <400> 425 caccttcatg tggaaastgt acaggcccct ttc 33 <210> 426 <211> 33 <212> DNA <213> Homo sapiens <400> 426 cagcaactat ccaagartac aacttcattt gct 33 <210> 427 <211> 33 <212> DNA <213> Homo sapiens <400> 427 tgccaagatt aaaaaayggt gcattcttgt tta 33 <210> 428 <211> 33 <212> DNA <213> Homo sapiens <400> 428 ttggcaacat cttgggrcat ggttagggcc atg 33 <210> 429 <211> 33 <212> DNA <213> Homo sapiens <400> 429 cccagggtgt cagctayatc caaggctaga aaa 33 <210> 430 <211> 33 <212> DNA <213> Homo sapiens <400> 430 ggttatgatg cgcatgkatc tggttaagtt aca 33 <210> 431 <211> 33 <212> DNA <213> Homo sapiens <400> 431 tacccagcta tatccayagt tgcaaaacaa agt 33 <210> 432 <211> 33 <212> DNA <213> Homo sapiens <400> 432 ctatgatgta aatgtarcaa atatgacttg att 33 <210> 433 <211> 33 <212> DNA <213> Homo sapiens <400> 433 tatccataat caatcayaca aaatacaagt aaa 33 <210> 434 <211> 33 <212> DNA <213> Homo sapiens <400> 434 gggcctgggt ggatccmaaa taagatatta ctg 33 <210> 435 <211> 33 <212> DNA <213> Homo sapiens <400> 435 cttaagaact tctcaaygaa atgaattatt tag 33 <210> 436 <211> 33 <212> DNA <213> Homo sapiens <400> 436 ataacaaaaa accaatmagt ctgtagaaaa atg 33 <210> 437 <211> 33 <212> DNA <213> Homo sapiens <400> 437 accatcaaat gttattwaag agagctataa aaa 33 <210> 438 <211> 33 <212> DNA <213> Homo sapiens <400> 438 aacaaatgcc tagaaamtat tggagaatta gaa 33 <210> 439 <211> 33 <212> DNA <213> Homo sapiens <400> 439 tttaaataac ttgagasaat ttcttcttga aaa 33 <210> 440 <211> 33 <212> DNA <213> Homo sapiens <400> 440 cctaatattt tctagarccc tctccaaaag gtc 33 <210> 441 <211> 33 <212> DNA <213> Homo sapiens <400> 441 ggagggagag agagcasacc taaatcttct acc 33 <210> 442 <211> 33 <212> DNA <213> Homo sapiens <400> 442 tcaacacgga agccccraaa gaatcttcag aca 33 <210> 443 <211> 33 <212> DNA <213> Homo sapiens <400> 443 ctgcttcttc ctggtcrcct attctcaatc ctt 33 <210> 444 <211> 33 <212> DNA <213> Homo sapiens <400> 444 ataaaagtct ataatawgag gcacctatgc aaa 33 <210> 445 <211> 33 <212> DNA <213> Homo sapiens <400> 445 ttcgggcatt atatacyggt gttttggaca aag 33 <210> 446 <211> 33 <212> DNA <213> Homo sapiens <400> 446 tgctcatagg agagaayata agaactctga gtg 33 <210> 447 <211> 33 <212> DNA <213> Homo sapiens <400> 447 agcagaataa tgtgacscaa aatcaagagg gaa 33 <210> 448 <211> 33 <212> DNA <213> Homo sapiens <400> 448 aaataataga gatccawcct agggagccat ttg 33 <210> 449 <211> 33 <212> DNA <213> Homo sapiens <400> 449 gagtacacta accagaygga tataaacatg agg 33 <210> 450 <211> 33 <212> DNA <213> Homo sapiens <400> 450 agccataagg aaatgcragg tcactgcttc cag 33 <210> 451 <211> 33 <212> DNA <213> Homo sapiens <400> 451 gtatttagtt tggtgcmgaa gtaacgcaca att 33 <210> 452 <211> 33 <212> DNA <213> Homo sapiens <400> 452 tactgcaaag aacacakgaa ttacaccttt ctt 33 <210> 453 <211> 33 <212> DNA <213> Homo sapiens <400> 453 tacacactgg aattaayaaa agcttttgca tta 33 <210> 454 <211> 33 <212> DNA <213> Homo sapiens <400> 454 atcacaagag ggtaaamtca gtgtcacagc aga 33 <210> 455 <211> 33 <212> DNA <213> Homo sapiens <400> 455 tttggtaaac tttgaarcac tactttatct act 33 <210> 456 <211> 32 <212> DNA <213> Homo sapiens <400> 456 ttacgagttc agtaaytgtg ggttgatgat gg 32 <210> 457 <211> 33 <212> DNA <213> Homo sapiens <400> 457 taatgattga ccttatkaca actctatatg act 33 <210> 458 <211> 33 <212> DNA <213> Homo sapiens <400> 458 agatggtcat gtttcaygga atttacataa taa 33 <210> 459 <211> 33 <212> DNA <213> Homo sapiens <400> 459 ggatttatcc tacaaasgca tataaatggg aaa 33 <210> 460 <211> 33 <212> DNA <213> Homo sapiens <400> 460 aaaagtatac aagaacycta tggcaatgtc aag 33 <210> 461 <211> 33 <212> DNA <213> Homo sapiens <400> 461 ttctgttctc ttcccarctg acaaggaaac ttc 33 <210> 462 <211> 33 <212> DNA <213> Homo sapiens <400> 462 acacatattt gcgttcrcca catacagtac aca 33 <210> 463 <211> 33 <212> DNA <213> Homo sapiens <400> 463 tttctcttca ctcccarcta aaacgtaagc tca 33 <210> 464 <211> 33 <212> DNA <213> Homo sapiens <400> 464 gaattctctc aaaaacycaa aataaagttg ttc 33 <210> 465 <211> 33 <212> DNA <213> Homo sapiens <400> 465 atgctatctt caaaagscaa taataccaaa gga 33 <210> 466 <211> 33 <212> DNA <213> Homo sapiens <400> 466 aagagcacct ggatacyggg gtcatgttag cgc 33 <210> 467 <211> 33 <212> DNA <213> Homo sapiens <400> 467 atgtccagag aatagcragg aagagaattg tag 33 <210> 468 <211> 33 <212> DNA <213> Homo sapiens <400> 468 taaatgcaaa aataaasgta gaaacaatgt gct 33 <210> 469 <211> 33 <212> DNA <213> Homo sapiens <400> 469 taagtgcaat taggaaygag tggaaacaat gag 33 <210> 470 <211> 33 <212> DNA <213> Homo sapiens <400> 470 cccaaaactc gaagtcyaaa gtcatatcca aga 33 <210> 471 <211> 33 <212> DNA <213> Homo sapiens <400> 471 tcaacactac agcaacmaag ttattagcta gta 33 <210> 472 <211> 33 <212> DNA <213> Homo sapiens <400> 472 agaggcttag gatataygcc ctgttcaata ttt 33 <210> 473 <211> 33 <212> DNA <213> Homo sapiens <400> 473 tttgctaacg aggctawgtg gtagattttt ttt 33 <210> 474 <211> 33 <212> DNA <213> Homo sapiens <400> 474 caaagggcag aacgtgragc agcatttgag gct 33 <210> 475 <211> 33 <212> DNA <213> Homo sapiens <400> 475 ctaattcttt tggatastaa accatgaaaa atg 33 <210> 476 <211> 33 <212> DNA <213> Homo sapiens <400> 476 gagcttcctc ttctgayggc aggagtttga agc 33 <210> 477 <211> 33 <212> DNA <213> Homo sapiens <400> 477 atgtatccat tacccasatt taagaaataa tat 33 <210> 478 <211> 33 <212> DNA <213> Homo sapiens <400> 478 gtttgcatac atcacargtt atttggggaa gta 33 <210> 479 <211> 33 <212> DNA <213> Homo sapiens <400> 479 tgtgttgcac gttcagrcaa tggctcctaa aat 33 <210> 480 <211> 33 <212> DNA <213> Homo sapiens <400> 480 ctgccctcat tgaacaragg aaaactgaga tgc 33 <210> 481 <211> 33 <212> DNA <213> Homo sapiens <400> 481 caccactgga gaggtaygac acactggtgt gtg 33 <210> 482 <211> 33 <212> DNA <213> Homo sapiens <400> 482 tcacttggat gtataamcgt gaacaaacta ctt 33 <210> 483 <211> 33 <212> DNA <213> Homo sapiens <400> 483 tgaacaaaat ggatgargtt ctatcttcct gag 33 <210> 484 <211> 33 <212> DNA <213> Homo sapiens <400> 484 ccaaatataa caaaaamcag atcataaacc tca 33 <210> 485 <211> 33 <212> DNA <213> Homo sapiens <400> 485 cctgtgtgga gactgcraaa tacagacttt tta 33 <210> 486 <211> 33 <212> DNA <213> Homo sapiens <400> 486 aggatgctga gcttccraga aattgatgga cct 33 <210> 487 <211> 33 <212> DNA <213> Homo sapiens <400> 487 ctggtgtatc ttggtaraag ctttagaaag ttt 33 <210> 488 <211> 33 <212> DNA <213> Homo sapiens <400> 488 ttagcaaatg aatgaaraat tatttagcag ctg 33 <210> 489 <211> 33 <212> DNA <213> Homo sapiens <400> 489 actacctcat tatacgwaag acctaattca atc 33 <210> 490 <211> 33 <212> DNA <213> Homo sapiens <400> 490 tggggataga gggaaamagg attctgagct agg 33 <210> 491 <211> 33 <212> DNA <213> Homo sapiens <400> 491 tttggcttta gggaatkaaa ttatttctgg ctg 33 <210> 492 <211> 33 <212> DNA <213> Homo sapiens <400> 492 aaaaaaagga aaagccrgaa tgctatggac tga 33

Claims (50)

  1. 인간 개체에 자궁내막증의 발생에 대해 변경된 위험(altered risk)을 가지는 지를 결정하는 방법에 있어서,
    개체의 유전자 물질내에서 표 1 또는 표 2의 변형(polymorphism) 또는 표 1 또는 표 2의 변형과 연관 비평형(linkage disequilibrium)에 있는 변형에서 선택된 하나 또는 그 이상 보호성 또는 고위험 변형의 유무를 감지하고, 이때 변형은 자궁내막증의 변경된 위험과 연관된 것을 특징으로 하는 방법.
  2. 제 1 항에 있어서, 변형은 인간 개체내 자궁내막증 발생의 사전징후 위험과 연관된 것을 특징으로 하는 방법.
  3. 제 1 항에 있어서, 각 독립 변수 세트가 이분적 종속 변수(dichotomous dependent variable)에 독특한 전조적 상관관계(unique predictive relationship)를 가지는 지를 결정함으로써 자궁내막증 발생의 변경된 위험을 측정하는 단계가 추가 포함되는 것을 특징으로 하는 방법.
  4. 제 3 항에 있어서, 자궁내막증 발생의 변경 위험을 평가하는 단계는 로직 회귀 분석을 포함하는 알고리즘을 이용하는 것을 특징으로 하는 방법.
  5. 제 1 항에 있어서, 표 1 또는 표 2의 변형과 연관 비평형의 관계에 있는 변형은 표 3-196의 변형에서 선택되는 것을 특징으로 하는 방법.
  6. 사람 개체가 자궁내막증 발생의 변경된 위험을 가지는 지를 결정하는 방법에 있어서,
    개체의 유전자 물질내에서 표 1 또는 표 2의 변형(polymorphism) 또는 표 1 또는 표 2의 변형과 연관 비평형(linkage disequilibrium)에 있는 변형에서 선택된 하나 또는 그 이상 보호성 또는 고위험 변형의 유무를 감지하고, 이때 변형은 자궁내막증의 변경된 위험과 연관되고; 그리고
    초경나이, BMI 및 자궁내막증과 연관된 다른 인자들에서 선택된 하나 또는 그 이상 비-유전적 임상 인자들과 연관된 위험을 평가하는 것을 포함하는 방법.
  7. 제 6 항에 있어서, 변형은 인간 개체내 자궁내막증 발생의 사전징후 위험과 연관된 것을 특징으로 하는 방법.
  8. 제 6 항에 있어서, 각 독립 변수 세트가 이분적 종속 변수(dichotomous dependent variable)에 독특한 전조적 상관관계(unique predictive relationship)를 가지는 지를 결정함으로써 자궁내막증 발생의 변경된 위험을 측정하는 단계가 추가 포함되는 것을 특징으로 하는 방법.
  9. 제 8 항에 있어서, 자궁내막증 발생의 변경 위험을 평가하는 단계는 로직 회귀 분석을 포함하는 알고리즘을 이용하는 것을 특징으로 하는 방법.
  10. 제 6 항에 있어서, 표 1 또는 표 2의 변형과 연관 비평형의 관계에 있는 변형은 표 3-196의 변형에서 선택되는 것을 특징으로 하는 방법.
  11. 표 1 또는 표 2의 변형 또는 표 1 또는 표 2의 변형과 연관 비평형에 있는 변형 또는 이의 상보체에서 선택된 변형의 뉴클레오티드 서열을 포함하는 증폭된 폴리뉴클레오티드에 있어서, 증폭된 폴리뉴클레오티드는 길이가 약 16개 뉴클레오티드이상인 것을 특징으로 하는 증폭된 폴리뉴클레오티드.
  12. 제 11 항에 있어서, 표 1 또는 표 2의 변형과 연관 비평형의 관계에 있는 변형은 표 3-196의 변형에서 선택되는 것을 특징으로 하는 증폭된 폴리뉴클레오티드.
  13. 제 11 항에 있어서, 변형은 표 1 또는 표 2의 변형에서 선택되는 것을 특징으로 하는 증폭된 폴리뉴클레오티드.
  14. 표 1 또는 표 2의 변형 또는 표 1 또는 표 2의 변형과 연관 비평형에 있는 변형 또는 이의 상보체에서 선택된 변형의 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 특이적으로 하이브리드되는 분리된 폴리뉴클레오티드.
  15. 제 14 항에 있어서, 길이가 약 8-70개인 것을 특징으로 하는 폴리뉴클레오티드.
  16. 제 14 항에 있어서, 폴리뉴클레오티드는 대립유전자-특이적 프로브인 것을 특징으로 하는 폴리뉴클레오티드.
  17. 제 14 항에 있어서, 폴리뉴클레오티드는 대립유전자-특이적 프라이머인 것을 특징으로 하는 폴리뉴클레오티드.
  18. 제 14 항에 있어서, 표 1 또는 표 2의 변형과 연관 비평형의 관계에 있는 변형은 표 3-196의 변형에서 선택되는 것을 특징으로 하는 폴리뉴클레오티드.
  19. 제 18 항에 있어서, 길이가 약 8-70개인 것을 특징으로 하는 폴리뉴클레오티드.
  20. 제 18 항에 있어서, 폴리뉴클레오티드는 대립유전자-특이적 프로브인 것을 특징으로 하는 폴리뉴클레오티드.
  21. 제 18 항에 있어서, 폴리뉴클레오티드는 대립유전자-특이적 프라이머인 것을 특징으로 하는 폴리뉴클레오티드.
  22. 제 14 항에 있어서, 변형은 표 1 또는 표 2의 변형에서 선택되는 것을 특징으로 하는 폴리뉴클레오티드.
  23. 제 22 항에 있어서, 길이가 약 8-70개인 것을 특징으로 하는 폴리뉴클레오티드.
  24. 제 22 항에 있어서, 폴리뉴클레오티드는 대립유전자-특이적 프로브인 것을 특징으로 하는 폴리뉴클레오티드.
  25. 제 22 항에 있어서, 폴리뉴클레오티드는 대립유전자-특이적 프라이머인 것을 특징으로 하는 폴리뉴클레오티드.
  26. 개체에서 징후 또는 사전 징후적 자궁내막증에 변경된 위험을 가리키는 핵산 변형을 감지하는 키트는 제14항에 따른 폴리뉴클레오티드, 효소, 완충액, 유전자 변형을 감지하는데 이용되는 시약들을 포함하는 것을 특징으로 하는 키트.
  27. 제 26 항에 있어서, 비-유전적 임상 인자 질문사항이 추가 포함된 것을 특징으로 하는 키트.
  28. 개체에서 징후 또는 사전 징후적 자궁내막증에 변경된 위험을 가리키는 핵산 변형을 감지하는 키트는 제18항에 따른 폴리뉴클레오티드, 효소, 완충액, 유전자 변형을 감지하는데 이용되는 시약들을 포함하는 것을 특징으로 하는 키트.
  29. 제 28 항에 있어서, 비-유전적 임상 인자 질문사항이 추가 포함된 것을 특징으로 하는 키트.
  30. 개체에서 징후 또는 사전 징후적 자궁내막증에 변경된 위험을 가리키는 핵산 변형을 감지하는 키트는 제14항에 따른 폴리뉴클레오티드, 효소, 완충액, 유전자 변형을 감지하는데 이용되는 시약들을 포함하는 것을 특징으로 하는 키트.
  31. 제 30 항에 있어서, 비-유전적 임상 인자 질문사항이 추가 포함된 것을 특징으로 하는 키트.
  32. 자궁내막증 발생의 변경된 위험과 관련된 변형(polymorphism)을 핵산에서 감지하는 방법에 있어서,
    표 1 또는 표 2의 변형 또는 표 1 또는 표 2의 변형과 연관 비평형에 있는 변형 또는 이의 상보체에서 선택된 하나 또는 그 이상 보호성 또는 고위험 변형을 가지는 폴리뉴클레오티드 서열에 스트린젼트 하이브리드 반응 조건하에 특이적으로 하이브리드되는 폴리뉴클레오티드 서열에 테스트 샘플을 접촉시키고, 이때 변형은 자궁내막증 발생의 변경된 위험과 연관되며; 그리고
    하이브리드된 듀플렉스 형성을 감지하는 것을 포함하는 방법.
  33. 제 32 항에 있어서, 변형은 사람 개체에서 자궁내막증 발생의 사전 징후적 위험과 관련된 것을 특징으로 하는 방법.
  34. 제 32 항에 있어서, 각 독립 변수 세트가 이분적 종속 변수(dichotomous dependent variable)에 독특한 전조적 상관관계(unique predictive relationship)를 가지는 지를 결정함으로써 자궁내막증 발생의 변경된 위험을 측정하는 단계가 추가 포함되는 것을 특징으로 하는 방법.
  35. 제 32 항에 있어서, 자궁내막증 발생의 변경 위험을 평가하는 단계는 로직 회귀 분석을 포함하는 알고리즘을 이용하는 것을 특징으로 하는 방법.
  36. 제 32 항에 있어서, 표 1 또는 표 2의 변형과 연관 비평형의 관계에 있는 변형은 표 3-196의 변형에서 선택되는 것을 특징으로 하는 방법.
  37. 자궁내막증 돌연변이를 감지하는 기구에 있어서,
    어레이에 부착된 다수의 폴리뉴클레오티드를 포함하는 DNA 칩 어레이, 이때 각 폴리뉴클레오티드는 표 1 또는 표 2의 변형 또는 표 1 또는 표 2의 변형과 연관 비평형에 있는 변형 또는 이의 상보체에서 선택된 변형을 포함하고;
    SNP를 감지하는 장치를 포함하는 기구.
  38. 제 37 항에 있어서, 표 1 또는 표 2의 변형과 연관 비평형의 관계에 있는 변형은 표 3-196의 변형에서 선택되는 것을 특징으로 하는 기구.
  39. 제 37 항에 있어서, 변형은 표 1 또는 표 2의 변형에서 선택되는 것을 특징으로 하는 기구.
  40. 자궁내막증 발생의 변경된 위험과 연관된 변형을 동정(identifying)하는 방법에 있어서, 이 방법은 표 1 - 196에서 제시된 변형과 연관 비평형에 있는 변형을 동정하는 단계를 포함하는 것을 특징으로 하는 방법.
  41. 제 40 항에 있어서, 방법은 표 1 또는 표 2의 변형 세트와 연관 비평형에 있는 변형을 개체의 유전 물질에서 확인하는 단계를 포함하는 것을 특징으로 하는 방법.
  42. 제 40 항에 있어서, 방법은 표 3-196의 변형 세트와 연관 비평형에 있는 변형을 개체의 유전 물질에서 확인하는 단계를 포함하는 것을 특징으로 하는 방법.
  43. 사람 개체를 스크리닝하는 방법에 있어서, 다음의 단계를 포함하는 것을 특징으로 하는 방법:
    사람 개체의 유전 물질 샘플을 구하고;
    유전 물질을 조사하고;
    자궁내막증 존재 상태, 자궁내막증 비존재 상태, 자궁내막증 진행 상태의 위험으로 구성된 자궁내막증과 관련된 상태중 최소 하나의 자궁내막증과 연관된 최소 하나의 사람 유전자 연합된 유전자 마크의 존부를 유전 물질에서 감지하고, 이때 유전자 마커의 사람 유전자 연합되는 사람 유전자는 다음의 군에 속하는 유전자를 제외한 임의 사람 유전자에서 선택되며; ACE, ADAR, AEBP1, AhRR, AHSG, APOE, AR, BRAF, C3, CCL5, CDH1, CLDN4, COL1A2, COL3A1, COMT, CSRP1, CSTB, CTSD, CYP1A1, CYP1B1, CYP17A1, CYP19A1, CYP27B1, DUSP1, EF1alpha, EGFR, EGR1, ERalpha, ERbeta, ESR1, ESR2, FAS, FASLG, FLT-1, FSHR, FTL, GALT, GSN, GSTM1, GSTP1, GSTT1, GSTT1, HLA-A, HLA-B, HLA-C, HLA-DPB1, HLA-DQA1, HLA-DQB1, HLA-DRB1, HRF, HSD17B1, HSD17B1, IB-1, ICAM-1, IFNG, IGFBP3, IGL, IL-1R, IL-1RA, IL-2R, IL-6, IL-10, KRAS, LTA, MCAM, MMP1, MMP3, MMP7, NACA, NAT2, NOS3, NR3C1, NRIP1, P4HB, PAEP, PAI1, PCOLCE, PGR, PLAT (tPA), PLAU (uPA), PODXL, PPARgamma2, PSAP, PTEN, RACK1, RAD21, RANTES, RPS6, SERPINA1, SERPINE1, SFRP4, StAR, STAT6, STMY3, TAFI, TCN2, TGFbeta1, TNFalpha, TNFR2, TNFRSF1B, TSG, VEGF, VEGF, VEGFR;
    유전자 마커의 감지에 반응한다.
  44. 제 43 항에 있어서, 반응 단계는 다음의 반응 단계중 최소 하나로 정의되는 것을 특징으로 하는 방법;
    자궁내막증 관련된 상태에 사람 개체의 성향의 평가된 위험을 나타내고,
    각 독립 변수 세트가 이분적 종속 변수(dichotomous dependent variable)에 독특한 전조적 상관관계(unique predictive relationship)를 가지는 지를 결정함으로써 자궁내막증 발생의 변경된 위험을 측정하고,
    자궁내막증 관련된 상태를 부분적으로 보상하는 치료체의 수용체로써 사람 개체를 선별하고,
    개체에 자궁내막증 관련 상태를 최소 부분적으로 보상하는 적절한 치료제를 사람 개체에 투여하여 개체를 치료하고,
    자궁내막증 관련 상태를 최소 부분적으로 보상하는 적절한 치료제를 개발하고,
    자궁내막증 관련 상태의 치료를 위해 적절한 치료제를 이용하는 것과 관련된 임상 시도를 위해 사람 개체를 선별하고, 그리고 사람 개체에서 최소 한 가지 비-유전적 임상 인자를 보이는 경우에 개체는 자궁내막증 관련된 상태에 대한 위험 성향이 증가된 것으로 지정한다.
  45. 제 44 항에 있어서, 적절한 치료제는 최소 하나의 의료 장치, 최소 하나의 약물, 그리고 최소 하나의 치료장치와 최소 하나의 약물를 포함하는 군의 최소 하나의 치료제로 정의되는 것을 특징으로 하는 방법.
  46. 제 44 항에 있어서, 자궁내막증 관련 상태의 변경된 위험의 평가는 로직 회귀 분석을 포함하는 알고리즘을 포함하는 것을 특징으로 하는 방법.
  47. 제 44 항에 있어서, 최소 하나의 비-유전적 임상 인자는 초경나이, BMI 및 자궁내막증과 연관된 다른 인자들에서 선택되는 것을 특징으로 하는 방법.
  48. 제 43 항에 있어서, 상관계수는 자궁내막증 관련 상태 집단과 대조군 집단의 변경괸 위험 사이에 0.01 Chi 제곱 분할 p 값(Chi square contingency p value)으로 정의되는 것을 특징으로 하는 방법.
  49. 제 43 항에 있어서, 유전자 마커는 표 1 또는 표 2의 변형 또는 표 1 또는 표 2의 변형과 연관 비평형에 있는 변형 또는 표1과 표2의 변형의 상보체, 그리고 표 1과 표 2의 변형과 연관 비평형에 있는 변형의 상보체로 구성된 변형 군에서 최소 하나의 변형으로 정의되는 것을 특징으로 하는 방법.
  50. 제 43 항에 있어서, 사람 개체는 자궁내막증 관련 상태의 사전 증후를 가지는 것을 특징으로 하는 방법.
KR1020097025865A 2007-06-11 2008-06-06 자궁내막증과 연관된 유전자 마커 및 이의 용도 KR20100020960A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US94319307P 2007-06-11 2007-06-11
US60/943,193 2007-06-11
US12/056,754 US20080305967A1 (en) 2007-06-11 2008-03-27 Genetic Markers Associated with Endometriosis and Use Thereof
US12/056,754 2008-03-27

Publications (1)

Publication Number Publication Date
KR20100020960A true KR20100020960A (ko) 2010-02-23

Family

ID=40096425

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097025865A KR20100020960A (ko) 2007-06-11 2008-06-06 자궁내막증과 연관된 유전자 마커 및 이의 용도

Country Status (7)

Country Link
US (1) US20080305967A1 (ko)
EP (1) EP2167659A4 (ko)
KR (1) KR20100020960A (ko)
AU (1) AU2008261970A1 (ko)
CA (1) CA2689631A1 (ko)
IL (1) IL202312A0 (ko)
WO (1) WO2008154352A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021132920A1 (ko) * 2019-12-27 2021-07-01 주식회사 클리노믹스 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법
KR20220052497A (ko) * 2020-10-21 2022-04-28 (주)비엠에스 유전자 발현 수준을 이용한 자궁내막증 진단을 위한 정보 제공 방법 및 이를 위한 조성물

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010124101A2 (en) 2009-04-22 2010-10-28 Juneau Biosciences, Llc Genetic markers associated with endometriosis and use thereof
CN101781684B (zh) * 2010-01-29 2013-04-24 广州益善生物技术有限公司 Cyp19a1基因snp检测液相芯片及检测方法
KR101725556B1 (ko) 2011-08-03 2017-04-12 주식회사 엘지생활건강 미백 피부 타입 유전자 다형성 마커 및 이의 용도
US11221327B2 (en) * 2013-10-10 2022-01-11 Mcmaster University Method for diagnosing and monitoring inflammatory disease progression
EP2891722B1 (en) * 2013-11-12 2018-10-10 Population Bio, Inc. Methods and compositions for diagnosing, prognosing, and treating endometriosis
US20170112881A1 (en) * 2016-01-06 2017-04-27 Predictive Therapeutics, LLC Method of Treating Endometriosis
US10240205B2 (en) 2017-02-03 2019-03-26 Population Bio, Inc. Methods for assessing risk of developing a viral disease using a genetic test
CA3057613A1 (en) * 2017-03-15 2018-09-20 Juneau Biosciences, L.L.C. Methods of using genetic markers associated with endometriosis
US20200063202A1 (en) * 2018-04-25 2020-02-27 Juneau Biosciences, L.L.C. Methods of using genetic markers associated with endometriosis
CA3108807A1 (en) 2018-08-08 2020-02-13 Pml Screening, Llc Methods for assessing the risk of developing progressive multifocal leukoencephalopathy caused by john cunningham virus by genetic testing
CN109371114A (zh) * 2018-12-26 2019-02-22 银丰基因科技有限公司 Hla-dqb1基因分型试剂盒
WO2020180424A1 (en) 2019-03-04 2020-09-10 Iocurrents, Inc. Data compression and communication using machine learning
JP7097852B2 (ja) * 2019-04-23 2022-07-08 ジェネシスヘルスケア株式会社 子宮内膜症のリスクを判定する方法
CN115966259B (zh) * 2022-12-26 2023-10-13 南京普恩瑞生物科技有限公司 一种基于逻辑回归建模的样本同源性检测校验方法及系统

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7122322B2 (en) * 1994-10-25 2006-10-17 The Curators Of The University Of Missouri Endometriosis-specific secretory protein
DE19824230A1 (de) * 1998-05-29 1999-12-02 Starzinski Powitz Anna Neues Endometriose-assoziiertes Gen
CA2366774A1 (en) * 1999-04-02 2000-10-12 Center For Molecular Medicine And Immunology Method of detecting endometriosis
WO2001032920A2 (en) * 1999-11-03 2001-05-10 Metris Therapeutics Limited Agents implicated in endometriosis
GB0004232D0 (en) * 2000-02-24 2000-04-12 Zeneca Ltd Diagnostic method
ES2336817T3 (es) * 2000-02-25 2010-04-16 Siemens Healthcare Diagnostics Inc. Marcadores relacionados con la endometriosis y usos de los mismos.
US6780594B2 (en) * 2000-09-25 2004-08-24 Schering Aktiengesellschaft Method for in vitro diagnosis of endometriosis
GB0025132D0 (en) * 2000-10-13 2000-11-29 Medical Res Council Method
US20020147155A1 (en) * 2001-04-06 2002-10-10 Foster Warren G. Prevention and treatment of endometriosis with aryl hydrocarbon receptor binding ligands
CA2475298A1 (en) * 2002-02-13 2003-08-21 Kamran Shazand Cd16b as a marker for the diagnosis of endometriosis
JP2005532394A (ja) * 2002-07-02 2005-10-27 ガリレオ ファーマシューティカルズ, インコーポレイティド 雌性被験体における炎症性症状および/またはバイオマーカーの低減のための組成物および方法
US20050214836A1 (en) * 2002-08-30 2005-09-29 Oncotherapy Science, Inc. Method of diagnosing ovarian endometriosis
US20040210400A1 (en) * 2003-01-27 2004-10-21 Perlegen Sciences, Inc. Analysis methods for individual genotyping
WO2005008251A2 (en) * 2003-07-11 2005-01-27 Praecis Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of endometriosis
CA2532534A1 (en) * 2003-07-14 2005-01-20 Japan Science And Technology Agency Methods for diagnosing endometriosis-related diseases
SG109604A1 (en) * 2003-09-03 2005-03-30 Singapore General Hospital Pte Method and probes for diagnosing a gynaecological condition
EP1730183A2 (en) * 2004-01-27 2006-12-13 Compugen USA, Inc. Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of endometriosis
US7943324B2 (en) * 2004-12-22 2011-05-17 The Trustees Of The University Of Pennsylvania Endometriosis markers
CA2607341A1 (en) * 2005-05-05 2006-11-09 Mount Sinai Hospital Diagnosis and treatment of endometriosis
US7399598B2 (en) * 2005-10-14 2008-07-15 Taipei Medical University Diagnosis method of endometriosis by detecting biochemical markers and usage of these biochemical markers
WO2007076501A2 (en) * 2005-12-23 2007-07-05 The Burnham Institute For Medical Research Endometriosis cell targeting peptide and uses thereof
US20070287676A1 (en) * 2006-05-16 2007-12-13 Sun-Wei Guo Diagnosis and treatment of endometriosis

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021132920A1 (ko) * 2019-12-27 2021-07-01 주식회사 클리노믹스 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법
KR20220052497A (ko) * 2020-10-21 2022-04-28 (주)비엠에스 유전자 발현 수준을 이용한 자궁내막증 진단을 위한 정보 제공 방법 및 이를 위한 조성물

Also Published As

Publication number Publication date
WO2008154352A2 (en) 2008-12-18
WO2008154352A3 (en) 2009-02-26
CA2689631A1 (en) 2008-12-18
EP2167659A4 (en) 2010-10-13
EP2167659A2 (en) 2010-03-31
AU2008261970A1 (en) 2008-12-18
US20080305967A1 (en) 2008-12-11
IL202312A0 (en) 2011-08-01

Similar Documents

Publication Publication Date Title
KR20100020960A (ko) 자궁내막증과 연관된 유전자 마커 및 이의 용도
JP5620058B2 (ja) 染色体10q26上の加齢性黄斑変性症(ARM)に対する感受性遺伝子
US11287425B2 (en) Genetic markers associated with endometriosis and use thereof
JP5409658B2 (ja) 静脈血栓症に関連した遺伝子多型、その検出方法および使用
US10991450B2 (en) Materials and methods for determining metabolizer status in humans
JP2009521904A (ja) 狭窄に関連する一塩基多型、その検出方法および使用
JP2009520460A (ja) 心筋梗塞に関連する遺伝的多型、その検出方法および使用
US20160053322A1 (en) Genetic markers associated with scoliosis and uses thereof
US20200087728A1 (en) Genetic markers associated with endometriosis and use thereof
US20090035768A1 (en) Method of Determining Predisposition to Scoliosis and Uses Thereof
US20130310261A1 (en) Simplified Method of Determining Predisposition to Scoliosis
US20080306034A1 (en) Method of Administering a Therapeutic
US20130288913A1 (en) Method of determining predisposition to scoliosis
US20100003691A1 (en) Genetic Markers Associated with Degenerative Disc Disease and Uses Thereof
US20130237447A1 (en) Genetic markers associated with scoliosis and uses thereof
WO2009140126A1 (en) Method of administering a therapeutic
US10770183B2 (en) Methods of assessing a risk of developing necrotizing meningoencephalitis
US20150337373A1 (en) Genetic Markers Associated with Degenerative Disc Disease and Uses Thereof
US20140045717A1 (en) Single Nucleotide Polymorphism Biomarkers for Diagnosing Autism
WO2008049111A1 (en) Genetic markers of chromosome 3 associated with scoliosis and use thereof
WO2008006001A2 (en) Genetic polymorphisms associated with scoliosis and use thereof
WO2008033813A1 (en) Genetic markers on chromosome 7 associated with scoliosis and use thereof
JP2011239697A (ja) パーキンソン病発症リスクマーカー

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid