KR20060126499A - RNAi 효능의 예측 방법 - Google Patents
RNAi 효능의 예측 방법 Download PDFInfo
- Publication number
- KR20060126499A KR20060126499A KR1020067011510A KR20067011510A KR20060126499A KR 20060126499 A KR20060126499 A KR 20060126499A KR 1020067011510 A KR1020067011510 A KR 1020067011510A KR 20067011510 A KR20067011510 A KR 20067011510A KR 20060126499 A KR20060126499 A KR 20060126499A
- Authority
- KR
- South Korea
- Prior art keywords
- rnai
- sirna
- artificial
- dna
- reagent
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering N.A.
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/10—Applications; Uses in screening processes
- C12N2320/11—Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Organic Chemistry (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Neurosurgery (AREA)
- Neurology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Veterinary Medicine (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
Abstract
본 발명은 RNAi 시약의 RNAi 효능을 예측하기 위한 알고리즘을 작성하는 방법을 제공한다. 또한, 본 발명은 RNA 시약의 RNAi 효능을 예측하는 방법, 및 이러한 알고리즘을 사용하여 소정의 표적 유전자의 발현을 억제하는 방법을 제공한다.
RNA 간섭, RNAi 시약, RNAi 효능, 알고리즘, 표적 유전자, 인공적인 뉴론성 네트워크, 훈련
Description
본 발명은 일반적으로 RNA 간섭 (RNA interference; RNAi)에 관한 것이며, 특히 인공적인 뉴론성 네트워크에 의해서 훈련된 알고리즘 (algorithm)을 사용하여 높은 RNAi 효능의 RNAi 시약을 수득하는 방법에 관한 것이다.
엘바셔 (Elbashir) 등은 RNA 간섭 (RNAi) 기전을 통해서 포유동물 세포에서 특정의 mRN 하향 조절 (down regulation)을 매개하는 합성 소형 간섭성 RNA (small interfering RNA; siRNA)의 능력을 입증하였기 때문에 [참조예: Elnashir et al., Nature, Vol. 411, pp. 494-498 (2001); 및 Caplen et al., PNAS, Vol. 98, No. 17, pp. 9742-9747 (2001)], 이 기술은 소정의 유전자의 특정한 하향-조절에 의해서 유도된 표현형을 탐색함으로써 유전자 기능을 조사하기 위한 연구도구로서 사용이 증가되었다. 특히, siRNA 또는 RNA-간섭 타입의 시약을 사용함에 의한 유전자 침묵 실험 (gene silencing experiment)은 단지 표적화된 유전자의 뉴클레오타이드 서열의 일부분에 대한 지식만을 필요로 하기 때문에, 일단 특정한 유기체의 게놈이 공지되어 있기만 하면, 모든 유전자에 대한 RNAi 실험을 디자인하고, 예를 들어, 치료학적 표적 발견에 적절한 표현형을 스크리닝하는 것을 구상할 수 있다. 이러한 게놈 전체에 걸친 접근방법은 RNAi 시약의 디자인을 위한 설명서를 작성한다. 실제로, 표적-이외의 침묵 (off-target silencing)을 회피하는 특이성 파라메터가 특별히 중요한 것이 된다. 또한, 개별적인 siRNA의 효능에 대한 특정화는 더 이상 구상할 수 없다. 따라서, 효능 예측 알고리즘은 유전자 전체에 걸친 표현형 스크린에 대하여 RNA 유전자 침묵실험을 적용하는 것을 필요로 한다.
안티센스와 유사하게, 표적 접근성 (accessibility)이 siRNA의 효능에 중요한 역할을 하는 것으로 믿어진다 [참조: Kretschmer-Kazemi et al., Nucleic Acids Res., Vol. 31, No. 15, pp. 4417-4424 (2003)]. 최근에 또 다른 연구 [참조: Anastasia Khvorova, Cell, Vol. 115, pp. 209-216 (2003)]는 안티센스 스트랜드의 9-14 영역에서뿐만 아니라 안티센스 스트랜드의 5'에서의 dsRNA의 낮은 내부적 안정성과 같은, siRNA 및 miRNA 효능을 유발하는 몇 가지의 서열 필요조건을 밝혀내었다. 이들 소견은 siRNA 효능과 이중 내부 열역학적 안정성 사이의 관계에 대한 통계학적 분석에 의해서 수득되었다. 이 분석법은 3가지 상이한 표적에 대한 375개의 무작위적으로 선택된 siRNA의 siRNA 효능을 기초로 하였다.
RNAi 기전이 완전히 특정화되지 않았고, 다수의 추가의 파라메터가 siRNA 효능에 대한 영향을 가질 수 있다는 사실을 가정하면, 서열-활성 관계에 대하여 더 잘 이해하기 위하여 더 큰 기능적 데이타 셋트를 획득하는 것이 유익할 것이다.
발명의 요약
한가지 국면에서, 본 발명은 a) 리포터 단백질 리드아웃 (readout)을 하향 조절하는 다수의 RNAi 시약의 효능을 실험적으로 결정하고; b) 상기 효능 데이타 셋트틀 사용하여 인공적인 뉴론성 네트워크를 훈련시키는 것을 포함하는, RNAi 시약의 RNAi 효능을 예측하기 위한 알고리즘을 작성하는 방법에 관한 것이다.
또 다른 국면에서, 본 발명은 본 발명에 따르는 방법에 의해서 수득된 알고리즘에 관한 것이다.
또 다른 국면에서, 본 발명은 a) 소정의 표적 유전자에 대해 상보적인 영역을 포함하는 다수의 RNAi 시약 서열을 제공하고; b) 본 발명에 따르는 훈련된 인공적인 뉴론성 네트워크를 상기 RNAi 시약 서열에 적용하고; c) 효능이 있는 것으로 예측되는 RNAi 시약 서열(들)을 선택하는 것을 포함하는, RNAi 시약의 RNAi 효능을 예측하는 방법에 관한 것이다.
또 다른 국면에서, 본 발명은 a) 소정의 표적 유전자에 대해 상보적인 영역을 포함하는 다수의 RNAi 시약 서열을 제공하고; b) 본 발명에 따르는 훈련된 인공적인 뉴론성 네트워크를 상기 RNAi 시약 서열에 적용하고; c) 효능이 있는 것으로 예측되는 RNAi 시약 서열(들)을 선택하고; d) 단계 c)에서 선택된 RNAi 시약(들)을 합성하고; e) 표적 유전자를 발현하는 세포를 단계 d)의 RNAi 시약(들)에 노출시키고; f) 표적 유전자의 하향 조절에 의해서 유도될 수 있는 RNAi 시약 또는 다른 표현형의 활성을 측정하는 것을 포함하는, 소정의 표적 유전자의 발현을 억제하는 방법에 관한 것이다.
도 1은 표준화된 데이타 셋트의 예이다. YFP mRNA의 3'-UTR 삽입물을 표적화한 79 siRNA는 리포터 융합 mRNA (H1299, 50 nM, 50 h에서 리드아웃)에 의해서 공동-형질감염되었다. 회색 바아 (bar)는 3'-UTR 표적화 siRNA이고, 흑색 바아는 양성 및 음성 대조군이다. 음성 대조군은 10% 효능에서의 임의의 셋트이고, 양성 대조군은 90% 효능에서의 셋트이다. 각각의 siRNA 효능은 이들 대조군에 따라서 표준화되었다.
도 2는 스크리닝 데이타의 필터링 (filtering)을 설명하는 것이다.
도 3은 훈련 셋트에 대한 예측 대 스크리닝 측정치의 비교를 나타낸 것이다.
도 4는 시험 셋트에 대한 예측 대 스크리닝 측정치의 비교를 나타낸 것이다.
도 5는 훈련 셋트의 크기로부터 예측 - 측정치 상관관계 (시험 셋트에 대함)의 의존성을 나타낸 것이다.
본 명세서에서 인용된 모든 특허출원, 특허 및 문헌자료들은 여기에 온전히 그대로 참고로 포함되어 있다.
본 명세서에서 사용된 것으로, 용어 "RNAi 시약" 및 "올리고리보뉴클레오타이드"는 상호 교환적으로 사용되며, 리보핵산 (RNA) 또는 데옥시리보핵산 (DNA)의 올리고머 또는 폴리머, 또는 그의 유사체를 의미한다. RNAi 시약은 또한, 변형된 리보뉴클레오타이드 잔기를 포함할 수도 있다. 적합한 변형은 본 기술분야에서 공지되어 있다 [참조예: Uhlmann, Current Opin. Drug Discovery Dev., Vol. 3, No. 2, pp. 203-213 (2000); 및 Uhlmann and Peyman, Chem. Rev., Washington, DC, Vol. 90, No. 4, pp. 543-584 (1990)]. 용어 RNAi 시약은 단일-스트랜드 및 이중-스트랜드 핵산 분자 둘 다를 포함한다. 이중-스트랜드 핵산 분자는 두개의 별도의 스트랜드로, 또는 이중-스트랜드 구조를 형성할 수 있는 두개의 영역을 포함하는 하나의 스트랜드와 헤어핀 루프 (hairpin loop)를 형성하는 두개의 영역 사이의 스페이서 (spacer) 영역으로 구성될 수 있다. RNAi와 관련하여, RNAi 시약은 바람직하게는 이중-스트랜드 구조를 가지며, 표적 유전자에 대해 상보적인 서열을 포함한다. 그러나, 본 발명은 이중 스트랜드 구조로 제한되는 것은 아니며, RNAi를 유도할 수 있는 단일-스트랜드 RNAi 시약도 포함한다 (참조: Schwarz et al., Mol. Cell. Vol. 10, No. 3, pp. 537-548 (2002)).
첫번째 국면에서, 본 발명은 a) 리포터 단백질 리드아웃을 하향 조절하는 다수의 RNAi 시약의 효능을 실험적으로 결정하고; b) 상기 효능 데이타 셋트틀 사용하여 인공적인 뉴론성 네트워크를 훈련시키는 것을 포함하는, RNAi 시약의 RNAi 효능을 예측하기 위한 알고리즘을 작성하는 방법을 제공한다.
한가지 구체예에서, RNAi 시약의 RNAi 효능을 예측하기 위한 알고리즘을 작성하는 방법은 a) 하나 이상의 표적 유전자에 대해 상보적인 서열을 포함하는 다수의 RNAi 시약의 RNAi 효능을 실험적으로 결정하고; b) 단계 a)의 실험적으로 결정된 RNAi 효능을 갖는 상기 RNAi 시약의 효능의 데이타 셋트를 생성시키고 (여기에서, 수득되었지만 상이한 표적 (리포터 융합-mRNA)에 관한 데이타 셋트는 평균 리포터 특이적 양성 및 음성 대조군에 의해서 표준화할 수 있는 공통적인 단백질 리드-아웃을 갖는다); c) 상기 리드-아웃을 사용하여 인공적인 뉴론성 네트를 훈련시키는 단계를 포함한다.
본 발명과 관련하여, 용어 알고리즘은 데이타에 자동적으로 적용될 수 있으며, 컴퓨터 상에서 실행하는 코드로서의 수단이 될 수 있는 방정식의 셋트 및 규칙의 셋트를 의미한다.
"RNAi 효능" 또는 "효능"은 기술적인 용어이며, 세포 분석에서 그의 형질감염시에 소정의 단백질 또는 mRNA를 하향 조절하는 소정의 siRNA의 상대적 능력을 의미한다. 일반적으로, siRNA의 효능은 표적 mRNA 또는 단백질의 발현 레벨을 측정함으로써 결정되며, 통상적으로 음성 대조군의 백분율로 표현된다. 따라서, 높은 효능은 RNAi 시약이 표적 유전자의 발현을 효율적으로 억제, 즉 감소시킬 수 있는 것을 의미하는 반면에, 낮은 효능은 표적 유전자의 발현이 전혀 억제되지 않거나, 또는 단지 약간 억제되는 것을 의미한다. 강력한 RNAi 시약은 표적 유전자의 발현을 음성 대조군에 비해서 50% 이상, 바람직하게는 60% 이상, 70% 이상, 80% 이상, 가장 바람직하게는 90% 이상 억제한다.
본 발명에 따르는 RNAi 시약은 RNAi 실험에 적합한 RNAi 시약이다. RNAi에 적합한 다양한 타입의 RNAi 시약은 본 기술분야에서 공지되어 있다 [참조: Dykxhoorn et al., Nature Rev., Vol. 4, pp. 457-467 (2003)]. 이러한 RNAi 시약은 표적 유전자에 대해 상보적인 서열을 포함한다. 본 발명과 관련하여 표적 유전자에 대해 상보적이라는 것은 그 서열이 프리-mRNA, mRNA, cDNA를 포함한, 표적 유전자의 DNA 서열로부터 전사된 RNA에 대해 상보적인 것을 의미한다. 용어 "표적 유전자"는 세포, 조직 또는 유기체 내에서 발현되는, 즉 RNA로 전사되는 어떤 DNA 서열이라도 포함하는 것을 의미한다. 발현된 서열은 단백질로 반드시 번역될 필요는 없으며, 예를 들어, 프리-mRNA, 조절성 RNA, rRNA 등을 포함한다. 표적 유전자에 대해 상보적인 서열은 일반적으로 길이가 약 19-23 뉴클레오타이드이지만, 더 길 수도 있다. 바람직하게는, 상보적 서열은 길이가 50 뉴클레오타이드 미만, 더욱 바람직하게는 길이가 15-35 뉴클레오타이드, 또는 길이가 18-25 뉴클레오타이드이다. 상보적 서열은 바람직하게는 표적 유전자의 상응하는 서열과 100% 동일하며, 즉 상보적 서열과 표적 유전자의 상응하는 서열 사이에 미스매치 (mismatch)는 없다. 일부의 구체예에서, 상보적 서열은 이들 미스매치가 RNAi 시약의 RNAi 활성을 파괴시키지 않는다면, 1, 2, 3, 4, 5 또는 그 이상의 미스매치를 포함할 수 있다. RNAi를 위해서 사용된 RNAi 시약은 바람직하게는 이중-스트랜드화 된 것이며, 두개의 별개의 스트랜드로 구성될 수 있지만, 헤어핀 루프를 형성하는 하나의 스트랜드로 구성될 수도 있다. RNAi 시약의 이중-스트랜드 RNA 영역은 미스매치를 함유할 수 있으며, miRNA-양 기전에서 작용할 수 있다. RNAi를 매개하는 RNAi 시약의 타입에 대한 예로는 예를 들어, siRNA 또는 miRNA (마이크로RNA) 또는 소형 헤어핀 RNA (shRNA)가 있다.
일단계에서, 다수의 RNAi 시약의 RNA 효능은 본 발명의 방법에 따라서 실험적으로 결정된다. 일반적으로, 제공된 RNAi 시약의 수와 알고리즘의 품질 사이에는 양성 상관관계가 있기 때문에, 다수의 RNAi 시약을 제공하는 것이 유익하다. 그러나, 실용적인 이유로, RNAi 시약 합성과 RNAi 효능의 실험적 측정은 비용이 많이 들고 시간이 걸리기 때문에, RNA 효능의 실험적 측정을 위한 RNAi 시약의 수는 가능한 한 작게 유지시키는 것이 바람직할 수 있다. 그러나, RNAi 시약의 수는 그 수 이하에서는 알고리즘을 적절하게 훈련할 수 없는 최소의 수 이하가 되지는 않아야 한다. 바람직한 구체예에서는 10종 이상의 RNAi 시약, 50종 이상의 RNAi 시약, 또는 100종 이상의 RNAi 시약이 제공되며, 더욱 바람직한 구체예에서는 200종 이상의 RNAi 시약, 500종 이상의 RNAi 시약, 1000종 이상의 RNAi 시약, 또는 2000종 이상의 RNAi 시약이 제공된다. 또 다른 바람직한 구체예에서는, 10000종 미만의 RNAi 시약, 바람직하게는 5000종 미만의 RNAi 시약, 또는 더욱 바람직하게는 3000종 미만의 RNAi 시약이 제공된다. 또 다른 바람직한 구체예에서, RNAi 시약은 무작위적으로 선택된다. RNAi 시약은 중복되거나 중복되지 않을 수 있으며, 바람직한 구체예에서 RNAi 시약은 중복되지 않는다. RNAi 시약은 표적 유전자에 대해 상보적인 영역을 포함한다. 몇가지 RNAi 시약은 중복되거나 중복되지 않는 동일한 표적 유전자에 대한 상보적인 영역을 포함할 수 있다. 한가지의 특정한 구체예에서, 모든 RNAi 시약은 중복되거나 중복되지 않는 동일한 표적 유전자에 대한 상보적인 영역을 포함한다. 또 다른 구체예에서, RNAi 시약은 하나 이상의 표적 유전자, 바람직하게는 2개 이상의 표적 유전자, 5개 이상의 표적 유전자, 또는 10개 이상의 표적 유전자에 대해서 상보적인 영역을 포함한다.
본 발명의 또 다른 바람직한 구체예에서, 단계 a)에서 제공된 RNAi 시약 서열은 RNAi 특이성에 대하여 전-스크리닝되었다. "RNAi 특이성" 또는 "특이성"은 기술적 용어이며, 본 발명과 관련하여 RNAi 시약의 선택성, 즉 세포, 조직 또는 유기체에서 발현된 다른 유전자의 발현을 억제하거나 감소시키지 않으면서 소정의 표적 유전자의 발현을 선택적으로 억제하거나 감소시키는 RNAi 시약의 능력을 나타낸다. 이상적으로, 특정의 RNAi 시약은 단지 표적 유전자의 발현을 억제하며, 세포, 조직 또는 유기체에서 발현된 모든 다른 유전자의 발현에는 영향을 미치지 않는다. 이러한 목적으로, 특정의 RNAi 시약은 유리하게는 표적 유전자에 대하여 완전히 상보적인 서열, 즉 표적 서열에 대한 미스매치를 갖지 않는 상보적 서열이지만, 세포 또는 유기체에서 발현된 다른 모든 유전자에 대해서 완전히 상보적이지 않은 서열을 포함하며, 즉 상기 상보적 서열은 표적 유전자 이외의 세포, 조직 또는 유기체에서 발현된 모든 서열에 대하여 하나의 미스매치, 바람직하게는 두개 이상의 미스매치, 더욱 바람직하게는 3개 이상의 미스매치를 갖는다. RNAi 시약의 특이성의 전-선택은 예를 들어, 서열 비교에 적합한 소프트웨어를 사용하여 소정의 세포, 조직 또는 유기체에 대한 데이타베이스에서 이용할 수 있는 모든 공지의 발현된 서열과 해당하는 RNAi 시약의 서열을 컴퓨터에 의해서 비교함으로써 수행될 수 있다.
RNAi 시약의 RNAi 효능을 실험적으로 결정하는데 적합한 다수의 방법은 본 기술분야에서 공지되어 있다. 일반적으로, 소정의 표적 유전자에 대한 상보적 영역을 포함하는 이중-스트랜드 RNAi 시약은 표적 유전자를 발현하는 세포에 형질감염시킨다. 형질감염을 위해서는 예를 들어, 일렉트로포레이션 (electroporation), 형질감염을 위한 헬퍼로서 양이온성 리피드 또는 양이온성 폴리머의 사용과 같은 다양한 방법이 사용될 수 있다. 그후, 세포를 표적 유전자의 발현을 가능하게 하는 적합한 조건 하에서 배양한다. 이어서 표적 유전자의 발현을 예를 들어, RT-PCR 또는 리포터 유전자의 양의 측정과 같은 적합한 기술을 사용하여 측정한다. 바람직한 구체예에서, 리포터를 코딩하는 융합-mRNA를 siRNA로 공동-형질감염시킨다. 바람직하게는, 표적 뉴클레오타이드 서열을 리포터 코딩 서열의 3'-UTR에 삽입한다. 이렇게 하여, 표적은 번역될 수 없으며, 그의 하향 조절은 생물학적 영향을 갖지 않을 수 있다. 바람직한 구체예에서, 리포터 단백질은 황색 형광성 단백질 (Yellow Fluorescent protein; YFP)이다. 또 다른 구체예에서, 음성 및 리포터 특이적 대조군, 즉 리포터 단백질의 코딩 영역을 표적화하며, 이렇게 하여 3'-UTR 삽입물과는 무관하게 유사한 효능을 갖는 리포터 단백질을 침묵시키는 siRNA를 사용하며, 각각의 siRNA에 의해서 수득된 리포터 단백질의 발현 레벨과 음성 대조군 및 리포터 특이적 양성 대조군의 발현 레벨의 비교를 가는하게 한다. 이렇게 함으로써, 모든 siRNA에 대해서 측정된 발현 레벨을 비교할 수 있으며, 하나의 단일한 균일의 데이타 셋트로 저장된다. 기본적으로, 어떤 종류의 세포라도 형질감염을 위해서 사용될 수 있지만, 바람직한 구체예에서 세포는 진핵세포, 바람직하게는 동물 세포, 더욱 바람직하게는 포유동물 세포, 가장 바람직하게는 인간 세포이다.
양성 및 음성 대조군을 각각의 siRNA에 대해 관찰된 억제와 비교하면 (또한, 표준화로도 언급됨), 실험의 데이타 셋트에서 수집될 수 있는 리드-아웃을 유도하는 실험적으로 결정된 RNAi 효능과 관련한 실험적 효능 스코어가 각각의 RNAi 시약에 대해서 생성될 수 있다. 바람직한 구체예에서, 실험적 스코어는 리포터 단백질의 측정에 의해서 수득된다. 바람직하게는, 실험적 리드-아웃의 모든 데이타는 균일한 조건 하에서 단일 타입의 실험적 셋팅으로부터 유래한다. 이 데이타는 바람직하게는 mRNA 레벨이 아닌 단백질 레벨에 대한 측정을 기준으로 하며, 즉 표적 유전자에 의해서 발현된 단백질의 양은 mRNA의 양이 아니라 RNAi 시약에 노출시켰을 때에 측정된다. 본 발명에 따라 RNAi 효능을 실험적으로 결정하기 위한 전형적인 실험적 셋업 (setup)은 이하에서 실시예에 기술된다.
본 발명의 바람직한 구체예에서는, RNAi 활성의 실험적 측정을 위해서 리포터 분석법이 사용된다. 본 발명에 따르는 리포터 분석법의 사용은 공통적인 실험적 리드-아웃을 갖는 표적의 광범한 판넬에 대한 다수의 siRNA를 스크리닝할 수 있도록 한다. 이러한 분석법은 문헌 (Huesken et al., Nucleic Acids Res., Vol. 31, No. 17, p. e102 (2003))에 기술되어 있다. 간략하면, 3'-비번역 영역에 삽입된 표적 영역을 갖는 전장 리포터 유전자를 포함하는 mRNA 융합 전사 작제물이 제공된다. 예를 들어, 루시퍼라제 (Luciferase)와 형광성 (Fluorescent) 리포터 유전자가 작제물에서 사용될 수 있다. RNAi 효능에 대해서 시험될 RNAi 시약은 3'-비번역 영역에 삽입된 해당하는 상보적인 서열을 포함한다. 그후, RNAi 시약을 리포터 유전자 작제물을 일시적으로 또는 구성적으로 발현하는 세포에 적합한 형질감염 방법에 의해서 형질감염시키고, 리포터 유전자의 발현을 가능하게 하는 적합한 조건 하에서 배양한다. 이어서, 리포터 유전자에 의해서 발현된 단백질의 레벨을 측정한다. 이러한 분석법은 공통적인 리드-아웃을 갖는 표적의 광범한 판넬에 대하여 단백질 레벨에서 다수의 RNAi 시약의 RNAi 효능을 측정할 수 있도록 허용한다. 이렇게 함으로써, 생성된 데이타 셋트는 균질하며, 모든 효능 데이타는 각각 함께 비교가 가능하다.
상술한 데이타 셋트가 인공적인 뉴론성 네트워크를 훈련시키기 위해서 사용된다. 인공적인 뉴론성 네트워크는 본 기술분야에서 공지되어 있으며 [참조예: Zell, Simulation neuronaler Netzwerke, Addison Wesley (1994); 및 Rumelhart and McLelland, Parallel Distributed Processing, Vol. 1, MIT Press, Cambridge, MA (1986)], 예를 들어, http://www-ra.informatik.uni-tuebingen.de/SNNS에서 이용할 수 있다. 통계학적 정보는 인공적인 뉴론성 네트워크에 의해서 siRNA 서열 안티센스 스트랜드로부터 추출될 수 있으며, 스크리닝 측정치와 연관될 수 있다. 결국, 훈련된 네트워크를 임의의 입력 서열 (input sequence)에 적용하여 '자칭 (would-be)' 스크리닝 측정치의 추정치를 제공할 수 있다. 예를 들어, 설명을 목적으로, 후진전파 훈련 (back propagation training) 7-8을 갖는 3층 피드-훠워드 (feed-forward) 네트워크가 사용될 수 있다. 입력층은 정돈된 노드 (ordered node)의 4개의 레인으로 구성된다 (참조: 도 1). 여기에는 핵산 염기 타입당 하나의 레인, 및 항상 동일한 입력 서열 위치를 칭하는 상이한 염기 타입의 4개의 노드가 존재한다. 위치의 수는 입력 서열의 길이이다. 정해진 시간에서, 훈련 및/또는 적용 중에, 어떤 소정의 위치에서라도 정확하게 하나의 노드가 활성화된다. 그 다음에, 정돈된 레인을 따른 활성은 입력 서열을 나타낸다. 활성화된 노드의 시그날은 입력층으로부터 숨은 유니트 (hidden unit)의 층으로도 불리는 제 2층으로 전파된다. 이러한 전파 중에, 0 또는 1인 입력층의 시그날은 상이하게 가중되어 숨은 유니트의 시그날로 합해진다. 마찬가지로, 숨은 유니트의 시그날은 제 3층 및 마지막 층의 단일 출력 노드로 진행한다. 가중치 (weights)는 통계학적 지식을 나타내기 위한 기억요소 (memory element)이다. 우선적으로, 가중치를 무작위적으로 설정하고, 참 (true) 스크리닝 시그날로부터 벗어나는 siRNA 안티센스 서열에 대한 출력 시그날을 제공한다. 현재의 네트워크 출력 시그날과 실험결과 사이의 차이를 사용하여 차이를 감소시키도록 모든 가중치를 변화시킨다. 후진전파는 네트워크에 의해서 제 2층 내의 숨은 유니트에 대한 '참' 표적 시그날을 갖기 위한 자리에 들어간다.
본 발명의 또 다른 국면은 컴퓨터 하드웨어 및 본 발명의 알고리즘을 포함하는 컴퓨터 시스템을 제공한다. 본 발명의 추가의 국면은 본 발명의 알고리즘을 포함하는 컴퓨터 판독가능한 매체 (computer readable medium)를 제공한다.
본 발명의 또 다른 국면은 소정의 표적 유전자에 대한 RNAi 효능의 증가된 가능성, 즉 전-선택된 표적 유전자의 발현을 억제할 수 있는 증가된 가능성을 갖는 RNAi 시약을 수득하기 위한 방법을 제공한다. 따라서, 고안된 소정의 수의 RNAi 시약을 위해서는, RNAi 시약이 무작위적으로 디자인된 경우보다 더 큰 백분율이 이 방법을 사용하여 RNAi 시약을 디자인하는데 유력할 것이다. 반대로, 표적 유전자의 발현을 특이적으로 억제하는데 유용한 높은 RNAi 효능의 소정의 수의 RNAi 시약을 확인하기 위하여는 더 적은 수의 RNAi 시약을 고안하고 스크리닝하여야 한다. 한가지 구체예에소, 본 발명에 따르는 방법은 a) 소정의 표적 유전자에 대해서 상보적인 영역을 포함하는 다수의 RNAi 시약 서열을 제공하고; b) 본 발명에 따르는 훈련된 알고리즘을 뉴론성 네트워크를 사용하여 상기 RNAi 시약 서열에 적용하고; c) 효능이 있는 것으로 예측되는 RNAi 시약 서열(들)을 선택하는 단계를 포함한다.
제 1단계에서는 표적화될 유전자, 즉 RNAi에 의해서 억제될 유전자에 대해서 상보적인 서열을 포함하는 다수의 후보 RNAi 시약 서열을 선택한다. RNAi 시약은 특이성에 대하여, 또는 특정의 서열 모티브의 존재 또는 부재에 대해서 전스크리닝될 수 있다. 이들은 중복되거나, 비-중복될 수 있다. 한가지 구체예에서, 후보 RNAi 시약은 무작위적으로 선택된다. 제 2단계에서, 제 1단계에서 제공된 RNAi 시약의 효능은 본 발명에 따르는 알고리즘을 사용하여 훈련된 뉴론성 네트워크를 사용하여 예측된다. 다음 단계에서, 강력한 것으로 예측된 RNAi 시약 서열을 선택한다. 예를 들어, 3개 또는 5개 또는 10개의 가장 강력한 RNAi 시약이 선택될 수 있다. 대신으로, 특정의 역치 (threshold) 스코어 이상의 예측 스코어를 갖는 모든 RNAi 시약 서열이 선택된다. 바람직한 구체예에서, 역치 스코어는 0.7 이상, 0.75 이상, 0.8 이상, 또는 0.85 이상이다. 선택된 RNAi 시약은 이제 그들의 RNAi 효능에 대해서 실험적으로 분석될 수 있다. 따라서, 다음 단계에서는 활성이 있는 것으로 예측되었던 서열을 포함하는 RNAi에 적합한 RNAi 시약을 합성한다. 바람직한 구체예에서, RNAi 시약은 화학적으로 합성된다. 숙련된 전문가는 예를 들어, 잘 알려져 있는 고체상 합성기술에 의해서 이러한 올리고뉴클레오타이드를 합성하기 위한 화학적 방법을 잘 알고 있다. 그러나, RNAi 시약은 또한, 시험관내 전사 또는 벡터 기본 시스템과 생화학적 방법을 사용하여 합성될 수도 있다. 이제 표적 유전자를 발현하는 적합한 세포를 합성된 RNAi 시약에 (또는 벡터 기본 시스템의 경우에는 해당하는 서열을 포함하는 벡터에) 노출시키고, 적합한 조건 하에서 배양할 수 있으며, 표적 유전자의 발현 레벨은 적합한 방법에 의해서 측정될 수 있다. 대조군으로, 해당하는 서열에 노출되지 않은 세포의 표적 유전자의 발현 레벨이 비교될 수 있다.
이하의 실시예는 본 발명의 바람직한 구체예를 설명하기 위해서 포함된 것이며, 본 발명을 제한하고자 하는 것은 아니다.
본 발명을 설명하기 위한 접근방법에서는 34개의 상이한 mRNA를 표적화한 3,000개 이상의 siRNA가 세포 분석법에서 효능에 대하여 스크리닝되었다. 이 분석법의 한가지 특징은 차후의 효능-서열 관계의 분석을 위한 균일한 데이타 셋트를 제공하는 것이다. 이것은 융합-mRNA 리포터 분석법을 사용하여 가능하게 된다 [참조: Huesken, et al., (2003), supra]. 이 분석법에서는, 표적 유전자가 리포터 mRNA의 3'-UTR에 삽입되어 있는 리포터 단백질에 대한 리포터 융합-mRNA를 코딩하는 플라스미드를 형질감염시키고, 이어서 RNAi 시약을 형질감염시킨다. 이렇게 함으로써,
a) 표적 유전자의 하향 조절의 결과는 생물학적 영향을 갖지 않으며;
b) 모든 분석법에서, 효능 리드아웃은 단백질 레벨에서 이루어지고, 동일한 리포터 단백질이 전체 분석법에 존재하기 때문에 효능 데이타는 상이한 리드-아웃에 의해서 편향되지 않고;
c) 모든 분석법에서 공통적인 양성 및 음성 대조군을 사용하여 모든 효능 데 이타의 표준화가 허용된다.
인공적인 뉴론성 네트워크를 사용하여 이러한 균일한 효능 데이타 셋트의 서열 효능 관계를 조사하였다. 그 결과로, 훈련된 인공적 뉴론성 네트워크는 유일하게 그의 뉴클레오타이드 서열을 기준으로 하여 어떤 siRNA의 효능이라도 예측할 수 있다. RNA 간섭경로를 통하여 작용하는 유전자 침묵 시약의 효능을 위한 서열 필요조건으로 인하여, 이러한 접근방법은 예를 들어, shRNA 또는 miRNA와 같은 다른 RNAi 시약에 적용할 수 있다.
RNAi
시약
이 분석법에서 사용된 RNAi 시약은 19 염기-페어링 (pairing) RNA 영역 및 각 스트랜드의 3' 상의 디데옥시뉴클레오타이드 오버행 (overhang)을 갖는 21-mer 이중-스트랜드화 RNAi 시약이었다. 센스 스트랜드의 오버행은 조직적으로 디티미딘이었으며, 그 반면에 안티센스의 오버행은 표적에 상보적이도록 디자인된 디데옥시뉴클레오타이드였다.
스크리닝 방법:
eYFP
mRNA
-융합 리포터 분석법
리포터 발현 클론의
작제
증진된 시안 및 황색 형광성 단백질 (eCFP, eYFP) 이중 리포터 기본 벡터 pNAS-092 (문헌 (Huesken, et al., (2003), supra)에 기술됨)는 해당하는 적절한 cDNA 또는 ESTs를 삽입하기 위하여 eYFP의 정지코돈 다음에 다수의 클로닝 영역을 포함하도록 작제되었다. eCFP 리포터는 연장인자 (elongation factor) 1 알파 (EF-1α) 프로토머 하에서 구동된 표준화 측정에 소용이 되며, eYFP 리포터를 사용하여 CMV 프로모터 하에서 구동된 siRNA의 활성을 모니터하였다. 벡터의 기원은 hCMV 및 EF-1α 프로모터를 함유하는 플라스미드 pBudCE4 (Invitrogen)였다. pNAS-092는 peCFP-N1 (Clontech)으로부터 유도된 eCFP 유전자를 삽입하고, peCFP-N1 (Clontech)로부터 유도된 eYFP 유전자를 클로닝 영역 (EcoRV, NotI, HindIII, KpnI, XbaI)를 포함하는 합성 DNA 단편과 함께 전이시킴으로써 생성되었다. pNAS-092에서 사용된 합성 DNA는 서열분석에 의해서 확인되었다. 대용 클로닝 전략을 위해서는, pNAS-092를 제조 프로토콜 (Invitrogen)에 따라 attR1 및 attR2 클로닝 영역을 eYFP 정지코돈 다음에 삽입함으로써 게이트웨이티엠 목적 벡터 (GatewayTM destination vector) pNAS-097로 전환시켰다. 최종 리포터 분석법을 위해서 사용된 모든 플라스미드는 연결 (pNAS-092) 또는 재조합 (pNAS-097)을 통해서 c-DNA를 클로닝 영역에 삽입함으로써 작제되었다.
세포주
및 세포 배양
인간 비-소세포 폐암 세포주 H-1299 (CRL-5803)는 ATCC (Rockville, MD)로부터 구입하였다. H-1299 세포는 10% 태자소혈청과 1% L-글루타민을 함유하는 RPMI 1640 배지 (Life Technologies)에서 37℃, 5% 가습된 CO2 대기 하에 유지시켰다. H1299 세포는 형질감염시키기 48시간 전에 80% 융합하 (subconfluent) 단계에 도달 하도록 분할되었다. 세포를 형질감염시키기 하루 전에 트립신처리하고, 세척하고, 흑색 96-웰 분석 플레이트 (Costar, 투명한 바닥)에 동등하게 분배시켰다 (50 ㎕).
참조 유전자를 수반하는 이중 리포터
작제물을
사용한 형광성 단백질 분석법 (
세포내
표준화)
플라스미드 형질감염
리포펙타민-PLUS 시약을 OptiMEM-1 내에서 희석된 플라스미드와 함께 배양하고 (22 ng/㎕ 플라스미드, 4.4 ㎖/㎖ 피로펙타민-PLUS), 이어서 이 혼합물을 OptiMEM-1로 11-배 희석하였다. 리포펙타민은 HEPES (20 mM, pH 7.2)로 1.3-배 전-희석하고, OptiMEM-1으로 28.6-배 더 희석하고 (26.6 ㎕/㎖ 리포펙타민), 15분 동안 유지시켰다. 두가지 혼합물을 1:1로 배합하고, 15분 동안 배양하고, OptiMEM-1로 10-배 더 희석하였다. 배지를 흡인하고, 100 ㎕를 세포에 첨가하였다 (0.2 ㎕/㎖ 리포펙타민-PLUS, 13.3 ㎕/㎖ 리포펙타민, 1 ㎍/㎕ 플라스미드). 2시간 후에, 50 ㎕의 siRNA 형질감염 혼합물을 세포에 첨가한 다음에, 2시간 동안 더 배양하였다.
siRNA
형질감염
올리고펙타민을 OptiMEM-1 (60 ㎕/㎖)로 희석하고, 혼합시키고, 실온에서 30분 동안 배양하였다. siRNA는 하이브리드화된 원액으로부터 하이브리드화 완충액 (30 mM HEPES, 100 mM 칼륨 아세테이트, 2 mM 마그네슘 아세테이트: pH 7.3)을 사 용하여 실온에서 600 μM까지 희석하였다. 어니일링은 90℃에서 2분 동안에 이어서 37℃에서 1시간 동안 수행하였다. 희석된 올리고펙타민과 siRNA를 2용적 + 1용적으로 배합하고, 15분 동안 배양하였다. siRNA-올리고펙타민 혼합물을 OptiMEM-1을 사용하여 1:1로 더 희석하고, 세포 상에 전이시켰다 (50 ㎕)(최종 농도 0.7 ng/㎕ 플라스미드, 10 ㎕/㎖ 올리고펙타민, 50 nM siRNA). 배지를 제거하고, 10% 태자소혈청 + 1% L-글루타민을 함유하는 페놀 레드-부재의 100 ㎕ 표준 RPMI 배지로 대체시키고, 37℃에서 3일 동안 배양하였다. 24-시간 간격으로 형광을 측정하였다. eCFP 및 eYFP의 형광은 각각 436/20 ㎚의 여기 필터와 480/30 ㎚의 방출 필터 및 500/25 ㎚의 여기 필터와 535/30 ㎚의 방출 필터를 사용하여 측정되었다. eYFP/eCFP 형광계수의 비율은 세포수 당량당, eYFP 활성을 나타낸다. eYFP 리포터 분석법에 의한 이 데이타 수집을 위해서는, 양성 표준 (YFP-특이적 siRNA NAS-12842/58) 및 음성 표준 (루시퍼라제 siRNA NAS-8548/9)의 모든 siRNA 처리는 삼중으로 수행되었다. 표준 siRNA NAS-12842/58 처리의 평균치로부터의 표준편차를 계산하였으며, 평균하여 9.1%인 것으로 확인되었다.
표적 선택
일차로, 34개의 상이한 삽입물을 갖는 리포터 플라스미드가 선택되었다. 삽입물의 크기는 344 뉴클레오타이드와 3784 뉴클레오타이드 사이에서 변화하였다.
siRNA
서열 디자인
플레이트당, 79 siRNA로 하여 총 3160개가 되었다. 다양한 크기 (0-20 염기)의 중복을 참작하여 서열은 삽입물이 무작위적으로 보행하도록 디자인되었다. 27k 염기의 삽입물 크기에 의해서 3160 siRNA의 더욱 규칙적으로 선택된 위치는 siRNA 서열의 유의적인 중복 (13 염기)을 제공할 수 있다. 긴 폴리뉴클레오타이드 스트레치 (stretch)(5개 또는 그 이상의 연속적인 뉴클레오타이드)를 갖는 서열은 고려되지 않았다. 긴 삽입물의 경우에는 79 siRNA의 두개의 셋트가 디자인되었다.
3160 siRNA 서열의 전체 셋트를 그의 핵산 함량에 대하여 검사되었다. 4개의 뉴클레오타이드 까지의 모든 존재가능한 모티브가 siRNA 서열 셋트에 존재한 것으로 확인되었다.
스크리닝 형식
각각의 siRNA 플레이트는 79 siRNA, 음성 대조군 (안티-루시퍼라제 siRNA NAS-8549), 두개의 리포터 특이적 siRNA (안티-YFP siRNA NAS-12842 및 NAS-12847)를 함유한다. 대조 siRNA를 하나의 단일 배치로부터 삼중으로 피펫으로 계량하였다. 8개의 웰은 빈 채로 남겨두었으며, "플라스미드 단독" 음성 대조군을 위해서 사용될 것이다.
siRNA
활성
데이타의
필터링
및 표준화 (
참조 도
2)
각각의 플레이트는 이중으로 분석되었으며, YFP 레벨은 두개의 시점에서 형광측정법에 의해서 측정되었다. 각각의 플레이트에 대해서, 양성 및 음성 대조군 의 억제 레벨뿐만 아니라 중복체 (duplicate) 내에서의 선형 상관관계가 조사되었다. 중복체 내에서의 상관관계가 0.7보다 우수한 경우, 및 양성 대조군이 음성 대조군에 비해서 YFP를 60% 이하로 하향 조절한 경우에 데이타가 채택되었다 (참조 도 3). 5회의 분석으로부터의 데이타 셋트는 그 필터에 따라서 불합격되었다. 나머지 데이타 셋트 (2717 서열)를 훈련 셋트와 시험 셋트로 분할하고, 각각의 siRNA를 개별적으로 조사하여 중복체에서 30% 이상의 편차를 나타내는 siRNA를 제외시킴으로써 더 필터링하였다. 이렇게 함으로써 약 15%의 데이타가 더 제거되었다. 나머지 중복 데이타 포인트를 평균하여 감소된 노이즈 (noise) 특성을 갖는 데이타 셋트를 제공하였다. 최종 데이타 셋트는 훈련 셋트에서 2109 서열 및 시험 셋트에서 234 서열을 함유하였다. 모든 데이타 포인트 S(i), 데이타 포인트를 지수화한 i는 하기 수학식의 어파인 시스템 (affine system) A에 의해서 표준화되었다:
T(i) = A(S(i)) = (T_high-T_low) / (S_high-S_low)*(S(i)-S_low) + T_low
여기에서, 음성 대조군의 원래의 시그날은 S_low이고 표준화하여 T_low를 제공하여야 한다 (여기에서 T_low = 0.1 = 10%로 설정되었다). 양성 대조군 시그날 S_high 및 그의 전환된 T_high도 유사하게 정의된다 (0.9 = 90%로 설정됨).
인공적인
뉴론성
네트워크 훈련 (
참조 도
3)
siRNA 서열 데이타는 입력층에 제시되며, 스크리닝 리포터 시그날을 사용하여 네트워크 노드 사이에서 가중치를 조정한다. 각각의 siRNA 서열 및 그의 스크리닝 측정치는 총 10회 제시된다. 모든 데이타 포인트의 1 회 제시후에, 네트워크 의 가중치는 0.1의 학습률 (learning rate) 및 0.1의 운동량 (momentum)을 사용하여 동시에 업데이트된다 [참조: Zell, Simulation Neuronaler Netzwerke, Addison Wesley (1994)]. 가중치의 5개의 상이한 초기화를 기초로 하여, 생성된 5개의 훈련된 네트워크 가중치는 상이하였지만, 5개의 네트워크는 모두 예측 출력을 단지 약간 변화시키면서 일정하게 나타났다. 최종 출력은 모두 5개의 네트워크의 개개 출력 노드의 시그날을 평균함으로써 획득되었다. 본 발명자들은 단순화를 위해서 어떤 개별적인 네트워크의 특성을 고려하는 대신에 평균 출력을 네트워크의 출력이라 칭할 것이다.
예측기의 성능의 평가 (
참조 도
4)
훈련된 네트워크는 시험 셋트에 적용하는 경우에 0.63의 상관관계를 가지고 실험적 억제활성을 예측하였으며, 그 반면에 훈련 셋트에 적용하는 경우에 이것은 0.685의 온화하게 더 높은 상관관계를 나타내었다. 도 3은 두개의 일치성을 도표로 나타낸 것이다. 예측값과 실험값 사이의 상관관계 이외에도, 알고리즘의 성능은 실험적으로 활성인 siRNA 및 예측된 활성 siRNA에 대한 역치를 설정함으로써 평가될 수 있다. 실험적으로 활성인 siRNA에 대한 역치는 75% 표준화된 효능으로 설정되었다 (0.75). 예측된 활성 siRNA에 대한 역치는 참 음성 (예측된 불활성이며 불활성), 가 음성 (예측된 불활성이지만 활성), 가 양성 (예측된 활성이지만 불활성) 및 참 양성 (예측된 활성이며 활성) 서열을 함유하는 4개의 사분원을 형성한다. 예측기 성능은 그의 민감성 및 선택성에 의해서 측정될 수 있다.
예측기 민감성 = 참 양성 / (참 양성 + 가 음성) = 0.26
예측기 선택성 = 참 양성 / (참 양성 + 가 양성) = 0.71
이들 값은 예측된 서열이 71%의 활성일 확률을 갖는다 (상기 정의한 바와 같음). 이 값은 서열의 35%가 활성이었던 전체 시험 셋트 상에서 관찰된 적중률 (hit rate)과 비교하였다. 또한, 예측기는 활성서열의 26%를 확인할 것이다.
예측기 성능에 대한 훈련
셋트의
크기의 영향 (
참조 도
5)
훈련 데이타는 훈련을 위해서 완전히 채택될 필요는 없으며, 이것은 셋트 크기를 페이딩하면서 바이오프레드 (BIOpred) 예측성능의 저하를 조사할 수 있도록 한다. 시험 셋트의 크기는 일정하였다. 상관관계 (참조 도 5)는 감소된 훈련 셋트를 사용하여 서서히 일관하게 저하한다. 265 데이타 포인트 정도로 작은 훈련 데이타 셋트에 대한 상관관계는 약 0.53의 상관관계를 제공할 것이다.
SEQUENCE LISTING
<110> Novartis AG
<120> Prediction Method
<130> DC/4-33542A
<160> 159
<170> PatentIn version 3.2
<210> 1
<211> 607
<212> DNA
<213> Homo sapiens
<400> 1
caaggggctg caggaagagc cggtcgaggg attccgcgtg acactggtgg acgagggcga 60
tctatacaac tgggaggtgg ccatcttcgg gccccccaac acctactacg agggcggcta 120
cttcaaggcg cgcctcaagt tccccatcga ctacccatac tctccaccag cctttcggtt 180
cctgaccaag atgtggcacc ctaacatcta cgagacgggg gacgtgtgta tctccatcct 240
ccacccgccg gtggacgacc cccagagcgg ggagctgccc tcagagaggt ggaaccccac 300
gcagaacgtc aggaccattc tcctgagtgt gatctccctc ctgaacgagc ccaacacctt 360
ctcgcccgca aacgtggacg cctccgtgat gtacaggaag tggaaagaga gcaaggggaa 420
ggatcgggag tacacagaca tcatccggaa gcaggtcctg gggaccaagg tggacgcgga 480
gcgtgacggc gtgaaggtgc ccaccacgct ggccgagtac tgcgtgaaga ccaaggcgcc 540
ggcgcccgac gagggctcag acctcttcta cgacgactac tacgggacgg cgaggtggag 600
gaggagg 607
<210> 2
<211> 21
<212> DNA
<213> Artificial
<220>
<223> oligonucleotide
<400> 2
ccgucccgua guagucgucg t 21
<210> 3
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 3
cgucccguag uagucgucgt a 21
<210> 4
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 4
cccguaguag ucgucguaga a 21
<210> 5
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 5
guagucgucg uagaagaggt c 21
<210> 6
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 6
uagucgucgu agaagagguc t 21
<210> 7
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 7
gucguagaag aggucugagc c 21
<210> 8
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 8
aagaggucug agcccucguc g 21
<210> 9
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 9
agaggucuga gcccucgucg g 21
<210> 10
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 10
gucugagccc ucgucgggcg c 21
<210> 11
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 11
gucgggcgcc ggcgccuugg t 21
<210> 12
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 12
gggcgccggc gccuugguct t 21
<210> 13
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 13
gcgccggcgc cuuggucuuc a 21
<210> 14
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 14
ccuuggucuu cacgcaguac t 21
<210> 15
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 15
uggucuucac gcaguacucg g 21
<210> 16
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 16
gucuucacgc aguacucggc c 21
<210> 17
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 17
uucacgcagu acucggccag c 21
<210> 18
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 18
cgcaguacuc ggccagcgug g 21
<210> 19
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 19
gcaguacucg gccagcgugg t 21
<210> 20
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 20
acucggccag cguggugggc a 21
<210> 21
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 21
gcgugguggg caccuucacg c 21
<210> 22
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 22
gucacgcucc gcguccacct t 21
<210> 23
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 23
ccgcguccac cuuggucccc a 21
<210> 24
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 24
ccuugguccc caggaccugc t 21
<210> 25
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 25
guccccagga ccugcuuccg g 21
<210> 26
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 26
ccugcuuccg gaugauguct g 21
<210> 27
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 27
gcuuccggau gaugucugug t 21
<210> 28
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 28
gaugaugucu guguacuccc g 21
<210> 29
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 29
uguguacucc cgauccuucc c 21
<210> 30
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 30
guguacuccc gauccuuccc c 21
<210> 31
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 31
cccgauccuu ccccuugcuc t 21
<210> 32
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 32
ccgauccuuc cccuugcuct c 21
<210> 33
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 33
uuuccacuuc cuguacauca c 21
<210> 34
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 34
uuccuguaca ucacggaggc g 21
<210> 35
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 35
ccuguacauc acggaggcgt c 21
<210> 36
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 36
caucacggag gcguccacgt t 21
<210> 37
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 37
ucacggaggc guccacguut g 21
<210> 38
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 38
cgggcgagaa gguguugggc t 21
<210> 39
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 39
guugggcucg uucaggaggg a 21
<210> 40
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 40
ucguucagga gggagaucac a 21
<210> 41
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 41
guucaggagg gagaucacac t 21
<210> 42
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 42
ggagggagau cacacucagg a 21
<210> 43
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 43
gagggagauc acacucagga g 21
<210> 44
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 44
gggagaucac acucaggaga a 21
<210> 45
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 45
ucacacucag gagaaugguc c 21
<210> 46
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 46
cacacucagg agaauggucc t 21
<210> 47
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 47
caggagaaug guccugacgt t 21
<210> 48
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 48
aggagaaugg uccugacgut c 21
<210> 49
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 49
cugacguucu gcguggggut c 21
<210> 50
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 50
ucugcguggg guuccaccuc t 21
<210> 51
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 51
ccaccucucu gagggcagct c 21
<210> 52
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 52
accucucuga gggcagcucc c 21
<210> 53
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 53
ugagggcagc uccccgcuct g 21
<210> 54
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 54
gagggcagcu ccccgcucug g 21
<210> 55
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 55
agggcagcuc cccgcucugg g 21
<210> 56
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 56
gggcagcucc ccgcucuggg g 21
<210> 57
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 57
ggucguccac cggcgggugg a 21
<210> 58
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 58
gucguccacc ggcgggugga g 21
<210> 59
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 59
cguagauguu agggugccac a 21
<210> 60
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 60
uguuagggug ccacaucuug g 21
<210> 61
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 61
guggagagua uggguagucg a 21
<210> 62
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 62
guauggguag ucgaugggga a 21
<210> 63
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 63
guagucgaug gggaacuuga g 21
<210> 64
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 64
gauggggaac uugaggcgcg c 21
<210> 65
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 65
auggggaacu ugaggcgcgc c 21
<210> 66
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 66
acuugaggcg cgccuugaag t 21
<210> 67
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 67
cgccuugaag uagccgccct c 21
<210> 68
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 68
uugaaguagc cgcccucgua g 21
<210> 69
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 69
gaaguagccg cccucguagt a 21
<210> 70
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 70
aaguagccgc ccucguagua g 21
<210> 71
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 71
ccucccaguu guauagaucg c 21
<210> 72
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 72
ucccaguugu auagaucgcc c 21
<210> 73
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 73
guuguauaga ucgcccucgt c 21
<210> 74
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 74
uguauagauc gcccucgucc a 21
<210> 75
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 75
uauagaucgc ccucguccac c 21
<210> 76
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 76
ucgcccucgu ccaccagugt c 21
<210> 77
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 77
cguccaccag ugucacgcgg a 21
<210> 78
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 78
acgcggaauc ccucgaccgg c 21
<210> 79
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 79
cccucgaccg gcucuuccug c 21
<210> 80
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 80
cggcucuucc ugcagcccct t 21
<210> 81
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 81
gacgacuacu acgggacggt t 21
<210> 82
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 82
cgacgacuac uacgggacgt t 21
<210> 83
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 83
cuacgacgac uacuacgggt t 21
<210> 84
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 84
ccucuucuac gacgacuact t 21
<210> 85
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 85
accucuucua cgacgacuat t 21
<210> 86
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 86
cucagaccuc uucuacgact t 21
<210> 87
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 87
acgagggcuc agaccucuut t 21
<210> 88
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 88
gacgagggcu cagaccucut t 21
<210> 89
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 89
gcccgacgag ggcucagact t 21
<210> 90
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 90
caaggcgccg gcgcccgact t 21
<210> 91
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 91
gaccaaggcg ccggcgccct t 21
<210> 92
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 92
aagaccaagg cgccggcgct t 21
<210> 93
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 93
uacugcguga agaccaaggt t 21
<210> 94
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 94
gaguacugcg ugaagaccat t 21
<210> 95
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 95
ccgaguacug cgugaagact t 21
<210> 96
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 96
uggccgagua cugcgugaat t 21
<210> 97
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 97
acgcuggccg aguacugcgt t 21
<210> 98
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 98
cacgcuggcc gaguacugct t 21
<210> 99
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 99
cccaccacgc uggccgagut t 21
<210> 100
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 100
gugaaggugc ccaccacgct t 21
<210> 101
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 101
gguggacgcg gagcgugact t 21
<210> 102
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 102
gggaccaagg uggacgcggt t 21
<210> 103
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 103
cagguccugg ggaccaaggt t 21
<210> 104
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 104
ggaagcaggu ccuggggact t 21
<210> 105
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 105
gacaucaucc ggaagcaggt t 21
<210> 106
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 106
acagacauca uccggaagct t 21
<210> 107
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 107
ggaguacaca gacaucauct t 21
<210> 108
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 108
gaaggaucgg gaguacacat t 21
<210> 109
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 109
ggaaggaucg ggaguacact t 21
<210> 110
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 110
agcaagggga aggaucgggt t 21
<210> 111
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 111
gagcaagggg aaggaucggt t 21
<210> 112
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 112
gauguacagg aaguggaaat t 21
<210> 113
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 113
ccuccgugau guacaggaat t 21
<210> 114
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 114
cgccuccgug auguacaggt t 21
<210> 115
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 115
cguggacgcc uccgugaugt t 21
<210> 116
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 116
aacguggacg ccuccgugat t 21
<210> 117
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 117
cccaacaccu ucucgcccgt t 21
<210> 118
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 118
ccuccugaac gagcccaact t 21
<210> 119
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 119
ugaucucccu ccugaacgat t 21
<210> 120
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 120
ugugaucucc cuccugaact t 21
<210> 121
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 121
cugaguguga ucucccucct t 21
<210> 122
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 122
ccugagugug aucucccuct t 21
<210> 123
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 123
cuccugagug ugaucuccct t 21
<210> 124
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 124
accauucucc ugagugugat t 21
<210> 125
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 125
gaccauucuc cugagugugt t 21
<210> 126
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 126
cgucaggacc auucuccugt t 21
<210> 127
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 127
acgucaggac cauucuccut t 21
<210> 128
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 128
accccacgca gaacgucagt t 21
<210> 129
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 129
agguggaacc ccacgcagat t 21
<210> 130
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 130
gcugcccuca gagagguggt t 21
<210> 131
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 131
gagcugcccu cagagaggut t 21
<210> 132
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 132
gagcggggag cugcccucat t 21
<210> 133
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 133
agagcgggga gcugcccuct t 21
<210> 134
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 134
cagagcgggg agcugcccut t 21
<210> 135
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 135
ccagagcggg gagcugccct t 21
<210> 136
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 136
cacccgccgg uggacgacct t 21
<210> 137
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 137
ccacccgccg guggacgact t 21
<210> 138
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 138
uggcacccua acaucuacgt t 21
<210> 139
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 139
aagauguggc acccuaacat t 21
<210> 140
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 140
gacuacccau acucuccact t 21
<210> 141
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 141
ccccaucgac uacccauact t 21
<210> 142
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 142
caaguucccc aucgacuact t 21
<210> 143
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 143
gcgccucaag uuccccauct t 21
<210> 144
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 144
cgcgccucaa guuccccaut t 21
<210> 145
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 145
uucaaggcgc gccucaagut t 21
<210> 146
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 146
gggcggcuac uucaaggcgt t 21
<210> 147
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 147
acgagggcgg cuacuucaat t 21
<210> 148
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 148
cuacgagggc ggcuacuuct t 21
<210> 149
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 149
acuacgaggg cggcuacuut t 21
<210> 150
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 150
gaucuauaca acugggaggt t 21
<210> 151
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 151
gcgaucuaua caacugggat t 21
<210> 152
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 152
cgagggcgau cuauacaact t 21
<210> 153
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 153
gacgagggcg aucuauacat t 21
<210> 154
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 154
uggacgaggg cgaucuauat t 21
<210> 155
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 155
cacuggugga cgagggcgat t 21
<210> 156
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 156
cgcgugacac ugguggacgt t 21
<210> 157
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 157
cggucgaggg auuccgcgut t 21
<210> 158
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 158
aggaagagcc ggucgagggt t 21
<210> 159
<211> 21
<212> DNA
<213> Artificial
<220>
<223> siRNA
<400> 159
ggggcugcag gaagagccgt t 21
Claims (18)
- a) 하나 이상의 표적 유전자에 대해 상보적인 서열을 포함하는 다수의 RNAi 시약의 RNAi 효능을 실험적으로 결정하는 단계; 및b) 상기 데이타 셋트를 사용하여 인공적 뉴론성 네트 (neuronal net)를 훈련시키는 단계를 포함하는, RNAi 시약의 RNAi 효능을 예측하기 위한 알고리즘을 작성하는 방법.
- 제 1 항에 있어서, RNAi 효능을 표적 유전자에 의해 코딩되는 단백질의 양을 측정함으로써 결정하는 방법.
- 제 1 항 또는 제 2 항에 있어서, RNAi 효능을 리포터 유전자 분석법에 의해 결정하는 방법.
- 제 1 항 내지 제 3 항 중의 어느 한 항에 있어서, RNAi 시약이 리포터 단백질을 코딩하는 융합-mRNA의 3'-UTR을 표적화하는 것인 방법.
- 제 1 항 내지 제 4 항 중의 어느 한 항에 있어서, 상이한 융합-mRNA로부터의 데이타를 표준화할 수 있는 방법.
- 제 1 항 내지 제 5 항 중의 어느 한 항에 있어서, 100종 이상의 RNAi 시약, 바람직하게는 1000종 이상의 RNAi 시약의 효능을 결정하는 방법.
- 제 1 항 내지 제 6 항 중의 어느 한 항에 있어서, RNAi 시약의 서열을 무작위적으로 선택하는 방법.
- 제 1 항 내지 제 7 항 중의 어느 한 항에 있어서, RNAi 시약의 서열이 표적 mRNA에 결합하기에 충분히 상보적인 15 내지 30 뉴클레오타이드 길이의 영역을 갖는 것인 방법.
- 제 1 항 내지 제 8 항 중의 어느 한 항에 있어서, RNAi 시약의 상보적 영역이 표적 유전자의 상응하는 영역에 대한 하나 또는 수개의 미스매치를 함유하는 것인 방법.
- 제 1 항 내지 제 9 항 중의 어느 한 항에 있어서, RNAi 시약이 siRNA인 방법.
- 제 1 항 내지 제 10 항 중의 어느 한 항에 있어서, RNAi 시약이 shRNA인 방법.
- 제 1 항 내지 제 11 항 중의 어느 한 항에 있어서, RNAi 시약이 miRNA인 방법.
- 제 1 항 내지 제 12 항 중의 어느 한 항에 따르는 방법에 의해 수득된 알고리즘.
- 제 13 항에 따르는 알고리즘을 포함하는 컴퓨터 판독가능한 저장 매체.
- 제 13 항에 따르는 알고리즘 및 컴퓨터 하드웨어를 포함하는 컴퓨터 시스템.
- a) 소정의 표적 유전자에 대해 상보적인 영역을 포함하는 다수의 RNAi 시약 서열을 제공하는 단계;b) 제 13 항에 따르는 훈련된 알고리즘을 뉴론성 네트워크를 사용하여 상기 RNAi 시약 서열에 적용하는 단계; 및c) 효능이 있는 것으로 예측되는 RNAi 시약 서열(들)을 선택하는 단계를 포함하는, RNAi 시약의 RNAi 효능을 예측하는 방법.
- a) 소정의 표적 유전자에 대해 상보적인 영역을 포함하는 다수의 RNAi 시약 서열을 제공하는 단계;b) 제 13 항에 따르는 훈련된 알고리즘을 뉴론성 네트워크를 사용하여 상기 RNAi 시약 서열에 적용하는 단계;c) 효능이 있는 것으로 예측되는 RNAi 시약 서열(들)을 선택하는 단계;d) 단계 c)에서 선택된 RNAi 시약(들)을 합성하는 단계; 및e) 표적 유전자를 발현하는 세포를 단계 d)의 RNAi 시약(들)에 노출시키는 단계를 포함하는, 소정의 표적 유전자의 발현을 억제하는 방법.
- 제 16 항 또는 제 17 항에 있어서, 단계 c)에서 선택된 RNAi 시약이 소정의 역치값 이상인 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US52843003P | 2003-12-10 | 2003-12-10 | |
US60/528,430 | 2003-12-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060126499A true KR20060126499A (ko) | 2006-12-07 |
Family
ID=34699869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067011510A KR20060126499A (ko) | 2003-12-10 | 2004-12-09 | RNAi 효능의 예측 방법 |
Country Status (9)
Country | Link |
---|---|
EP (1) | EP1694843A1 (ko) |
JP (1) | JP2007523632A (ko) |
KR (1) | KR20060126499A (ko) |
CN (1) | CN1890370A (ko) |
AU (1) | AU2004298527A1 (ko) |
BR (1) | BRPI0417489A (ko) |
CA (1) | CA2545675A1 (ko) |
RU (1) | RU2006124515A (ko) |
WO (1) | WO2005059132A1 (ko) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102006016365B4 (de) * | 2006-04-05 | 2015-08-13 | Qiagen Gmbh | RNA-Interferenz Tags |
WO2008071771A2 (en) * | 2006-12-15 | 2008-06-19 | Novartis Ag | Inhibition of gpr4 |
CA2678055C (en) | 2007-04-10 | 2016-02-16 | Qiagen Gmbh | Rna interference tags |
US20110020368A1 (en) | 2008-03-25 | 2011-01-27 | Nancy Hynes | Treating cancer by down-regulating frizzled-4 and/or frizzled-1 |
EP2405920A1 (en) | 2009-03-06 | 2012-01-18 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute For Biomedical Research | Novel therapy for anxiety |
EP2241323A1 (en) | 2009-04-14 | 2010-10-20 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute For Biomedical Research | Tenascin-W and brain cancers |
CN101625732B (zh) * | 2009-08-03 | 2011-11-30 | 杭州电子科技大学 | 江河潮水水位的预测方法 |
EP2292266A1 (en) | 2009-08-27 | 2011-03-09 | Novartis Forschungsstiftung, Zweigniederlassung | Treating cancer by modulating copine III |
US20120244170A1 (en) | 2009-09-22 | 2012-09-27 | Rafal Ciosk | Treating cancer by modulating mex-3 |
WO2011045352A2 (en) | 2009-10-15 | 2011-04-21 | Novartis Forschungsstiftung | Spleen tyrosine kinase and brain cancers |
EP2542578A1 (en) | 2010-03-05 | 2013-01-09 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute For Biomedical Research | Smoc1, tenascin-c and brain cancers |
WO2011131611A1 (en) | 2010-04-19 | 2011-10-27 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute For Biomedical Research | Modulating xrn1 |
US20130089538A1 (en) | 2010-06-10 | 2013-04-11 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute forBiomedical Researh | Treating cancer by modulating mammalian sterile 20-like kinase 3 |
EP2717911A1 (en) | 2011-06-06 | 2014-04-16 | Novartis Forschungsstiftung, Zweigniederlassung | Protein tyrosine phosphatase, non-receptor type 11 (ptpn11) and triple-negative breast cancer |
WO2013068431A1 (en) | 2011-11-08 | 2013-05-16 | Novartis Forschungsstiftung, Zweigniederlassung, Friedrich Miescher Institute For Biomedical Research | New treatment for neurodegenerative diseases |
RU2014124184A (ru) | 2011-11-15 | 2015-12-27 | Новартис Аг | Комбинация ингибитора фосфоинозитид-3-киназы и модулятора пути янус-киназы 2 - проводника сигнала и активатора транскрипции 5 |
US20140363448A1 (en) | 2012-01-02 | 2014-12-11 | Novartis Ag | Cdcp1 and breast cancer |
WO2013144240A1 (en) | 2012-03-29 | 2013-10-03 | Friedrich Miescher Institute For Biomedical Research | Inhibition of interleukin- 8 and/or its receptor cxcrl in the treatment her2/her3 -overexpressing breast cancer |
EP2866831A1 (en) | 2012-06-29 | 2015-05-06 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute For Biomedical Research | Treating diseases by modulating a specific isoform of mkl1 |
WO2014006114A1 (en) | 2012-07-05 | 2014-01-09 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute For Biomedical Research | New treatment for neurodegenerative diseases |
US20150224190A1 (en) | 2012-07-06 | 2015-08-13 | Mohamed Bentires-Alj | Combination of a phosphoinositide 3-kinase inhibitor and an inhibitor of the IL-8/CXCR interaction |
US20160178610A1 (en) | 2013-08-07 | 2016-06-23 | Friedrich Miescher Institute For Biomedical Research | New screening method for the treatment Friedreich's ataxia |
WO2015189816A1 (en) | 2014-06-13 | 2015-12-17 | Friedrich Miescher Institute For Biomedical Research | New treatment against influenza virus |
US20170165261A1 (en) | 2014-07-01 | 2017-06-15 | Brian Arthur Hemmings | Combination of a brafv600e inhibitor and mertk inhibitor to treat melanoma |
WO2016046768A1 (en) | 2014-09-24 | 2016-03-31 | Friedrich Miescher Institute For Biomedical Research | Lats and breast cancer |
EP3368566A1 (en) | 2015-10-28 | 2018-09-05 | Friedrich Miescher Institute for Biomedical Research | Tenascin-w and biliary tract cancers |
CN109360604B (zh) * | 2018-11-21 | 2021-09-24 | 南昌大学 | 一种卵巢癌分子分型预测系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0212302D0 (en) * | 2002-05-28 | 2002-07-10 | Isis Innovation | Method of selecting targets for gene silencing by RNA interference |
-
2004
- 2004-12-09 JP JP2006543479A patent/JP2007523632A/ja active Pending
- 2004-12-09 RU RU2006124515/13A patent/RU2006124515A/ru not_active Application Discontinuation
- 2004-12-09 KR KR1020067011510A patent/KR20060126499A/ko not_active Application Discontinuation
- 2004-12-09 CN CNA2004800367195A patent/CN1890370A/zh active Pending
- 2004-12-09 AU AU2004298527A patent/AU2004298527A1/en not_active Abandoned
- 2004-12-09 EP EP04820427A patent/EP1694843A1/en not_active Withdrawn
- 2004-12-09 WO PCT/EP2004/014037 patent/WO2005059132A1/en active Application Filing
- 2004-12-09 BR BRPI0417489-5A patent/BRPI0417489A/pt not_active IP Right Cessation
- 2004-12-09 CA CA002545675A patent/CA2545675A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
AU2004298527A1 (en) | 2005-06-30 |
BRPI0417489A (pt) | 2007-05-22 |
WO2005059132A1 (en) | 2005-06-30 |
CA2545675A1 (en) | 2005-06-30 |
RU2006124515A (ru) | 2008-01-20 |
CN1890370A (zh) | 2007-01-03 |
EP1694843A1 (en) | 2006-08-30 |
JP2007523632A (ja) | 2007-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20060126499A (ko) | RNAi 효능의 예측 방법 | |
Elbashir et al. | Analysis of gene function in somatic mammalian cells using small interfering RNAs | |
Jin et al. | Transfection of microRNA mimics should be used with caution | |
Toledano et al. | The let-7–Imp axis regulates ageing of the Drosophila testis stem-cell niche | |
Nakamura et al. | Chondrocyte-specific microRNA-140 regulates endochondral bone development and targets Dnpep to modulate bone morphogenetic protein signaling | |
Li et al. | A microRNA imparts robustness against environmental fluctuation during development | |
Siegel et al. | A functional screen implicates microRNA-138-dependent regulation of the depalmitoylation enzyme APT1 in dendritic spine morphogenesis | |
Grote et al. | The tissue-specific lncRNA Fendrr is an essential regulator of heart and body wall development in the mouse | |
Dorn II | MicroRNAs in cardiac disease | |
CN105960459A (zh) | 抑制neat1用于治疗实体肿瘤 | |
Dai et al. | RNAi-induced targeted silencing of developmental control genes during chicken embryogenesis | |
US20050197315A1 (en) | siRNA expression system and method for producing functional gene knock-down cell using the system | |
Taylor et al. | MBNL splicing activity depends on RNA binding site structural context | |
WO2005031002A2 (en) | Synthetic lethal screen using rna interference | |
JP2011004763A (ja) | Rna干渉の方法と組成物 | |
EP1693450A1 (en) | METHOD OF EVALUATING RNAi ACTIVITY AND miRNA ACTIVITY | |
Desideri et al. | Intronic determinants coordinate charme lncRNA nuclear activity through the interaction with MATR3 and PTBP1 | |
WO2007147067A2 (en) | Methods and compositions for regulating cell cycle progression | |
Dubes et al. | miR‐124‐dependent tagging of synapses by synaptopodin enables input‐specific homeostatic plasticity | |
Falschlehner et al. | High‐throughput RNAi screening to dissect cellular pathways: A how‐to guide | |
Xu et al. | Functional comparison of single-and double-stranded siRNAs in mammalian cells | |
Jensen et al. | Human miR-1271 is a miR-96 paralog with distinct non-conserved brain expression pattern | |
Li et al. | Delta-like 4 mRNA is regulated by adjacent natural antisense transcripts | |
WO2003102185A2 (en) | Methods and compositions for treating neoplasia relating to hnrnp a1 and a2 nucleic acid molecules | |
US20090137505A1 (en) | Method for Predicting and Identifying Target mRnas Controlled By Functional Rnas and Method of Using the Same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |