샤르가프의 법칙
Chargaff's rules샤르가프의 규칙(어윈 샤르가프가 준)은 어떤 종의 DNA에서도 구아닌의 양은 시토신의 양과 같아야 하고 아데닌의 양은 티민의 양과 같아야 한다고 말합니다. 또한 퓨린과 피리미딘 염기의 1:1 화학량론적 비율(즉, A+G=T+C
)이 있어야 합니다. 이 패턴은 DNA의 양쪽 가닥에서 발견됩니다. 그것들은 1940년대 후반 오스트리아에서 태어난 화학자 에르빈 샤르가프에[1][2] 의해 발견되었습니다.
정의들
퍼스트 패리티 룰
첫 번째 규칙은 이중 가닥 DNA 분자가 전 세계적으로 동일한 퍼센트 염기쌍을 갖는다는 것입니다. A% = T% and G% = C%. 규칙의 엄격한 검증은 DNA 이중 나선 모델에서 왓슨-크릭 쌍의 기초를 구성합니다.
세컨드 패리티 룰
두 번째 규칙은 α% ≈ τ%와 G% ≈ C%가 두 DNA 가닥 각각에 대해 유효하다는 것입니다. 이것은 단일 DNA 가닥에서 염기 조성의 전체적인 특징만을 설명합니다.[4]
조사.
두 번째 패리티 규칙은 1968년에 발견되었습니다.[3] 단일가닥 DNA에서 아데닌 단위의 수는 티민(%A ≈ %T)의 수와 거의 같고 시토신 단위의 수는 구아닌(%C ≈ %G)의 수와 거의 같다고 기술되어 있습니다.
대칭 원리라고 불리는 샤르가프의 두 번째 패리티 규칙의 첫 번째 경험적 일반화는 1993년 Vinayakumar V. Prabhu에 의해 제안되었습니다. 이 원리는 임의의 주어진 올리고뉴클레오티드에 대하여, 그 주파수가 상보적인 역 올리고뉴클레오티드의 주파수와 대략 동일하다는 것을 말합니다. 이론적인[6] 일반화는 Michel E. B. Yamagishi와 Roberto H에 의해 수학적으로 유도되었습니다. 헤라이는 2011년에.[7]
2006년에 이 규칙이 5가지 유형의 이중 가닥 유전체 중 4가지에[2] 적용된다는 것이 밝혀졌는데, 구체적으로 진핵 염색체, 세균 염색체, 이중 가닥 DNA 바이러스 유전체, 고고 염색체에 적용됩니다.[8] ~20-30kbp보다 작은 소기관 유전체(미토콘드리아 및 색소체)에는 적용되지 않으며, 단일 가닥 DNA(바이러스) 유전체나 어떤 종류의 RNA 유전체에도 적용되지 않습니다. 게놈 크기가 역할을 할 수 있지만 이 규칙의 근거는 아직 조사 중입니다.
규칙 자체는 결과를 가져옵니다. 대부분의 박테리아 유전체(일반적으로 80-90% 코딩)에서 유전자는 코딩 서열의 약 50%가 양쪽 가닥에 놓이는 방식으로 배열됩니다. 1960년대 Wacaw Szybalski는 박테리오파지 코딩 서열 퓨린(A와 G)이 피리미딘(C와 T)을 초과한다는 것을 보여주었습니다.[9] 이 규칙은 그 이후로 다른 유기체에서 확인되었으며 아마도 "시발스키의 규칙"으로 명명되어야 할 것입니다. Szybalski의 규칙은 일반적으로 유지되지만 예외는 존재하는 것으로 알려져 있습니다.[10][11][12] Szybalski의 법칙에 대한 생물학적 근거는 아직 알려지지 않았습니다.
샤르가프의 두 번째 규칙과 Szybalski의 규칙의 결합된 효과는 코딩 서열이 동등하게 분포되지 않은 박테리아 유전체에서 볼 수 있습니다. 유전 암호에는 64개의 코돈이 있으며, 그 중 3개는 종결 코돈으로 기능합니다: 단백질에는 보통 20개의 아미노산만이 존재합니다. (제한된 수의 단백질에서 발견되고 정지 코돈에 의해 암호화되는 셀레노시스테인과 피롤리신이라는 흔치 않은 두 가지 아미노산이 있습니다.)TGA 및 TAG 각각.) 코돈과 아미노산의 수가 일치하지 않기 때문에 여러 코돈이 단일 아미노산을 코딩할 수 있습니다.
두 가닥의 동일한 양의 코딩 서열을 가진 유전체 내의 코돈 사용에 대한 다변량 통계 분석은 세 번째 위치의 코돈 사용이 유전자가 위치한 가닥에 따라 달라진다는 것을 보여주었습니다. 이것은 Szybalski와 Chargaff의 규칙의 결과로 보입니다. 피리미딘과 푸린의 코딩 서열에서의 사용의 비대칭성 때문에, 코딩 함량이 더 높은 가닥은 더 많은 푸린 염기를 갖는 경향이 있을 것입니다(Szybalski's rule). 퓨린 염기의 수는 매우 근사적으로 동일한 가닥 내에서 상보적인 피리미딘의 수와 같으며, 코딩 서열이 가닥의 80-90%를 차지하기 때문에, (1) 더 큰 코딩 함량을 갖는 가닥의 퓨린 염기의 수를 최소화하기 위해 제3 염기에 선택적인 압력이 존재하는 것으로 보이고, (2) 이 압력은 두 가닥 사이의 코딩 서열 길이의 불일치에 비례하는 것으로 나타나는 것을 특징으로 하는 방법.
세포 소기관에서 샤르가프의 규칙에서 벗어난 기원은 복제 메커니즘의 결과로 제시되었습니다.[13] 복제하는 동안 DNA 가닥은 분리됩니다. 단일 가닥 DNA에서 시토신은 자발적으로 천천히 아데노신으로 탈아미노화됩니다. 가닥이 길게 분리될수록 탈아미노화의 양이 늘어납니다. 아직 명확하지 않은 이유로 가닥은 염색체 DNA보다 미토콘드리아에 단일 형태로 더 오래 존재하는 경향이 있습니다. 이 과정은 시토신(C)과 아데노신(A)이 풍부한 보체와 함께 구아닌(G)과 티민(T)이 풍부한 한 가닥을 생성하는 경향이 있으며, 이 과정은 미토콘드리아에서 발견되는 편차를 초래했을 수 있습니다.[citation needed][dubious ]
샤르가프의 두 번째 규칙은 더 복잡한 패리티 규칙의 결과인 것으로 보입니다: DNA의 단일 가닥 내에 모든 올리고뉴클레오티드(k-mer 또는 n-그램; 길이 ≤ 10)가 역상보적 뉴클레오티드와 동일한 수로 존재합니다. 계산 요구 사항 때문에 이것은 모든 올리고뉴클레오티드에 대한 모든 유전체에서 검증되지 않았습니다. 대용량 데이터 세트에 대한 삼중항 올리고뉴클레오티드에 대해 검증되었습니다.[14] 알브레히트-뷸러는 이 규칙이 역전과 전치 과정에 의해 진화하는 유전체의 결과라고 제안했습니다.[14] 이 과정은 미토콘드리아 유전체에 작용하지 않은 것으로 보입니다. Chargaff의 두 번째 패리티 규칙은 전체 단일 가닥 인간 게놈 DNA의 경우 뉴클레오티드 수준에서 코돈 삼중체 집단으로 확장되는 것으로 보입니다.[15] 일종의 "코돈 수준 제2 샤르가프 패리티 규칙"은 다음과 같이 제안됩니다.
퍼스트 코돈 | 두 번째 코돈 | 관계 제안 | 세부 사항 |
---|---|---|---|
Twx (1루 위치는 T) | yzA (3루 위치는 A) | % Twx simeq} % yzA | Twx 그리고. yzA 예를 들어 거울 코돈입니다. TCG 그리고. CGA |
Cwx (1루 위치는 C) | yzG (3루 위치는 G) | % Cwx simeq} % yzG | Cwx 그리고. yzG 예를 들어 거울 코돈입니다. CTA 그리고. TAG |
wTx (2루 위치는 T) | yAz (2루 위치는 A) | % wTx simeq} % yAz | wTx 그리고. yAz 예를 들어 거울 코돈입니다. CTG 그리고. CAG |
wCx (2루 위치는 C) | yGz (2루 위치는 G) | % wCx simeq} % yGz | wCx 그리고. yGz 예를 들어 거울 코돈입니다. TCT 그리고. AGA |
wxT (3루 위치는 T) | Ayz (1루 위치는 A) | % wxT simeq} % Ayz | wxT 그리고. Ayz 예를 들어 거울 코돈입니다. CTT 그리고. AAG |
wxC (3루 위치는 C) | Gyz (1루 위치는 G) | % wxC simeq} % Gyz | wxC 그리고. Gyz 예를 들어 거울 코돈입니다. GGC 그리고. GCC |
예제 — 첫 번째 코돈 판독 프레임을 사용하여 전체 인간 게놈을 계산하는 방법은 다음과 같습니다.
36530115 TTT 및 36381293 AAA(ratio % = 1.00409). 2087242 TCG and 2085226 CGA (ratio % = 1.00096), etc...
2020년에는 dsDNA(이중 가닥 DNA)의 물리적 특성과 모든 물리적 시스템의 최대 엔트로피 경향이 Chargaff의 두 번째 패리티 규칙의 원인이라고 제안됩니다.[16] dsDNA 서열에 존재하는 대칭과 패턴은 생물학적 또는 환경적 진화 압력이 아니라 dsDNA 분자의 물리적 특성과 최대 엔트로피 원리만으로 나타날 수 있습니다.
DNA 내 염기의 백분율
다음 표는 Erwin Chargaff의 1952년 데이터의 대표적인 샘플로, 다양한 유기체의 DNA의 염기 구성을 나열하고 Chargaff의 두 규칙을 모두 뒷받침합니다.[17] A/T와 G/C의 변이가 1개와 같은 φX174와 같은 유기체는 단일 가닥 DNA를 나타냅니다.
유기체 | 택슨 | %A | %G | %C | %T | A / T | G / C | %GC | %AT |
---|---|---|---|---|---|---|---|---|---|
옥수수 | 제아 | 26.8 | 22.8 | 23.2 | 27.2 | 0.99 | 0.98 | 46.1 | 54.0 |
문어. | 문어. | 33.2 | 17.6 | 17.6 | 31.6 | 1.05 | 1.00 | 35.2 | 64.8 |
치킨. | 갈루스 | 28.0 | 22.0 | 21.6 | 28.4 | 0.99 | 1.02 | 43.7 | 56.4 |
쥐. | 라투스 | 28.6 | 21.4 | 20.5 | 28.4 | 1.01 | 1.00 | 42.9 | 57.0 |
인간 | 호모 | 29.3 | 20.7 | 20.0 | 30.0 | 0.98 | 1.04 | 40.7 | 59.3 |
메뚜기 | 오소프테라속 | 29.3 | 20.5 | 20.7 | 29.3 | 1.00 | 0.99 | 41.2 | 58.6 |
성게 | 에치노이데아 | 32.8 | 17.7 | 17.3 | 32.1 | 1.02 | 1.02 | 35.0 | 64.9 |
밀 | 트리티쿰 | 27.3 | 22.7 | 22.8 | 27.1 | 1.01 | 1.00 | 45.5 | 54.4 |
효모균 | 사카로미세스 | 31.3 | 18.7 | 17.1 | 32.9 | 0.95 | 1.09 | 35.8 | 64.4 |
대장균 | 에스케리키아 | 24.7 | 26.0 | 25.7 | 23.6 | 1.05 | 1.01 | 51.7 | 48.3 |
φX174 | PhiX174 | 24.0 | 23.3 | 21.5 | 31.2 | 0.77 | 1.08 | 44.8 | 55.2 |
참고 항목
참고문헌
- ^ Elson D, Chargaff E (1952). "On the deoxyribonucleic acid content of sea urchin gametes". Experientia. 8 (4): 143–145. doi:10.1007/BF02170221. PMID 14945441. S2CID 36803326.
- ^ a b Chargaff E, Lipshitz R, Green C (1952). "Composition of the deoxypentose nucleic acids of four genera of sea-urchin". J Biol Chem. 195 (1): 155–160. doi:10.1016/S0021-9258(19)50884-5. PMID 14938364. S2CID 11358561.
- ^ a b Rudner, R; Karkas, JD; Chargaff, E (1968). "Separation of B. Subtilis DNA into complementary strands. 3. Direct analysis". Proceedings of the National Academy of Sciences of the United States of America. 60 (3): 921–2. Bibcode:1968PNAS...60..921R. doi:10.1073/pnas.60.3.921. PMC 225140. PMID 4970114.
- ^ Zhang CT, Zhang R, Ou HY (2003). "The Z curve database: a oraphic representation of genome sequences". Bioinformatics. 19 [issue=5 (5): 590–599. doi:10.1093/bioinformatics/btg041. PMID 12651717.
- ^ Prabhu VV (1993). "Symmetry observation in long nucleotide sequences". Nucleic Acids Research. 21 (12): 2797–2800. doi:10.1093/nar/21.12.2797. PMC 309655. PMID 8332488.
- ^ Yamagishi MEB (2017). Mathematical Grammar of Biology. SpringerBriefs in Mathematics. Springer. arXiv:1112.1528. doi:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.
- ^ Yamagishi ME, Herai RH (2011). Chargaff's "Grammar of Biology": New Fractal-like Rules. SpringerBriefs in Mathematics. arXiv:1112.1528. doi:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.
- ^ Mitchell D, Bridge R (2006). "A test of Chargaff's second rule". Biochem Biophys Res Commun. 340 (1): 90–94. doi:10.1016/j.bbrc.2005.11.160. PMID 16364245.
- ^ Szybalski W, Kubinski H, Sheldrick O (1966). "Pyrimidine clusters on the transcribing strand of DNA and their possible role in the initiation of RNA synthesis". Cold Spring Harb Symp Quant Biol. 31: 123–127. doi:10.1101/SQB.1966.031.01.019. PMID 4966069.
- ^ Cristillo AD (1998). Characterization of G0/G1 switch genes in cultured T lymphocytes. Kingston, Ontario, Canada: Queen's University.
- ^ Bell SJ, Forsdyke DR (1999). "Deviations from Chargaff's second parity rule correlate with direction of transcription". J Theor Biol. 197 (1): 63–76. Bibcode:1999JThBi.197...63B. doi:10.1006/jtbi.1998.0858. PMID 10036208.
- ^ Lao PJ, Forsdyke DR (2000). "Thermophilic Bacteria Strictly Obey Szybalski's Transcription Direction Rule and Politely Purine-Load RNAs with Both Adenine and Guanine". Genome Research. 10 (2): 228–236. doi:10.1101/gr.10.2.228. PMC 310832. PMID 10673280.
- ^ Nikolaou C, Almirantis Y (2006). "Deviations from Chargaff's second parity rule in organellar DNA. Insights into the evolution of organellar genomes". Gene. 381: 34–41. doi:10.1016/j.gene.2006.06.010. PMID 16893615.
- ^ a b Albrecht-Buehler G (2006). "Asymptotically increasing compliance of genomes with Chargaff's second parity rules through inversions and inverted transpositions". Proc Natl Acad Sci USA. 103 (47): 17828–17833. Bibcode:2006PNAS..10317828A. doi:10.1073/pnas.0605553103. PMC 1635160. PMID 17093051.
- ^ Perez, J.-C. (September 2010). "Codon populations in single-stranded whole human genome DNA are fractal and fine-tuned by the Golden Ratio 1.618". Interdisciplinary Sciences: Computational Life Sciences. 2 (3): 228–240. doi:10.1007/s12539-010-0022-0. PMID 20658335. S2CID 54565279.
- ^ Piero Farisell, Cristian Taccioli, Luca Pagani & Amos Maritan (April 2020). "DNA sequence symmetries from randomness: the origin of the Chargaff's second parity rule". Briefings in Bioinformatics. 22 (bbaa04): 2172–2181. doi:10.1093/bib/bbaa041. PMC 7986665. PMID 32266404.
{{cite journal}}
: CS1 maint: 다중 이름: 저자 목록 (링크) - ^ Bansal M (2003). "DNA structure: Revisiting the Watson-Crick double helix" (PDF). Current Science. 85 (11): 1556–1563. Archived from the original (PDF) on 2014-07-26. Retrieved 2013-07-26.
더보기
- Szybalski W, Kubinski H, Sheldrick P (1966). "Pyrimidine clusters on the transcribing strands of DNA and their possible role in the initiation of RNA synthesis". Cold Spring Harbor Symposia on Quantitative Biology. 31: 123–127. doi:10.1101/SQB.1966.031.01.019. PMID 4966069.
- Lobry JR (1996). "Asymmetric substitution patterns in the two DNA strands of bacteria". Mol. Biol. Evol. 13 (5): 660–665. doi:10.1093/oxfordjournals.molbev.a025626. PMID 8676740.
- Lafay B, Lloyd AT, McLean MJ, Devine KM, Sharp PM, Wolfe KH (1999). "Proteome composition and codon usage in spirochaetes: species-specific and DNA strand-specific mutational biases". Nucleic Acids Res. 27 (7): 1642–1649. doi:10.1093/nar/27.7.1642. PMC 148367. PMID 10075995.
- McLean MJ, Wolfe KH, Devine KM (1998). "Base composition skews, replication orientation, and gene orientation in 12 prokaryote genomes". J Mol Evol. 47 (6): 691–696. Bibcode:1998JMolE..47..691M. CiteSeerX 10.1.1.28.9035. doi:10.1007/PL00006428. PMID 9847411. S2CID 12917481.
- McInerney JO (1998). "Replicational and transcriptional selection on codon usage in Borrelia burgdorferi". Proc Natl Acad Sci USA. 95 (18): 10698–10703. Bibcode:1998PNAS...9510698M. doi:10.1073/pnas.95.18.10698. PMC 27958. PMID 9724767.
외부 링크
- 포르투갈 웹 아카이브에 보관된 CBS Genome Atlas Database Archive 2016-05-16 — 수백 개의 기본 스큐 예를 포함하고 있으며 문제가 있었습니다.[1]
- 유전체의 Z 곡선 데이터베이스 – 유전체의 3차원 시각화 및 분석 도구.[2]
- ^ Hallin PF, David Ussery D (2004). "CBS Genome Atlas Database: A dynamic storage for bioinformatic results and sequence data". Bioinformatics. 20 (18): 3682–3686. doi:10.1093/bioinformatics/bth423. PMID 15256401.
- ^ Zhang CT, Zhang R, Ou HY (2003). "The Z curve database: a graphic representation of genome sequences". Bioinformatics. 19 (5): 593–599. doi:10.1093/bioinformatics/btg041. PMID 12651717.