샤르가프의 법칙

Chargaff's rules
DNA 염기쌍을 보여주는 그림으로, 샤갑의 법칙의 근거를 보여줍니다.

샤르가프의 규칙(어윈 샤르가프가 준)은 어떤 종의 DNA에서도 구아닌의 양은 시토신의 양과 같아야 하고 아데닌의 양은 티민의 양과 같아야 한다고 말합니다. 또한 퓨린피리미딘 염기의 1:1 화학량론적 비율(즉, A+G=T+C)이 있어야 합니다. 이 패턴은 DNA의 양쪽 가닥에서 발견됩니다. 그것들은 1940년대 후반 오스트리아에서 태어난 화학자 에르빈 샤르가프[1][2] 의해 발견되었습니다.

정의들

퍼스트 패리티 룰

첫 번째 규칙은 이중 가닥 DNA 분자가 전 세계적으로 동일한 퍼센트 염기쌍을 갖는다는 것입니다. A% = T% and G% = C%. 규칙의 엄격한 검증은 DNA 이중 나선 모델에서 왓슨-크릭 쌍의 기초를 구성합니다.

세컨드 패리티 룰

두 번째 규칙은 α% ≈ τ%와 G% ≈ C%가 두 DNA 가닥 각각에 대해 유효하다는 것입니다. 이것은 단일 DNA 가닥에서 염기 조성의 전체적인 특징만을 설명합니다.[4]

조사.

두 번째 패리티 규칙은 1968년에 발견되었습니다.[3] 단일가닥 DNA에서 아데닌 단위의 수는 티민(%A ≈ %T)의 수와 거의 같고 시토신 단위의 수는 구아닌(%C ≈ %G)의 수와 거의 같다고 기술되어 있습니다.

대칭 원리라고 불리는 샤르가프의 두 번째 패리티 규칙의 첫 번째 경험적 일반화는 1993년 Vinayakumar V. Prabhu에 의해 제안되었습니다. 이 원리는 임의의 주어진 올리고뉴클레오티드에 대하여, 그 주파수가 상보적인 역 올리고뉴클레오티드의 주파수와 대략 동일하다는 것을 말합니다. 이론적인[6] 일반화는 Michel E. B. Yamagishi와 Roberto H에 의해 수학적으로 유도되었습니다. 헤라이는 2011년에.[7]

2006년에 이 규칙이 5가지 유형의 이중 가닥 유전체 중 4가지에[2] 적용된다는 것이 밝혀졌는데, 구체적으로 진핵 염색체, 세균 염색체, 이중 가닥 DNA 바이러스 유전체, 고고 염색체에 적용됩니다.[8] ~20-30kbp보다 작은 소기관 유전체(미토콘드리아색소체)에는 적용되지 않으며, 단일 가닥 DNA(바이러스) 유전체나 어떤 종류의 RNA 유전체에도 적용되지 않습니다. 게놈 크기가 역할을 할 수 있지만 이 규칙의 근거는 아직 조사 중입니다.

20309 염색체가 Chargaff의 두 번째 패리티 규칙을 어떻게 준수하는지를 보여주는 히스토그램

규칙 자체는 결과를 가져옵니다. 대부분의 박테리아 유전체(일반적으로 80-90% 코딩)에서 유전자는 코딩 서열의 약 50%가 양쪽 가닥에 놓이는 방식으로 배열됩니다. 1960년대 Wacaw Szybalski박테리오파지 코딩 서열 퓨린(A와 G)이 피리미딘(C와 T)을 초과한다는 것을 보여주었습니다.[9] 이 규칙은 그 이후로 다른 유기체에서 확인되었으며 아마도 "시발스키의 규칙"으로 명명되어야 할 것입니다. Szybalski의 규칙은 일반적으로 유지되지만 예외는 존재하는 것으로 알려져 있습니다.[10][11][12] Szybalski의 법칙에 대한 생물학적 근거는 아직 알려지지 않았습니다.

샤르가프의 두 번째 규칙과 Szybalski의 규칙의 결합된 효과는 코딩 서열이 동등하게 분포되지 않은 박테리아 유전체에서 볼 수 있습니다. 유전 암호에는 64개의 코돈이 있으며, 그 중 3개는 종결 코돈으로 기능합니다: 단백질에는 보통 20개의 아미노산만이 존재합니다. (제한된 수의 단백질에서 발견되고 정지 코돈에 의해 암호화되는 셀레노시스테인피롤리신이라는 흔치 않은 두 가지 아미노산이 있습니다.)TGA 및 TAG 각각.) 코돈과 아미노산의 수가 일치하지 않기 때문에 여러 코돈이 단일 아미노산을 코딩할 수 있습니다.

두 가닥의 동일한 양의 코딩 서열을 가진 유전체 내의 코돈 사용에 대한 다변량 통계 분석은 세 번째 위치의 코돈 사용이 유전자가 위치한 가닥에 따라 달라진다는 것을 보여주었습니다. 이것은 Szybalski와 Chargaff의 규칙의 결과로 보입니다. 피리미딘과 푸린의 코딩 서열에서의 사용의 비대칭성 때문에, 코딩 함량이 더 높은 가닥은 더 많은 푸린 염기를 갖는 경향이 있을 것입니다(Szybalski's rule). 퓨린 염기의 수는 매우 근사적으로 동일한 가닥 내에서 상보적인 피리미딘의 수와 같으며, 코딩 서열이 가닥의 80-90%를 차지하기 때문에, (1) 더 큰 코딩 함량을 갖는 가닥의 퓨린 염기의 수를 최소화하기 위해 제3 염기에 선택적인 압력이 존재하는 것으로 보이고, (2) 이 압력은 두 가닥 사이의 코딩 서열 길이의 불일치에 비례하는 것으로 나타나는 것을 특징으로 하는 방법.

차갑의 원핵생물 6-머에 대한 2차 패리티 규칙

세포 소기관에서 샤르가프의 규칙에서 벗어난 기원은 복제 메커니즘의 결과로 제시되었습니다.[13] 복제하는 동안 DNA 가닥은 분리됩니다. 단일 가닥 DNA에서 시토신은 자발적으로 천천히 아데노신으로 탈아미노화됩니다. 가닥이 길게 분리될수록 탈아미노화의 양이 늘어납니다. 아직 명확하지 않은 이유로 가닥은 염색체 DNA보다 미토콘드리아에 단일 형태로 더 오래 존재하는 경향이 있습니다. 이 과정은 시토신(C)과 아데노신(A)이 풍부한 보체와 함께 구아닌(G)과 티민(T)이 풍부한 한 가닥을 생성하는 경향이 있으며, 이 과정은 미토콘드리아에서 발견되는 편차를 초래했을 수 있습니다.[citation needed][dubious ]

샤르가프의 두 번째 규칙은 더 복잡한 패리티 규칙의 결과인 것으로 보입니다: DNA의 단일 가닥 내에 모든 올리고뉴클레오티드(k-mer 또는 n-그램; 길이 ≤ 10)가 역상보적 뉴클레오티드와 동일한 수로 존재합니다. 계산 요구 사항 때문에 이것은 모든 올리고뉴클레오티드에 대한 모든 유전체에서 검증되지 않았습니다. 대용량 데이터 세트에 대한 삼중항 올리고뉴클레오티드에 대해 검증되었습니다.[14] 알브레히트-뷸러는 이 규칙이 역전전치 과정에 의해 진화하는 유전체의 결과라고 제안했습니다.[14] 이 과정은 미토콘드리아 유전체에 작용하지 않은 것으로 보입니다. Chargaff의 두 번째 패리티 규칙은 전체 단일 가닥 인간 게놈 DNA의 경우 뉴클레오티드 수준에서 코돈 삼중체 집단으로 확장되는 것으로 보입니다.[15] 일종의 "코돈 수준 제2 샤르가프 패리티 규칙"은 다음과 같이 제안됩니다.

코돈 모집단의 백분율 간의 가닥 내 관계
퍼스트 코돈 두 번째 코돈 관계 제안 세부 사항
Twx (1루 위치는 T) yzA (3루 위치는 A) % Twx simeq} % yzA Twx 그리고. yzA 예를 들어 거울 코돈입니다. TCG 그리고. CGA
Cwx (1루 위치는 C) yzG (3루 위치는 G) % Cwx simeq} % yzG Cwx 그리고. yzG 예를 들어 거울 코돈입니다. CTA 그리고. TAG
wTx (2루 위치는 T) yAz (2루 위치는 A) % wTx simeq} % yAz wTx 그리고. yAz 예를 들어 거울 코돈입니다. CTG 그리고. CAG
wCx (2루 위치는 C) yGz (2루 위치는 G) % wCx simeq} % yGz wCx 그리고. yGz 예를 들어 거울 코돈입니다. TCT 그리고. AGA
wxT (3루 위치는 T) Ayz (1루 위치는 A) % wxT simeq} % Ayz wxT 그리고. Ayz 예를 들어 거울 코돈입니다. CTT 그리고. AAG
wxC (3루 위치는 C) Gyz (1루 위치는 G) % wxC simeq} % Gyz wxC 그리고. Gyz 예를 들어 거울 코돈입니다. GGC 그리고. GCC

예제 — 첫 번째 코돈 판독 프레임을 사용하여 전체 인간 게놈을 계산하는 방법은 다음과 같습니다.

36530115 TTT 및 36381293 AAA(ratio % = 1.00409). 2087242 TCG and 2085226 CGA (ratio % = 1.00096), etc... 

2020년에는 dsDNA(이중 가닥 DNA)의 물리적 특성과 모든 물리적 시스템의 최대 엔트로피 경향이 Chargaff의 두 번째 패리티 규칙의 원인이라고 제안됩니다.[16] dsDNA 서열에 존재하는 대칭과 패턴은 생물학적 또는 환경적 진화 압력이 아니라 dsDNA 분자의 물리적 특성과 최대 엔트로피 원리만으로 나타날 수 있습니다.

DNA 내 염기의 백분율

다음 표는 Erwin Chargaff의 1952년 데이터의 대표적인 샘플로, 다양한 유기체의 DNA의 염기 구성을 나열하고 Chargaff의 두 규칙을 모두 뒷받침합니다.[17] A/T와 G/C의 변이가 1개와 같은 φX174와 같은 유기체는 단일 가닥 DNA를 나타냅니다.

유기체 택슨 %A %G %C %T A / T G / C %GC %AT
옥수수 제아 26.8 22.8 23.2 27.2 0.99 0.98 46.1 54.0
문어. 문어. 33.2 17.6 17.6 31.6 1.05 1.00 35.2 64.8
치킨. 갈루스 28.0 22.0 21.6 28.4 0.99 1.02 43.7 56.4
쥐. 라투스 28.6 21.4 20.5 28.4 1.01 1.00 42.9 57.0
인간 호모 29.3 20.7 20.0 30.0 0.98 1.04 40.7 59.3
메뚜기 오소프테라속 29.3 20.5 20.7 29.3 1.00 0.99 41.2 58.6
성게 에치노이데아 32.8 17.7 17.3 32.1 1.02 1.02 35.0 64.9
트리티쿰 27.3 22.7 22.8 27.1 1.01 1.00 45.5 54.4
효모균 사카로미세스 31.3 18.7 17.1 32.9 0.95 1.09 35.8 64.4
대장균 에스케리키아 24.7 26.0 25.7 23.6 1.05 1.01 51.7 48.3
φX174 PhiX174 24.0 23.3 21.5 31.2 0.77 1.08 44.8 55.2

참고 항목

참고문헌

  1. ^ Elson D, Chargaff E (1952). "On the deoxyribonucleic acid content of sea urchin gametes". Experientia. 8 (4): 143–145. doi:10.1007/BF02170221. PMID 14945441. S2CID 36803326.
  2. ^ a b Chargaff E, Lipshitz R, Green C (1952). "Composition of the deoxypentose nucleic acids of four genera of sea-urchin". J Biol Chem. 195 (1): 155–160. doi:10.1016/S0021-9258(19)50884-5. PMID 14938364. S2CID 11358561.
  3. ^ a b Rudner, R; Karkas, JD; Chargaff, E (1968). "Separation of B. Subtilis DNA into complementary strands. 3. Direct analysis". Proceedings of the National Academy of Sciences of the United States of America. 60 (3): 921–2. Bibcode:1968PNAS...60..921R. doi:10.1073/pnas.60.3.921. PMC 225140. PMID 4970114.
  4. ^ Prabhu VV (1993). "Symmetry observation in long nucleotide sequences". Nucleic Acids Research. 21 (12): 2797–2800. doi:10.1093/nar/21.12.2797. PMC 309655. PMID 8332488.
  5. ^ Yamagishi MEB (2017). Mathematical Grammar of Biology. SpringerBriefs in Mathematics. Springer. arXiv:1112.1528. doi:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.
  6. ^ Yamagishi ME, Herai RH (2011). Chargaff's "Grammar of Biology": New Fractal-like Rules. SpringerBriefs in Mathematics. arXiv:1112.1528. doi:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.
  7. ^ Mitchell D, Bridge R (2006). "A test of Chargaff's second rule". Biochem Biophys Res Commun. 340 (1): 90–94. doi:10.1016/j.bbrc.2005.11.160. PMID 16364245.
  8. ^ Szybalski W, Kubinski H, Sheldrick O (1966). "Pyrimidine clusters on the transcribing strand of DNA and their possible role in the initiation of RNA synthesis". Cold Spring Harb Symp Quant Biol. 31: 123–127. doi:10.1101/SQB.1966.031.01.019. PMID 4966069.
  9. ^ Cristillo AD (1998). Characterization of G0/G1 switch genes in cultured T lymphocytes. Kingston, Ontario, Canada: Queen's University.
  10. ^ Bell SJ, Forsdyke DR (1999). "Deviations from Chargaff's second parity rule correlate with direction of transcription". J Theor Biol. 197 (1): 63–76. Bibcode:1999JThBi.197...63B. doi:10.1006/jtbi.1998.0858. PMID 10036208.
  11. ^ Lao PJ, Forsdyke DR (2000). "Thermophilic Bacteria Strictly Obey Szybalski's Transcription Direction Rule and Politely Purine-Load RNAs with Both Adenine and Guanine". Genome Research. 10 (2): 228–236. doi:10.1101/gr.10.2.228. PMC 310832. PMID 10673280.
  12. ^ Nikolaou C, Almirantis Y (2006). "Deviations from Chargaff's second parity rule in organellar DNA. Insights into the evolution of organellar genomes". Gene. 381: 34–41. doi:10.1016/j.gene.2006.06.010. PMID 16893615.
  13. ^ a b Albrecht-Buehler G (2006). "Asymptotically increasing compliance of genomes with Chargaff's second parity rules through inversions and inverted transpositions". Proc Natl Acad Sci USA. 103 (47): 17828–17833. Bibcode:2006PNAS..10317828A. doi:10.1073/pnas.0605553103. PMC 1635160. PMID 17093051.
  14. ^ Perez, J.-C. (September 2010). "Codon populations in single-stranded whole human genome DNA are fractal and fine-tuned by the Golden Ratio 1.618". Interdisciplinary Sciences: Computational Life Sciences. 2 (3): 228–240. doi:10.1007/s12539-010-0022-0. PMID 20658335. S2CID 54565279.
  15. ^ Piero Farisell, Cristian Taccioli, Luca Pagani & Amos Maritan (April 2020). "DNA sequence symmetries from randomness: the origin of the Chargaff's second parity rule". Briefings in Bioinformatics. 22 (bbaa04): 2172–2181. doi:10.1093/bib/bbaa041. PMC 7986665. PMID 32266404.{{cite journal}}: CS1 maint: 다중 이름: 저자 목록 (링크)
  16. ^ Bansal M (2003). "DNA structure: Revisiting the Watson-Crick double helix" (PDF). Current Science. 85 (11): 1556–1563. Archived from the original (PDF) on 2014-07-26. Retrieved 2013-07-26.

더보기

외부 링크