DNA바코딩

DNA barcoding
DNA 바코드 방식

DNA 바코딩은 특정 유전자 또는 유전자의 DNA의 짧은 부분을 사용하여 종을 식별하는 방법입니다.DNA 바코딩의 전제는 그러한 DNA 섹션의 참조 라이브러리(시퀀스라고도 함)와 비교함으로써, 슈퍼마켓 스캐너가 UPC 바코드의 익숙한 검은 줄무늬를 사용하여 참조에 대한 재고 품목을 식별하는 것과 같은 방법으로, 개별 시퀀스가 생물에서 종으로 고유하게 사용될 수 있다는 것이다.데이터베이스를 [1]입력합니다.이러한 "바코드"는 때때로 알려지지 않은 종, 유기체의 일부분을 식별하기 위한 노력 또는 단순히 가능한 많은 분류군을 분류하기 위한 노력 또는 종들의 경계를 결정하기 위한 전통적인 분류법과 비교하기 위한 노력으로 사용됩니다.

다른 유전자 영역은 바코드를 사용하여 다른 유기체 그룹을 식별하기 위해 사용됩니다.동물과 일부 원생동물에게 가장 일반적으로 사용되는 바코드 영역은 미토콘드리아 DNA에서 발견되는 시토크롬 c 산화효소 I(COI 또는 COX1) 유전자의 일부입니다.DNA 바코딩에 적합한 다른 유전자는 곰팡이와 RuBis에 자주 사용되는 내부 전사 스페이서(ITS) rRNA이다.식물[2][3]사용되는 CO.미생물은 다른 유전자 영역을 사용하여 검출된다.예를 들어 16S rRNA 유전자는 원핵생물 식별에 널리 사용되는 반면 18S rRNA 유전자는 미생물 진핵생물 검출에 주로 사용된다.이러한 유전자 영역은 "바코딩 갭"으로 알려진 종간(종간)[4] 변동보다 종내(종내) 변동이 적기 때문에 선택된다.

DNA바코딩의 몇몇 어플리케이션:꽃이나 과일을 얻을 수 없다는 사실을 확인하는 식물도, 어른들보다 덜 진단 문자가 있을 수도 있곤충 유충을 확인하는 꽃가루 pollinating 동물의 몸을 수집한 식별, 또는 동물 자신의 위 콘텐츠, 침 혹은 배설물에 근거한 식단을 조사하고 잎을 포함한다.[5]바코드를 사용하여 두 개 이상의 유기체의 DNA를 포함하는 샘플에서 유기체를 식별할 경우, DNA 메타암코딩이라는 용어가 사용됩니다.[6][7] 예를 들어, 하천과 하천의 규조 군집의 DNA 메타암코딩은 [8]수질을 평가하는 데 사용됩니다.


배경

DNA 바코딩 기술은 5S rRNA [9]유전자를 사용하여 미생물 군집에서의 초기 DNA 염기서열 분석 연구로부터 개발되었습니다.2003년 Paul D.N.의 논문에서 종을 식별하기 위한 표준화된 방법으로서 현대 DNA 바코딩의 구체적인 방법과 용어를 제안하고 미지의 염기서열을 잠재적으로 순서와 필라와 같은 상위 분류군에 할당했다. 캐나다 [10]온타리오 구엘프 대학의 헤버트 외 연구진Hebert와 그의 동료들은 1994년 Folmer 등에 의해 최초로 이용시토크롬c산화효소I(COI) 유전자의 효용을 메타조아 무척추동물 [11]간의 적절한 차별적 도구로서 종 수준에서[10] 계통발생학적 분석을 위한 도구로 사용했다.COI 유전자의 "Folmer region"은 DNA 수준의 변화 패턴에 따라 분류군을 구별하는 데 일반적으로 사용됩니다.서열을 비교적 쉽게 검색할 수 있고 종 간 보존과 혼합된 다양성은 COI의 이점 중 일부입니다.헤버트 외 연구진은 프로파일을 "바코드"라고 부르며, "글로벌 생물 식별 시스템"의 기초가 될 수 있는 COI 데이터베이스의 개발을 구상했다.

방법들

채취 및 보존

바코딩은 대상 검체의 조직, 유기체의 혼합물(벌크 샘플) 또는 환경 샘플에 존재하는 DNA(예: 물 또는 토양)에서 수행할 수 있다.표본 추출, 보존 또는 분석 방법은 표본 유형에 따라 다릅니다.

조직 샘플

대상 검체의 조직 샘플을 바코드화하려면 작은 피부 조각, 스케일, 다리 또는 안테나로 충분할 수 있습니다(검체 크기에 따라 다름).오염을 방지하려면 검체 간에 사용한 공구를 멸균해야 합니다.1개의 시료에서 2개의 시료를 채취하는 것이 좋습니다. 하나는 아카이브, 하나는 바코딩 공정용입니다.DNA 분해 문제를 극복하기 위해서는 샘플 보존이 중요하다.

벌크 샘플

벌크 샘플은 연구 중인 분류학 그룹의 여러 유기체를 포함하는 환경 샘플의 한 유형입니다.벌크 샘플(여기서 사용하는 의미)과 다른 환경 샘플의 차이점은 벌크 샘플이 일반적으로 양질의 DNA를 대량으로 제공한다는 것입니다.벌크 샘플의 예로는 킥넷에 의해 수집된 수중 대식세포 샘플이나 말라즈 트랩으로 수집된 곤충 샘플이 있다.단세포 진핵생물처럼 전체 유기체를 포함하는 여과되거나 크기 분절된 물 샘플도 종종 벌크 샘플로 정의됩니다.이러한 샘플은 형태학 기반 식별을 위해 기존 샘플을 얻는 데 사용한 것과 동일한 기술로 수집할 수 있다.

eDNA 샘플

환경 DNA(eDNA) 방법은 바코딩 또는 메타바코딩을 통해 환경 샘플(예: 물 또는 토양)에 존재하는 세포 잔해 또는 세포외 DNA에서 종을 검출하고 식별하는 비침습적 접근법이다.이 접근법은 모든 생물들이 환경에 DNA를 남겨두고 있다는 사실에 기초하고 있으며, 이 환경 DNA는 매우 낮은 존재의 생물에서도 검출될 수 있다.따라서 현장표본에서 가장 중요한 부분은 대상 생물체의 DNA가 저량으로 존재할 가능성이 높은 경우 오염을 방지하기 위해 각 표본 사이트 또는 표본에 DNA가 없는 물질과 도구를 사용하는 것이다.반면에, eDNA 샘플은 항상 많은 양의 살아있는 전세포의 DNA를 포함합니다.따라서 자연환경에서 채취한 미생물 시료는 eDNA 시료라고도 불리지만 대상 생물의 양이 많기 때문에 오염이 덜 문제가 된다.eDNA 방법은 물, 침전물, 토양, 동물의 배설물, 위 내용물 또는 거머리의 혈액과 같은 대부분의 샘플 유형에 적용됩니다.{{인용 last1=Jelger Herder title=Environmental DNA - (침습성)종 검출에 사용할 수 있는 어플리케이션 검토.

DNA 추출, 증폭 및 염기서열 분석

DNA 바코딩은 샘플의 DNA를 추출해야 합니다.여러 가지 다른 DNA 추출 방법이 있으며 비용, 시간, 샘플 유형 및 수율 등의 요인이 최적의 방법의 선택에 영향을 미칩니다.

생체 또는 eDNA 검체의 DNA가 중합효소 연쇄반응(PCR)을 사용하여 증폭되면 해당 반응은 [12]검체에 포함된 억제제 분자에 의해 부정적인 영향을 받을 수 있습니다.이러한 억제제의 제거는 후속 분석에 고품질 DNA를 사용할 수 있도록 하기 위해 매우 중요합니다.

추출된 DNA의 증폭은 DNA 바코딩에 필요한 단계이다.일반적으로 DNA 바코드를 얻기 위해 전체 DNA 물질의 작은 조각(일반적으로 400–800 염기쌍)[13]배열됩니다.eDNA는 다른 선원의 DNA 물질보다 단편화될 가능성이 높기 때문에 eDNA 물질의 증폭은 일반적으로 더 작은 단편 크기(베이스 쌍 200개 미만)에 초점을 맞춘다.그러나 일부 연구는 엠프리콘 크기와 eDNA [14][15]검출률 사이에는 아무런 관계가 없다고 주장한다.

스웨덴 웁살라에 있는 SciLIfeLab의 HiSeq 시퀀서.사진은 2019년 3월 SLU 코스 PNS0169 견학 중 촬영됐다.

DNA 바코드 마커 영역이 증폭된 경우, 다음 단계는 DNA [16]염기서열 분석 방법을 사용하여 마커 영역을 배열하는 것입니다.다양한 시퀀싱 플랫폼을 사용할 수 있으며 기술 개발이 빠르게 진행되고 있습니다.

마커 선택

Pseudomonas의 16S rRNA 유전자에 나타난 프라이머와 표적 영역의 개략도.프라이머로 일반적으로 변동성이 낮은 짧은 보존 시퀀스를 선택하면 선택된 대상 그룹의 대부분 또는 모든 종을 증폭시킬 수 있다.프라이머는 두 프라이머 사이의 매우 가변적인 표적 영역을 증폭하는 데 사용되며, 이는 종 식별에 사용됩니다.Bodilis, Josselin, Nsig-Meilo, Sandrine, Besaury, Ludovic; Quillet, Laurent, CC에서 사용되는 "Pseudomonas의 16S rRNA 유전자의 가변 복사 번호, 유전자 내 이질성 및 가로 이동"에서 수정:https://www.researchgate.net/figure/Hypervariable-regions-within-the-16S-rRNA-gene-in-Pseudomonas-The-plotted-line-reflects_fig2_224832532 를 참조해 주세요.

DNA 바코드에 사용되는 마커를 바코드라고 합니다.DNA 바코드에 기초한 종을 성공적으로 특징짓기 위해서는 유익한 DNA 영역의 선택이 중요하다.좋은 DNA 바코드는 낮은 특이적 및 높은 특이적 간 변동성[10] 가져야 하며 광범위한 분류학적 적용을 위한 범용 PCR 프라이머를 개발하기 위한 보존 측면 부위가 있어야 한다.목표는 연구된 유기체 그룹의 대부분 또는 모든 종을 감지하고 구별하는 프라이머를 설계하는 것입니다(높은 분류학적 분해능).바코드 시퀀스의 길이는 현재 샘플링 소스, DNA 추출, 증폭시퀀싱 [17]방법에 사용할 수 있을 정도로 짧아야 합니다.

이상적으로는 바이러스에서 식물과 동물에 이르는 모든 분류 그룹에 하나의 유전자 배열이 사용될 것이다.그러나, 그러한 유전자 영역은 아직 발견되지 않았기 때문에,[18] 다른 그룹의 유기체에 대해 또는 연구 질문에 따라 다른 바코드를 사용한다.

동물에게 가장 널리 사용되는 바코드는 미토콘드리아 시토크롬 C 산화효소 I(COI) 궤적입니다.[19]Cytb, 12S 또는 18S와 같은 다른 미토콘드리아 유전자들도 사용된다.미토콘드리아 유전자는 핵 유전자의 부족, 유전반수체 형태, 제한된 [19][20]재조합 때문에 핵 유전자보다 선호된다.게다가, 각각의 세포는 다양한 미토콘드리아를 가지고 있고 각각의 세포는 여러 개의 원형 DNA 분자를 가지고 있다.따라서 미토콘드리아는 샘플 조직이 [18]제한적일 때에도 풍부한 DNA 공급원을 제공할 수 있다.

그러나 식물에서 미토콘드리아 유전자는 돌연변이율[21]낮기 때문에 DNA 바코딩에 적합하지 않다.엽록체 게놈에서 몇 개의 후보 유전자가 발견되었으며, 가장 유망한 것은 마투라아제 K 유전자 자체 또는 다른 유전자와 관련된 것이다.matK, rbcL, trnH 또는 다른 유전자와 함께 리보솜 내부 전사 스페이서(ITS DNA)와 같은 다중 위치 마커도 종 [18]식별에 사용되었다.두 개 이상의 엽록체 바코드를 [22]사용할 때 식물 종 간의 최선의 구별이 달성되었습니다.

박테리아의 경우 리보솜 RNA(16S) 유전자의 작은 서브유닛은 [23]보존성이 높기 때문에 다른 분류군에 사용될 수 있다.일부 연구에 따르면 COI,[24] 타입 II 샤페로닌(cpn60)[25] 또는 RNA 중합효소(rpoB)[26]의 β 서브유닛도 세균 DNA 바코드로 작용할 수 있다.

균류를 바코딩하는 것은 더 어렵고, 둘 이상의 프라이머 조합이 [27]필요할 수 있습니다.COI 마커는 특정 균류 [28]그룹에서는 잘 수행되지만 다른 [29]그룹에서는 똑같이 잘 수행되지 않습니다.따라서 ITS rDNA 및 핵 리보솜 RNA의 서브유닛(28S LSU rRNA)[30]과 같은 추가 마커가 사용되고 있다.

프로토타입 그룹 내에서 28S rDNA의 D1–D2 또는 D2–D3 영역, 18S rRNA 유전자의 V4 하위 영역, ITS rDNA 및 COI와 같은 다양한 바코드가 제안되었다.또한 광합성 원생체에는 예를 들어 리불로스-1,5-이인산카르복실화효소-산소화효소 유전자(rbcL) 및 엽록소체 23S rRNA 유전자의 [18]큰 서브유닛을 사용할 수 있다.

Purty와 Chatterjee에서 [18]변형된 다른 유기체 그룹의 DNA 바코딩에 사용된 마커입니다.
유기체군 마커 유전자/위치
동물 COI,[31] Cytb,[32] 12S,[33] 16S[34]
식물 matK,[35] rbcL,[36] psbA-trnH,[37] ITS[38]
박테리아 COI,[24] rpoB,[26] 16S,[39] cpn60,[25] tuf,[40] RIF,[41] gnd[42]
곰팡이 ITS,[2][43] TEF1α,[44][45] RPB1, RPB2, 18S,[30] 28S[46]
프로테스트 ITS,[47] COI,[48] rbcL,[49] 18S,[50] 28S,[49] 23S[18]

참조 라이브러리 및 생물 정보학

참조 라이브러리는 바코딩 또는 메타바코딩에서 얻은 시퀀스의 분류학적 식별(주석이라고도 함)에 사용됩니다.이러한 데이터베이스에는 이전에 식별된 분류군에 할당된 DNA 바코드가 포함되어 있습니다.대부분의 참고 도서관은 유기체 그룹 내의 모든 종을 다루지 않으며, 새로운 항목이 지속적으로 작성됩니다.매크로 및 많은 미생물(조류 등)의 경우, 이러한 참조 라이브러리에는 상세한 문서(표본 채취 장소 및 날짜, 수집한 사람, 이미지 등)와 바우처 표본의 권위 있는 분류학적 식별 및 특정 형식의 시퀀스 제출이 필요하다.그러나 그러한 기준은 소수의 종에 대해서만 충족된다.또한 이 과정에서는 박물관 소장품, 허브리아 및 기타 협력 기관에 바우처 표본을 보관해야 한다.분류학적으로 포괄적인 범위와 콘텐츠 품질은 식별 [51]정확도에 중요하다.미생물 세계에서는 대부분의 종 이름에 대한 DNA 정보가 없고 많은 DNA 배열이 린네어 이항식에 [52]할당될 수 없습니다.유기체군과 사용된 유전자 표지에 따라 몇 가지 참조 데이터베이스가 존재합니다.더 작은 국가 데이터베이스(예: FinBOL)와 International Barcode of Life Project(iBOL)[53]와 같은 대규모 컨소시엄이 있습니다.

굵은 글씨

2007년에 출시된 바코드 오브 라이프 데이터 시스템([54]BOLD)은 2022년에 약 780,000개의 BIN(Barcode Index Number)을 포함하는 가장 큰 데이터베이스 중 하나입니다.바코드 연구를 위한 검체 및 시퀀스 레코드에 자유롭게 액세스할 수 있는 저장소이며 바코드 데이터의 관리, 품질 보증 및 분석을 지원하는 작업대이기도 합니다.데이터베이스는 주로 COI 유전자 표지에 기초한 동물에 대한 BIN 기록을 포함하고 있다.

통일하다

UNITE[55] 데이터베이스는 2003년에 시작되었으며 핵 리보솜 내부 전사 스페이서(ITS) 유전자 표시 영역을 가진 곰팡이(및 2018년 이후 모든 진핵 생물) 종의 분자 식별을 위한 참조 데이터베이스이다.이 데이터베이스는 종(種) 가설의 개념에 기초하고 있습니다.작업할 비율을 선택하면 전문가가 식별한 바우처 샘플에서 얻은 시퀀스와 비교하여 시퀀스가 정렬됩니다.

Diat. 바코드

Diat.barcode[56] 데이터베이스는 2016년 프랑스 국립농업과학원(INRA)의 수생생물학 스테이션의 Thononon 문화 컬렉션(TCC)과 국립생명공학정보센터(NCBI)의 두 가지 소스에서 데이터를 시작으로 R-sys::diatom이라는[57] 이름으로 처음 발행되었다.Diat.barcode는 rbcL(리불로스-1,5-이인산카르복실화효소/산소효소)과 18S(18S 리보솜 RNA)의 두 가지 유전자 마커에 대한 데이터를 제공합니다.데이터베이스는 또한 형태학적 특성(바이오 부피, 크기 치수 등), 생물 형태(이동성, 군락형 등) 또는 생태학적 특징(오염 민감도 등)과 같은 종의 추가적인 특성 정보를 포함한다.

생물정보분석

잘 구조화되고, 깨끗하고, 해석 가능한 데이터를 얻기 위해서는 생화학적인 분석을 사용하여 원시 염기서열 데이터를 처리해야 한다.시퀀스 데이터가 포함된 FASTQ 파일에는 샘플에서 검출된 시퀀스(FASTA 파일)와 각 DNA 시퀀스의 각 뉴클레오티드와 관련된 품질 점수(PHRED 점수)가 있는 품질 파일이라는 두 가지 유형의 정보가 포함되어 있습니다.PHRED 점수는 관련 뉴클레오티드가 올바르게 평가되었을 가능성을 나타냅니다.

PHRED 품질 점수 및 관련 확실도 수준
10 90%
20 99%
30 99.9%
40 99.99%
50 99.999%

일반적으로 PHRED 점수는 각 DNA 배열의 끝에 따라 감소합니다.따라서 일부 생물 정보학 파이프라인은 정의된 임계값에서 시퀀스의 끝을 단순하게 절단한다.

MiSeq와 같은 일부 시퀀스 기술은 쌍단 시퀀싱을 사용하며, 이 동안 양방향에서 시퀀싱이 수행되어 품질이 향상됩니다.그런 다음 겹치는 시퀀스가 콘티그에 정렬되어 병합됩니다.일반적으로 여러 검체는 한 번에 풀링되며 각 검체는 짧은 DNA 조각인 태그로 특징지어집니다.디멀티플렉싱 단계에서는 이 태그를 사용하여 시퀀스를 정렬하여 개별 샘플을 재구성합니다.상세 분석 전에 태그 및 기타 어댑터는 바코드 시퀀스 DNA fragment에서 삭제됩니다.트리밍 중에 불량 시퀀스(낮은 PHRED 점수) 또는 목표 DNA 바코드보다 훨씬 짧거나 긴 시퀀스는 제거됩니다.다음 폐기 단계는 품질 필터링된 모든 시퀀스를 샘플에 풍부하다는 정보와 함께 고유한 읽기 세트(개별 시퀀스 단위 ISU)로 정리하는 과정입니다.그 후 키메라(즉 혼합기원 조각으로 이루어진 화합물 배열)를 검출하여 제거한다.마지막으로, 시퀀스는 많은 클러스터링 전략 중 하나를 사용하여 OTU(Operational Templyics Units)로 클러스터링됩니다.가장 많이 사용되는 바이오 인포매틱 소프트웨어로는 Mother,[58] Uparse,[59] Qiime,[60] Galaxy,[61] Obitools,[62] JAMP,[63] Barque,[64] DADA2 [65]등이 있다.

샘플의 총 판독 수뿐만 아니라 종에 대한 상대 판독량도 샘플, 방법 또는 기타 변수에 따라 다를 수 있기 때문에 서로 다른 샘플 간의 판독량(즉, 시퀀스)을 비교하는 것은 여전히 어려운 일이다.비교를 위해 각 샘플의 판독 수를 비교할 샘플의 최소 판독 수로 줄일 수 있습니다. 이 프로세스를 희귀성이라고 합니다.또 다른 방법은 상대적으로 풍부한 [66]읽기를 사용하는 것입니다.

종 식별 및 분류학적 할당

종에 대한 OTU의 분류학적 할당은 참조 라이브러리에 시퀀스를 일치시킴으로써 달성된다.BLAST(Basic Local Alignment Search Tool)는 샘플의 시퀀스 읽기와 참조 데이터베이스의 [67]시퀀스를 비교하여 시퀀스 간의 유사성 영역을 식별하는 데 일반적으로 사용됩니다.참조 데이터베이스가 관련 종의 시퀀스를 포함하는 경우 샘플 시퀀스는 종 수준에서 식별될 수 있다.시퀀스를 기존 참조 라이브러리 엔트리와 일치시킬 수 없는 경우 DNA 바코드를 사용하여 새 엔트리를 작성할 수 있습니다.

경우에 따라 참조 데이터베이스의 불완전성으로 인해 식별은 패밀리 또는 클래스에 대한 할당과 같은 상위 분류 수준에서만 달성될 수 있습니다.박테리아와 같은 몇몇 유기체 그룹에서는, 종 수준에 대한 분류학적 할당이 종종 가능하지 않습니다.이 경우 샘플은 특정 운영분류단위(OTU)에 할당될 수 있다.

적용들

DNA바코딩의 응용 새로운 종의 식별, 음식, 식별과 수수께끼 같은 종에 대한 평가 안전성 평가, 외계인 종들의 탐지 및 멸종 위협을 받고 species,[68]의 식별이 성인 종류 난치어 단계를 연결하는, bioresources을 확보 지적 재산권, 세계적인 틀 포함한다. 위광보존 전략과 먹이 [69]틈새에 대한 명확한 측정 계획.DNA 바코드 마커는 공동체 집합, 종 상호 작용 네트워크, 분류학적 발견 및 환경 보호를 위한 우선순위 영역 평가를 포함한 체계학, 생태학, 진화 생물학보존에 대한 기본적인 질문에 대처하기 위해 적용될 수 있다.

종의 동정

게놈의 표준화된 영역으로부터의 특정 짧은 DNA 배열 또는 마커는 [70]종을 식별하기 위한 DNA 바코드를 제공할 수 있다.분자법은 전통적인 방법이 적용되지 않을 때 특히 유용하다.DNA 바코딩은 일반적으로 사용 가능한 진단 특성이 거의 없는 유충의 식별과 많은 [71]동물에서 다른 생활 단계(예: 유충과 성체)의 연관성에 매우 잘 적용된다.국제멸종위기종거래조약(CITES) 부록에 기재된 종의 식별은 바코드 기법을 사용하여 불법거래를 [72]감시하는 데 사용된다.

침입종의 검출

외계종은 바코드를 통해 [73][74]탐지될 수 있다.바코딩은 다른 종 간의 유사성, 충분한 진단 특성[73] 부족 및/또는 분류학적 전문성 부족으로 인해 종종 신속하고 정확한 형태학적 식별이 불가능한 국경 통제에서 종 검출에 적합할 수 있다.바코딩과 메타바코딩은 또한 침입종의 생태계를 선별하고 침입종과 형태학적으로 유사한 [75]토착종을 구별하는 데 사용될 수 있다.

암호종 구분

DNA 바코딩은 암호종[76]식별과 인식을 가능하게 한다.DNA 바코드 분석의 결과는 분석 방법의 선택에 따라 달라지기 때문에 DNA 바코드를 사용하여 암호 종을 구분하는 과정은 다른 형태의 분류법만큼이나 주관적일 수 있습니다.헤버트 외(2004년)는 코스타리카 북서부에 사는 나비 아스트라프테스 풀제네이터가 실제로는 10개의 다른 [77]종으로 이루어져 있다고 결론지었다.그러나 이러한 결과는 분석의 수많은 심각한 결함을 지적한 브라우어(2006)에 의해 그 후에 이의를 제기되었고, 원본 데이터는 10개의 [78]암호종이 아닌 3개에서 7개의 암호 분류군을 지원할 수 있을 것이라는 결론을 내렸다.스미스 등(2007) Belvosia parasitoid fly(Diptera: 파리 20종의 종 식별을 위해 시토크롬 c 산화효소 I DNA 바코드를 사용했다.코스타리카 북서부 과나카스테 지역(ACG)의 애벌레(Lepidoptera)에서 사육되고 있다.이 저자들은 이전에는 일반론자로 여겨졌던 세 종류의 기생충 종 각각이 실제로 숙주 특이적인 암호종의 [79]배열이라는 것을 밝혀냄으로써 바코드를 통해 종의 수를 32개로 증가시킨다는 것을 발견했다.DNA 바코딩을 통해 연구된 남극 심해저에 있는 15종의 폴리케트류에 대해, 50%의 사례에서 불가사의한 다양성이 발견되었다.또한, 이전에 간과되었던 10종의 모르포스가 검출되어 표본의 총 종족 농도를 233%[80] 증가시켰다.

바코딩은 음식의 품질을 보증하는 도구이다.여기에서는 노르웨이 전통 크리스마스 음식에서 DNA를 추출하여 NTNU 대학 박물관의 분자 체계 연구실에서 추출했습니다.

다이어트 분석 및 식품 웹 애플리케이션

DNA 바코딩과 메타바코딩은 다이어트 분석 [81]연구에 유용할 수 있으며, 전형적으로 먹이 표본을 형태학적 [82][83]특성에 기초하여 식별할 수 없는 경우에 사용된다.식이요법 분석에는 다양한 표본 추출 방법이 있다: DNA 메타코딩은 위 내용물,[84] 대변,[83][85][86] 또는 전신 [68][87]분석에 대해 수행될 수 있다.분변 샘플이나 고도로 소화된 위 내용물에서는 조직을 단일 종과 구별할 수 없는 경우가 많기 때문에 메타암호화가 [83][88]대신 적용될 수 있다.대변이나 침은 비침습적 샘플링 방법을 나타내며, 전신 분석은 종종 개인을 먼저 죽여야 한다는 것을 의미합니다.더 작은 유기체의 경우, 위 내용물의 배열은 동물 전체의 배열에 의해 종종 이루어집니다.

식품 안전을 위한 바코드

DNA 바코딩은 식품의 품질을 평가하는 데 필수적인 도구이다.그 목적은 식품 추적 가능성을 보장하고, 식품 해적 행위를 최소화하며, 지역적이고 전형적인 농업 식품 생산의 가치를 평가하는 것이다.또 다른 목적은 공중보건을 보호하는 것이다.예를 들어 메타코딩은 식사용 [89]잔존물에서 이과테라 어류 중독을 일으키는 농가를 식별하거나 독버섯을 식용 버섯에서 분리할 수 있는 가능성을 제공한다(Ref).

바이오모니터링 및 생태평가

DNA 바코드를 사용하여 보존 노력을 위한 멸종위기종 존재 여부(Ref) 또는 특정 생태 조건에 반영되는 지표종 존재 여부(Ref)를 평가할 수 있다(예: 과잉 영양소 또는 낮은 산소 수준).

장점과 단점

가능성

전통적인 생물 평가 방법은 국제적으로 잘 확립되어 있으며, 예를 들어 EU 지침 WFDMSFD 내의 수중 생물 평가와 같이 생물 모니터링에 잘 도움이 된다.그러나 DNA 바코딩은 다음과 같은 이유로 전통적인 방법을 개선할 수 있다. (i) DNA 바코딩은 분류학적 분해능을 높이고 식별이 어렵거나 전문가가 부족한 분류군의 식별을 조화시킬 수 있다. (ii) 환경 요인을 특정 분류군과 더 정확하고 정확하게 관련시킬 수 있다 (iii) 규제군 간의 비교 가능성을 높일 수 있다.이온, (iv) 초기 생활 단계와 단편화된 검체를 포함할 수 있도록 허용하고, (v) 암호/유전자 종(vi) 예를 들어 스트레스 요인에 민감하거나 영향을 받을 수 있는 희귀/유전자 종(vi)의 개발을 허용하며, (vi) 처리할 수 있는 검체의 수를 증가시키고, 결과적으로 처리 시간을 감소시킨다.종 생태학에 대한 지식 증가, (vii)는 eDNA [90]방법을 사용할 때 비침습적 모니터링 방법이다.

시간과 비용

DNA 바코딩은 훈련에서 분류학적 할당에 이르기까지 전통적인 형태학적 방법보다 빠르다.분류학 전문가가 되는 것보다 DNA 방법에 대한 전문 지식을 얻는 데 시간이 덜 걸린다.또한 DNA 바코딩 워크플로우(샘플에서 결과까지)는 일반적으로 기존 형태학적 워크플로우보다 빠르고 더 많은 샘플을 처리할 수 있다.

분류학적 해결

DNA 바코드를 사용하면 분류군의 분해능을 더 높은(예: 과)에서 더 낮은(예: 종) 분류 수준으로 할 수 있다. 분류군은 현미경을 통한 식별과 같은 전통적인 형태학적 방법을 사용하여 식별하기 어렵다.예를 들어, 물리지 않는 개똥벌레과(Chironomidae)는 지상 생태계와 담수 생태계 모두에 널리 분포한다.그들의 풍부함과 풍부함은 그들을 생태학적 과정과 네트워크에 중요하게 만들고, 그들은 생물 관찰에 사용되는 많은 무척추 동물 그룹들 중 하나이다.무척추동물 표본은 종종 표본의 50%를 차지하는 100종류의 척추동물을 포함할 수 있다.그럼에도 불구하고, 분류학적 전문지식과 [91]시간이 필요하기 때문에 보통 가족 수준 이하로 식별되지 않는다.이로 인해 서로 다른 생태학적 선호도를 가진 다양한 카이로노미드 종이 함께 그룹화되어 수질 평가가 부정확해질 수 있다.

DNA 바코딩은 분류군을 해결하고 스트레스 요인 효과를 개별 카이노미드 종과 같은 특정 분류군과 직접 연관시킬 수 있는 기회를 제공합니다.예를 들어, Beerman et al. (2018) DNA는 여러 스트레스 요인에 대한 반응을 조사하기 위해 Chironomidae를 바코딩했다. 즉, 흐름 감소, 미세 침전물 증가 및 염도 [92]증가.바코드를 사용한 후, 카이노미드 샘플은 183개의 OTU(Operational Templyics Units), 즉 형태학적 종에 상당하는 바코드(시퀀스)로 구성되었다.이들 183개의 OTU는 동일한 다중 스트레스 요인 연구에서 모든 카이노미드가 함께 그룹화되었을 때 이전에 보고된 두 가지 응답 유형이 아닌 15가지 응답 유형을 표시했다.뉴질랜드 메이플라이 종 델레아티디움 신비로운 다양성을 발견한 마허 외 연구진(2016년)의 연구에서도 비슷한 추세가 발견되었다.이 연구는 스트레스 요인에 대한 12개의 분자별 OTU의 다른 반응 패턴을 발견했는데, 이는 이 하루살이들이 [94]오염에 민감하다는 공감대를 바꿀 수 있다.

단점

DNA 바코딩에 의해 제공되는 이점에도 불구하고, DNA 바코딩이 전통적인 [90]형태학적 방법의 보완으로 가장 잘 사용된다고 또한 제안되어 왔다.이 권장사항은 여러 가지 인식된 과제에 기초하고 있습니다.

물리 파라미터

바이오모니터링을 위해 바코드를 사용하는 경우 필요하기 때문에 DNA 바코드를 해당 바코드의 생태적 선호도와 연결하는 것은 완전히 간단하지 않다.예를 들어, 수생계에서 표적 DNA를 검출하는 것은 현장의 DNA 분자의 농도에 의존하며, 이는 다시 많은 요인에 의해 영향을 받을 수 있다.DNA 분자의 존재는 현장의 분산(예: 전류의 방향 또는 강도)에 따라 달라진다.DNA가 개울이나 호수에서 어떻게 움직이는지는 잘 알려져 있지 않기 때문에 표본 추출이 어렵습니다.또 다른 요인은 대상 종의 행동일 수 있는데, 예를 들어 물고기는 계절적인 움직임의 변화를 가질 수 있고, 가재나 홍합은 그들의 삶의 특정한 시기에 많은 양의 DNA를 방출합니다.토양에 있는 DNA의 경우, 분포, 양 또는 품질에 대해서는 훨씬 더 적게 알려져 있다.

바코드 방법의 주요 한계는 시퀀스의 분류학적 식별을 바코드 참조 라이브러리에 의존한다는 것입니다.분류학적 식별은 신뢰할 수 있는 참조를 사용할 수 있는 경우에만 정확합니다.그러나 대부분의 데이터베이스는 특히 균류, 식물성 플랑크톤, 선충 등과 같은 작은 유기체에 대해서는 아직 불완전하다.또한 현재 데이터베이스에는 오식별, 철자 오류 및 기타 오류가 있습니다.데이터베이스 주변에는 대규모 바코드 프로젝트(예를 들어 BOLD(Barcode of Life Data Systems) 참조 [95][96]데이터베이스용 iBOL 프로젝트)를 포함하여 필요한 모든 유기체를 위한 대규모 큐레이션 및 완료 작업이 있습니다.그러나 완성 및 큐레이션은 어렵고 시간이 많이 소요됩니다.보증된 샘플이 없으면 참조로 사용되는 시퀀스가 정확한지 여부를 확인할 수 없습니다.

GenBank와 같은 DNA 염기서열 데이터베이스에는 시료에 얽매이지 않는 염기서열이 다수 포함되어 있습니다(예를 들어, 하바륨 검체, 배양 세포주, 때로는 이미지).이는 여러 종을 분할 또는 결합해야 하는지, 또는 과거의 식별이 건전한지와 같은 분류학적 문제에 직면할 때 문제가 된다.처음에 잘못 식별된 유기체의 시료에 묶이지 않은 염기서열을 재사용하는 것은 잘못된 결론을 뒷받침할 수 있으므로 [97]피해야 한다.따라서 DNA 바코딩의 베스트 프랙티스는 보증된 [98][99]검체의 염기서열을 지정하는 것입니다.많은 분류군의 경우, 예를 들어, 포획이 어려운 표본의 경우, 이용 가능한 표본이 보존 상태가 좋지 않거나, 적절한 분류학적 전문지식이 [97]부족할 수 있다.

중요한 것은 DNA 바코드를 사용하여 중간 분류법을 작성할 수 있다는 것이다.이 경우 OTU는 기존의 라틴어 바이노미얼을 대체할 수 있기 때문에 완전히 채워진 참조 데이터베이스에 [100]대한 의존도를 크게 줄일 수 있다.

기술적 편견

DNA 바코딩은 또한 샘플링에서 생물정보학 데이터 분석까지 방법론적 편견을 가지고 있다.PCR 억제제에 의한 DNA 샘플의 오염 위험 외에도 프라이머 바이어스는 DNA [101][102]바코딩의 주요 오류 원인 중 하나이다.효율적인 DNA 마커와 프라이머의 설계는 복잡한 과정이며, 다양한 [103]분류학적 그룹에서 DNA 바코드를 위한 프라이머를 개발하기 위해 상당한 노력이 이루어졌다.그러나 프라이머는 종종 일부 시퀀스에 우선적으로 결합되어 프라이머 효율성 및 특수성 차이와 대표성이 없는 커뮤니티의 평가 및 풍성 [104]인플레이션을 초래한다.따라서, 표본 군집 시퀀스의 구성은 주로 PCR 단계에서 변경된다.또한 PCR 복제는 종종 필요하지만 오염 위험이 기하급수적으로 증가한다.몇몇 연구들은 이러한 편견을 피하기 위해 미토콘드리아가 풍부한 샘플이나 PCR이 없는 접근방식을 사용할 가능성을 강조했지만, 현재도 DNA 메타암호화 기술은 여전히 [103]앰픽의 염기서열 분석을 기반으로 하고 있다.키메라 생성과 같은 시퀀스의 염기서열 분석 및 생체정보 처리 중에 다른 편견이 그림으로 들어옵니다.

표준화의 결여

DNA 바코딩이 더 널리 사용되고 적용되더라도, DNA 보존 또는 추출 방법, DNA 마커와 프라이머 세트의 선택, 또는 PCR 프로토콜에 관한 합의는 없다.생물 정보학 파이프라인의 매개변수(예: OTU 클러스터링, 분류학적 할당 알고리즘 또는 임계값 등)는 DNA 바코딩 [103]사용자들 사이에서 많은 논쟁의 원천이다.생성되는 방대한 양의 DNA 데이터를 분석하는 도구와 함께 시퀀스 기술도 빠르게 발전하고 있으며, 더 큰 공간 및 시간 규모로 협업 및 데이터 공유를 가능하게 하기 위해 방법의 표준화가 시급합니다.유럽 규모로 바코드 방법을 표준화하는 것은 유럽 COST 조치 DNAqua-net의 목적의 일부이며, CEN([108]유럽 표준화 위원회)에서도 다루어지고 있다.

DNA 바코딩에 대한 또 다른 비판은 종 수준 이하의 정확한 식별(예를 들어 품종 간 구별), 잡종 검출 및 진화 속도에[citation needed] 의해 영향을 받을 수 있는 제한된 효율성이다.

기존(형태학) 식별과 바코드 기반 식별의 불일치

기존의 (형태학적) 식별에 의해 도출된 분류 목록은 여러 가지 이유로 인해 바코드 기반 식별에 의해 도출된 분류 목록과 직접 비교될 수 없으며, 앞으로도 그렇지 않을 수 있다는 것을 아는 것이 중요하다.가장 중요한 원인은 아마도 eDNA 시퀀스의 올바른 분류학적 할당을 방해하는 분자 참조 데이터베이스의 불완전성과 정확성 부족일 것이다.참조 데이터베이스에 존재하지 않는 분류군은 eDNA에 의해 발견되지 않으며, 잘못된 이름과 연결된 시퀀스는 잘못된 [90]식별을 초래할 수 있다.다른 알려진 원인으로는 전통적인 샘플과 분자 샘플 사이의 다른 샘플링 규모와 크기, 유기체 그룹에 따라 두 방법 모두 다른 방법으로 발생할 수 있는 죽은 유기체의 가능한 분석, 두 방법 중 하나의 특정 선택, 즉 다양한 분류학적 전문 지식 또는 식별 가능성 등이 있다.fy 특정 유기체 그룹, 각각 프라이머 편향,[90] 분류군의 잠재적 편향 분석으로 이어진다.

풍부성/다양성 추정

DNA 바코딩은 종의 풍부함과 다양성을 과대평가하거나 과소평가할 수 있다.일부 연구는 인공물이 생물 [109][110]다양성의 팽창의 주요 원인이라고 시사한다.가장 문제가 되는 문제는 낮은 시퀀스 판독 수로 나타나는 분류법입니다.연구 결과에 따라 이러한 저주파 판독치의 대부분이 아티팩트일 [111]수 있으므로 이러한 판독치는 일반적으로 데이터 필터링 프로세스 중에 제거됩니다.그러나 이러한 저농축 판독치에는 [112]진짜 희귀한 분류군이 존재할 수 있습니다.희귀 시퀀스는 커뮤니티의 고유한 혈통을 반영할 수 있으므로 유익하고 가치 있는 시퀀스가 될 수 있습니다.따라서 정보 판독과 아티팩트를 구별할 수 있는 보다 강력한 생물 정보학 알고리즘이 필요하다.완전한 참조 라이브러리는 또한 인공물의 더 나은 필터링을 허용함으로써 생물 정보학 알고리즘의 더 나은 시험을 가능하게 할 것이다(즉, 현존하는 종 중에서 상대물이 없는 염기서열의 제거). 따라서 보다 정확한 종 [113]할당을 얻을 수 있을 것이다.하나의 형태학적 종이 실제로 많은 뚜렷한 분자 배열로 분열될 [90]수 있기 때문에 불가사의한 다양성은 또한 생물 다양성을 부풀리는 결과를 초래할 수 있다.

메타바코딩

DNA 바코딩 및 메타암코딩의 표준 방법 차이.DNA 바코딩이 특정 종을 찾는 것을 가리키는 반면 메타바코딩은 공동체 전체를 찾습니다.

메타바코딩은 DNA 또는 eDNA(환경 DNA)의 바코딩으로 정의되며, 동일한 (환경) 샘플 내에서 많은 분류군을 동시에 식별할 수 있지만 종종 동일한 유기체 그룹 내에서 정의됩니다.접근법 간의 주요 차이점은 바코딩과 달리 메타암코딩은 하나의 특정 유기체에 초점을 맞추는 것이 아니라 표본 내에서 종 구성을 결정하는 것을 목표로 한다는 것이다.

방법론

메타바코딩 절차는 일반적인 바코딩과 마찬가지로 DNA 추출, PCR 증폭, 시퀀싱데이터 분석 단계를 포함합니다.바코드는 짧은 가변 유전자 영역(예를 들어 다른 마커/바코드 참조)으로 구성되며 프라이머 [114]설계에 사용할 수 있는 고도로 보존된 유전자 영역으로 측면 배치되는 분류학적 할당에 유용하다.하나의 종을 바코드화하는 것이 목적인지 아니면 여러 종을 메타암호화하는 것이 목적인지에 따라 다른 유전자가 사용된다.후자의 경우, 보다 보편적인 유전자가 사용된다.메타바코딩은 단일 종 DNA/RNA를 출발점으로 사용하지 않고 하나의 환경 또는 벌크 샘플에서 파생된 여러 다른 유기체의 DNA/RNA를 사용한다.

적용들

메타코딩은 생물다양성 측정치를 보완할 수 있으며, 특히 기술의 진보와 절차가 점차 저렴해지고 최적화되어 [115][116]널리 보급됨에 따라 경우에 따라서는 이를 대체할 수도 있다.

DNA 메타코딩 어플리케이션에는 다음이 포함됩니다.

장점과 과제

위에서 검토한 바코딩의 일반적인 장점과 단점은 메타바코딩에도 유효합니다.메타암호화 연구의 한 가지 특별한 단점은 eDNA 메타암호화에 [117]적용될 최적의 실험 설계와 생물 정보학 기준에 대한 합의가 아직 없다는 것이다.그러나, EU COST 네트워크 DNAqua-Net과 같이, 바이오모니터링의 [90]베스트 프랙티스 표준을 확립하기 위한 경험과 지식을 교환하는 등, 현재 협력하고 있는 시도가 있다.

「 」를 참조해 주세요.

서브토픽:

관련 토픽:

기사 맨 위에 있는 사이드바 네비게이션도 참조하십시오.

레퍼런스

  1. ^ "What is DNA Barcoding?". iBOL. Retrieved 2019-03-26.
  2. ^ a b Schoch, Conrad L.; Seifert, Keith A.; Huhndorf, Sabine; Robert, Vincent; Spouge, John L.; Levesque, C. André; Chen, Wen; Fungal Barcoding Consortium (2012). "Nuclear ribosomal internal transcribed spacer (ITS) region as a universal DNA barcode marker for Fungi" (PDF). Proceedings of the National Academy of Sciences. 109 (16): 6241–6246. doi:10.1073/pnas.1117018109. ISSN 0027-8424. PMC 3341068. PMID 22454494.
  3. ^ CBOL Plant Working Group; Hollingsworth, P. M.; Forrest, L. L.; Spouge, J. L.; Hajibabaei, M.; Ratnasingham, S.; van der Bank, M.; Chase, M. W.; Cowan, R. S. (2009-08-04). "A DNA barcode for land plants". Proceedings of the National Academy of Sciences. 106 (31): 12794–12797. Bibcode:2009PNAS..10612794H. doi:10.1073/pnas.0905845106. ISSN 0027-8424. PMC 2722355. PMID 19666622.
  4. ^ Paulay, Gustav; Meyer, Christopher P. (2005-11-29). "DNA Barcoding: Error Rates Based on Comprehensive Sampling". PLOS Biology. 3 (12): e422. doi:10.1371/journal.pbio.0030422. ISSN 1545-7885. PMC 1287506. PMID 16336051.
  5. ^ Soininen, Eeva M; Valentini, Alice; Coissac, Eric; Miquel, Christian; Gielly, Ludovic; Brochmann, Christian; Brysting, Anne K; Sønstebø, Jørn H; Ims, Rolf A (2009). "Analysing diet of small herbivores: the efficiency of DNA barcoding coupled with high-throughput pyrosequencing for deciphering the composition of complex plant mixtures". Frontiers in Zoology. 6 (1): 16. doi:10.1186/1742-9994-6-16. ISSN 1742-9994. PMC 2736939. PMID 19695081.
  6. ^ Creer, Simon; Deiner, Kristy; Frey, Serita; Porazinska, Dorota; Taberlet, Pierre; Thomas, W. Kelley; Potter, Caitlin; Bik, Holly M. (2016). Freckleton, Robert (ed.). "The ecologist's field guide to sequence-based identification of biodiversity" (PDF). Methods in Ecology and Evolution. 7 (9): 1008–1018. doi:10.1111/2041-210X.12574.
  7. ^</