생물학적 데이터베이스

Biological database
단백질 [1]간의 기능적 연결을 특징짓는 STRING이라는 생물학적 데이터베이스의 홈페이지.

생물 데이터베이스는 과학 실험, 출판된 문헌, 높은 처리량 실험 기술 및 계산 [citation needed]분석에서 수집된 생물 과학 라이브러리입니다.그것들은 유전체학, 단백질학,[2] 대사학, 마이크로어레이 유전자 발현, 계통학 등의 연구 분야의 정보를 포함하고 있다.생물학적 데이터베이스에 포함된 정보에는 유전자 기능, 구조, 국소화(세포와 염색체 모두), 돌연변이의 임상 영향 및 생물학적 배열과 구조의 유사성이 포함된다.

생물학적 데이터베이스는 수집한 데이터의 종류에 따라 분류할 수 있다(아래 참조).일반적으로 분자 데이터베이스(배열, 분자 등), 기능 데이터베이스(생리학, 효소 활동, 표현형, 생태학 등), 분류 데이터베이스(종 및 기타 분류 등급), 이미지 및 기타 매체 또는 표본(박물관 소장 등)이 있다.

데이터베이스는 과학자들이 생체분자의 구조와 그 상호작용으로부터 유기체의 전체 대사, 그리고 종의 진화를 이해하는데 많은 생물학적 현상을 분석하고 설명할 수 있도록 돕는 중요한 도구이다.이 지식은 질병과의 전쟁을 용이하게 하고, 의약품 개발을 돕고, 특정 유전병을 예측하고, 생명 역사에서 종들 간의 기본적인 관계를 발견하는데 도움을 준다.

기술적 기초 및 이론적 개념

컴퓨터 과학의 관계형 데이터베이스 개념과 디지털 라이브러리의 정보 검색 개념은 생물학적 데이터베이스를 이해하는 데 중요합니다.생물학적 데이터베이스 설계, 개발 및 장기 관리는 생물정보학 [3]분야의 핵심 영역이다.데이터 내용은 유전자 배열, 텍스트 기술, 속성 및 온톨로지 분류, 인용 및 표 형식의 데이터를 포함한다.이러한 데이터는 종종 반구조화 데이터로 설명되며 테이블, 키 구분 레코드 및 XML 구조로 표현될 수 있습니다.

접근

대부분의 생물학적 데이터베이스는 사용자가 온라인으로 데이터를 검색할 수 있도록 데이터를 구성하는 웹 사이트를 통해 사용할 수 있습니다.또한 기본 데이터는 일반적으로 다양한 형식으로 다운로드할 수 있습니다.생물학적 데이터는 다양한 형식으로 제공됩니다.이러한 형식에는 텍스트, 시퀀스 데이터, 단백질 구조 및 링크가 포함됩니다.이들 각각은 다음과 같은 특정 소스에서 찾을 수 있습니다.

  • 텍스트 형식은 PubMed 및 OMIM에서 제공합니다.
  • 염기서열 데이터는 DNA의 관점에서 GenBank에 의해 제공되며 단백질의 관점에서 UniProt에 의해 제공됩니다.
  • 단백질 구조는 PDB, SCOP CATH에 의해 제공됩니다.

문제와 과제

생물학적 지식은 수많은 데이터베이스로 분산되어 있다.이는 정보의 일관성을 보장하는 것을 어렵게 만들기도 한다. 예를 들어, 동일한 종이나 다른 데이터 형식에 대해 다른 이름을 사용하는 경우이다.그 결과, 상호 운용성은 정보 교환에 있어서 항상 과제가 되고 있습니다.예를 들어 DNA 염기서열 데이터베이스가 종의 이름을 따라 DNA 염기서열을 저장하는 경우, 해당 종의 이름 변경은 다른 이름을 사용할 수 있는 다른 데이터베이스와의 연결을 끊을 수 있습니다.통합 생물 정보학은 통합 액세스를 제공함으로써 이 문제를 해결하려는 한 분야입니다.한 가지 해결책은 생물학적 데이터베이스다른 데이터베이스와 상호 참조하여 관련 지식을 서로 연결하는 방법이다(예: 종 이름이 변경되더라도 등록 번호가 동일하게 유지되도록).많은 데이터베이스가 동일한 정보를 저장해야 하기 때문에 중복성은 또 다른 문제이다. 를 들어 단백질 구조 데이터베이스는 해당 데이터베이스가 다루는 단백질의 배열, 배열 및 서지 정보를 포함한다.

모델-기관 데이터베이스

종별 데이터베이스는 일부 종, 주로 연구에 자주 사용되는 (모델 유기체)에 대해 사용할 수 있다.예를 들어 EcoCyc는 대장균 데이터베이스입니다.다른 인기 있는 모델 유기체 데이터베이스 마우스 게놈 Informatics은 실험실 쥐를, Mus musculus, 쥐 게놈 데이터베이스 Rattus에, ZFIN Danio Rerio에(제브라 피시), PomBase[4]는 분열 효모 Schizosaccharomyces pombe에, FlyBase인 초파리에, WormBase이 선충류 Caenorhabditis elegans과 Caenorhabditis briggsae를 포함한다.dXenopus tropicalisXenopus laevis 개구리의 Xenbase.

생물 다양성 및 생물종 데이터베이스

생명[5]카탈로그에 있는 동물군과 그 종의 수.

수많은 데이터베이스가 지구상의 생명체의 다양성을 기록하려고 시도한다.대표적인 예가 2001년 종 2000과 통합분류정보시스템에 [6]의해 처음 만들어진 생명 카탈로그다.생명 카탈로그[1]는 세계에서 [7]현재 인정되고 있는 모든 종의 분류학적 분류를 문서화하는 것을 목적으로 하는 공동 프로젝트입니다.생명 카탈로그는 연구자 및 정책 입안자가 참조할 수 있도록 통합되고 일관된 데이터베이스를 제공합니다.Catalogue of Life는 Conifer Database, ICTV MSL(바이러스용) 및 LepIndex(나비 및 나방용)와 같은 다른 소스의 최신 데이터 세트를 큐레이션합니다.생명의 카탈로그는 2022년 [8]5월 현재 165개의 데이터베이스에서 작성되었다.생명 카탈로그의 운영 비용은 Global Biodiversity Information Facility, Illinois Natural History Survey, Naturalis Biodiversity Center 및 Smithsonian [9]Institution이 부담합니다.

일부 생물학적 데이터베이스는 또한 다른 종의 지리적 분포를 기록한다.Shuang Dai 등은 기존의 데이터베이스에는 많은 [10]종에 대한 공간 분포 데이터가 심각하게 부족했기 때문에 중국에서 1,371종의 조류에 대한 공간적/지리적 분포를 문서화하기 위해 새로운 다중 소스 데이터베이스를 만들었다.이 새로운 데이터베이스의 출처는 책, 문헌, GPS 추적, 온라인 웹 페이지 데이터를 포함합니다.새 데이터베이스에는 각 종에 대한 분류법, 분포, 종 정보 및 데이터 소스가 표시되었습니다.조류 공간 분포 데이터베이스(DB)를 완성한 결과 중국에서 알려진 종의 61%가 기존에 알려진 지역 이외의 지역에 분포하고 있는 것으로 나타났다.[11]

의료 데이터베이스

상처 DB로 인한 발 상처야[12]

의료 데이터베이스는 생물의학 데이터 자원의 특수한 경우이며 PubMed와 같은 참고 문헌에서 AI 기반 진단 소프트웨어 개발을 위한 이미지 데이터베이스까지 다양하다.예를 들어, 그러한 영상 데이터베이스는 상처 모니터링 [13]알고리즘의 개발을 지원하기 위해 개발되었다.사진, 열 이미지 및 3D 메시 깊이 맵으로 구성된 79개 환자 방문에서 188개 이상의 다중 모달 이미지 세트가 큐레이션되었습니다.상처 윤곽을 수동으로 그려 사진 데이터 [14]세트에 추가했다.데이터베이스는 WingsDB라는 프로그램의 형태로 공개되었으며, 만성 상처 데이터베이스 웹사이트에서 다운로드 할 수 있습니다.[2]

핵산 연구 데이터베이스 문제

생물학적 데이터베이스를 찾기 위한 중요한 자원은 핵산 연구(NAR) 저널의 특별 연호이다.NAR의 Database Issue는 자유롭게 이용할 수 있으며, 많은 공공 생물 데이터베이스를 분류한다.온라인 분자 생물학 데이터베이스 컬렉션이라고 불리는 문제의 동반 데이터베이스에는 1,380개의 온라인 데이터베이스가 나열되어 [15]있습니다.MetaBase 및 Biobiatics Links Collection과 [16][17]같은 다른 데이터베이스 집합이 존재합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Szklarczyk D; Franceschini A; Kuhn M; et al. (January 2011). "The STRING database in 2011: functional interaction networks of proteins, globally integrated and scored". Nucleic Acids Res. 39 (Database issue): D561–8. doi:10.1093/nar/gkq973. PMC 3013807. PMID 21045058.
  2. ^ Altman RB (March 2004). "Building successful biological databases". Brief. Bioinformatics. 5 (1): 4–5. doi:10.1093/bib/5.1.4. PMID 15153301.
  3. ^ Bourne P (August 2005). "Will a biological database be different from a biological journal?". PLOS Comput. Biol. 1 (3): 179–81. Bibcode:2005PLSCB...1...34B. doi:10.1371/journal.pcbi.0010034. PMC 1193993. PMID 16158097.
  4. ^ Lock, A; Rutherford, K; Harris, MA; Hayles, J; Oliver, SG; Bähler, J; Wood, V (13 October 2018). "PomBase 2018: user-driven reimplementation of the fission yeast database provides rapid and intuitive access to diverse, interconnected information". Nucleic Acids Research. 47 (D1): D821–D827. doi:10.1093/nar/gky961. PMC 6324063. PMID 30321395.
  5. ^ Catalogue of Life (2001). "Homepage". Search. Species 2000. Retrieved 2022-05-05.
  6. ^ Jones, Andrew C. (2011). "Identifying and Relating Biological Concepts in the Catalogue of Life". Journal of Biomedical Semantics. 2 (1): 7. doi:10.1186/2041-1480-2-7. PMC 3245425. PMID 22004596. Retrieved 2022-05-05.
  7. ^ Catalogue of Life (2001). "What is Catalogue of Life?". Our Mission. Species 2000. Retrieved 2022-05-05.
  8. ^ Catalogue of Life (2001). "Source Datasets". Species 2000. Retrieved 2022-05-05.
  9. ^ Catalogue of Life (2001). "Funding". Species 2000. Retrieved 2022-05-05.
  10. ^ Dai, Shuang (2019). "A Spatialized Digital Database for All Bird Species in China". Science China Life Sciences. 62 (5): 661–667. doi:10.1007/s11427-018-9419-2. PMID 30900164. S2CID 84845653. Retrieved 2022-05-05.
  11. ^ Dai, Shuang (2019). "A Spatialized Digital Database for All Bird Species in China". Science China Life Sciences. 62 (5): 661–667. doi:10.1007/s11427-018-9419-2. PMID 30900164. S2CID 84845653. Retrieved 2022-05-05.
  12. ^ "Chronic Wound Database". WoundsDB. Silesian University of Technology. 2020. Retrieved 2022-05-05.
  13. ^ Kręcichwost, Michał (2021). "Chronic Wounds Multimodal Image Database". Computerized Medical Imaging and Graphics. 88: 101844. doi:10.1016/j.compmedimag.2020.101844. PMID 33477091. S2CID 231676950. Retrieved 2022-05-05.
  14. ^ "Chronic Wound Database". WoundsDB. Silesian University of Technology. 2020. Retrieved 2022-05-05.
  15. ^ Galperin MY; Fernández-Suárez XM (January 2012). "The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection". Nucleic Acids Res. 40 (Database issue): D1–8. doi:10.1093/nar/gkr1196. PMC 3245068. PMID 22144685.
  16. ^ Bolser DM; Chibon PY; Palopoli N; et al. (January 2012). "MetaBase--the wiki-database of biological databases". Nucleic Acids Res. 40 (Database issue): D1250–4. doi:10.1093/nar/gkr1099. PMC 3245051. PMID 22139927.
  17. ^ Brazas MD; Yim DS; Yamada JT; Ouellette BF (July 2011). "The 2011 Bioinformatics Links Directory update: more resources, tools and databases and features to empower the bioinformatics community". Nucleic Acids Res. 39 (Web Server issue): W3–7. doi:10.1093/nar/gkr514. PMC 3125814. PMID 21715385.

외부 링크