جينبنك
المحتويات | |
---|---|
الوصف | تسلسل النوكليوتيدات لأكثر من 300000 كائن حي مع دعم ببليوغرافي وشروح بيولوجية. |
نوع البيانات |
|
الكائنات | All |
العناوين | |
مركز الأبحاث | NCBI |
الاستشهاد الأولى | 21071399 |
تاريخ الإطلاق | 1982 |
الوصول | |
صيغة الملف |
|
الموقع | NCBI |
رابط التحميل | ncbi ftp |
خدمة ويب URL | |
الأدوات | |
ويب | بلاست |
برمجية | BLAST |
متنوعات | |
الرخصة | Unclear[1] |
جينبنك أو بنك الجينات (بالإنجليزية: GenBank)هي قاعدة بيانات تسلسل ذات وصول مفتوح، ومجموعة مشروحة من جميع تسلسلات النيوكليوتيد المتاحة للعامة وترجمات البروتين الخاصة بها. يُنتج ويصون المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI؛ جزء من المعاهد الصحة الوطنية في الولايات المتحدة ) قاعدة البيانات كجزء من التعاون الدولي لقاعدة بيانات تسلسل النيوكليوتيد (INSDC).
يتلقى جينبانك والمتعاونون معه سلاسل تُنتج في المختبرات في جميع أنحاء العالم من أكثر من 100 000 كائن حي مميز. أطلق والتر غواد ومختبر لوس ألاموس الوطني قاعدة البيانات في عام 1982. أصبح جينبانك قاعدة بيانات مهمة للبحث في المجالات البيولوجية ونما في السنوات الأخيرة بمعدل أسي من خلال مضاعفة كل 18 شهرًا تقريبًا.[2][3]
الإصدار رقم 194، الذي أُنتج في فبراير 2013، يحتوي على أكثر من 150 مليار بيان من النيوكليوتيدات في أكثر من 162 مليون تسلسل.[4] شُيد جينبانك بعمليات إرسال فردية مباشرة من المختبرات، وكذلك من عمليات إرسال مجمعة من مراكز تسلسل واسعة النطاق.
التقديمات
[عدل]يمكن إرسال التسلسلات الأصلية فقط إلى جينبنك. يتم تقديم الطلبات المباشرة إلى جينبنك باستخدام BankIt، وهو نموذج مستند إلى الويب، أو برنامج التقديم المستقل، Sequin. عند استلام تقديم التسلسل، يقوم موظفو جينبنك بفحص أصالة البيانات وتعيين رقم انضمام للتسلسل وإجراء فحوصات ضمان الجودة. تصدر بعد ذلك التقديمات إلى قاعدة البيانات العامة، حيث يمكن استردادها عن طريق أنتريه أو تنزيلها بواسطة بروتوكول نقل الملفات. المقدمة الأكبر من تسلسل وسم معبر عنه (EST)، موقع-التسلسل الموسوم (STS)، الجينوم المسح تسلسل (الشاباك)، وعالية الإنتاجية الجينوم تسلسل وغالبا ما قدمت بيانات (HTGS) من خلال مراكز التسلسل على نطاق واسع. تقوم مجموعة عمليات الإرسال المباشر لـ جينبنك أيضًا بمعالجة تسلسل الجينوم الميكروبي الكامل.
التاريخ
[عدل]قام والتر غواد من مجموعة البيولوجيا النظرية والفيزياء الحيوية في مختبر لوس ألاموس الوطني وآخرون بإنشاء قاعدة بيانات تسلسل لوس ألاموس في عام 1979، والتي بلغت ذروتها في عام 1982 بإنشاء جينبنك العام.[5] تم توفير التمويل من قبل معاهد الصحة الوطنية، ومؤسسة العلوم الوطنية، ووزارة الطاقة، ووزارة الدفاع. تعاون LANL في جينبنك مع شركة بولت وبرانيك ونيومان، وبحلول نهاية عام 1983 تم تخزين أكثر من 2000 تسلسل فيه.
في منتصف الثمانينيات، أدارت شركة المعلوماتية الحيوية الاستعلامية في جامعة ستانفورد مشروع جينبنك بالتعاون مع LANL.[6] كواحد من أقدم مشاريع مجتمع المعلوماتية الحيوية على الإنترنت، بدأ مشروع جينبنك مجموعات أخبار BIOSCI / Bionet لتعزيز اتصالات الوصول المفتوح بين علماء الأحياء الحيوية. خلال عام 1989 إلى عام 1992، انتقل مشروع جينبنك إلى المركز الوطني لمعلومات التكنولوجيا الحيوية المنشأ حديثًا.[7]
نمو
[عدل]تشير ملاحظات إصدار جينبنك للإصدار 162.0 (أكتوبر 2007) إلى أنه «من عام 1982 حتى الوقت الحاضر، تضاعف عدد القواعد في جينبنك تقريبًا كل 18 شهرًا».[4][8] اعتبارًا من 15 يونيو 2019[تحديث]، إصدار جينبنك 232.0 يحتوي على 213,383,758 موقعًا، 329,835,282,370 قاعدة، من 213,383,758 تسلسلًا تم الإبلاغ عنه.
تتضمن قاعدة بيانات جينبنك مجموعات بيانات إضافية يتم إنشاؤها ميكانيكيًا من جمع بيانات التسلسل الرئيسي، وبالتالي يتم استبعادها من هذا العدد.
كائن حي | قاعده ازواج |
---|---|
الانسان العاقل | 16٬310٬774٬187 |
فأر المنازل | 9٬974٬977٬889 |
الجرذ النرويجي | 6٬521٬253٬272 |
البقر | 5٬386٬258٬455 |
نبات الذرة | 5٬062٬731٬057 |
خنزير بري | 4٬887٬861٬860 |
دانيو مخطط | 3٬120٬857٬462 |
Strongylocentrotus purpuratus | 1٬435٬236٬534 |
مكاك ريسوسي | 1٬256٬203٬101 |
أرز أسيوي | 1٬255٬686٬573 |
تبغ ذائع | 1٬197٬357٬811 |
قيطم مداري | 1٬249٬938٬611 |
ذبابة فاكهة شائعة | 1٬119٬965٬220 |
شيمبانزي شائع | 1٬008٬323٬292 |
رشاد أذن الفأر | 1٬144٬226٬616 |
كلب | 951٬238٬343 |
كرمة نبيذية | 999٬010٬073 |
دجاج الأدغال الأحمر | 899٬631٬338 |
فول الصويا | 906٬638٬854 |
قمح طري | 898٬689٬329 |
تعريفات غير مكتملة
[عدل]قواعد البيانات العامة التي يمكن البحث فيها باستخدام أداة البحث عن المحاذاة المحلية الأساسية (NCBI BLAST) التي يستخدمها المركز الوطني لمعلومات التكنولوجيا الحيوية، تفتقر إلى تسلسل مراجعة النظراء لسلالات النوع وتسلسل السلالات غير النوعية. من ناحية أخرى، في حين يحتمل أن تحتوي قواعد البيانات التجارية على بيانات تسلسل مفلترة عالية الجودة، هناك عدد محدود من التسلسلات المرجعية.
قيمت ورقة نشرت في مجلة علم الأحياء الدقيقة السريرية[10] نتائج تسلسل الجينات 16S rRNA التي تم تحليلها مع جينبنك بالاقتران مع قواعد البيانات العامة الأخرى المتاحة مجانًا والتي يتم التحكم فيها بالجودة على الويب، مثل EzTaxon -e (و BIBI (قواعد بيانات / bibi / ). أظهرت النتائج أن التحليلات التي أجريت باستخدام جينبنك مع EzTaxon -e (kappa = 0.79) كانت أكثر تمييزية من استخدام جينبنك (kappa = 0.66) أو قواعد البيانات الأخرى وحدها.
انظر أيضا
[عدل]- انسمبل متصفح الجينوم للالجينومات الفقارية التي تدعم البحوث في الجينوم المقارنة
- قاعدة بيانات مرجعية للبروتين البشري [الإنجليزية] (HPRD)
- تجميع التسلسلات
- قاعدة بيانات لتسلسل البروتين ومعلوماته الوظيفية يونيبروت
- قائمة الجينومات حقيقية النواة التسلسلية [الإنجليزية]
- قائمة الجينومات المتسلسلة [الإنجليزية]
- قاعدة بيانات مرجعية RefSeq — قاعدة بيانات التسلسل المرجعي
- Geneious — يتضمن أداة تقديم جينبنك
- البيانات العلمية المفتوحة
المراجع
[عدل]- ^ The download page at UCSC says "NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters may claim براءات الاختراع البيولوجية, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information contained in GenBank." نسخة محفوظة 27 يناير 2020 على موقع واي باك مشين.
- ^ Benson D؛ Karsch-Mizrachi، I.؛ Lipman، D. J.؛ Ostell، J.؛ Wheeler، D. L.؛ وآخرون (2008). "GenBank". Nucleic Acids Research. ج. 36 ع. Database: D25–D30. DOI:10.1093/nar/gkm929. PMC:2238942. PMID:18073190.
- ^ Benson D؛ Karsch-Mizrachi، I.؛ Lipman، D. J.؛ Ostell، J.؛ Sayers، E. W.؛ وآخرون (2009). "GenBank". Nucleic Acids Research. ج. 37 ع. Database: D26–D31. DOI:10.1093/nar/gkn723. PMC:2686462. PMID:18940867.
- ^ ا ب "GenBank release notes". NCBI. مؤرشف من الأصل في 2018-04-01.
- ^ Hanson، Todd (21 نوفمبر 2000). "Walter Goad, GenBank founder, dies". Newsbulletin: obituary. Los Alamos National Laboratory. مؤرشف من الأصل في 2008-11-07.
- ^ LANL GenBank History نسخة محفوظة 3 مارس 2016 على موقع واي باك مشين.
- ^ Benton D (1990). "Recent changes in the GenBank On-line Service". Nucleic Acids Research. ج. 18 ع. 6: 1517–1520. DOI:10.1093/nar/18.6.1517. PMC:330520. PMID:2326192.
- ^ Benson، D. A.؛ Cavanaugh، M.؛ Clark، K.؛ Karsch-Mizrachi، I.؛ Lipman، D. J.؛ Ostell، J.؛ Sayers، E. W. (2012). "GenBank". Nucleic Acids Research. ج. 41 ع. Database issue: D36–D42. DOI:10.1093/nar/gks1195. PMC:3531190. PMID:23193287.
- ^ "GenBank". Nucleic Acids Res. ج. 39 ع. Database issue: D32–37. يناير 2011. DOI:10.1093/nar/gkq1079. PMC:3013681. PMID:21071399.
- ^ Kyung Sun Parka, Chang-Seok Kia, Cheol-In Kangb, Yae-Jean Kimc, Doo Ryeon Chungb, Kyong Ran Peckb, Jae-Hoon Songb and Nam Yong Lee (مايو 2012). "Evaluation of the GenBank, EzTaxon, and BIBI Services for Molecular Identification of Clinical Blood Culture Isolates That Were Unidentifiable or Misidentified by Conventional Methods". J. Clin. Microbiol. ج. 50 ع. 5: 1792–1795. DOI:10.1128/JCM.00081-12. PMC:3347139. PMID:22403421.
{{استشهاد بدورية محكمة}}
: صيانة الاستشهاد: أسماء متعددة: قائمة المؤلفين (link)
روابط خارجية
[عدل]- جينبنك
- سجل تسلسل مثال، لبيتا الهيموجلوبين
- BankIt
- Sequin — أداة برمجية مستقلة طورتها NCBI لتقديم وتحديث الإدخالات إلى قاعدة بيانات تسلسل جينبنك.
- EMBOSS — مجاني مفتوح المصدر لعلم الأحياء الجزيئي
- جينبنك وRefSeq وTPA وUniProt: ما هو الاسم؟