Biology">
Nothing Special   »   [go: up one dir, main page]

2022 - Lab1 - Basededatos - Oscar Orellana

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

Universidad Galileo Oscar Rotherham Orellana Herberth

Maestría en Biología Molecular 22000588


Bioinformatica 04/02/2022
MSc. Jorge Hernandez Bello jornada sabatina

Laboratorio 1: Base de datos


Las bases de datos biológicas son librerías que contienen un conjunto de datos
organizados y estructurados sobre los organismos. Asimismo, estas son
herramientas indispensables en el día a día del investigador, ya que permite tener
acceso a datos de primera fuente, son de ayuda para el diseño de futuros
experimentos y descubrimiento de nuevos conocimientos. Adicionalmente, estas
bibliotecas se deben caracterizar por ser amigables con el usuario, es decir, tener
una interfaz intuitiva en la que el investigador pueda definir sus campos de
búsqueda. Sin embargo, para esto el investigador debe estar relacionado con los
temas que busca, las palabras clave que necesita y la pregunta de investigación
que desea resolver. El secreto de sacarle provecho a estas herramientas es
delimitar el tema de nuestro trabajo lo máximo posible, así evitamos información
que pueda causar ruido en nuestra investigación. El objetivo de esta práctica de
laboratorio es familiarizarse con una de las bases de datos más utilizadas en
ciencias biológicas (NCBI).
Lectura recomendada:https://www.ncbi.nlm.nih.gov/books/NBK143764/
Guia de trabajo adaptada de Explorando Bases de Datos Biológicas realizada
porMSc. Elizabeth Solórzano.
Lea detenidamente las instrucciones de cada inciso y responda las preguntas que
aparecen:
National Center forBiotechnologyInformation (NCBI): repositorio de
información de secuencias biológicas, esta base de datos reúne distinta
información, desde datos puros obtenidos de investigaciones hasta datos
previamente analizas. Los datos biológicos contenidos en NCBI son curados, es
decir, detrás de esta base de datos hay especialistas que analizan los datos que
son almacenados en esta librería, realizan control de calidad e ingresan las
secuencias identificadas correctamente. Adicionalmente, esta base de datos
cuenta con herramientas de análisis como lo es el BLAST y sus variantes.
Link de acceso: https://www.ncbi.nlm.nih.gov/
1. Ingresar a la página de NCBI (link de acceso). Explorar la página
principal e identificar la sección NCBI information, dentro de esta
sección encontrará el módulo About NCBI, ingresar a este apartado.
Responder:

a. ¿Cuáles son los grupos que conforman NCBI? Describirlos con sus
palabras.
Rama de Biología Computacional (CBB)
Rama de Ingeniería de la Información (IEB)
Rama de Recursos de Información (IRB)

b. ¿De dónde obtiene la información biológica la base de datos de


NCBI?
El Laboratorio Europeo de Biología Molecular (EMBL) y el Base de datos de ADN
de Japón (DDBJ). Los acuerdos con la Oficina de Patentes y Marcas Registradas
de EE. UU. Permiten la incorporación de datos de secuencias patentadas.

c. ¿Qué bases de datos secundarias usan información de NCBI?


NCBI apoya y distribuye una variedad de bases de datos para las comunidades
médica y científica. Estos incluyen la herencia mendeliana en línea en el hombre
(OMIM), la base de datos de modelos moleculares (MMDB) de estructuras de
proteínas en 3D, un mapa genético del genoma humano, el navegador de
taxonomía y el proyecto de anatomía del genoma del cáncer (CGAP), en
colaboración con el Instituto Nacional del Cáncer.
2. Utilizando la información contenida en la lectura recomendada,
elabore una lista de tres servicios que brinda NCBI, describir cada uno
de esos servicios y describa como sería utilizado en su área de
trabajo.
 Entrez: sistema de búsqueda y recuperación de NCBI brindando a los usuarios
acceso integrado a secuencias, mapeo, taxonomía y datos estructurales con
vistas gráficas de secuencias y mapas cromosómicos. En el ámbito de la
ingeniería agronómica para identificar un individuo en una clase taxonómica
exacta.
 PubMed: interfaz de búsqueda web que brinda acceso a más de 11 millones de
citas de revistas en MEDLINE y contiene enlaces a artículos de texto completo
en los sitios web de las editoriales participantes. Para la redacción de reportes
y documentos de investigación son de gran ayuda en la ingeniería agronómica
que la información a veces es bien limitada.
 BLAST: programa para la búsqueda de similitud de secuencias desarrollado en
NCBI y es fundamental para identificar genes y características genéticas.
BLAST puede ejecutar búsquedas de secuencias en toda la base de datos de
ADN en menos de 15 segundos. Para el ámbito agronómico de gran ayuda en
identificar algún gen estudiado para genes de resistencia en plantas a gran
velocidad.
 Open Reading Frame Finder (ORF Finder), Electronic PCR y las herramientas
de envío de secuencias, Sequin y BankIt. Todas las bases de datos y
herramientas de software de NCBI están disponibles en la WWW o por FTP. El
NCBI también tiene servidores de correo electrónico que brindan una forma
alternativa de acceder a las bases de datos para la búsqueda de texto o la
búsqueda de similitud de secuencias.
 Divulgación y Educación de NCBI: cuenta con el valor de comunicación
científica en el área de las computadoras, aplicada a la biología molecular y la
genética, mediante el patrocinio de reuniones, talleres y series de conferencias.
Se ha establecido un Programa de Visitantes Científicos para fomentar la
colaboración con científicos externos. Los puestos de becarios posdoctorales
están disponibles como parte del Programa de investigación intramuros de los
NIH.

3. Regrese a la página principal de NCBI y describa brevemente ¿Cómo


funciona el motor de búsqueda?
Es funcional e intuitivo para la búsqueda de base de datos para diversos enlaces
con otras bases de datos, y los resultados lo da tanto especifico el lugar, y también
de forma grafica.
4. Identificar las bases de datos que están contenidas en NCBI e listar 5
bases de datos que puedan tener datos útiles en su área de interés,
describir porque serían útiles.
 Taxonomía: La base de datos de taxonomía es una clasificación y
nomenclatura seleccionadas para todos los organismos en las bases de datos
de secuencias públicas. Esto representa actualmente alrededor del 10% de las
especies de vida descritas en el planeta. En la licenciatura de ingeniero
agrónomo me ayudo mucho para ver la taxonomía exacta que era un individuo
estudiado.
 Genoma: Este recurso organiza información sobre genomas, incluidas
secuencias, mapas, cromosomas, ensamblajes y anotaciones. También
contiene datos de secuencias y mapas de los genomas completos de más de
1000 organismos. Los genomas representan tanto organismos completamente
secuenciados como aquellos cuya secuenciación está en curso. Se
representan los tres dominios principales de la vida (bacterias, arqueas y
eucariotas), así como muchos virus, fagos, viroides, plásmidos y orgánulos.
Este apartado para la ingeniería me ayudo para todo el apartado de
microbiología.
 Gene: Una base de datos de búsqueda de genes, que se centra en genomas
que han sido completamente secuenciados y que tienen una comunidad de
investigación activa para contribuir con datos específicos de genes. La
información incluye nomenclatura, localización cromosómica, productos
genéticos y sus atributos (por ejemplo, interacciones de proteínas), marcadores
asociados, fenotipos, interacciones y enlaces a citas, secuencias, detalles de
variaciones, mapas, informes de expresión, homólogos, contenido de dominios
de proteínas y bases de datos externas. Para la tesis de licenciatura meayudo
a encontrar algunos genes de resistencia en la planta de frijol.

5. Para nosotros investigadores, es importante tener la mayor


información posible para responder una pregunta de investigación.
Sin embargo, no toda la información que recolectamos es utilizada.
Comúnmente uno de los primeros pasos es hacer una búsqueda
general no específica. En el campo de buscador escriba “Cytochrome
c oxidase subunit I”

a. Mencioné la cantidad de resultados (hits) obtenidos en las bases de


datos mencionadas en el apartado 4.
Taxonomy 0
Genome 0
Gene 81131
6. Para ahorrarnos tiempo y también eliminar el ruido en nuestra
búsqueda podemos realizar búsquedas específicas. NCBI nos permite
utilizar AND y OR como métodos de búsqueda. Estas búsquedas están
basadas en cadenas de caracteres por lo que en AND significa que la
búsqueda se realizara “palabra 1” Y “palabra 2”, los resultados serán
únicamente todos aquellos que contengan las dos palabras.
Adicionalmente podemos utilizar OR, que será “palabra 1” O “palabra
2”, los resultados que obtendremos son todos aquellos que al menos
una de las dos palabras este presente. Defina al menos 4 posibles
filtros de búsqueda para GEN: Cytochrome c oxidase subunit I
deDaniorerioy documentelos resultados de los hits obtenidos por
cada una con una captura de pantalla.
Filtro Resultados
Cox 1 danio rerio 179
Cox 1 AND danio rerio 49
Cox 1 OR danio rerio 2844492
Cytochrome c oxidase subunit I 3121056
OR danio rerio
Cytochrome c oxidase subunit I
danio rerio
Cytochrome c oxidase subunit I
AND danio rerio

Cytochrome c oxidase subunit I


OR danio rerio

COX1 AND danio rerio


7. De acuerdo a los resultados anteriores, ¿Qué combinación de
búsqueda fue el que dio mejor resultado?
De acuerdo a que tan específico es nuestra búsqueda será mejor menos
resultados, mientras hacemos una investigación amplia y recolección de
evidencias o base de datos para análisis mejor hacerlo de forma general sin
especificar un término especifico.

8. Interpretación: de acuerdo con la búsqueda del gen COX1, describa la


función de este gen, donde participa, está relacionado a alguna ruta
metabólica. Basado en esto, proponga una idea de proyecto utilizando
el gen COX1 en su área de estudio.
No tiene un uso inmediato con el área de investigación o interés propio con la
ingeniería agronómica.

9. Realice un diagrama de flujo de cómo utilizar una base de datos.


Recuerde ser lo más específico posible ya que debe ser reproducible
por cualquier persona.

REFERENCIAS
Solórzano, Elizabeth. Explorando Bases de Datos Biológicas. Bioinformática –
UVG. 2021.

También podría gustarte