Bases de datos y generalidades de bioinformática
Objetivo
Que el alumno conozca la utilidad de las bases de datos bioinformáticas especializadas en la búsqueda de información específica para el estudio de ácidos nucleicos y proteínas, las herramientas para alineamientos multiples.
Instrucciones
Desarrolla el tutorial de la practica, si tienes alguna duda pregunta.
= = = > > > > > > TUTORIAL < < < < < < = = =
1. Utilizando los dominios EMBL ó NCBI, acceda a la secuencia NP_000325.4 (Este será denominado TARGET_1)
2. Descarga el programa Bioedit y copia la secuencia TARGET_1
3. ¿Cuál es la clave de identificación del organismo (taxonomy ID) a la que corresponde dicha secuencia?
4. En la base de datos AmiGO 2 encuentra la entrada GO:0005887 y explica qué relación tiene con la proteína target
5. ¿Cuál es la función molecular de la entrada GO:0005248 y qué relación tiene con el TARGET_1?
6. Copia la información de la sección “Sequence databases” de uniprot de la entrada P35499 (TARGET_2); encuentra y localiza en esta sección la secuencia del ARNm y guárdala en formato FASTA.
7. Utilizando la base de datos Genome identifica el locus 17q23.3 del taxonomy ID: 9606. y encuentra cual es la relación que tiene con los targets 1 y 2.
8. Localiza el Gene ID que se estudia en la entrada PMID: 28330959 de pubmed.
9. Extrae la secuencia 63938554-63972918 de la cadena complementaria del cromosoma NC_000017.11
10. En la base de datos gene utiliza la herramienta “sequence text view” e identifica y colorea en el reporte los intrones y exnoes en la secuencia gene ID: 6393.
11. Identifique el gen del TARGET_1 y extraiga su secuencia incluyendo 2000 pb rio arriba del codón de inicio de la traducción (en dirección 5’) y 1000 pb rio abajo del codón de paro en dirección 3’ y márquelas con colores en un documento electrónico.
12. Analice la Seceuncia_1 en la plataforma pfam y determine la relación que tiene con la entrada scop ID: 81323 e interpro ID: IPR005821
13. Utilizando la plataforma PANTHER identifique genes pertenecientes a la familia a la que pertenece el gen del target_2 para los siguientes organismos:
a) Canis lupus familiaris
b) Schizosaccharomyces pombe
c) Felis catus
d) Mus musculus
e) Rattus norvegicus
14. Utilizando los programas Clustal W o Clustal Omega Elabora un alineamiento múltiple de secuencias utilizando la información de las siguientes proteínas. Guarda los datos e identifica cual es la identidad y la similitud con la secuencia Query (esta información la encontraras en la matriz de correlación).
a) QuerySeq 00X_QuerySeq
b) Sodium Channel Protein Type 4 Subunit Alpha (Rattus norvegicus) 001_Pro_rNav1.4
c) Sodium Channel Protein Type 4 Subunit Alpha (Homo sapiens) 002_Pro_hNav1.4
d) Sodium Channel Protein Type 4 Subunit Alpha (Mus musculus) 003_Pro_mNav1.4
e) Ph-gated Potassium Channel KcsA (Streptomyces lividans) 004_Pro_pH-gated potassium channel KcsA
Listado de programas