Tag Archive: Jmol


Cuando se me ofreció la oportunidad de escribir un artículo de divulgación científica, lo primero en que pensé fue en ayudar a aquellas personas que como yo en el pasado no teníamos ni idea de cómo encontrar información sobre proteínas sin recurrir a la wikipedia. No es que tenga algo en contra de la wikipedia. Lo que pasa es que la ciencia esta escrita en ingles, al igual que los recursos interesantes. Así que aquí estoy, dispuesto a hablar de Protein Data Bank como una de las bases de datos de donde poder obtener datos, aunque también hay otras como Uniprot y Structure con otras posibilidades muy curiosas.

Esta entrada la centrare en Protein Data Bank  por ser más sencillo como primera aproximación si no se esta familiarizado con estas bases de datos. En esta página podemos buscar principalmente proteínas cuya estructura haya sido resuelta. Presenta dos inconvenientes: primero, las estructuras que no han sido resueltas no aparecen. Y segundo, esta en ingles y hacer una búsqueda de la proteína requiere conocer el nombre de la proteína en ingles.

Una vez se tiene el nombre de la proteína se introduce en la barra de búsqueda.

A continuación aparecerán unas listas con las que podremos refinar la búsqueda limitando, entre otras, el organismo al que pertenece la proteína, el método experimental usado…

El organismo (Organism) se refiere a la especie que te interesa.

El método experimental (Experimental Method) nos indica como se ha obtenido la estructura de la proteína. Yo me quedaría siempre que pueda con las estructuras obtenidas por difracción de rayos X (X-Ray) y en su defectos por las obtenidas por RMN, resonancia magnética nuclear (Solution NMR).

La resolución de los métodos de rayos X nos habla de la calidad de la “imagen”, como si de una fotografía se tratase. Pero aquí, cuanto menor sea la resolución mejor. Una resolución menor de 2.5 Ǻ es más que aceptable.

En cuanto al año de lanzamiento sugiero buscar uno de los archivos más antiguos, si lo que buscas es la proteína sin ningún tipo de interacción con otras moléculas o en condiciones especiales. Las primeras estructuras de una proteína serán en su estado natural mientras que las siguientes mostraran interacciones con otras moléculas o con residuos modificados. Estas estructuras posteriores se obtienen con la idea de predecir como podrían actuar otras moléculas con la proteína como fármacos y tóxicos.

Una vez refinada la búsqueda  si miramos más abajo en la página vemos una lista. Cada entrada de la lista esta formada por un código de 4 letras, generalmente un número y 3 letras, estas letras son el código que tiene esta proteína en el Protein Data Bank y que puede facilitar las búsquedas futuras si ya se conoce esto (simplemente basta con poner el código en la barra de búsqueda). Debajo hay una imagen de la proteína y a la derecha el titulo de la entrada acompañada de una serie datos sobre la estructura que nos puede ayudar a identificar la que más nos interesa.

Si pinchamos en la imagen, el código o el titulo de la entrada nos aparecen los datos de la proteína divididos en una serie de pestañas.

La primera de las pestañas nos da unos datos relacionados con publicaciones de PubMed. Además tambien nos proporciona datos de la masa molecular de la estructura (Structure Weight), la longitud en residuos de aminoácidos (Length) y el organismo al que pertenece (Organism). También ofrece la posibilidad de ver la estructura tridimensional en un programa, para esto pinchar en View in Jmol.

Se puede descargar un archivo con el que poder ver la estructura de la proteína en cualquier visor como Jmol o Astex Viewer. Para esto hay que pinchar en el desplegable “Download Files” y cuando se abra, seleccionar la opción PDB File (Text).

En la pestaña de Sequence podemos ver otra vez la longitud en residuos de aminoácidos y una referencia de alguna publicación (generalmente de UniProtKB), que también nos puede proporcionar información. Además también podemos ver el % de estructura secundaria de la proteína y una imagen representativa. La imagen podemos descargarla pinchando en Image. Si te interesa la secuencia de aminoácidos puedes descargarla pinchando en FASTA. El formato FASTA se puede abrir con el bloc de notas.

La pestaña “Seq. Similarity” nos sirve para encontrar otras proteínas similares a nuestra proteína seleccionada usando como criterio la secuencia de aminoácidos. Lógicamente las más similares serán las mismas proteínas que hemos seleccionado pero en otras especies.

La pestaña “3D Similarity” también nos sirve para encontrar proteínas similares en su estructura tridimensional, independientemente de su secuencia de aminoácidos.

El resto de pestañas ofrece información sobre artículos relacionados, anotaciones y la geometría los angulos de los enlaces, además de un diagrama de Ramachandran (en la pestaña “Geometry”).

Con todo esto el lector ya debería tener una idea general de cómo obtener estructuras de proteínas en Protein Data Bank (PDB para los amigos).

Juan Pedro Pagan

Anuncios

Para comenzar este blog me gustaría hablar de que es, desde mi punto de vista, la bioinformática. Mi experiencia en este mundo de la divulgación es nula, por tanto espero que este post os agrade y me anime para que realice futuras entradas.

Mi idea en este post, es acercar a las personas de todos los ambientes, que entiendan el castellano, el mundo de la bioinformática y explicar por qué es tan importante para los investigadores el conocimiento de aplicaciones que ofrece esta rama de conocimiento. Tengo que dejar claro que yo no soy investigador, pero me estoy moldeando para ello, y posiblemente de lo que vaya hablar yo ahora sea escaso para personas mas documentadas en este tema, por tanto  me gustaría introducir desde mi punto de vista la bioinformática para todo el mundo.

Yo empecé esta disciplina con un terror tremendo, pues mis conocimientos de matemáticas eran muy escasas, y claro todo lo relacionado con informática debe tener números y complicadas operaciones que nunca te saldrán porque te equivocaste en una coma. Pero sin embargo, y como gran sorpresa, no fue así.

Con un gran miedo busqué información previa sobre que es en sí la bioinformática y según la gran amiga Wikipedia, la bioinformática es la aplicación de tecnología de computadores a la gestión y análisis de datos biológicos, desde mi punto de vista, esta definición recalca muy bien que sería la bioinformática.

Aún así, ¿qué quiere decir con la tecnología de computadores? yo en un principio pensé, anda ya estamos en la tecnología de los computadores, ¡¡maldita sea!!, ¡estoy en Matrix y Morfeo no me ha ofrecido la ‘’pastillita’’ roja!, o sí, pero acepte la azul y no me acuerdo de nada… . Mas tarde recapacite y deje de pensar tonterías y busqué que significado tiene y, en este caso, se refiere a que con una serie de software han conseguido que se puedan gestionar datos biológicos.

El éxito que ha tenido esta disciplina como es la bioinformática es que todos los investigadores del mundo puedan conocer la actualidad de las investigaciones que se están llevando a cabo, como los avances en la detección y tratamiento de enfermedades y la producción de alimentos genéticamente modificados. De este modo, por ejemplo, un bioquímico español puede conocer los estudios sobre la ‘diabetes Mellitus tipo 1 en adolescentes’  de inmunólogos Coreanos, o conocer la estructura o la secuencia  de una enzima antes de trabajar con ella.

Un factor importante es que todas las bases de datos de esta disciplina están entrelazadas, por lo que la actualización en una de ellas afecta a todas las bases. Es muy bueno porque no necesito estar dentro de todas las bases para actualizarme en donde me interesa sino que puedo leer el articulo relacionado de la proteína en una base de datos y pasar automáticamente a otra que me refleja su estructura tridimensional.

Dentro de bioinformática, existen tres subdisciplinas:

a) El desarrollo de nuevos algoritmos (fórmulas matemáticas) y estadísticas para establecer relaciones entre miembros de grandes grupos de datos. Como dije anteriormente, mi gran miedo era el realizar formulas matemáticas pero en ningún momento, a no ser que te dediques a la programación de esta base de datos, deberás realizar problemas muy complicados, que para eso ya lo hacen los programas.

b) El análisis y al interpretación de varios tipos de datos incluyendo secuencias de nucleótidos y aminoácidos, dominios proteicos y estructuras de proteínas.

c) El desarrollo y la implementación de herramientas que permitan acceso y manejo eficientes de diferentes tipos de información.

La expansión de esta disciplina es muy reciente puesto que comenzó a emplearse años después de la revolución genómica tras conocer la secuenciación de Haemophilus influenzae (una bacteria que se puede infectar sin hacer nada hasta que un cambio por culpa de otro factor hace que esta bacteria sea una puñetera produciendo problemas respiratorios) en 1995, y desde entonces los genomas están siendo secuenciados a un ritmo rápido.

En octubre de 2011, según Wikipedia, las secuencias completas están disponibles para: 2.719 virus , 1115 archaea y bacterias , y 36 eucariotas , de los cuales aproximadamente la mitad son hongos . Por supuesto, hay que tener en cuenta que la bioinformática no avanzó únicamente por la secuenciación genómica.

La única pega de esta disciplina, es el idioma, donde todo lo descubierto y que aparecen en esa base de datos, salvo muy pocos artículos, están en inglés. Pero sin embargo lo bueno de esto es que el inglés se internacionaliza, es decir, de este modo  lo que  descubran los chinos no va han a esta sus articulos en Mandarín y lo que  descubran los rusos no aparezca en eslavo.

De este modo el inglés es el idioma internacional donde todos los investigadores nos entendemos, y me ahorro aprender chino o eslavo si me interesa seguir el trabajo que llevan a cabo es esos países.

A mí me ha ayudado hasta el momento ha realizar trabajos del ámbito medico (como ha podido ser National  Center Biotechnology Information o NCBI y el European Bioinformatics institute o EMBL-EBI) y la búsqueda de proteínas para conocer su secuencia de aminoácidos para su analisis (UniProt  o expasy) o su estructura obtenida por cristalización (PDB o PDBe ) o tan solo una base de datos que nos hable de todo lo trabajado con la enzima (Brenda).

No solo la bioinformaica son bases de datos en Internet, también hay una gama de programas de, por ejemplo, reproducir la estructura de una proteína (Jmol) u obtener los parámetros cinéticos de una enzima (WES).

Hasta aquí mi única opinión sobre esta rama de la ciencia es que ha servido de mucho para mantenerse actualizado desde todo el mundo, yo ahora seguiré pensando en porque no elegí la pastilla roja, mis razones tendría.

Aarón Ayllón Benitez.