Cuando se me ofreció la oportunidad de escribir un artículo de divulgación científica, lo primero en que pensé fue en ayudar a aquellas personas que como yo en el pasado no teníamos ni idea de cómo encontrar información sobre proteínas sin recurrir a la wikipedia. No es que tenga algo en contra de la wikipedia. Lo que pasa es que la ciencia esta escrita en ingles, al igual que los recursos interesantes. Así que aquí estoy, dispuesto a hablar de Protein Data Bank como una de las bases de datos de donde poder obtener datos, aunque también hay otras como Uniprot y Structure con otras posibilidades muy curiosas.

Esta entrada la centrare en Protein Data Bank  por ser más sencillo como primera aproximación si no se esta familiarizado con estas bases de datos. En esta página podemos buscar principalmente proteínas cuya estructura haya sido resuelta. Presenta dos inconvenientes: primero, las estructuras que no han sido resueltas no aparecen. Y segundo, esta en ingles y hacer una búsqueda de la proteína requiere conocer el nombre de la proteína en ingles.

Una vez se tiene el nombre de la proteína se introduce en la barra de búsqueda.

A continuación aparecerán unas listas con las que podremos refinar la búsqueda limitando, entre otras, el organismo al que pertenece la proteína, el método experimental usado…

El organismo (Organism) se refiere a la especie que te interesa.

El método experimental (Experimental Method) nos indica como se ha obtenido la estructura de la proteína. Yo me quedaría siempre que pueda con las estructuras obtenidas por difracción de rayos X (X-Ray) y en su defectos por las obtenidas por RMN, resonancia magnética nuclear (Solution NMR).

La resolución de los métodos de rayos X nos habla de la calidad de la “imagen”, como si de una fotografía se tratase. Pero aquí, cuanto menor sea la resolución mejor. Una resolución menor de 2.5 Ǻ es más que aceptable.

En cuanto al año de lanzamiento sugiero buscar uno de los archivos más antiguos, si lo que buscas es la proteína sin ningún tipo de interacción con otras moléculas o en condiciones especiales. Las primeras estructuras de una proteína serán en su estado natural mientras que las siguientes mostraran interacciones con otras moléculas o con residuos modificados. Estas estructuras posteriores se obtienen con la idea de predecir como podrían actuar otras moléculas con la proteína como fármacos y tóxicos.

Una vez refinada la búsqueda  si miramos más abajo en la página vemos una lista. Cada entrada de la lista esta formada por un código de 4 letras, generalmente un número y 3 letras, estas letras son el código que tiene esta proteína en el Protein Data Bank y que puede facilitar las búsquedas futuras si ya se conoce esto (simplemente basta con poner el código en la barra de búsqueda). Debajo hay una imagen de la proteína y a la derecha el titulo de la entrada acompañada de una serie datos sobre la estructura que nos puede ayudar a identificar la que más nos interesa.

Si pinchamos en la imagen, el código o el titulo de la entrada nos aparecen los datos de la proteína divididos en una serie de pestañas.

La primera de las pestañas nos da unos datos relacionados con publicaciones de PubMed. Además tambien nos proporciona datos de la masa molecular de la estructura (Structure Weight), la longitud en residuos de aminoácidos (Length) y el organismo al que pertenece (Organism). También ofrece la posibilidad de ver la estructura tridimensional en un programa, para esto pinchar en View in Jmol.

Se puede descargar un archivo con el que poder ver la estructura de la proteína en cualquier visor como Jmol o Astex Viewer. Para esto hay que pinchar en el desplegable “Download Files” y cuando se abra, seleccionar la opción PDB File (Text).

En la pestaña de Sequence podemos ver otra vez la longitud en residuos de aminoácidos y una referencia de alguna publicación (generalmente de UniProtKB), que también nos puede proporcionar información. Además también podemos ver el % de estructura secundaria de la proteína y una imagen representativa. La imagen podemos descargarla pinchando en Image. Si te interesa la secuencia de aminoácidos puedes descargarla pinchando en FASTA. El formato FASTA se puede abrir con el bloc de notas.

La pestaña “Seq. Similarity” nos sirve para encontrar otras proteínas similares a nuestra proteína seleccionada usando como criterio la secuencia de aminoácidos. Lógicamente las más similares serán las mismas proteínas que hemos seleccionado pero en otras especies.

La pestaña “3D Similarity” también nos sirve para encontrar proteínas similares en su estructura tridimensional, independientemente de su secuencia de aminoácidos.

El resto de pestañas ofrece información sobre artículos relacionados, anotaciones y la geometría los angulos de los enlaces, además de un diagrama de Ramachandran (en la pestaña “Geometry”).

Con todo esto el lector ya debería tener una idea general de cómo obtener estructuras de proteínas en Protein Data Bank (PDB para los amigos).

Juan Pedro Pagan

Anuncios