Aula Prática: Protein Data Bank (PDB)
Como foi abordado em sala de aula, existem diversos bancos de dados biológicos, que podem abrigar diversos tipos de informação biológica. Nesta aula prática, focaremos no Protein Data Bank, ou PDB, um repositório que funciona como uma arquivo de estruturas tridimensionais determinadas de proteínas, ácidos nucleicos e outras macromoléculas biológicas.
- Acessar o repositório através do link: https://www.rcsb.org
- Obter uma entrada PDB relativa a alguma proteína, neste caso, vamos utilizar a entrada 1W0E
O arquivo PDB é um repositório de coordenadas atômicas e outras informações que descrevem proteínas e outras macromoléculas biológicas. Acessando a sua interface através da busca de uma entrada, é possível visualizar a estrutura tridimensional, e outras características no cabeçalho, como PDB DOI, classificação, organismos fonte, sistemas de expressão, se há mutação na sequência, as datas de depósito e lançamento no banco, além dos autores responsáveis pelo mesmo.
Também há informações sobre dados experimentais, como o método utilizado na determinação da estrutura, o valor da resolução e gráficos contendo essas métricas. Essa determinação pode ser realizada a partir da utilização de métodos como cristalografia de raios X, espectroscopia de RMN e microscopia crioeletrônica.
Outra importante informação disponibilizada é a referência na literatura sobre a citação primária que descreve a estrutura.
No PDB estão disponíveis estruturas para muitas das proteínas e ácidos nucleicos envolvidos em importantes processos biológicos, sendo possível acessá-lo para encontrar estruturas de ribossomos, oncogenes, alvos de fármacos e até mesmo vírus inteiros.
A entrada 1W0E foi escolhida para esta prática por se tratar da estrutura cristalográfica do citocromo P450 3A4 humano – o CYP3A4 –, muito importante na metabolização de medicamentos.
Existem alguns desafios ao se trabalhar com esse repositório, como o grande volume e diversidade de informações, considerando que há múltiplas estruturas para uma determinada molécula, estruturas parciais, estruturas que foram modificadas ou inativadas de sua forma nativa, pode dificultar a localização das mais adequadas para cada tipo de pesquisa.
Desta forma, o Protein Data Bank é um importante banco de dados para trabalhos em bioinformática, principalmente na área da bioinformática estrutural, apresentando uma boa infraestrutura e integração de dados biológicos, além de dispor de uma enorme variedade de moléculas.
Fontes
- PDB-101 - https://pdb101.rcsb.org/learn/guide-to-understanding-pdb-data/pdb-overview
- RCSB PDB - https://www.rcsb.org