Conhecendo a Bioinformática

Em 1988 o governo americano lançou o primeiro banco de dados público contendo sequências de DNA dos mais diversos organismos. Este repositório de seqüências recebeu o nome de Centro Nacional para Informação em Biotecnologia (NCBI-National Center for Biotechnology Information). Hoje, este centro tem várias ramificações no mundo inteiro e, além do banco de dados propriamente dito, o NCBI proporciona um grande número de ferramantas de informática e recursos para auxiliar o cientista na pesquisa genética. A utilização cada vez maior da informática no estudo da pesquisa biólogica e ainda mais específicamente no estudo dos genes, deu origem à disciplina conhecida como bioinformática.
A bioinformática é ainda considerada uma recente subdivisão da biotecnologia e representa o “casamento” da biotecnologia com a informática. De modo simples, bioinformática consiste no depósito e análise de sequências genéticas em bancos de dados e consequente manipulação e análise destas sequências com a utilização de software específicos.
O estabelecimento de bancos de dados públicos possibilita que os cientistas possam ter acesso à informação proveniente de outros laboratórios e possam também trocar e compartilhar seqüências genéticas. Todos os dias novas seqüências são depositadas no banco de dados púbicos do NCBI, o chamado GenBank. A bioinformática tem revolucionado o desenvolvimento da pesquisa médico-biólogica e tem possibilitado que novas descobertas relevantes sejam realizadas quase todos os dias.
Hoje, a maioria dos biólogos envolvidos com a pesquisa genética não estão restritos apenas ao trabalho de laboratório, devendo os mesmos, dedicar grande parte do seu tempo à bioinformática.
As bases de dados em biologia molecular são importantes principalmente para proporcionar à comunidade científica (e a quem mais interessar) uma forma de tornar os dados produzidos em todo o mundo acessíveis de forma mais fácil, rápida e inteligente:  http://www.ncbi.nlm.nih.gov/About/primer/bioinformatics.html
A primeira base de dados de biologia molecular parece ter surgido por volta de 1960, quando Dayhoff e colaboradores construíram um catálogo contendo todas as seqüências de proteínas conhecidas até a data. Essas seqüências foram publicadas num livro chamado “Atlas of Protein Sequences and Structure”, de 1965. O conteúdo dessa base de dados não deveria conter mais de 1Mb de informação, se transferida para computadores modernos (Baxevanis e Ouellette, 2001).
Com o advento do sequenciamento do DNA e, principalmente, a partir da década de 1990, com o sequenciamento em larga escala, foi necessária a construção de bancos de dados mais robustos para abrigar a explosão no número de seqüências obtidas pelos pesquisadores. O NCBI, por exemplo, foi criado pelo NIH em 1988 para abrigar esse tipo de informação (Wheller et al., 2002).
Dessa forma, foi criada uma colaboração internacional para montar um banco de dados de seqüências de nucleotídeos, a INSDC (International Nucleotide Sequence Database Colaboration). Essa instituição contém o NCBI (National Center for Biotechnology Information), o EMBL (European Molecular Biology Laboratory) e o DDJB (DNA Data Bank of Japan) (Tateno et al., 2002). Cada um desses centros possibilita a submissão individual de seqüências de DNA e trocam informações entre si diariamente, sendo que todos os três possuem informações atualizadas de todas as seqüências disponíveis para os pesquisadores (Stoesser et al., 2002). Cada centro apresenta os dados de forma particular, apesar de bastante semelhante.
Existem basicamente dois tipos de bancos de dados disponíveis para utilização e pesquisa de genes e proteínas. Os bancos de dados primários apresentam resultados de dados experimentais que são publicados com alguma interpretação, onde não há uma análise cuidadosa desses dados com relação aos outros publicados anteriormente. Esse é o caso, por exemplo, do GenBank, EMBL (Stoesser et al., 2002) e PDB (Westbrook et al., 2002). Já os secundários são aqueles onde há uma compilação e interpretação dos dados de entrada de forma que podem ser obtidos dados mais representativos e interessantes. Esses são os bancos de dados curados, como o SWISS-PROT e o TrEMBL (Bairoch e Apweiler, 2002).

Por Prof. Francisco Prosdocimi, PhD. para o site "O DNA vai à escola" (http://www.odnavaiaescola.com/.)

Comentários

  1. Muito bom o texto Prof.
    Me ajudou um pouco mais a entender o que é a bioinformática.

    ResponderExcluir

Postar um comentário

Postagens mais visitadas deste blog

A Mariposa da Morte

Tecnologia Indígena

Sensibilidade e Especificidade