Computadores Que Podem Ler Registros Fósseis

Cientistas da computação estão apostando na criação de um programa de computador que seja capaz de extrair informações sobre registros fósseis diretamente dos artigos científicos. Os paleontólogos esperam que o software possa construir bancos de dados sobre fósseis automaticamente a partir dos trabalhos de pesquisa.


Para um campo de estudo cuja a razão de ser é o relato de um passado remoto, a paleontologia está extremamente voltada paro o futuro, quando se trata de organizar seus dados. Ao longo dos últimos 
15 anos, os paleontólogos reuniram coletivamente registros de mais de um milhão de fósseis em um banco de dados on-line, permitindo-lhes rastrear tendências gerais na história da vida. Agora, eles estão buscando meios de usar programas de computador para extrair dados sobre fósseis de seus trabalhos de pesquisas automaticamente. 
Segundo o paleontólogo Shanan Peters, da Universidade de Wisconsin-Madison (UW Madison), que está co-liderando um trabalho que visa usar um software para extrair informações de dezenas de milhares de artigos de paleontologia, "a construção de um banco de dados, por si só, será uma coisa do passado. Esses bancos de dados serão gerados dinamicamente com base nas perguntas que você está interessado, e a máquina irá fazer o trabalho pesado. "
Peters é o principal pesquisador do Banco de Dados de Paleobiologia (PBDB;paleobiodb.org ), que detalha a idade, a localização e a identidade de cerca de 1,2 milhões de fósseis. Desde que foi iniciado em 1998, os pesquisadores passaram cerca de 80.000 horas - o equivalente a nove anos contínuos - reunindo e opinando sobre os dados provenientes de pesquisas de campo e cerca de 40.000 artigos científicos. O PBDB produziu centenas de artigos e permitiu aos paleontólogos tratar de questões sobre temas que vão desde as taxas de extinção em todas as épocas ao desaparecimento de certos dinossauros.
O PBDB é um banco de dados criado por especialistas: cerca de 380 cientistas carregaram dados de algumas das 560.000 opiniões publicadas sobre as classificações de 320.000 nomes taxonômicos. Mas Peters estava curioso para saber se esse banco de dados podiam ser compilados automaticamente pelo computador. Então, em 2013 iniciou uma parceria com dois outros cientistas da computação, Miron Livny e Chris Ré. Este último havia desenvolvido um software chamado DeepDive, que utiliza uma técnica conhecida como text-mining (mineração de texto - ou mineração de conteúdo - em tradução livre), uma ferramenta muito comum em ciência da computação, a qual está lentamente começando a ser utilizada em campos de pesquisa de genômica para a descoberta de medicamentos. 
A nível experimental, Peters e Ré usaram um software personalizado que eles chamaram de PaleoDeepDive para criar um texto extraído de uma versão em escala reduzida do PBDB, incorporando cerca de 12.000 documentos. Em alguns aspectos, o banco de dados gerado por computador superou o PBDB, disse Peters, porque todas as informações vinha com uma probabilidade atribuída a ele e remetia ao texto original. "A máquina é realmente clara sobre a incerteza, quando não ambiguidade, ou diferenças entre documentos e autores", diz Peters. O PaleoDeepDive também conseguiu extrair 192.000 opiniões sobre a classificação dos nomes taxonômicos dos periódicos, enquanto os curadores humanos do PBDB encontraram apenas 80.000.
Fonte: Nature

Comentários

Postagens mais visitadas deste blog

A Mariposa da Morte

Tecnologia Indígena

Sensibilidade e Especificidade