Mineração de textos e dados (TDM - text and data mining)

Encontre uma melhor forma de baixar, pesquisar, filtrar e entender milhões de artigos e livros publicados em ScienceDirect. Todos os livros e revistas científicas da Elsevier permitem a mineração de texto e dados.  Descubra mais hoje.

O básico sobre mineração de textos e dados (em inglês)

Por que usar artigos acadêmicos?

Os artigos e livros publicados já contêm as informações que você pode estar procurando e a mineração de texto é a maneira ideal de liberar esse conhecimento. Os artigos e capítulos de livros também são organizados e constituem uma fonte confiável de informações, e o mais importante de tudo é que existem muitos disponíveis em todas as disciplinas desde o primeiro artigo publicado!


Preparação

Para a mineração de texto, é necessário que você primeiro acesse e baixe o conteúdo desejado e, em seguida, execute as ferramentas especiais de mineração de texto no conteúdo correspondente para encontrar aquilo que procura. Você poderá acessar e baixar o conteúdo disponibilizado por assinatura que visualizar no formato HTML ou PDF na Science Direct usando a interface de programação (API) de textos completos de artigos. Esta é uma maneira fácil e simples de baixar um grande volume de conteúdo da Elsevier para fins não comerciais de mineração de textos de pesquisa. Você pode acessar o texto completo da API por meio de nosso portal de desenvolvedores. Nossa API inclui conteúdo com acesso aberto, mas você também pode minerar o conteúdo de acesso aberto usando a função de recuperação do DOI http://api.elsevier.com/content/article/doi/[DOI] que o seu script automatizado pode executar.

Obtenha o acesso agora

Por que usar uma API?

A mineração de texto requer o uso de várias ferramentas e recursos diferentes para funcionar, além da inserção de informações de nossos pesquisadores. Para ajudar você a começar, desenvolvemos APIs para facilitar o download do conteúdo que geralmente é necessário para a mineração em uma linguagem programática.  Usar uma API permite que você:

  • Seja mais eficiente: O uso de web crawler é um método ineficiente de obter grandes quantidades de conteúdo e com o uso de nossas APIs, você poderá acessar e baixar com rapidez e facilidade os dados que necessitar.
  • Recupere os seus dados em um formato melhor: a Elsevier converte os artigos de nossas revistas e nossos livros em XML, que é o formato preferido pelos mineradores de texto.
  • Garanta consistência: Com mais de 2 milhões de artigos e capítulos de livros disponíveis, é importante que os mineradores possam identificar as partes específicas que desejam extrair. Nossa API oferece um formato consistente para todos os dados disponíveis, o que facilita a execução e o teste das ferramentas de mineração de texto e dados

Logo da CrossRef

Quer fazer a mineração entre diferentes editoras?

Quando começar a fazer a mineração de texto, você inevitavelmente desejará fazer isso em várias revistas publicadas de diferentes editoras. Isso representa um problema de logística. Para facilitar a mineração de textos, apoiamos o serviço de mineração de textos e dados  Crossref. Este serviço gratuito oferece a API de metadados do Crossref que pode ser usada para acessar textos completos identificados pelos DOIs da Crossref de vários sites de editoras.

Saiba mais

Conjuntos de artigos com acesso aberto

Teste suas ferramentas de mineração de textos e dados

A mineração de textos depende do uso de ferramentas de Processamento de Linguagem Natural (PLN). Para desenvolver e refinar as ferramentas de PLN que funcionem especificamente na literatura acadêmica, criamos conjuntos de artigos com acesso aberto. Esses conjuntos podem ser úteis para testar e refinar as suas ferramentas.

Saiba mais


Aprendizado e suporte

Saiba como você pode acessar e usar a mineração de texto para usar em seu próximo projeto de pesquisa: