Minería de datos y textos

Encuentre una forma mejor de descargar, buscar, filtrar y comprender millones de artículos y libros publicados en ScienceDirect. Todas las revistas y libros de Elsevier permiten la minería de datos y textos (TDM).  Más información hoy.

Aspectos básicos de TDM (en inglés)

¿Por qué utilizar artículos académicos?

Los artículos y libros publicados ya contienen la información que puede estar buscando y la minería de textos es una forma ideal de desvelar ese conocimiento. También se seleccionan capítulos de libros y artículos, que son una fuente de información fiable, y lo que es más importante, ¡hay mucha en todas las disciplinas que se remonta hasta el primer artículo publicado!


Cómo empezar

La extracción de textos requiere que primero acceda y se descargue el contenido que desea encontrar. Más tarde, deberá indagar sobre ese material con las herramientas especiales diseñadas para este propósito a fin de localizar lo que está buscando. Puede acceder y descargarse contenido suscrito que ve en formato HTML o PDF en ScienceDirect utilizando nuestra interfaz de programación de artículos de texto completo (API). Es una forma fácil y sencilla de realizar una descarga masiva de contenido de Elsevier para fines no comerciales de minería de textos de investigación. Puede obtener acceso a la API de texto completa a través de nuestro portal de desarrolladores. Nuestra API incluye contenido de acceso abierto, pero también puede minar contenido de acceso abierto usando la función de recuperación de DOI http://api.elsevier.com/content/article/doi/[DOI] sobre el que su script automático puede ejecutarse.

Obtener acceso ahora

¿Por qué usar una API?

La minería de textos requiere muchos recursos y herramientas diferentes para poder funcionar y mucha contribución experta de investigadores. Para ayudarle a empezar, hemos creado APIs para hacer que sea mucho sencillo descargar el volumen de contenido que generalmente querrá extraer y en un lenguaje de programación.  El uso de una API le permite:

  • Ser más eficiente: el rastreo de webs es un método ineficiente de recoger grandes cantidades de contenido y, con el uso de nuestras API, puede acceder de manera fácil y rápida y descargar los datos que necesita.
  • Recuperar sus datos en un formato mejor: Elsevier convierte nuestros artículos de revistas y capítulos de libros en XML, que es un formato preferido por los mineros de textos.
  • Garantizar la coherencia: con más de dos millones de artículos y capítulos de libros disponibles, es importante que los mineros puedan identificar partes clave que desean extraer. Nuestra API ofrece un formato uniforme para todos los datos disponibles haciendo que le resulte más fácil ejecutar y poner a prueba sus herramientas TDM

Logotipo de CrossRef

¿Desea extraer información de diferentes editoriales?

Cuando empiece a practicar minería de textos, inevitablemente deseará hacerlo en múltiples revistas publicadas por distintas editoriales. Esto presenta un problema logístico. Para facilitar la minería de textos apoyamos  el servicio Crossref TDM. Este servicio gratuito le ofrece la API de metadatos de Crossref que puede utilizarse para acceder al contenido de texto completo identificado por los DOI de Crossreff en varios sitios de editoriales.

Leer más

OA STM Corpus

Ponga a prueba sus herramientas TDM

La minería de datos depende del uso de herramientas de Procesamiento de lenguajes naturales (PLN). Para desarrollar y perfeccionar las herramientas PLN que funcionarán específicamente en la bibliografía académica, hemos creado un corpus de artículos de acceso abierto. Estos artículos pueden servirle para poner a prueba y perfeccionar sus herramientas.

Leer más


Formación y apoyo

Descubra cómo puede acceder y usar la minería de textos para apoyar su siguiente proyecto de investigación: