Extraction de textes et de données

Trouver un meilleur moyen de télécharger, chercher, filtrer et comprendre des millions d’articles et ouvrages publiés sur ScienceDirect. Toutes les revues et tous les livres Elsevier permettent l’extraction de textes et de données (TDM). En savoir plus aujourd’hui.

Bases des outils TDM

Pourquoi utiliser des articles scientifiques ?

Les articles et les livres publiés contiennent déjà les informations que vous pourriez chercher, et la fouille des textes est un moyen idéal de déverrouiller ces connaissances. Les articles et les chapitres de livres sont également organisés et constituent une source fiable d’informations. Plus important encore, un grand nombre d’entre eux dans toutes les disciplines remontent au premier article publié.

Pour commencer

La fouille de textes nécessite tout d’abord d’accéder au contenu que vous souhaitez extraire et de le télécharger, puis d’utiliser des outils spécifiques de fouille de textes sur ce contenu pour accéder à ce que vous recherchez. Notre interface de programmation d’applications (application programming interface, API) pour la recherche de données dans des articles complets est un moyen simple et facile pour vous de télécharger en bloc des contenus d’Elsevier pour des objectifs de fouille de textes de recherche non commerciaux. Vous pouvez accéder à notre API de recherche de données par l’intermédiaire de notre portail des développeurs.

Obtenir l’accès(S’ouvre dans une nouvelle fenêtre)

Pourquoi utiliser une interface de programme d’application (application program interface, API) ?

L’exploration d’un texte nécessite un certain nombre d’outils et de ressources différents pour le faire fonctionner, ainsi qu’un grand nombre de qualifications de la part des chercheurs. Pour vous aider à démarrer, nous avons créé des API afin de faciliter le téléchargement du volume de contenu que vous souhaitez généralement exploiter, et cela dans un langage de programmation. Utiliser une API vous apporte les avantages suivants :

Être plus efficace : la navigation sur Internet n’est pas une méthode efficace pour collecter de grandes quantités de contenu. En utilisant nos API, vous pouvez accéder rapidement et facilement aux données dont vous avez besoin et les télécharger.
Récupérer vos données dans un meilleur format : Elsevier convertit nos articles de revues et nos chapitres de livres en format XML, qui est le format préféré des « fouilleurs » de textes.
Assurer la cohérence : avec plus de deux millions d’articles et de chapitres de livres disponibles, il est important que les « fouilleurs » puissent identifier les éléments clés qu’ils souhaitent extraire. Notre API fournit un format cohérent pour toutes les données disponibles, ce qui vous permet d’exécuter et de tester plus facilement vos outils TDM

Regarder la vidéo montrant comment obtenir une clé API(S’ouvre dans une nouvelle fenêtre)

Want to mine across different publishers?

Vous souhaitez fouiller les textes de différents éditeurs ?

Lorsque vous commencerez à fouiller les textes, vous souhaiterez inévitablement le faire dans les multiples revues publiées par différents éditeurs. Cela pose un problème logistique. Pour rendre la fouille de textes plus facile, nous soutenons le service Crossref TDM. Ce service gratuit met à votre disposition l’API Crossref Metadata que vous pouvez utiliser pour accéder au texte intégral du contenu identifié par les DOI Crossref dans l’ensemble des sites des éditeurs.

En savoir plus(S’ouvre dans une nouvelle fenêtre)

Testez vos outils TDM

La fouille de textes est fondée sur l’utilisation d’outils de traitement automatique du langage naturel (Natural Language Processing, NLP). Afin de développer et d’affiner les outils de NLP qui seront spécifiquement efficaces sur la littérature scientifique, nous avons créé un corpus d’articles en libre accès. Ceux-ci peuvent vous être utiles pour tester et affiner vos outils.

Capture d’écran du corpus STM en accès libre

Apprendre & accompagner

Découvrez comment vous pouvez accéder à la fouille de textes et l'utiliser pour favoriser votre prochain projet de recherche:

To get started go to our developers portalopens in new tab/window
Learn more about how to text mine using our full text APIopens in new tab/window
For further details about accessing Elsevier content see our text and data mining policy
Download our text and data mining glossaryopens in new tab/window
See our FAQs for details about how to register for the API and share and/or use your TDM corpus
To access and mine content from other publishers please see CrossRef Text and Data mining servicesopens in new tab/window
For commercial text mining of Elsevier content see our professional R&D services text mining solutions