Passer au contenu principal

Votre navigateur n’est malheureusement pas entièrement pris en charge. Si vous avez la possibilité de le faire, veuillez passer à une version plus récente ou utiliser Mozilla Firefox, Microsoft Edge, Google Chrome, ou Safari 14 ou plus récent. Si vous n’y parvenez pas et que vous avez besoin d’aide, veuillez nous faire part de vos commentaires.

Nous vous serions reconnaissants de nous faire part de vos commentaires sur cette nouvelle expérience.Faites-nous part de votre opinion(S’ouvre dans une nouvelle fenêtre)

Elsevier
Publier avec nous

Extraction de textes et de données

Trouver un meilleur moyen de télécharger, chercher, filtrer et comprendre des millions d’articles et ouvrages publiés sur ScienceDirect. Toutes les revues et tous les livres Elsevier permettent l’extraction de textes et de données (TDM). En savoir plus aujourd’hui.

Bases des outils TDM

Pourquoi utiliser des articles scientifiques ?

Les articles et les livres publiés contiennent déjà les informations que vous pourriez chercher, et la fouille des textes est un moyen idéal de déverrouiller ces connaissances. Les articles et les chapitres de livres sont également organisés et constituent une source fiable d’informations. Plus important encore, un grand nombre d’entre eux dans toutes les disciplines remontent au premier article publié.

Pour commencer

La fouille de textes nécessite tout d’abord d’accéder au contenu que vous souhaitez extraire et de le télécharger, puis d’utiliser des outils spécifiques de fouille de textes sur ce contenu pour accéder à ce que vous recherchez. Notre interface de programmation d’applications (application programming interface, API) pour la recherche de données dans des articles complets est un moyen simple et facile pour vous de télécharger en bloc des contenus d’Elsevier pour des objectifs de fouille de textes de recherche non commerciaux. Vous pouvez accéder à notre API de recherche de données par l’intermédiaire de notre portail des développeurs. Notre API comprend un contenu en libre accès, mais vous pouvez également fouiller des contenus en libre accès en utilisant la fonction de récupération avec identificateur des objets numérique (DOI) : https://api.elsevier.com/content/article/doi/[DOI] sur laquelle votre script automatisé peut s’exécuter.

Pourquoi utiliser une interface de programme d’application (application program interface, API) ?

L’exploration d’un texte nécessite un certain nombre d’outils et de ressources différents pour le faire fonctionner, ainsi qu’un grand nombre de qualifications de la part des chercheurs. Pour vous aider à démarrer, nous avons créé des API afin de faciliter le téléchargement du volume de contenu que vous souhaitez généralement exploiter, et cela dans un langage de programmation. Utiliser une API vous apporte les avantages suivants :

  • Être plus efficace : la navigation sur Internet n’est pas une méthode efficace pour collecter de grandes quantités de contenu. En utilisant nos API, vous pouvez accéder rapidement et facilement aux données dont vous avez besoin et les télécharger.

  • Récupérer vos données dans un meilleur format : Elsevier convertit nos articles de revues et nos chapitres de livres en format XML, qui est le format préféré des « fouilleurs » de textes.

  • Assurer la cohérence : avec plus de deux millions d’articles et de chapitres de livres disponibles, il est important que les « fouilleurs » puissent identifier les éléments clés qu’ils souhaitent extraire. Notre API fournit un format cohérent pour toutes les données disponibles, ce qui vous permet d’exécuter et de tester plus facilement vos outils TDM

Want to mine across different publishers?

Vous souhaitez fouiller les textes de différents éditeurs ?

Lorsque vous commencerez à fouiller les textes, vous souhaiterez inévitablement le faire dans les multiples revues publiées par différents éditeurs. Cela pose un problème logistique. Pour rendre la fouille de textes plus facile, nous soutenons le service Crossref TDM. Ce service gratuit met à votre disposition l’API Crossref Metadata que vous pouvez utiliser pour accéder au texte intégral du contenu identifié par les DOI Crossref dans l’ensemble des sites des éditeurs.

logo Crossref

Testez vos outils TDM

La fouille de textes est fondée sur l’utilisation d’outils de traitement automatique du langage naturel (Natural Language Processing, NLP). Afin de développer et d’affiner les outils de NLP qui seront spécifiquement efficaces sur la littérature scientifique, nous avons créé un corpus d’articles en libre accès. Ceux-ci peuvent vous être utiles pour tester et affiner vos outils.

Capture d’écran du corpus STM en accès libre

Apprendre & accompagner

Découvrez comment vous pouvez accéder à la fouille de textes et l'utiliser pour favoriser votre prochain projet de recherche: