Text- und Data-Mining

Finden Sie einen besseren Weg, wie Sie Millionen von Artikeln und Büchern, die auf ScienceDirect veröffentlicht wurden, herunterladen, suchen, filtern und verstehen können. Alle Elsevier-Zeitschriften und -Bücher ermöglichen Text- und Data-Mining (TDM).  Erhalten Sie noch heute weitere Informationen.

TDM Basics (auf Englisch)

Warum sollten Sie wissenschaftliche Artikel nutzen?

Veröffentlichte Artikel und Bücher enthalten bereits die Informationen, nach denen Sie vielleicht suchen; das Text-Mining stellt eine optimale Möglichkeit dar, wie dieses Wissen freigesetzt werden kann. Artikel und Buchkapitel sind ebenfalls kuratiert und sie sind eine vertrauenswürdige Informationsquelle - und was noch viel wichtiger ist: es gibt eine Menge davon über alle Disziplinen hinweg und sie führen bis zum ersten Publikation zurück!


Erste Schritte

Beim Text-Mining müssen Sie zuerst auf die Inhalte zugreifen, die Sie filtern möchten, und diese herunterladen. Dann sollten Sie spezielle Text-Mining-Tools über diese Inhalte laufen lassen, um zu finden, wonach Sie suchen. Sie können abonnierte Inhalte, die Sie im HTML- oder PDF-Format auf ScienceDirect sehen, über unsere Volltext-Programmierschnittstelle (API) aufrufen und herunterladen. Dies bietet Ihnen eine unkomplizierte und einfache Möglichkeit, Elsevier-Inhalte für nicht kommerzielle Recherche-Text-Mining-Zwecke in großen Mengen herunterzuladen. Sie können über unser Entwickler-Portal auf die Volltext-API zugreifen. Unsere API enthält Open-Access-Inhalte, aber Sie können auch OA-Inhalte mithilfe der DOI-Abruffunktion http://api.elsevier.com/content/article/doi/[DOI] filtern, auf der Ihr automatisiertes Skript ausgeführt werden kann.

Jetzt Zugang erhalten

Warum sollte man eine API verwenden?

Text-Mining erfordert eine Menge verschiedener Tools und Ressourcen und viel Fachwissen-Input der Wissenschaftler, damit es funktioniert. Um Ihnen den Einstieg zu erleichtern, haben wir APIs erstellt, mit denen Sie das Volumen der Inhalte, die Sie normalerweise benötigen, in einer programmatischen Sprache wesentlich einfacher herunterladen können.  Die Verwendung einer API ermöglicht Ihnen Folgendes:

  • Effizienz: Webcrawling ist eine ineffiziente Methode, um große Mengen an Inhalten zu sammeln. Mit unseren APIs können Sie schnell und einfach auf die benötigten Daten zugreifen und diese herunterladen.
  • Ihre Daten in einem besseren Format abrufen: Elsevier konvertiert unsere Zeitschriftenartikel und Buchkapitel in XML, ein von Text-Minern bevorzugtes Format.
  • Einheitlichkeit: Mit über zwei Millionen zur Verfügung stehenden Artikeln und Buchkapiteln ist es wichtig, dass Miner in der Lage sind, die wichtigen Stellen, die sie extrahieren möchten, zu identifizieren. Unsere API bietet ein einheitliches Format für alle verfügbaren Daten, sodass Sie Ihre TDM-Tools einfacher ausführen und testen können.

CrossRef-Logo

Möchten Sie mit verschiedenen Herausgebern arbeiten?

Wenn Sie mit dem Text-Mining beginnen, werden Sie dies zwangsläufig in mehreren Zeitschriften, die von verschiedenen Herausgebern veröffentlicht werden, tun. Dies stellt ein logistisches Problem dar. Um das Text-Mining einfacher zu machen, unterstützen wir den Crossref TDM Service. Dieser kostenlose Service bietet Ihnen die Crossref-Metadaten-API, mit der Sie auf den Websites der Herausgeber auf den vollständigen Text von Inhalten zugreifen können, die von Crossref-DOIs identifiziert werden.

Weitere Informationen

OA STM Corpus

Ihre TDM-Tools testen

Text-Mining basiert auf der Verwendung von Natural-Language-Processing-Tools (NLP). Zur Entwicklung und Verfeinerung von NLP-Tools, die speziell für die wissenschaftliche Literatur geeignet sind, haben wir einen Open-Access-Korpus mit Artikeln geschaffen. Dies kann für Sie nützlich sein, wenn Sie Ihre Tools testen und verfeinern möchten.

Weitere Informationen


Informationen und Unterstützung

Erfahren Sie, wie Sie Zugang erhalten und das Text-Mining zur Unterstützung Ihres nächsten wissenschaftlichen Projekts verwenden: