文本和数据挖掘

寻求更好的方式下载、搜索、筛选和了解ScienceDirect上发表的数百万文章和图书。所有爱思唯尔期刊和图书均支持文本和数据挖掘(TDM)。立刻了解更多。

TDM基础(英文)

为什么要使用学术文献?

您苦苦寻找的信息都已经出版在文章或图书中,而文本挖掘则是为您解锁知识的一种理想途径。经过组织构思的文章和图书章节,是可靠的信息来源。更重要的是,几乎所有学科都可追溯回其领域内发表的第一篇文章!


开始

文本挖掘需要首先访问和下载想要挖掘的内容然后运行特殊的文本挖掘工具来查找所需信息。您可以使用我们的全文文章编程接口(API),在Science Direct上以HTML或PDF格式访问和下载您所查看的订阅内容。这是以非商业研究文本挖掘目的批量下载爱思唯尔出版内容的简单方法。您可以通过我们的开发人员门户网站访问全文API。我们的API包括开放获取内容,但您也可以使用可在其上运行您自动化脚本的DOI检索功能http://api.elsevier.com/content/article/doi/[DOI]来挖掘OA内容。

立即访问

为什么要使用API?

文本挖掘需要许多工具和资源才能奏效,也需要研究人员的大量技能投入。为了助您入门,我们构建了API。这样以编程语言下载您想要挖掘的大量内容就会容易得多。使用API让您能够:

  • 更高效: 对采集大量内容而言,网络爬取效率低下,而使用API,您就可以快速、轻松地访问和下载您需要的数据。
  • 以更好的格式检索您的数据:爱思唯尔将我们的期刊文章和图书章节转为XML,这是文本挖掘者的首选格式。
  • 确保一致性:鉴于有超过200万篇文章和图书章节可用,挖掘者能够识别其想提取的关键部分变得十分重要。我们的API为所有可用数据提供一致的格式,让您更容易运行和测试您的TDM工具

CrossRef标识

想要跨出版商进行挖掘吗?

在开始文本挖掘时,您一定会希望能在不同出版商出版的多份期刊中进行挖掘。这就出现了逻辑问题。为了让文本挖掘变得更容易,我们支持Crossref TDM服务。这项免费服务为您提供Crossref Metadata API,可用以访问Crossref DOI在不同出版商网站所识别内容的全文。

了解更多

OA STM语料库

测试您的TDM工具

文本挖掘依赖于自然语言处理(NLP)工具的使用。为了开发和改善将专门处理学术文献的NLP工具,我们创建了一个开放获取的文章语料库。您可以利用这些来测试和改善您的工具。

了解更多


了解与支持

了解您可以如何访问和使用文本挖掘以支持您的下一个研究项目: