テキスト・データマイニング

ScienceDirectで出版されている多くの論文や書籍を検索、ダウンロード、理解するためのより良い方法を見つけてみませんか。すべてのエルゼビアのジャーナルと書籍はテキストデータマイニング (TDM)をすることができます。以下の詳細情報をご覧ください。

TDM Basics(英語)

学術文献をTDMに利用する理由

欲しい情報が出版されている論文や書籍に含まれているかを調べ、そこから知識を解き放つには、テキストマイニングは理想的な方法です。
論文や書籍は厳選された信頼できる情報源であり、さらに重要なのは、広範な学問分野にわたって最初に出版された学術情報にまで遡ることができることです。


利用方法

テキストマイニングを行うには、まず対象コンテンツにアクセス・ダウンロードができること。そして専用のテキストマイニングツールを対象コンテンツに対して使用できることが必要です。
ScienceDirectでは、エルゼビアが提供する専用のアプリケーションプログラミングインタフェース(API)を利用することで、購読コンテンツの情報にアクセス、ダウンロードできます。これは、非商業的な研究テキストマイニングの目的でコンテンツを大量にダウンロードするための簡単で平易な方法です。このフルテキストAPIは、エルゼビアのディベロッパーポータルから取得可能です。
オープンアクセスのコンテンツにも利用できますが、DOI検索機能(http://api.elsevier.com/content/article/doi/[DOI])を使用してこれらのコンテンツをマイニングすることもできます。

アクセスはこちら

APIを使用する理由

テキストマイニングには、動作させるための多くのツールとリソース、および熟練した研究者からのインプットが必須です。テキストマイニングを簡単に始められるよう、マイニングしたいと思うコンテンツをプログラム言語で簡単にダウンロードできるAPIを作成しました。 APIを使用すると:

  • 効率的: ウェブクローリングは大量のコンテンツを処理するには非効率です。APIであれば必要なデータに素早く簡単にアクセスすることができます。
  • より望ましいデータ形式で取得: エルゼビアのAPIでは、ジャーナルや書籍の情報をテキストマイニングに適切なXML形式に変換します。
  • 一貫性: 膨大な論文や書籍の情報から欲しい部分を特定できることはマイニングをする上で非常に重要です。エルゼビアのAPIは利用可能なすべてのデータに対して一貫したフォーマットを提供し、TDMツールの実行とテストを容易にします。

CrossRefロゴ

異なる出版間を横断するデータマイニングを行う場合

テキストマイニングを利用すると、必然的に異なる出版社間の複数ジャーナルに対してマイニングを実施したくなりますが、これにはロジスティクスに関する問題が存在します。テキストマイニングをより容易にするために、エルゼビアではCrossref TDMサービスに対応しています。これは、Crossref Metadata APIを利用することでCrossref DOIによる各出版社のサイトをまたいだフルテキストコンテンツへのアクセスを可能とする無料のサービスです。

詳細はこちら

OA STM Corpus

TDMツールのテスト

テキストマイニングには、自然言語処理(NLP)ツールの使用が不可欠です。目的にそったNLPツールを開発するために、エルゼビアは文献情報のオープンアクセスコーパスを作成しました。これらはツールのテストや改良に有用です。

詳細はこちら


詳細情報&サポート

テキストマイニングへのアクセス方法、使用方法: