メインのコンテンツにスキップする

申し訳ございませんが、お客様のブラウザには完全に対応しておりませんオプションがありましたら、新しいバージョンにアップグレードするか、 Mozilla Firefox、 Microsoft Edge、Google Chrome、またはSafari 14以降をお使いください。これらが利用できない場合、またサポートが必要な場合は、フィードバックをお送りください。

この新ホームページへのフィードバックを歓迎します。ご意見をお寄せください(新しいタブ/ウィンドウで開く)

Elsevier
論文を投稿する

テキストとデータマイニング

ScienceDirect に公開されている何百万もの論文や書籍をダウンロード、検索、フィルタリング、理解するためのより良い方法を見つけます。Elsevier のすべてのジャーナルで、テキストとデータマイニング(TDM)が可能です。 今すぐ詳細をご確認ください。

TDM の基礎知識

学術論文を使う理由

出版された論文および書籍には、ユーザーが求めているであろう情報がすでに含まれており、テキストマイニングはその知識を掘り起こす理想的な方法です。論文と書籍の章もキュレーションされており、信頼できる情報源となっています。さらに重要なのは、最初に発表された論文までさかのぼると、あらゆる分野にまたがる多くの情報があるということです。

Getting started

テキストマイニングでは、まずマイニングしたいコンテンツにアクセスしてダウンロードし、そのコンテンツに対して専用のテキストマイニングツールを実行して、探しているものを見つける必要があります。フルテキストarticle programming interface(API)は、非商用の研究用テキストマイニングを目的として、Elsevier のコンテンツを一括ダウンロードするための簡単かつシンプルな方法です。開発者ポータルからフルテキスト API にアクセスすることができます。API にはオープンアクセスコンテンツが含まれていますが、自動化スクリプトが実行できる DOI 検索機能 https://api.elsevier.com/content/article/doi/[DOI] を使用して OA コンテンツをマイニングすることもできます。

API を使用する理由

テキストマイニングを行うには、さまざまなツールやリソース、そして研究者の高度なインプットが必要です。これを始める手助けとして、私たちは API を構築し、ユーザーが通常必要とする量のコンテンツを、プログラム言語でより簡単にダウンロードできるようにしました。 API を使うことで、以下が可能になります。

  • より効率的: ウェブクローリングは、大量のコンテンツを収集する非効率的な方法です。弊社の API を使用することで、必要なデータに素早く簡単にアクセスし、ダウンロードすることができます。

  • より良い形式でのデータ取得: Elsevierは、ジャーナルの論文や書籍の章を、テキストユーザーに好まれるXML形式に変換します。

  • 一貫性の確保: 200万を超える論文と書籍の章が利用可能であるため、ユーザーが抽出したい重要な部分を特定できるようにすることが重要です。弊社のAPIは、利用可能なすべてのデータに対して一貫した形式を提供し、TDM ツールの実行とテストをより簡単にします。

Want to mine across different publishers?

いろいろな出版社のマイニングを行いたいと考えていますか?

テキストマイニングを始めるとどうしても、異なる出版社が発行する複数のジャーナルにわたって行いたいと思うようになります。これはロジスティクス上の問題につながります。テキストマイニングを容易にするために、弊社は Crossref TDM サービスを サポートしています。この無料サービスは出版社サイト全体の Crossref DOI で特定されるコンテンツの全文にアクセスするために使用できる Crossref Metadata API を提供します。

Crossref のロゴ

TDM ツールのテスト

テキストマイニングは、Natural Language Processing(NLP)ツールの使用に依存しています。学術文献に特化した NLP ツールを開発し、改良するために、弊社はオープンアクセスの論文コーパスを作成しました。これらはツールをテストし、改良する上で役立ちます。

Screenshot of the open access STM corpus

Learn & support

次回の研究プロジェクトをサポートするために、テキストマイニングにアクセスして使用する方法をご紹介します。