跳到主要內容

很遺憾,我們無法支援你的瀏覽器。如果可以,請升級到新版本,或使用 Mozilla Firefox、Microsoft Edge、Google Chrome 或 Safari 14 或更新版本。如果無法升級,而且需要支援,請將你的回饋寄給我們。

我們衷心感謝你對這個新體驗的回饋。告訴我們你的想法(打開新的分頁/視窗)

Elsevier
與我們共同出版

文字和資料探勘

找到更好的方式下載、搜尋、篩選和理解在 ScienceDirect 出版的數百萬論文和書籍。 所有 Elsevier 期刊和書籍都支援文字和資料探勘(TDM)。 即刻瞭解更多資訊。

TDM 基礎

為什麼使用學術論文?

已出版的論文和書籍內有你可能在尋找的資訊,而文字探勘是解鎖這些知識的理想方法。這些論文和書籍章節都經過精心選編,是值得信賴的資訊來源,而且更重要的是,裡面涵蓋了各個學科領域的大量資料,甚至追溯至最早的出版論文。

開始

文字探勘過程中,首先需要找到和下載你希望挖掘的內容,然後對這些內容運用特殊文字探勘工具,找到所需的資料。我們的全文論文程式設計介面(article programming interface,API)旨在進行非商業性研究文字探勘,讓你以輕鬆簡單的方式大量下載 Elsevier 的內容。你可從我們的開發者入口網站取用全文 API。我們的 API 不僅涵蓋公開取用內容,還可以使用數位物件識別碼檢索功能 https://api.elsevier.com/content/article/doi/[DOI] 來探勘公開取用(OA)內容,同時你的自動腳本可在其上執行。

為何使用 API?

文字探勘需要眾多的不同工具和資源來發揮作用,也需要研究員大量技能的投入為了助你輕鬆入門,我們建立了 API,讓你輕鬆下載大量欲探勘的內容,並以程式語言處理。 API 可使你:

  • 更有效率:網路資料爬梳是一種取得大量內容的低效方法,但是透過我們的 API,你可以快速輕鬆地取用和下載所需的資料。

  • 獲得最佳的資料格式:Elsevier 將期刊論文和書籍章節轉換為 XML,這是文字探勘者偏愛的格式。

  • 確保一致性:共有超過 200 萬篇的論文和書籍章節供你取用,讓探勘者準確辨識並提取所需的關鍵部分。我們的 API 為所有可用資料提供統一格式,使你更輕鬆啟動和測試 TDM 工具

Want to mine across different publishers?

希望在不同出版人之間進行探勘嗎?

開始文字探勘時,您可能希望挖掘不同出版商、多種期刊的資料。 這會引發後勤問題。 為了讓文字探勘更輕鬆,我們支援 Crossref TDM 服務。 這項免費服務為你提供 Crossref Metadata API,可以用來取用 Crossref DOI 在各出版人網站上標識的內容全文。

Crossref 標誌

測試你的 TDM 工具

文字探勘依賴自然語言處理(Natural Language Processing,NLP)工具的使用。 為了開發和完善學術文獻專用的 NLP 工具,我們建立了一個公開取用的論文語料庫。 這些對你測試和完善自己的工具非常有用。

公開取用《科技、醫療與社會》期刊的語料庫截圖

學習與支援

了解如何取用和利用文字探勘來支援你的下一個研究專案: