주요 콘텐츠로 건너뛰기

귀하의 브라우저가 완벽하게 지원되지 않습니다. 옵션이 있는 경우 최신 버전으로 업그레이드하거나 Mozilla Firefox, Microsoft Edge, Google Chrome 또는 Safari 14 이상을 사용하세요. 가능하지 않거나 지원이 필요한 경우 피드백을 보내주세요.

이 새로운 경험에 대한 귀하의 의견에 감사드립니다.의견을 말씀해 주세요(새 탭/창에서 열기)

Elsevier
엘스비어와 함께 출판

텍스트 및 데이터 마이닝

ScienceDirect에 게시된 수백만 편의 논문과 책을 다운로드, 검색, 필터링 및 이해할 수 있는 더 나은 방법을 확인하십시오. 모든 엘스비어 저널 및 서적은 텍스트 및 데이터 마이닝(TDM)이 가능합니다. 지금 자세히 알아보십시오.

TDM 기본 사항

학술 논문을 사용하는 이유는 무엇입니까?

출판된 논문과 책에는 이미 찾고 있는 정보가 포함되어 있으며 텍스트 마이닝은 이러한 지식을 활용하는 이상적인 방법입니다. 기사와 책의 챕터도 큐레이션된 신뢰할 수 있는 정보 소스이며, 더 중요한 것은 최초 출판된 논문까지 거슬러 올라가는 모든 분야에 걸쳐 많은 정보가 있다는 사실입니다.

시작하기

텍스트 마이닝은 먼저 마이닝하려는 콘텐츠에 액세스하고 다운로드한 다음 해당 콘텐츠에 대한 특수 텍스트 마이닝 도구를 실행하여 원하는 것을 찾아야 합니다. 엘스비어의 전체 텍스트 논문 프로그래밍 인터페이스(API)는 비상업적 연구 텍스트 마이닝 목적으로 엘스비어 콘텐츠를 대량으로 다운로드할 수 있는 쉽고 간단한 방법입니다. 개발자 포털을 통해 전체 텍스트 API에 액세스할 수 있습니다. 엘스비어의 API에는 오픈 액세스 콘텐츠가 포함되어 있지만 자동화된 스크립트를 실행할 수 있는 DOI 검색 기능 https://api.elsevier.com/content/article/doi/[DOI]을 사용하여 OA 콘텐츠를 마이닝할 수도 있습니다.

API를 사용하는 이유는 무엇입니까?

텍스트 마이닝을 위해서는 다양한 도구와 리소스, 많은 연구자들의 숙련된 입력이 필요합니다. 시작에 도움을 드리기 위해, 일반적으로 마이닝하려는 콘텐츠의 양을 프로그램 언어로 훨씬 쉽게 다운로드할 수 있도록 API를 구축했습니다. API 사용을 통해 누릴 수 있는 혜택은 다음과 같습니다.

  • 효율성 향상: 웹 크롤링은 대량의 콘텐츠를 수집하는 비효율적인 방법이며 API를 사용하면 필요한 데이터에 빠르고 쉽게 액세스하고 다운로드할 수 있습니다.

  • 더 나은 형식으로 데이터 검색: 엘스비어는 저널 논문과 책의 챕터를 텍스트 마이너가 선호하는 형식인 XML로 변환합니다.

  • 일관성 보장: 200만 개 이상의 논문과 책의 챕터를 사용할 수 있으므로 마이너가 추출하려는 핵심 부분을 식별할 수 있는 것이 중요합니다. 엘스비어의 API는 사용 가능한 모든 데이터에 대해 일관된 형식을 제공하므로 TDM 도구를 더 쉽게 실행하고 테스트할 수 있습니다

Want to mine across different publishers?

다른 출판사에서 마이닝을 하고 싶은가요?

텍스트 마이닝을 시작할 때 필연적으로 서로 다른 출판사에서 발행한 여러 저널에 걸쳐 마이닝을 하고 싶어질 것입니다. 이때 물류 문제가 나타납니다. 보다 쉬운 텍스트 마이닝을 위해 엘스비어는 Crossref TDM 서비스를 지원합니다. 이 무료 서비스는 여러 출판사 사이트 걸쳐 Crossref DOI로 식별된 콘텐츠의 전체 텍스트에 액세스하는 데 사용할 수 있는 Crossref 메타데이터 API를 제공합니다.

Crossref 로고

TDM 도구 테스트하기

텍스트 마이닝은 자연어 처리(NLP) 도구를 사용합니다. 특히 학술 문헌에서 작동할 NLP 도구를 개발하고 개선하기 위해 엘스비어는 공개 액세스 논문 코퍼스를 구축했습니다. 이 서비스는 도구를 테스트하고 개선하는 데 유용할 수 있습니다.

오픈 액세스 STM 코퍼스의 스크린샷

교육 및 지원

다음 연구 프로젝트 지원을 위해 텍스트 마이닝에 액세스하고 사용하는 방법을 알아보십시오.