Metin ve veri madenciliği

ScienceDirect'te yayınlanan milyonlarca makale ve kitabı indirmek, aramak, filtrelemek ve anlamanın daha iyi bir yolunu öğrenin. Tüm Elsevier dergileri ve kitapları metin ve veri madenciliğine (TDM) imkan vermektedir.  Hemen daha fazla bilgi alın.

TDM Basics (İngilizce)

Akademik makaleleri neden kullanılırsınız?

Yayınlanmış olan makaleler ve kitaplar aradığınız bilgileri içeriyor olabilir ve veri madenciliği bu bilgiyi açığa çıkarmak için ideal bir yoldur. Makaleler ve kitap bölümleri de derlenmiştir ve güvenilir bir bilgi kaynağıdır; daha da önemlisi, her disiplinde ilk yayınlanmış makaleden başlayarak günümüze kadar uzanan pek çoğu mevcuttur!


Başlangıç

Metin madenciliği ilk olarak madenciliğini yapmak istediğiniz içeriğe erişip indirmenizi, ardından da aradığınız şeyi bulmak için o içerikler üzerinde özel veri madenciliği araçlarını çalıştırmanızı gerektirir. Tam metinli makale programlama arayüzümüzü (API) kullanarak ScienceDirect'te HTML veya PDF formatında gördüğünüz abone olduğunuz içeriklere erişebilir ve bunları indirebilirsiniz. Bu, ticari olmayan araştırma veri madenciliği amacıyla Elsevier içeriklerini toplu olarak indirmenizin kolay bir yöntemidir. Geliştirici portalımızdan tam metin API'mize erişim elde edebilirsiniz. API'miz açık erişimli içerikleri içermektedir, ama açık erişimli içerik madenciliğini, otomatik komut dizinizin çalıştığı DOI bilgi çekme işlevini http://api.elsevier.com/content/article/doi/[DOI] kullanarak da yapabilirsiniz.

Şimdi erişin

API'ler neden kullanılır?

Metin madenciliğinin işe yaraması için pek çok farklı araç ve kaynağın yanı sıra araştırmacılardan gelen pek çok uzmanlık girdisine ihtiyaç vardır. Başlamanıza yardımcı olmak için normalde madenciliğini yapmak isteyeceğiniz içerikleri çok daha kolay ve programatik bir dille indirmenizi sağlayan API'ler geliştirdik.  Bir API kullanmak size şunları sağlar:

  • Daha verimli olmak: Büyük miktarda içerik toplamak için "web crawling" yöntemini kullanmak verimsizdir ve API'lerimizi kullanarak ihtiyacınız olan verileri hızla ve kolayca bulabilir ve indirebilirsiniz.
  • Verilerinizi daha iyi bir formatta çekmek: Elsevier dergi makaleleriniz ve kitap bölümlerinizi, metin madencileri tarafından tercih edilen XML formatına dönüştürür.
  • Tutarlılığı sağlamak: 2 milyonun üzerinde makale ve kitap bölümü olduğundan madencilerin almak istedikleri önemli parçaları belirlemesi önemlidir. API'miz mevcut tüm veriler için tutarlı bir format sağlayarak TDM araçlarınızı çalıştırmanızı ve sınamanızı kolaylaştırır

CrossRef logosu

Farklı yayıncılardan madencilik mi yapmak istiyorsunuz?

Metin madenciliğine başladığınızda, bunu kaçınılmaz olarak farklı yayıncılar tarafından yayınlanan birden çok dergide yapmak isteyeceksiniz. Bu lojistik bir sorun doğurmaktadır. Metin madenciliğini kolaylaştırmak için  Crossref TDM hizmetini desteklemekteyiz. Bu ücretsiz hizmet size Crossref DOI'leri tarafından farklı yayıncıların sitelerinde bulunan içeriklerin tam metinlerine erişmek için kullanılabilen Crossref Metadata API'sini sağlamaktadır.

Daha fazla bilgi

OA STM Corpus

TDM araçlarınızın test edilmesi

Metin madenciliği Doğal Dil İşleme (NLP) araçlarının kullanımına dayalıdır. Özellikle akademik literatürde çalışacak NLP araçları geliştirmek ve iyileştirmek için bir açık erişim makaleleri kitaplığı oluşturduk. Bunlar kendi araçlarınızı test etmeniz ve iyileştirmenizde faydalı olabilir.

Daha fazla bilgi


Öğren ve destekle

Bir sonraki araştırma projenizi desteklemek için metin madenciliğine nasıl erişebileceğinizi ve bunu nasıl kullanabileceğinizi öğrenin: