Datasets
Conjuntos de dados para AI e transformação digital
A IA e a transformação digital estão rapidamente se tornando populares. Associe seu conhecimento interno com nossos dados enriquecidos e com curadoria específicos da área para responder a perguntas de P&D com maior precisão.
Acelere as descobertas
Integre dados científicos confiáveis e operacionais em aplicativos personalizados e ferramentas de terceiros para permitir casos de uso comercial, como:
Pesquisa corporativa, federada e/ou semântica
Painéis de inteligência empresarial
Criação de gráficos de conhecimento
Análises de estrelas e principais líderes de opinião (KOL) em ascensão
Análises acuradas
Transforme dados validados em insights científicos, incorporando conjuntos de dados da Elsevier em seus ecossistemas computacionais para:
Treinar algoritmos e redes neurais
Desenvolver modelos preditivos, como previsões de propriedades de materiais ou interações medicamentosas
Executar QSAR de ligação proteína-ligante
Automatizar e aprimorar tarefas e fluxos de trabalho
Changing AI in drug discovery
Elsevier understands the challenges of life sciences R&D. Our comprehensive, high-quality and machine-readable datasets provide clear data provenance and support evidence-based decisions. Through our vast history of supporting the life sciences, we can provide:
Curated datasets from full-text articles in disciplines across life sciences, including medicine, chemistry, biochemistry, genetics, immunology, microbiology, pharmacology, toxicology and more.
FAIR data in 11 therapy areas
Specialized data, such as bioactivity data, biological relationships, substances, reactions and more
What types of datasets are available?
Estão disponíveis pacotes de dados flexíveis adaptados às suas necessidades, como:
Dados de 2.500 periódicos que representam 24 grandes áreas disciplinares
Dados FAIR em 11 áreas de terapia; dados de periódicos de texto integral enriquecidos com metadados legíveis por máquina, como títulos de coleções premium da Cell Press e The Lancet
Leia mais sobre conjuntos de dados científicos com texto integral da Elsevier.
Três conjuntos de dados de resumos, autores e filiações, e métricas de avaliação, abrangem 24 disciplinas de pesquisa de 7.000 editoras. Os dados extraídos de periódicos científicos revisados por pares, livros, publicações em série, patentes e anais de conferências incluem:
1,8 bilhão de referências citadas
17,6 milhões de perfis de autores
94.800 perfis institucionais
11,7 milhões de artigos de conferências de mais de 149.000 eventos
Dados de estrutura química, reação e bioatividade que foram validados experimentalmente, disponíveis por API ou arquivo simples.
Os conjuntos de dados são provenientes de diversas fontes, como:
264 milhões de substâncias e respectivas propriedades
62 milhões de reações com condições experimentais e referências da literatura
65 milhões de documentos de 16.000 periódicos
38 milhões de patentes de 105 escritórios de patentes
44 milhões de bioatividades
32.000 alvos exclusivos
54.000 espécies
Indexados com o dicionário de sinônimos de ciências biológicas Emtree, os dados e as fontes de dados da literatura biomédica revisada por pares, publicações na imprensa e resumos de conferências incluem:
41 milhões de registros
8.300 periódicos incluindo 2.900 não disponíveis no MEDLINE
3,6 milhões de resumos de conferências, de 11.500 conferências
The Dataset currently includes 18.6 million biological relationships from 36 million MEDLINE abstracts and 7.6 million full-text articles. These include protein-protein interactions, and effects of proteins, compounds and cells on diseases and cell processes. The information comes from full-text literature on Elsevier’s ScienceDirect, and from other high-impact publishers, and public and proprietary databases. The Dataset also includes:
1.3 million small molecule protein interactions from Reaxys
150,000 data points from ClinicalTrials.gov
600,000 relationships from public databases of protein-protein interactions, small molecule protein interactions, MiRNA effects, SNP annotations and more
Download the EmBiology Dataset factsheet abre em uma nova guia/janela
Diversas APIs oferecem dados estruturados extraídos de documentos regulatórios da FDA e da EMA, como:
5.000 medicamentos aprovados
2 milhões de registros de dados farmacocinéticos extraídos de mais de 95 parâmetros de farmacocinética
600.000 registros de dados extraídos sobre enzimas e transportadores: medicamento como indutor, inibidor ou substrato
1,8 milhão de dados extraídos sobre segurança e eventos adversos
3,8 milhões de dados de eficácia extraídos de ensaios clínicos de pacotes regulatórios
Fontes dos dados:
3 milhões de páginas de documentos de aprovação da FDA, como rótulos, pacotes de aprovação, documentos do programa de Implementação do Estudo de Eficácia de Medicamentos (DESI, na sigla em inglês), documentos do Conselho Consultivo
384.000 páginas de pacotes de aprovação da EMA
20 milhões de relatórios pós-comercialização da FDA (FAERS)