ClinicalKey AI : un contenu de confiance, propulsé par une IA responsable.

Votre navigateur n’est malheureusement pas entièrement pris en charge. Si vous avez la possibilité de le faire, veuillez passer à une version plus récente ou utiliser Mozilla Firefox, Microsoft Edge, Google Chrome, ou Safari 14 ou plus récent. Si vous n’y parvenez pas et que vous avez besoin d’aide, veuillez nous faire part de vos commentaires.
Nous vous serions reconnaissants de nous faire part de vos commentaires sur cette nouvelle expérience.Faites-nous part de votre opinionS’ouvre dans une nouvelle fenêtre
9 septembre 2025 | Lecture de 12 min
Par Ian Evans

Amber Featherstone-Uwague, Physician Lead Evaluation, ClinicalKey AI, présente des résultats lors de la conférence AI at Vive
L’intelligence artificielle (IA) transforme rapidement les soins de santé en offrant aux cliniciens des outils innovants pour optimiser les flux de travail et améliorer les résultats pour les patients. Dans cette évolution prometteuse, il est essentiel de garantir que ces systèmes d’IA sont sûrs, fiables et efficaces afin de les intégrer avec succès dans les environnements cliniques. C’est là qu’interviennent des cadres d’évaluation rigoureux, comme celui développé par l’équipe d’évaluation de l’IA générative d’Elsevier, qui établissent des standards privilégiant la confiance, l’exactitude et la sécurité.
En nous appuyant sur les enseignements du cadre d’évaluation de ClinicalKey AI et du rapport Clinician of the Future 2025, nous examinons comment des évaluations réfléchies et l’adoption des technologies d’IA façonnent l’avenir de la prise de décision clinique.
L’IA fait désormais partie intégrante de la boîte à outils des cliniciens. Selon le rapport Clinician of the Future 2025, près de la moitié des cliniciens interrogés, soit 48 %, ont déjà utilisé des outils d’IA dans des environnements cliniques, une hausse notable par rapport aux 26 % enregistrés en 2024. Si cette adoption témoigne de l’enthousiasme des professionnels de santé, elle souligne aussi la nécessité de cadres d’évaluation solides pour s’assurer que les outils d’IA fournissent des informations crédibles et exploitables.
Rhett Alden, Chief Technology Officer for Health Markets chez Elsevier, résume clairement ce défi : « Il faut environ 20 ans pour qu’une avancée soit intégrée à la pratique standard. Nous avons besoin d’outils qui aident les cliniciens à accéder plus rapidement à des informations utiles à leurs patients. »
Les cadres d’évaluation, comme celui utilisé pour ClinicalKey AI, apportent structure et rigueur à l’évaluation de l’IA. Ils contribuent à optimiser l’IA afin qu’elle fournisse des informations opportunes, exactes et utiles, tout en aidant à limiter les risques tels que la désinformation, les recommandations incorrectes ou les résultats biaisés.
ClinicalKey AI utilise une architecture RAG (Retrieval Augmented Generation), qui associe des modèles de langage avancés à des contenus sélectionnés et fondés sur des données probantes. Cette approche réduit les écueils courants, comme les hallucinations ou les réponses invérifiables, en ancrant les réponses dans des ressources cliniques validées. Il reste toutefois important que les organisations évaluent la capacité de la solution à comprendre les requêtes et à fournir des réponses à la fois exactes et pertinentes sur le plan clinique.
Leah Livingston, Director of Generative AI Evaluation for Health Markets chez Elsevier, souligne l’importance d’évaluations approfondies : « Cette approche “clinicien dans la boucle” permet aux développeurs de comprendre les performances de l’outil en conditions réelles et offre une vue d’ensemble de la qualité. »
Le cadre d’évaluation repose sur la notation de cinq dimensions clés, chacune essentielle à son rôle dans la prise de décision clinique. Pour une présentation détaillée de la méthodologie du cadre d’évaluation, vous pouvez lire l’article de recherche publié dans JAMIA Open : Reproducible generative artificial intelligence evaluation for health care: a clinician-in-the-loop approach.opens in new tab/window
Cette dimension mesure la valeur globale des réponses générées par l’IA dans des scénarios cliniques. Lors de son évaluation du T4 2024, ClinicalKey AI a affiché d’excellentes performances, 94,4 % des réponses ayant été jugées utiles par des experts cliniques du domaine (SME).
La quasi-totalité des réponses évaluées, soit 98,6 %, a montré que le système d’IA pouvait comprendre et interpréter avec précision des requêtes cliniques complexes. Cette compréhension approfondie va au-delà du traitement du langage pour atteindre une véritable interprétation clinique.
L’exactitude est primordiale dans les soins de santé. ClinicalKey AI a atteint un taux d’exactitude de 95,5 %, ce qui reflète son appui sur des sources cliniques de haute qualité revues par les pairs.
Cette dimension évalue si les réponses de l’IA couvrent tous les aspects pertinents de la requête clinique. ClinicalKey AI a obtenu un score de 90,9 %, légèrement inférieur aux autres indicateurs, mais toujours représentatif de standards élevés en matière d’exhaustivité des réponses.
La réduction des risques est essentielle. Le cadre a montré que ClinicalKey AI présentait un faible taux (0,47 %) de contenu potentiellement préjudiciable, en supposant que les informations de la réponse soient appliquées directement. Grâce à des garde-fous clairs, ClinicalKey AI aide les cliniciens à s’appuyer sur l’outil sans compromettre la sécurité des patients, même si les résultats soulignent la nécessité que du personnel qualifié évalue les réponses fournies par l’outil.
Le processus d’évaluation reposait sur un modèle à deux évaluateurs, dans lequel les experts du domaine notaient les réponses de manière indépendante. Les divergences ont été résolues au moyen d’un processus de consensus inspiré de la méthode Delphi modifiée, afin que les désaccords nuancés soient traités de façon méthodique par les cliniciens évaluateurs.
L’articleopens in new tab/window de JAMIA Open présente l’évaluation du T4 2024 de ClinicalKey AI, pour laquelle Elsevier a recruté 41 experts cliniques du domaine, dont des médecins certifiés par un conseil de spécialité et des pharmaciens cliniciens. Ces experts ont examiné 426 réponses générées par l’IA à des requêtes couvrant un large éventail de spécialités cliniques.
Ce niveau de rigueur vise à aligner les résultats de l’IA sur les attentes et les besoins des cliniciens. Livingston souligne : « Le processus itératif d’affinement du cadre d’évaluation optimisera la capacité d’Elsevier à fournir aux utilisateurs cliniques des contenus générés par l’IA qui soient fiables et adaptés à un usage clinique. »
Des outils d’IA comme ClinicalKey AI apportent déjà des bénéfices tangibles dans la pratique clinique. Selon le rapport Clinician of the Future 2025, les cliniciens utilisent l’IA pour répondre à des difficultés et optimiser les flux de travail. Quelques exemples clés :
Analyse des interactions médicamenteuses
30 % des cliniciens utilisent actuellement l’IA pour identifier les interactions médicamenteuses, et 59 % supplémentaires se disent intéressés par l’adoption de cette capacité.
Imagerie médicale
21 % des cliniciens utilisent l’IA pour interpréter l’imagerie médicale, une statistique qui souligne le rôle essentiel de l’IA dans le diagnostic.
Synthèses des traitements médicamenteux des patients
20 % des cliniciens s’appuient sur l’IA pour simplifier des tâches comme la génération de synthèses des traitements médicamenteux, contribuant ainsi à une plus grande efficacité.
Les cliniciens prévoient que ces applications se développeront dans les années à venir. À l’échelle mondiale, 70 % pensent que l’IA les aidera à gagner du temps, tandis que 54 % estiment qu’elle permettra des diagnostics plus exacts. « Nous n’avons pas d’autre choix que d’adopter l’IA dans toutes les activités de neurochirurgie », déclare un neurochirurgien de la région Asie-Pacifique, soulignant le caractère de plus en plus indispensable de l’IA dans les spécialités.
Malgré son potentiel considérable, l’adoption de l’IA dépend de la confiance. Selon le rapport Clinician of the Future 2025, 68 % des cliniciens affirment que leur confiance dans les outils d’IA clinique repose sur la citation automatique des références, tandis que 65 % insistent sur l’entraînement de l’IA à partir de contenus de haute qualité revus par les pairs.
ClinicalKey AI répond à ces attentes grâce à ses fondements de transparence et de fiabilité. Livingston rappelle l’importance des pratiques qui renforcent la confiance, en soulignant que l’IA ne doit pas remplacer les cliniciens, mais les aider à prendre des décisions éclairées. Un médecin sud-américain cité anonymement dans le rapport l’a rappelé : « L’IA ne remplace pas le jugement clinique ; elle n’est qu’un outil qui doit faciliter les processus de soins. »
ClinicalKey AI et son cadre d’évaluation illustrent la capacité d’Elsevier à associer technologie de pointe et rigueur clinique. En affinant ses outils d’IA et en mettant l’accent sur la confiance, Elsevier cherche à fournir aux cliniciens des informations fiables et exploitables, afin qu’ils puissent se concentrer sur l’essentiel : la qualité des soins aux patients.
Pour l’avenir, les cliniciens du monde entier s’accordent à dire que les soins de santé reposeront sur une collaboration entre l’expertise humaine et l’IA. En exploitant ces avancées de manière responsable, nous nous rapprochons d’un écosystème de santé qui allie précision et compassion.

