Connect

Évaluation de l’IA dans l’aide à la décision clinique : bâtir un socle de confiance

9 septembre 2025

Lecture de 12 min

Par Ian Evans

Healthcare, doctor and patient breathing with stethoscope for diagnosis, medical service and checkup. Hospital, clinic and health worker with mature person for surgery recovery, wellness and healing GettyImages-1832022971.jpg

Amber Featherstone-Uwague, Physician Lead Evaluation, ClinicalKey AI, présente des résultats lors de la conférence AI at Vive

L’intelligence artificielle (IA) transforme rapidement les soins de santé en offrant aux cliniciens des outils innovants pour optimiser les flux de travail et améliorer les résultats pour les patients. Dans cette évolution prometteuse, il est essentiel de garantir que ces systèmes d’IA sont sûrs, fiables et efficaces afin de les intégrer avec succès dans les environnements cliniques. C’est là qu’interviennent des cadres d’évaluation rigoureux, comme celui développé par l’équipe d’évaluation de l’IA générative d’Elsevier, qui établissent des standards privilégiant la confiance, l’exactitude et la sécurité.

En nous appuyant sur les enseignements du cadre d’évaluation de ClinicalKey AI et du rapport Clinician of the Future 2025, nous examinons comment des évaluations réfléchies et l’adoption des technologies d’IA façonnent l’avenir de la prise de décision clinique.

Pourquoi les cadres d’évaluation de l’IA sont importants dans les soins de santé

L’IA fait désormais partie intégrante de la boîte à outils des cliniciens. Selon le rapport Clinician of the Future 2025, près de la moitié des cliniciens interrogés, soit 48 %, ont déjà utilisé des outils d’IA dans des environnements cliniques, une hausse notable par rapport aux 26 % enregistrés en 2024. Si cette adoption témoigne de l’enthousiasme des professionnels de santé, elle souligne aussi la nécessité de cadres d’évaluation solides pour s’assurer que les outils d’IA fournissent des informations crédibles et exploitables.

Rhett Alden, Chief Technology Officer for Health Markets chez Elsevier, résume clairement ce défi : « Il faut environ 20 ans pour qu’une avancée soit intégrée à la pratique standard. Nous avons besoin d’outils qui aident les cliniciens à accéder plus rapidement à des informations utiles à leurs patients. »

Les cadres d’évaluation, comme celui utilisé pour ClinicalKey AI, apportent structure et rigueur à l’évaluation de l’IA. Ils contribuent à optimiser l’IA afin qu’elle fournisse des informations opportunes, exactes et utiles, tout en aidant à limiter les risques tels que la désinformation, les recommandations incorrectes ou les résultats biaisés.

ClinicalKey AI et le cadre d’évaluation

ClinicalKey AI utilise une architecture RAG (Retrieval Augmented Generation), qui associe des modèles de langage avancés à des contenus sélectionnés et fondés sur des données probantes. Cette approche réduit les écueils courants, comme les hallucinations ou les réponses invérifiables, en ancrant les réponses dans des ressources cliniques validées. Il reste toutefois important que les organisations évaluent la capacité de la solution à comprendre les requêtes et à fournir des réponses à la fois exactes et pertinentes sur le plan clinique.

Leah Livingston, Director of Generative AI Evaluation for Health Markets chez Elsevier, souligne l’importance d’évaluations approfondies : « Cette approche “clinicien dans la boucle” permet aux développeurs de comprendre les performances de l’outil en conditions réelles et offre une vue d’ensemble de la qualité. »

Le cadre d’évaluation repose sur la notation de cinq dimensions clés, chacune essentielle à son rôle dans la prise de décision clinique. Pour une présentation détaillée de la méthodologie du cadre d’évaluation, vous pouvez lire l’article de recherche publié dans JAMIA Open : Reproducible generative artificial intelligence evaluation for health care: a clinician-in-the-loop approach.opens in new tab/window

1. Utilité

Cette dimension mesure la valeur globale des réponses générées par l’IA dans des scénarios cliniques. Lors de son évaluation du T4 2024, ClinicalKey AI a affiché d’excellentes performances, 94,4 % des réponses ayant été jugées utiles par des experts cliniques du domaine (SME).

2. Compréhension

La quasi-totalité des réponses évaluées, soit 98,6 %, a montré que le système d’IA pouvait comprendre et interpréter avec précision des requêtes cliniques complexes. Cette compréhension approfondie va au-delà du traitement du langage pour atteindre une véritable interprétation clinique.

3. Exactitude

L’exactitude est primordiale dans les soins de santé. ClinicalKey AI a atteint un taux d’exactitude de 95,5 %, ce qui reflète son appui sur des sources cliniques de haute qualité revues par les pairs.

4. Exhaustivité

Cette dimension évalue si les réponses de l’IA couvrent tous les aspects pertinents de la requête clinique. ClinicalKey AI a obtenu un score de 90,9 %, légèrement inférieur aux autres indicateurs, mais toujours représentatif de standards élevés en matière d’exhaustivité des réponses.

5. Risque potentiel de préjudice clinique

La réduction des risques est essentielle. Le cadre a montré que ClinicalKey AI présentait un faible taux (0,47 %) de contenu potentiellement préjudiciable, en supposant que les informations de la réponse soient appliquées directement. Grâce à des garde-fous clairs, ClinicalKey AI aide les cliniciens à s’appuyer sur l’outil sans compromettre la sécurité des patients, même si les résultats soulignent la nécessité que du personnel qualifié évalue les réponses fournies par l’outil.

Fonctionnement du processus d’évaluation

Le processus d’évaluation reposait sur un modèle à deux évaluateurs, dans lequel les experts du domaine notaient les réponses de manière indépendante. Les divergences ont été résolues au moyen d’un processus de consensus inspiré de la méthode Delphi modifiée, afin que les désaccords nuancés soient traités de façon méthodique par les cliniciens évaluateurs.

L’articleopens in new tab/window de JAMIA Open présente l’évaluation du T4 2024 de ClinicalKey AI, pour laquelle Elsevier a recruté 41 experts cliniques du domaine, dont des médecins certifiés par un conseil de spécialité et des pharmaciens cliniciens. Ces experts ont examiné 426 réponses générées par l’IA à des requêtes couvrant un large éventail de spécialités cliniques.

Ce niveau de rigueur vise à aligner les résultats de l’IA sur les attentes et les besoins des cliniciens. Livingston souligne : « Le processus itératif d’affinement du cadre d’évaluation optimisera la capacité d’Elsevier à fournir aux utilisateurs cliniques des contenus générés par l’IA qui soient fiables et adaptés à un usage clinique. »

Applications concrètes de l’IA dans les soins cliniques

Des outils d’IA comme ClinicalKey AI apportent déjà des bénéfices tangibles dans la pratique clinique. Selon le rapport Clinician of the Future 2025, les cliniciens utilisent l’IA pour répondre à des difficultés et optimiser les flux de travail. Quelques exemples clés :

Analyse des interactions médicamenteuses
- 30 % des cliniciens utilisent actuellement l’IA pour identifier les interactions médicamenteuses, et 59 % supplémentaires se disent intéressés par l’adoption de cette capacité.
Imagerie médicale
- 21 % des cliniciens utilisent l’IA pour interpréter l’imagerie médicale, une statistique qui souligne le rôle essentiel de l’IA dans le diagnostic.
Synthèses des traitements médicamenteux des patients
- 20 % des cliniciens s’appuient sur l’IA pour simplifier des tâches comme la génération de synthèses des traitements médicamenteux, contribuant ainsi à une plus grande efficacité.

Les cliniciens prévoient que ces applications se développeront dans les années à venir. À l’échelle mondiale, 70 % pensent que l’IA les aidera à gagner du temps, tandis que 54 % estiment qu’elle permettra des diagnostics plus exacts. « Nous n’avons pas d’autre choix que d’adopter l’IA dans toutes les activités de neurochirurgie », déclare un neurochirurgien de la région Asie-Pacifique, soulignant le caractère de plus en plus indispensable de l’IA dans les spécialités.

Bâtir la confiance pour l’avenir

Malgré son potentiel considérable, l’adoption de l’IA dépend de la confiance. Selon le rapport Clinician of the Future 2025, 68 % des cliniciens affirment que leur confiance dans les outils d’IA clinique repose sur la citation automatique des références, tandis que 65 % insistent sur l’entraînement de l’IA à partir de contenus de haute qualité revus par les pairs.

ClinicalKey AI répond à ces attentes grâce à ses fondements de transparence et de fiabilité. Livingston rappelle l’importance des pratiques qui renforcent la confiance, en soulignant que l’IA ne doit pas remplacer les cliniciens, mais les aider à prendre des décisions éclairées. Un médecin sud-américain cité anonymement dans le rapport l’a rappelé : « L’IA ne remplace pas le jugement clinique ; elle n’est qu’un outil qui doit faciliter les processus de soins. »

Comment Elsevier ouvre la voie au progrès

ClinicalKey AI et son cadre d’évaluation illustrent la capacité d’Elsevier à associer technologie de pointe et rigueur clinique. En affinant ses outils d’IA et en mettant l’accent sur la confiance, Elsevier cherche à fournir aux cliniciens des informations fiables et exploitables, afin qu’ils puissent se concentrer sur l’essentiel : la qualité des soins aux patients.

Pour l’avenir, les cliniciens du monde entier s’accordent à dire que les soins de santé reposeront sur une collaboration entre l’expertise humaine et l’IA. En exploitant ces avancées de manière responsable, nous nous rapprochons d’un écosystème de santé qui allie précision et compassion.

Grâce à une évaluation rigoureuse et à un optimisme partagé, la promesse de l’IA dans les soins cliniques devient réalité.

Contributeur

ClinicalKey AI : un contenu de confiance, propulsé par une IA responsable.

Rejoignez-nous dès aujourd’hui

A doctor in uniform with a stethoscope and notepad