Connect

Evaluación de la IA en el apoyo a la decisión clínica: una base de confianza

9 de septiembre de 2025

Lectura de 12 min

Por Ian Evans

Healthcare, doctor and patient breathing with stethoscope for diagnosis, medical service and checkup. Hospital, clinic and health worker with mature person for surgery recovery, wellness and healing GettyImages-1832022971.jpg

Amber Featherstone-Uwague, Physician Lead Evaluation, ClinicalKey AI, presenta resultados en la conferencia AI at ViVE

La inteligencia artificial (IA) está transformando rápidamente la atención sanitaria y ofrece a los profesionales clínicos herramientas innovadoras para optimizar los flujos de trabajo y mejorar los resultados de los pacientes. En medio de esta prometedora revolución, garantizar que estos sistemas de IA sean seguros, fiables y eficaces resulta esencial para integrarlos con éxito en el entorno clínico. Ahí es donde entran en juego los marcos de evaluación rigurosos, como el desarrollado por el equipo de evaluación de IA generativa de Elsevier, que establecen estándares centrados en la confianza, la precisión y la seguridad.

A partir de los hallazgos del marco de evaluación de ClinicalKey AI y del informe Clinician of the Future 2025, analizamos cómo las evaluaciones rigurosas y la adopción de tecnologías de IA están configurando el futuro de la toma de decisiones clínicas.

Por qué son importantes los marcos de evaluación de IA en la atención sanitaria

La IA se ha convertido en una parte integral del conjunto de herramientas de los profesionales clínicos. Según el informe Clinician of the Future 2025, casi la mitad de los profesionales clínicos encuestados, el 48 %, ya ha utilizado herramientas de IA en entornos clínicos, un aumento notable frente al 26 % de 2024. Aunque esta adopción refleja el entusiasmo de los profesionales sanitarios, también pone de manifiesto la necesidad de contar con marcos de evaluación sólidos que garanticen que las herramientas de IA ofrecen información creíble y aplicable.

Rhett Alden, Chief Technology Officer for Health Markets de Elsevier, resume este reto con claridad: «Cualquier avance tarda unos 20 años en convertirse en parte de la práctica habitual. Necesitamos herramientas que ayuden a los profesionales clínicos a acceder más rápido a información que pueda ayudar a sus pacientes».

Los marcos de evaluación, como el utilizado para ClinicalKey AI, aportan estructura y rigor a las evaluaciones de IA. Ayudan a optimizar la IA para que proporcione información oportuna, precisa y útil, y contribuyen a mitigar riesgos como la desinformación, las recomendaciones incorrectas o los resultados sesgados.

ClinicalKey AI y el marco de evaluación

ClinicalKey AI utiliza una arquitectura de generación aumentada por recuperación (Retrieval Augmented Generation, RAG), que combina modelos de lenguaje avanzados con contenido seleccionado y basado en evidencia. Este enfoque minimiza problemas comunes, como las alucinaciones o las respuestas no verificables, al fundamentar las respuestas en materiales clínicos validados. Aun así, es importante que las organizaciones evalúen la capacidad de la solución para comprender consultas y ofrecer respuestas que sean precisas y clínicamente significativas.

Leah Livingston, Director of Generative AI Evaluation for Health Markets de Elsevier, destaca la importancia de realizar evaluaciones exhaustivas: «Este enfoque de “clínico en el circuito” permite a los desarrolladores entender cómo funciona la herramienta en el mundo real y ofrece una “visión panorámica” de la calidad».

El marco de evaluación se basa en la puntuación de cinco dimensiones clave, cada una esencial para su papel en la toma de decisiones clínicas. Para consultar en detalle la metodología del marco de evaluación, puede leer el artículo de investigación publicado en JAMIA Open: Reproducible generative artificial intelligence evaluation for health care: a clinician-in-the-loop approach.opens in new tab/window

1. Utilidad

Esta dimensión mide el valor general de las respuestas generadas por IA en escenarios clínicos. Durante su evaluación del cuarto trimestre de 2024, ClinicalKey AI mostró un rendimiento sobresaliente: el 94,4 % de las respuestas fueron calificadas como útiles por expertos clínicos en la materia (SMEs).

2. Comprensión

Casi todas las respuestas evaluadas, el 98,6 %, demostraron que el sistema de IA podía comprender e interpretar con precisión consultas clínicas complejas. Esta comprensión profunda va más allá del procesamiento del lenguaje y llega a una verdadera interpretación clínica.

3. Corrección

La precisión es fundamental en la atención sanitaria. ClinicalKey AI alcanzó una tasa de corrección del 95,5 %, lo que refleja su base en fuentes clínicas de alta calidad y revisadas por pares.

4. Exhaustividad

Esta dimensión evalúa si las respuestas de la IA abordan todos los aspectos relevantes de la consulta clínica. ClinicalKey AI obtuvo una puntuación del 90,9 %, ligeramente inferior a la de otras métricas, pero aun así representativa de altos estándares de exhaustividad en las respuestas.

5. Posible daño clínico

Minimizar el riesgo es esencial. El marco determinó que ClinicalKey AI presentó una tasa baja (0,47 %) de contenido potencialmente perjudicial, suponiendo que se actuara directamente sobre la información incluida en la respuesta. Al incorporar salvaguardas claras, ClinicalKey AI ayuda a que los profesionales clínicos puedan confiar en la herramienta sin comprometer la seguridad del paciente, aunque los hallazgos subrayan la necesidad de que personal cualificado evalúe las respuestas proporcionadas por la herramienta.

Cómo funciona el proceso de evaluación

El proceso de evaluación siguió un modelo con dos evaluadores, en el que los expertos en la materia calificaron las respuestas de forma independiente. Las discrepancias se resolvieron mediante un proceso de consenso basado en el método Delphi modificado, lo que permitió que los evaluadores clínicos abordaran de manera metódica los desacuerdos más matizados.

El artículoopens in new tab/window de JAMIA Open presenta la evaluación del cuarto trimestre de 2024 de ClinicalKey AI, para la que Elsevier reclutó a 41 expertos clínicos en la materia, incluidos médicos especialistas certificados y farmacéuticos clínicos. Estos expertos revisaron 426 respuestas a consultas generadas por IA en una amplia variedad de especialidades clínicas.

Este nivel de rigor está diseñado para alinear los resultados de la IA con las expectativas y necesidades de los profesionales clínicos. Livingston subraya: «El proceso iterativo de perfeccionamiento del marco de evaluación optimizará la capacidad de Elsevier para ofrecer a los usuarios clínicos contenido generado por IA que sea fiable y adecuado para el uso clínico».

Aplicaciones reales de la IA en la atención clínica

Herramientas de IA como ClinicalKey AI ya ofrecen beneficios tangibles en la práctica clínica. Según el informe Clinician of the Future 2025, los profesionales clínicos están aprovechando la IA para abordar puntos críticos y optimizar flujos de trabajo. Entre los principales ejemplos se incluyen:

Análisis de interacciones farmacológicas
- El 30 % de los profesionales clínicos utiliza actualmente IA para identificar interacciones farmacológicas, y otro 59 % manifiesta interés en adoptar esta capacidad.
Imagen médica
- El 21 % de los profesionales clínicos utiliza IA para interpretar imágenes médicas, una cifra que subraya el papel crítico de la IA en el diagnóstico.
Resúmenes de medicación de pacientes
- El 20 % de los profesionales clínicos recurre a la IA para agilizar tareas como la generación de resúmenes de medicación, lo que ayuda a lograr una mayor eficiencia.

Los profesionales clínicos prevén que estas aplicaciones se expandirán en los próximos años. A nivel mundial, el 70 % predice que la IA les ayudará a ahorrar tiempo, mientras que el 54 % anticipa que la IA permitirá diagnósticos más precisos. «No tenemos otra opción que adoptar la IA en toda la actividad neuroquirúrgica», afirma un neurocirujano de Asia-Pacífico, lo que subraya la creciente importancia de la IA en campos especializados.

Generar confianza para el futuro

A pesar de su importante potencial, la adopción de la IA depende de la confianza. Según el informe Clinician of the Future 2025, el 68 % de los profesionales clínicos afirma que la confianza en las herramientas clínicas de IA depende de la citación automática de referencias, mientras que el 65 % destaca la importancia de entrenar la IA con contenido de alta calidad y revisado por pares.

ClinicalKey AI responde a estas expectativas mediante una base de transparencia y fiabilidad. Livingston recuerda la importancia de las prácticas que generan confianza y subraya que la IA no debe reemplazar a los profesionales clínicos, sino apoyarlos en la toma de decisiones fundamentadas. Un médico sudamericano citado de forma anónima en el informe reiteró: «La IA no reemplaza el juicio clínico; es simplemente una herramienta que debe facilitar los procesos de atención».

Cómo Elsevier impulsa el progreso

ClinicalKey AI y su marco de evaluación ejemplifican el liderazgo de Elsevier al combinar tecnología de vanguardia con rigor clínico. Al perfeccionar sus herramientas de IA y centrarse en la confianza, Elsevier busca capacitar a los profesionales clínicos con información fiable y aplicable, para que puedan centrarse en lo que más importa: una atención al paciente de calidad.

De cara al futuro, los profesionales clínicos de todo el mundo coinciden en que el futuro de la atención sanitaria será un esfuerzo colaborativo entre la experiencia humana y la IA. Al aprovechar estos avances de forma responsable, nos acercamos a un ecosistema sanitario que combina precisión y compasión.

Mediante una evaluación cuidadosa y un optimismo compartido, la promesa de la IA en la atención clínica se está haciendo realidad.

Contribuidor

ClinicalKey AI: contenido fiable. Impulsado por IA responsable.

Únase al recorrido

A doctor in uniform with a stethoscope and notepad