¿Son peligrosas las alucinaciones de la IA en entornos sanitarios?

Sí, especialmente porque en salud la información errónea tiene consecuencias directas sobre pacientes reales. Un resumen de historia clínica con datos inventados, una recomendación farmacológica incorrecta o una referencia bibliográfica falsa que justifica una práctica pueden causar daños que no existirían si el profesional hubiera elaborado el contenido directamente. Por eso cualquier output de IA generativa en un contexto clínico debe tratarse como borrador que requiere verificación obligatoria.

¿Cómo detecta la enfermera una alucinación de la IA?

No siempre es fácil, y ese es precisamente el problema. Las señales de alerta incluyen: datos que no coinciden con la historia clínica conocida del paciente, referencias bibliográficas que no se pueden verificar, afirmaciones clínicas que contradicen protocolos establecidos, y coherencia interna del texto pero inconsistencia con la realidad clínica. La única defensa real es el hábito de verificación sistemática: nunca asumir que el output es correcto sin contrastarlo.

¿Qué tareas clínicas tienen más riesgo de alucinaciones?

Las tareas con mayor riesgo son aquellas donde el modelo trabaja con información específica del paciente: resúmenes de historia clínica, borradores de informes de alta, planificación de cuidados personalizada, respuestas a preguntas clínicas concretas y traducción de documentación médica. También son de alto riesgo las consultas que requieren conocimiento actualizado, porque los modelos tienen fecha de corte en su entrenamiento y pueden desconocer cambios recientes en guías o protocolos.

Alucinaciones en IA Generativa en Salud | Riesgos y Supervisión Clínica

Q: ¿Qué es una alucinación en IA generativa?

Una alucinación en IA generativa es cuando el modelo produce información incorrecta, inventada o falsa presentándola con total confianza y aparente coherencia. El sistema no sabe que se equivoca: no hay ninguna señal de advertencia. El texto generado suena bien redactado, puede incluir referencias bibliográficas que no existen y datos clínicos que son erróneos.

¿Qué es una alucinación en IA generativa?

Cuando un modelo de lenguaje —un LLM— produce información que es incorrecta, inventada o directamente falsa, presentándola con la misma confianza y fluidez que cuando es correcta, hablamos de una alucinación. No hay ningún indicador de error. No hay asterisco de advertencia. El texto sale bien construido, coherente en su forma, y puede ser completamente erróneo en su fondo.

El modelo no sabe que se equivoca. No puede saberlo: no tiene acceso a la verdad externa, solo a los patrones estadísticos de su entrenamiento. Cuando esos patrones no son suficientes para responder con precisión, el modelo no dice "no sé". Rellena el hueco con lo que estadísticamente parece más probable. Y lo hace de forma fluida, convincente, sin vacilación.

"El mayor peligro de la IA generativa no es que falle de forma obvia. Es que falle de forma invisible."

Por qué son especialmente peligrosas en salud

En muchos contextos, una alucinación de IA es un error molesto pero recuperable. En salud, puede tener consecuencias directas sobre pacientes reales. Y hay tres características del entorno clínico que amplifican ese riesgo:

Riesgo 1

Confianza institucional
Un documento bien redactado en un sistema hospitalario genera confianza automática. La enfermera tiende a asumir que si está en la HCE, es correcto.

Riesgo 2

Carga cognitiva
Bajo presión asistencial, la verificación se vuelve superficial. Es el momento en que el sesgo de automatización y las alucinaciones hacen más daño.

Riesgo 3

Propagación en cadena
Un error en un resumen de alta puede reproducirse en la siguiente valoración, en el informe de continuidad, en la planificación de cuidados.

Riesgo 4

Referencias inventadas
Los LLMs pueden citar artículos científicos que no existen, con DOI plausibles y autores reales. El profesional que confía en esa referencia toma decisiones sin evidencia real.

¿Dónde aparecen con más frecuencia en la práctica clínica?

Las tareas que implican información específica del paciente son las de mayor riesgo. El modelo trabaja bien con patrones generales, pero cuando necesita recuperar datos concretos de un documento o una historia clínica, puede mezclar, omitir o directamente inventar.

Las situaciones más frecuentes donde aparecen alucinaciones en contextos sanitarios:

Resúmenes de historia clínica generados automáticamente donde se mezclan datos de pacientes o se inventan antecedentes
Borradores de informes de alta con datos de evolución incorrectos o tratamientos no prescritos
Respuestas a preguntas clínicas específicas donde el modelo no tiene suficiente información y rellena con probabilidades
Planificación de cuidados personalizada con recomendaciones que no corresponden a la situación real del paciente
Educación sanitaria con información sobre dosis, interacciones o contraindicaciones incorrectas
Búsqueda bibliográfica donde se citan artículos inexistentes o se atribuyen conclusiones a estudios que no las contienen

⚠️

El conocimiento con fecha de corte

Los modelos de lenguaje tienen una fecha límite en su entrenamiento. No conocen actualizaciones de guías clínicas, cambios en protocolos farmacológicos ni nuevas evidencias publicadas después de esa fecha. Si preguntas sobre recomendaciones actualizadas sin especificar el año, el modelo puede darte la versión obsoleta con total confianza.

Cómo detectarlas: señales de alerta

No existe un detector infalible de alucinaciones. La única defensa real es el criterio clínico del profesional. Pero hay señales que deben activar la verificación inmediata:

Datos que no coinciden con lo que conoces del paciente por tu propia valoración
Referencias bibliográficas que no puedes localizar en PubMed u otras bases de datos
Afirmaciones categóricas sobre temas donde sabes que existe debate clínico o incertidumbre
Información muy específica —dosis exactas, porcentajes precisos— sin fuente verificable
Coherencia interna perfecta del texto pero inconsistencia con la historia clínica real
Respuestas demasiado completas y ordenadas para preguntas complejas con escasa información de entrada

El protocolo mínimo: output de IA = borrador

La regla más importante —y la más fácil de enunciar aunque no siempre de aplicar— es esta: cualquier output de IA generativa en un contexto clínico es un borrador, no un documento definitivo. Nunca.

Esto implica un cambio de mentalidad que va más allá de "revisar antes de firmar". Significa tratar el output del modelo con el mismo escepticismo activo que aplicarías a una información de segunda mano: puede ser correcta, probablemente lo es en su mayor parte, pero necesita verificación porque las consecuencias de que sea errónea las asume el paciente.

En la práctica, el protocolo mínimo ante cualquier output clínico de IA generativa incluye verificar que los datos del paciente son correctos y corresponden al caso real, contrastar las recomendaciones con los protocolos vigentes de tu unidad, localizar y comprobar las referencias bibliográficas si las hay, y documentar que la revisión se ha realizado.

Alucinaciones y Vibe Coding Sanitario

En el contexto del Vibe Coding Sanitario —crear herramientas digitales para salud usando IA generativa sin programación tradicional— el riesgo de alucinaciones tiene una dimensión adicional: no solo afecta al contenido que genera la herramienta, sino a la propia lógica de la herramienta que estás construyendo.

Un enfermero que usa IA para crear una calculadora de riesgo, un formulario de valoración o un sistema de alertas debe asumir que el código generado puede contener errores lógicos que el modelo presenta como soluciones correctas. El HITL no termina cuando la herramienta está creada: empieza ahí. Verificar que la herramienta hace lo que debe hacer, con los pacientes reales, es parte inseparable del proceso de innovación responsable.

Alucinaciones en IA Generativa en Salud

¿Qué es una alucinación en IA generativa?

Por qué son especialmente peligrosas en salud

¿Dónde aparecen con más frecuencia en la práctica clínica?

El conocimiento con fecha de corte

Cómo detectarlas: señales de alerta

El protocolo mínimo: output de IA = borrador

Alucinaciones y Vibe Coding Sanitario

Preguntas frecuentes

¿Quieres entender el marco completo?

¿Qué es una alucinación en IA generativa?

Por qué son especialmente peligrosas en salud

¿Dónde aparecen con más frecuencia en la práctica clínica?

El conocimiento con fecha de corte

Cómo detectarlas: señales de alerta

El protocolo mínimo: output de IA = borrador

Alucinaciones y Vibe Coding Sanitario

🔗 Artículos relacionados

Preguntas frecuentes

¿Quieres entender el marco completo?