Revista Clínica Española

ISSN: 0014-2565

Revista Clínica Española, publicó su primer número en 1940 y es órgano de expresión de la Sociedad Española de Medicina Interna (SEMI).
La Revista hace suyos los objetivos de actualizar los conocimientos y facilitar la adquisición de los avances claves de la medicina interna aplicados a la clínica. Revista Clínica Española somete a una rigurosa revisión doble ciega los artículos que recibe en español o inglés. Publica 10 números al año fundamentalmente con originales, revisiones y documentos de consenso.

Indexada en:

Scopus

Congreso

Contenidos del congreso

Congreso

44º Congreso de la Sociedad Española de Medicina Interna (SEMI) - Valencia

Valencia, 15 - 17 noviembre 2023

Comunicación

Comunicación anterior

13. MEDICINA DIGITAL

Texto completo

Descargar PDF

1467 - USO DE LA INTELIGENCIA ARTIFICIAL PARA LA EXTRACCIÓN DE DATOS CLÍNICOS

álvaro Marchán López¹, Blanca Ayuso García², Manuel Lorenzo López Reboiro¹, Eva Romay Lema², Cristina Sardiña González¹, Pablo Ventura Valcárcel³, Juan Carlos Piñeiro Fernández² y José López Castro¹

¹Hospital Público de Monforte, Monforte de Lemos, España. ²Hospital Universitario Lucus Augusti, Lugo, España. ³Hospital DA Costa, Burela, España.

Objetivos: Valorar la utilidad de una herramienta de Inteligencia Artificial para extraer datos clínicos de informes de alta en formato texto natural en pdf.

Métodos: Se extrajeron al azar 10 informes de alta de pacientes en formato pdf. Se editaron los archivos para eliminar todos los datos que pudieran identificar al paciente (nombre, teléfono, dirección, CIP y número de la seguridad social). Se elaboró una pregunta (fig.) que se realizó a un LLM (large language model, modelo grande de lenguaje) comercial no entrenado previamente para la tarea (ChatGPT, v4.0) y se le administraron los informes en pdf para la extracción del número de historia clínica, sexo, edad, presencia/ausencia de ocho antecedentes médicos preespecificados, tratamiento antibiótico recibido durante el ingreso, y destino al alta. Los informes se introdujeron primero juntos en un fichero y después por separado. Un digitador de datos humano realizó la misma tarea y se cuantificó la proporción de acuerdo observado y el coeficiente kappa de Cohen.

Resultados: En total se solicitó la extracción de 13 datos de cada uno de los 10 informes de alta (tabla). Mediante el fichero con los 10 informes conjuntos el LLM fue incapaz de realizar la tarea. Al introducir los informes uno a uno, el acuerdo total observado fue del 96,9% (IC95 95,4-98,4%), con un coeficiente kappa global de 0,8574. El acuerdo fue perfecto para número de historia, edad, y sexo, así como para los antibióticos recibidos y el destino al alta. Para los antecedentes el acuerdo total observado fue del 95,0% (IC95 92,6-97,4%), el acuerdo positivo observado del 87,5%, el acuerdo negativo del 96,9% y el coeficiente kappa de 0,8438. Las discordancias encontradas (4 datos) se muestran en la tabla.

Variable

NHC

Sexo

Edad

HTA

CISQ

ICC

ERC

EPOC

EHC

Cáncer

Antibiótico

Alta

Acuerdo humano:IA

100%

90%

100%

80%

90%

100%

Desacuerdos observados

1. ERC

Antecedente de fracaso renal por aminoglucósidos, la IA interpretó ERC = Sí

2. EHC

Antecedente de colelitiasis con colangitis de repetición, la IA interpretó EHC = Sí

3. EHC

Antecedente de esteatosis hepática, la IA interpretó EHC = No

4. Cáncer

Neoplasia vesical pendiente de resección transuretral, la IA interpretó Cáncer = No

NHC, número de historia clínica; HTA, hipertensión arterial; DM, diabetes mellitus; CISQ, cardiopatía isquémica; ICC, insuficiencia cardíaca; ERC, enfermedad renal crónica; EPOC, enfermedad pulmonar obstructiva crónica; EHC: enfermedad hepática crónica.

Discusión: La historia clínica electrónica a menudo no está diseñada para la extracción de datos para la investigación, como tampoco los informes que esta produce. Si bien los parámetros numéricos (constantes, resultados analíticos) pueden obtenerse desde los sistemas informáticos de laboratorios, antecedentes, evolución y recomendaciones al alta deben recogerse manualmente, a menudo desde campos tipo texto libre. Presentamos un ejemplo de extracción mediante Inteligencia Artificial de esta información a partir de informes de alta corrientes con un acuerdo muy bueno o excelente entre el LLM y un digitador humano. El experimento produjo fallos al introducir varios informes en un mismo fichero, pero no era un modelo específico ni había sido preentrenado para la tarea.

Conclusiones: En nuestro estudio, la concordancia de un LLM con un digitador humano fue excelente. Los LLM son una opción prometedora dentro de la inteligencia artificial para la extracción de datos clínicos a partir de documentos no específicos para ello.