Información de la revista

Congreso

Contenidos del congreso
Congreso
44º Congreso de la Sociedad Española de Medicina Interna (SEMI) - Valencia
Valencia, 15-17 noviembre 2023
Listado de sesiones
Comunicación
13. MEDICINA DIGITAL
Texto completo

1467 - USO DE LA INTELIGENCIA ARTIFICIAL PARA LA EXTRACCIÓN DE DATOS CLÍNICOS

álvaro Marchán López1, Blanca Ayuso García2, Manuel Lorenzo López Reboiro1, Eva Romay Lema2, Cristina Sardiña González1, Pablo Ventura Valcárcel3, Juan Carlos Piñeiro Fernández2 y José López Castro1

1Hospital Público de Monforte, Monforte de Lemos, España. 2Hospital Universitario Lucus Augusti, Lugo, España. 3Hospital DA Costa, Burela, España.

Objetivos: Valorar la utilidad de una herramienta de Inteligencia Artificial para extraer datos clínicos de informes de alta en formato texto natural en pdf.

Métodos: Se extrajeron al azar 10 informes de alta de pacientes en formato pdf. Se editaron los archivos para eliminar todos los datos que pudieran identificar al paciente (nombre, teléfono, dirección, CIP y número de la seguridad social). Se elaboró una pregunta (fig.) que se realizó a un LLM (large language model, modelo grande de lenguaje) comercial no entrenado previamente para la tarea (ChatGPT, v4.0) y se le administraron los informes en pdf para la extracción del número de historia clínica, sexo, edad, presencia/ausencia de ocho antecedentes médicos preespecificados, tratamiento antibiótico recibido durante el ingreso, y destino al alta. Los informes se introdujeron primero juntos en un fichero y después por separado. Un digitador de datos humano realizó la misma tarea y se cuantificó la proporción de acuerdo observado y el coeficiente kappa de Cohen.

Resultados: En total se solicitó la extracción de 13 datos de cada uno de los 10 informes de alta (tabla). Mediante el fichero con los 10 informes conjuntos el LLM fue incapaz de realizar la tarea. Al introducir los informes uno a uno, el acuerdo total observado fue del 96,9% (IC95 95,4-98,4%), con un coeficiente kappa global de 0,8574. El acuerdo fue perfecto para número de historia, edad, y sexo, así como para los antibióticos recibidos y el destino al alta. Para los antecedentes el acuerdo total observado fue del 95,0% (IC95 92,6-97,4%), el acuerdo positivo observado del 87,5%, el acuerdo negativo del 96,9% y el coeficiente kappa de 0,8438. Las discordancias encontradas (4 datos) se muestran en la tabla.

Variable

NHC

Sexo

Edad

HTA

DM

CISQ

ICC

ERC

EPOC

EHC

Cáncer

Antibiótico

Alta

Acuerdo humano:IA

100%

100%

100%

100%

100%

100%

100%

90%

100%

80%

90%

100%

100%

Desacuerdos observados

1. ERC

Antecedente de fracaso renal por aminoglucósidos, la IA interpretó ERC = Sí

2. EHC

Antecedente de colelitiasis con colangitis de repetición, la IA interpretó EHC = Sí

3. EHC

Antecedente de esteatosis hepática, la IA interpretó EHC = No

4. Cáncer

Neoplasia vesical pendiente de resección transuretral, la IA interpretó Cáncer = No

NHC, número de historia clínica; HTA, hipertensión arterial; DM, diabetes mellitus; CISQ, cardiopatía isquémica; ICC, insuficiencia cardíaca; ERC, enfermedad renal crónica; EPOC, enfermedad pulmonar obstructiva crónica; EHC: enfermedad hepática crónica.

Discusión: La historia clínica electrónica a menudo no está diseñada para la extracción de datos para la investigación, como tampoco los informes que esta produce. Si bien los parámetros numéricos (constantes, resultados analíticos) pueden obtenerse desde los sistemas informáticos de laboratorios, antecedentes, evolución y recomendaciones al alta deben recogerse manualmente, a menudo desde campos tipo texto libre. Presentamos un ejemplo de extracción mediante Inteligencia Artificial de esta información a partir de informes de alta corrientes con un acuerdo muy bueno o excelente entre el LLM y un digitador humano. El experimento produjo fallos al introducir varios informes en un mismo fichero, pero no era un modelo específico ni había sido preentrenado para la tarea.

Conclusiones: En nuestro estudio, la concordancia de un LLM con un digitador humano fue excelente. Los LLM son una opción prometedora dentro de la inteligencia artificial para la extracción de datos clínicos a partir de documentos no específicos para ello.

Idiomas
Revista Clínica Española