Estudio sobre un método automatizado para el diagnóstico diferencial de síntomas en medicina tradicional china basado en modelos de lenguaje grandes y cálculo de incrustación de texto

SUN Zhaoyang ,  

WANG Yang ,  

MA Mingze ,  

CHEN Yanwen ,  

LYU Zhenxiu ,  

JIANG Tiantian ,  

WEN Huiling ,  

CHEN Bo ,  

GUAN Jing ,  

摘要

El objetivo de este estudio es desarrollar un método automatizado para el diagnóstico diferencial de síntomas en la medicina tradicional china (MTC). El método primero construye y entrena un modelo multitarea de incrustación de texto Instr-MT-TCM basado en conocimientos del dominio, sinónimos, diagnóstico diferencial y etiquetas de casos clínicos de MTC. Luego, cinco expertos en diagnóstico de MTC con grado de maestría o superior seleccionaron y anotaron síntomas en un conjunto de datos del mundo real para evaluar la puntuación F1 del método colaborativo entre Instr-MT-TCM y modelos de lenguaje grandes (LLM) frente a anotaciones manuales. Finalmente, para validar la viabilidad clínica, se aplicó el método a 48 casos reales de cáncer de próstata. El modelo Instr-MT-TCM mostró una rápida mejora en el rendimiento en las primeras etapas del entrenamiento con una tasa de recuperación en primer lugar (R@1) de 0,848. Los expertos seleccionaron 1793 casos reales que abarcaban 34 enfermedades comunes y 66 tipos de síndromes. En la tarea de diagnóstico diferencial, el método colaborativo entre LLM e Instr-MT-TCM obtuvo un puntaje F1 promedio de 0,927, claramente superior a las anotaciones manuales de 0,512. En el análisis de los síntomas de 48 casos de cáncer de próstata, los síntomas patológicos se centraron principalmente en el fuego (calor) y la deficiencia de Yin, mientras que la localización patológica principal estuvo en la vejiga y los riñones. Conclusión: Este estudio presenta y valida de manera innovadora un nuevo método automatizado para el diagnóstico diferencial de síntomas de MTC basado en la colaboración entre los LLM y Instr-MT-TCM, que alcanzó una alta puntuación F1 (0,927) en datos del mundo real, mostrando gran precisión y fuerte capacidad de generalización, y demostrando un buen potencial clínico en el análisis del cáncer de próstata, proporcionando soporte técnico efectivo y nuevas direcciones de investigación para la inteligencia artificial en el diagnóstico de MTC.

关键词

diagnóstico diferencial de síntomas;modelos de lenguaje grandes;incrustación de texto

阅读全文