Étude d’une méthode automatisée de diagnostic des symptômes en médecine traditionnelle chinoise basée sur de grands modèles de langage et le calcul d’incorporation de texte

SUN Zhaoyang ,  

WANG Yang ,  

MA Mingze ,  

CHEN Yanwen ,  

LYU Zhenxiu ,  

JIANG Tiantian ,  

WEN Huiling ,  

CHEN Bo ,  

GUAN Jing ,  

摘要

Cette étude vise à développer une méthode automatisée de diagnostic des symptômes en médecine traditionnelle chinoise (MTC). La méthode commence par construire et entraîner un modèle d’incorporation de texte multitâche Instr-MT-TCM basé sur les connaissances du domaine, les synonymes, le diagnostic différentiel et les étiquettes de cas cliniques en MTC. Ensuite, cinq experts en diagnostic de MTC, titulaires d’un master ou plus, ont sélectionné et annoté des symptômes sur un ensemble de données de cas cliniques réels afin d’évaluer le score F1 de la méthode collaborative Instr-MT-TCM combinée avec un grand modèle de langage (LLM), comparée à l’annotation manuelle. Enfin, pour valider la faisabilité clinique, la méthode a été appliquée à 48 cas réels de cancer de la prostate. Le modèle Instr-MT-TCM a montré une amélioration rapide des performances en début d’entraînement avec un rappel en première position (R@1) de 0,848. Les experts ont sélectionné 1793 cas couvrant 34 maladies courantes et 66 types de syndromes. Dans la tâche de diagnostic de symptômes, la méthode collaborative LLM plus Instr-MT-TCM avec un score F1 moyen de 0,927 a nettement surpassé l’annotation humaine (0,512). L’analyse des 48 cas de cancer de la prostate a révélé que les symptômes pathogènes étaient principalement liés au feu (chaleur) et à la déficience du Yin, tandis que les localisations pathogènes concernaient la vessie et les reins. Conclusion : Cette recherche propose et valide une méthode innovante d’automatisation du diagnostic des symptômes en MTC basée sur la collaboration entre LLM et Instr-MT-TCM. La méthode a obtenu un score F1 élevé (0,927) sur des données réelles, démontrant une grande précision et une forte capacité de généralisation, et montre un bon potentiel clinique dans l’analyse du cancer de la prostate, offrant un soutien technique efficace et de nouvelles directions de recherche pour l’intelligence artificielle dans le diagnostic en MTC.

关键词

diagnostic des symptômes;grands modèles de langage;incorporation de texte

阅读全文