大規模言語モデルとテキスト埋め込み計算に基づく中医学証素辨証自動化手法の研究

SUN Zhaoyang ,  

WANG Yang ,  

MA Mingze ,  

CHEN Yanwen ,  

LYU Zhenxiu ,  

JIANG Tiantian ,  

WEN Huiling ,  

CHEN Bo ,  

GUAN Jing ,  

摘要

本研究の目的は、自動化された中医学証素辨証方法を開発することである。方法として、まず分野知識、同義語、辨証論治および中医学症例ラベルの4種類の異なる中医学関連タスクデータセットに基づき、指令調整型中医学多タスクテキスト埋め込みモデル(Instr-MT-TCM)を構築・訓練した。次に、修士以上の学歴を持つ5名の中医学診断専門家が実際の臨床データセットから症状および体征を選別し注釈を付与し、Instr-MT-TCMと大規模言語モデル(LLM)の協調方法と人工注釈結果の証素辨証タスクにおけるF1スコアを評価した。最後に、本手法の実臨床環境での実現可能性を検証するため、実世界の前立腺癌48例に証素スコア計算を適用した。結果として、Instr-MT-TCMモデルは訓練初期において急速な性能向上を示し、トップ1再現率(R@1)は0.848であった。専門家は臨床で一般的な34の疾患と66の証型を含む1793例の実臨床症例を選別した。証素辨証タスクにおいて、LLMとInstr-MT-TCMの協調方法の平均F1スコアは0.927で、人工注釈の0.512を大きく上回った。前立腺癌48例の証素分析では、病性証素は主に火(熱)および陰虚であり、病位証素は膀胱および腎が中心であった。結論として、本研究はLLMとInstr-MT-TCMの協調に基づく中医学証素自動辨証の新たな手法を革新的に提案・検証し、実臨床データにおいて高いF1スコア(0.927)を達成し、高精度かつ高い汎化能力を示し、前立腺癌証素分析において良好な臨床応用可能性を示した。本手法は中医学知能化証素辨証に有効な技術支援と新たな研究方向を提供する。

关键词

証素辨証;大規模言語モデル;テキスト埋め込み

阅读全文