针对中医问诊领域数据规模大,以及医生在问诊中主观性强、数据对齐难的问题,提出了一种中医问答领域的大语言模型ChatTCM。利用大语言模型(large language model,LLM)在处理自然语言理解与文本生成方面的强大能力,通过对大语言模型进行...针对中医问诊领域数据规模大,以及医生在问诊中主观性强、数据对齐难的问题,提出了一种中医问答领域的大语言模型ChatTCM。利用大语言模型(large language model,LLM)在处理自然语言理解与文本生成方面的强大能力,通过对大语言模型进行微调,使LLM具有在中医问答领域的专业知识和能力,避免模型在生成时出现幻觉的现象。提取中医书籍中的三元组信息,构建中医知识图谱数据库,实现中医知识的数据对齐与系统化整合,并为大语言模型生成答案提供背景知识;结合思维链(chain-of-thought,COT)与知识图谱数据库的动态交互,生成客观的推理过程,确保诊疗建议具有科学依据;把思维链与知识图谱的推理结果作为新知识进行存储,从而不断扩展本地知识库。与中医领域的HuaTuoGPT模型对比实验表明,ChatTCM模型在MedChatZH数据集上BLEU-4和ROUGE-L的评测指标分别提高了10.6和10.5个百分点,并且在已开源的数据集上准确度达到了70%,比同类型的MedChatZH模型提升了10个百分点。展开更多
在中医药(Traditional Chinese Medicine,TCM)具有海量的知识和数据背景下,可计算生物医学知识(Computable Biomedical Knowledge,CBK)概念的提出及推动为创新性传承和发展中医药知识带来了启示。中医药的发展需要结合现代新型医学理念...在中医药(Traditional Chinese Medicine,TCM)具有海量的知识和数据背景下,可计算生物医学知识(Computable Biomedical Knowledge,CBK)概念的提出及推动为创新性传承和发展中医药知识带来了启示。中医药的发展需要结合现代新型医学理念,而中医药知识特点恰好符合CBK循环学习模式,针对目前中医药领域知识传承模式与发展存在的局限性,结合CBK理念,提出可计算中医药知识(Computable Traditional Chinese Medicine Knowledge,CTCMK)的发展理念。分析中医药知识可计算发展前景并提出相关发展策略,以期推进可计算中医药知识的发展,加速中医药知识获取、发现和及时转化为实践,为中医药领域知识的创新性发展、提高中医药研究和医疗服务质量奠定基础。展开更多
目的:系统评价高血压前期中医体质类型分布规律,并确定该病的高危体质类型,为高血压前期的中医药防治提供循证医学证据。方法:检索国家知识基础设施数据库(CNKI)、中国学术期刊数据库(CSPD)、中文科技期刊数据库(CCD)、中国生物医学文...目的:系统评价高血压前期中医体质类型分布规律,并确定该病的高危体质类型,为高血压前期的中医药防治提供循证医学证据。方法:检索国家知识基础设施数据库(CNKI)、中国学术期刊数据库(CSPD)、中文科技期刊数据库(CCD)、中国生物医学文献数据库(CBM)以及外文数据库PubMed、Web of Science核心合集、Cochrane Library,纳入所有评价中医体质类型与高血压前期相关的临床研究文献,按照纳入标准选择文献,提取数据。用纽卡斯尔-渥太华量表(NOS)对病例对照研究和队列研究进行质量评价,用美国卫生保健质量和研究机构(AHRQ)推荐的评价标准对横断面研究、随机对照试验研究进行质量评价。用Stata软件进行单个率的Meta分析并与王琦教授发表的中国一般人群体质分布情况进行比较。采用Review Manager5.3软件进行对照研究的Meta分析。以率(rate)或比值比(OR)及其95%置信区间(CI)描述效应值。结果:最终纳入文献28篇,共涉及高血压前期患者13455例,对照组(即非高血压前期患者)4133例。所有纳入评价的文献均未完全符合NOS或AHRQ条目要求,但文献质量评价总分均较高,总体质量较高。痰湿质、阴虚质、湿热质和血瘀质在高血压前期患者占比较高,分别为17.2%、16.6%、10.9%和9.4%。含健康对照人群的Meta分析显示,痰湿质、湿热质、阴虚质、血瘀质、郁质、平和质、阳虚质、特禀质发生高血压前期风险的OR值分别为8.39(2.18~32.36)、2.11(1.46~3.06)、2.02(1.44~2.83)、1.82(1.57~2.11)、0.81(0.61~1.06)、0.78(0.57~1.08)、0.31(0.21~0.47)、0.71(0.52~0.99)、0.55(0.40~0.76)湿质、阴虚质、湿热质和血瘀质是高血压前期患者的主要体质类型,也是导致高血压前期发病的危险因素,其中以痰湿质与高血压前期关系最为密切;而平和质、阳虚质、特禀质在高血压前期患者的体质分布中是相对保护因素。展开更多
文摘针对中医问诊领域数据规模大,以及医生在问诊中主观性强、数据对齐难的问题,提出了一种中医问答领域的大语言模型ChatTCM。利用大语言模型(large language model,LLM)在处理自然语言理解与文本生成方面的强大能力,通过对大语言模型进行微调,使LLM具有在中医问答领域的专业知识和能力,避免模型在生成时出现幻觉的现象。提取中医书籍中的三元组信息,构建中医知识图谱数据库,实现中医知识的数据对齐与系统化整合,并为大语言模型生成答案提供背景知识;结合思维链(chain-of-thought,COT)与知识图谱数据库的动态交互,生成客观的推理过程,确保诊疗建议具有科学依据;把思维链与知识图谱的推理结果作为新知识进行存储,从而不断扩展本地知识库。与中医领域的HuaTuoGPT模型对比实验表明,ChatTCM模型在MedChatZH数据集上BLEU-4和ROUGE-L的评测指标分别提高了10.6和10.5个百分点,并且在已开源的数据集上准确度达到了70%,比同类型的MedChatZH模型提升了10个百分点。
文摘在中医药(Traditional Chinese Medicine,TCM)具有海量的知识和数据背景下,可计算生物医学知识(Computable Biomedical Knowledge,CBK)概念的提出及推动为创新性传承和发展中医药知识带来了启示。中医药的发展需要结合现代新型医学理念,而中医药知识特点恰好符合CBK循环学习模式,针对目前中医药领域知识传承模式与发展存在的局限性,结合CBK理念,提出可计算中医药知识(Computable Traditional Chinese Medicine Knowledge,CTCMK)的发展理念。分析中医药知识可计算发展前景并提出相关发展策略,以期推进可计算中医药知识的发展,加速中医药知识获取、发现和及时转化为实践,为中医药领域知识的创新性发展、提高中医药研究和医疗服务质量奠定基础。
文摘目的:系统评价高血压前期中医体质类型分布规律,并确定该病的高危体质类型,为高血压前期的中医药防治提供循证医学证据。方法:检索国家知识基础设施数据库(CNKI)、中国学术期刊数据库(CSPD)、中文科技期刊数据库(CCD)、中国生物医学文献数据库(CBM)以及外文数据库PubMed、Web of Science核心合集、Cochrane Library,纳入所有评价中医体质类型与高血压前期相关的临床研究文献,按照纳入标准选择文献,提取数据。用纽卡斯尔-渥太华量表(NOS)对病例对照研究和队列研究进行质量评价,用美国卫生保健质量和研究机构(AHRQ)推荐的评价标准对横断面研究、随机对照试验研究进行质量评价。用Stata软件进行单个率的Meta分析并与王琦教授发表的中国一般人群体质分布情况进行比较。采用Review Manager5.3软件进行对照研究的Meta分析。以率(rate)或比值比(OR)及其95%置信区间(CI)描述效应值。结果:最终纳入文献28篇,共涉及高血压前期患者13455例,对照组(即非高血压前期患者)4133例。所有纳入评价的文献均未完全符合NOS或AHRQ条目要求,但文献质量评价总分均较高,总体质量较高。痰湿质、阴虚质、湿热质和血瘀质在高血压前期患者占比较高,分别为17.2%、16.6%、10.9%和9.4%。含健康对照人群的Meta分析显示,痰湿质、湿热质、阴虚质、血瘀质、郁质、平和质、阳虚质、特禀质发生高血压前期风险的OR值分别为8.39(2.18~32.36)、2.11(1.46~3.06)、2.02(1.44~2.83)、1.82(1.57~2.11)、0.81(0.61~1.06)、0.78(0.57~1.08)、0.31(0.21~0.47)、0.71(0.52~0.99)、0.55(0.40~0.76)湿质、阴虚质、湿热质和血瘀质是高血压前期患者的主要体质类型,也是导致高血压前期发病的危险因素,其中以痰湿质与高血压前期关系最为密切;而平和质、阳虚质、特禀质在高血压前期患者的体质分布中是相对保护因素。