期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多级组件融合中文词嵌入模型及核心药物识别应用
1
作者 孔德阳 张云 +2 位作者 王维广 陈子杰 刘勇国 《计算机应用》 CSCD 北大核心 2024年第S2期50-54,共5页
词嵌入模型可以将词语映射到低维向量空间以分析词语语义,为计算机理解和文本处理提供有效手段。传统中文词嵌入模型通过中文词语内部的组成信息学习语义信息,然而,对于汉字及其不同层级组件信息的利用程度,不同模型存在利用不够或过度... 词嵌入模型可以将词语映射到低维向量空间以分析词语语义,为计算机理解和文本处理提供有效手段。传统中文词嵌入模型通过中文词语内部的组成信息学习语义信息,然而,对于汉字及其不同层级组件信息的利用程度,不同模型存在利用不够或过度的问题。为了更好地利用汉字不同层级组件信息生成高质量的词嵌入,提出多级组件融合中文词嵌入(MJWE)模型,综合考虑词语、汉字和多级组件的特征,融合带有位置信息的字嵌入,构建以偏旁、部首和更小粒度的组件构成的多级组件嵌入,从而更全面地捕捉中文词语内部语义信息。同时,构建非组合词词表防止词语内部信息的过度利用。实验结果表明,在词相似任务WS-295上,与JWE(Joint learning Word Embeddings)模型相比,MJWE模型的准确率提高了2.11%;在词类比任务state上,与跳元(SG)模型相比,MJWE模型的准确率提高了2.52%;在词类比任务family上,与连续词袋(CBOW)模型相比,MJWE模型的准确率提高了6.58%。在情感二分类任务上,与JWE模型相比,MJWE模型的准确率提高了0.71%;在情感七分类任务上,与SG模型相比,MJWE模型的准确率提高了8.60%。同时,将MJWE模型应用于中医文献分析,在方剂核心药物识别的任务中,MJWE可以识别治疗慢性肾小球肾炎不同证候的核心药物。可见,MJWE可以生成质量较好的中文词嵌入,结合社区检测算法可以识别治疗慢性肾小球肾炎不同证候的核心药物,有利于辅助中医医师临床决策。 展开更多
关键词 词嵌入 中文词语 多级组件 中药方剂 核心药物
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部