期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于中文预训练语言模型的医学量表开发方法和评测指标抽取:评价研究
1
作者 郝洁 彭庆龙 +1 位作者 孙海霞 李姣 《中文信息学报》 CSCD 北大核心 2024年第11期57-69,共13页
该文旨在评估中文预训练语言模型应用在医学量表相关实体识别任务中的表现,包括开发方法和评测指标等。首先,人工标注中文护理学、肿瘤学和精神病学领域的量表开发期刊论文摘要形成CMedS-M研究数据集;然后,选取Chinese-BERT-wwm、MacBER... 该文旨在评估中文预训练语言模型应用在医学量表相关实体识别任务中的表现,包括开发方法和评测指标等。首先,人工标注中文护理学、肿瘤学和精神病学领域的量表开发期刊论文摘要形成CMedS-M研究数据集;然后,选取Chinese-BERT-wwm、MacBERT、ERNIE 3.0等预训练语言模型,实现量表开发方法和评测指标提及抽取;最后,从实体类型、学科领域和字长等视角综合分析不同模型的性能表现。CMedS-M包含自1994年至2023年共230种医学核心期刊的1589篇摘要,涵盖11441个句子和16422个实体提及。在该数据集上的实验结果表明,W2NER(MacBERT)的精确率和Macro-F_(1)值最高,分别达94.01%和95.10%;W2NER(ERNIE 3.0)召回率最高,达97.59%。所有模型在识别开发方法实体提及上的表现均略优于评测指标,在精神病学领域的表现整体低于肿瘤学和护理学,且在3~7个字长的实体提及识别上效果较佳。 展开更多
关键词 医学量表文本 命名实体识别 预训练语言模型 数据集构建
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部