期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于中文预训练语言模型的医学量表开发方法和评测指标抽取:评价研究
1
作者
郝洁
彭庆龙
+1 位作者
孙海霞
李姣
《中文信息学报》
CSCD
北大核心
2024年第11期57-69,共13页
该文旨在评估中文预训练语言模型应用在医学量表相关实体识别任务中的表现,包括开发方法和评测指标等。首先,人工标注中文护理学、肿瘤学和精神病学领域的量表开发期刊论文摘要形成CMedS-M研究数据集;然后,选取Chinese-BERT-wwm、MacBER...
该文旨在评估中文预训练语言模型应用在医学量表相关实体识别任务中的表现,包括开发方法和评测指标等。首先,人工标注中文护理学、肿瘤学和精神病学领域的量表开发期刊论文摘要形成CMedS-M研究数据集;然后,选取Chinese-BERT-wwm、MacBERT、ERNIE 3.0等预训练语言模型,实现量表开发方法和评测指标提及抽取;最后,从实体类型、学科领域和字长等视角综合分析不同模型的性能表现。CMedS-M包含自1994年至2023年共230种医学核心期刊的1589篇摘要,涵盖11441个句子和16422个实体提及。在该数据集上的实验结果表明,W2NER(MacBERT)的精确率和Macro-F_(1)值最高,分别达94.01%和95.10%;W2NER(ERNIE 3.0)召回率最高,达97.59%。所有模型在识别开发方法实体提及上的表现均略优于评测指标,在精神病学领域的表现整体低于肿瘤学和护理学,且在3~7个字长的实体提及识别上效果较佳。
展开更多
关键词
医学量表文本
命名实体识别
预训练语言模型
数据集构建
在线阅读
下载PDF
职称材料
题名
基于中文预训练语言模型的医学量表开发方法和评测指标抽取:评价研究
1
作者
郝洁
彭庆龙
孙海霞
李姣
机构
中国医学科学院/北京协和医学院医学信息研究所
哈尔滨工程大学青岛创新发展基地
出处
《中文信息学报》
CSCD
北大核心
2024年第11期57-69,共13页
基金
国家社会科学基金(21BTQ069)
中国医学科学院医学与健康科技创新工程项目(2021-I2M-1-056)
国家重点研究与发展计划课题(2022YFC3601005)。
文摘
该文旨在评估中文预训练语言模型应用在医学量表相关实体识别任务中的表现,包括开发方法和评测指标等。首先,人工标注中文护理学、肿瘤学和精神病学领域的量表开发期刊论文摘要形成CMedS-M研究数据集;然后,选取Chinese-BERT-wwm、MacBERT、ERNIE 3.0等预训练语言模型,实现量表开发方法和评测指标提及抽取;最后,从实体类型、学科领域和字长等视角综合分析不同模型的性能表现。CMedS-M包含自1994年至2023年共230种医学核心期刊的1589篇摘要,涵盖11441个句子和16422个实体提及。在该数据集上的实验结果表明,W2NER(MacBERT)的精确率和Macro-F_(1)值最高,分别达94.01%和95.10%;W2NER(ERNIE 3.0)召回率最高,达97.59%。所有模型在识别开发方法实体提及上的表现均略优于评测指标,在精神病学领域的表现整体低于肿瘤学和护理学,且在3~7个字长的实体提及识别上效果较佳。
关键词
医学量表文本
命名实体识别
预训练语言模型
数据集构建
Keywords
medical scale
named entity recognition
pre-trained language model
dataset construction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于中文预训练语言模型的医学量表开发方法和评测指标抽取:评价研究
郝洁
彭庆龙
孙海霞
李姣
《中文信息学报》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部