期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于预训练语言模型的维吾尔语事件抽取
被引量:
4
1
作者
张朋捷
王磊
+3 位作者
马博
杨雅婷
董瑞
艾孜麦提·艾瓦尼尔
《计算机工程与设计》
北大核心
2023年第5期1487-1494,共8页
以往的维吾尔语事件抽取研究多采用静态词向量加长短时记忆神经网络的分析方式,无法有效处理一词多义和上下文语义表示问题。针对目标语言,训练两种维吾尔语预训练语言模型,提出一种结合BiGRU的联合问答模型事件抽取方法。利用预训练语...
以往的维吾尔语事件抽取研究多采用静态词向量加长短时记忆神经网络的分析方式,无法有效处理一词多义和上下文语义表示问题。针对目标语言,训练两种维吾尔语预训练语言模型,提出一种结合BiGRU的联合问答模型事件抽取方法。利用预训练语言模型获取文本的动态语义向量,融合类别表征信息,运用BiGRU进一步提取文本特征。实验结果表明,在事件识别任务上F1值达到77.96%,在事件主体抽取任务上F1值达到74.89%。相比基线模型NER方法,所提方法的F1值提高了14.08%。
展开更多
关键词
预训练语言模型
维吾尔语
事件抽取
联合问答模型
双向门控循环单元
类型识别
主体抽取
在线阅读
下载PDF
职称材料
一种针对维汉的跨语言远程监督方法
2
作者
杨振宇
王磊
+4 位作者
马博
杨雅婷
董瑞
艾孜麦提·艾瓦尼尔
王震
《计算机工程》
CAS
CSCD
北大核心
2023年第2期271-278,共8页
远程监督是关系抽取领域重要的语料扩充技术,可以在少量已标注语料的基础上快速生成伪标注语料。但是传统的远程监督方法主要应用于单语种文本,维吾尔语等低资源语言并不能使用这类方法得到伪标注语料。针对上述问题,提出一种针对维汉...
远程监督是关系抽取领域重要的语料扩充技术,可以在少量已标注语料的基础上快速生成伪标注语料。但是传统的远程监督方法主要应用于单语种文本,维吾尔语等低资源语言并不能使用这类方法得到伪标注语料。针对上述问题,提出一种针对维汉的跨语言远程监督方法,在无语料的情况下利用现有的汉语语料进行维语语料的自动扩充。将远程监督视为文本语义相似度计算问题而不是简单的文本查找,从实体语义和句子语义2个层面判断维语和汉语句子对是否包含同一关系,若为同一关系则将已有的汉语标注转移到维语句子上,实现维语语料从零开始的自动扩充。此外,为有效捕获实体的上下文和隐藏语义信息,提出一种带有门控机制的交互式匹配方法,通过门控单元控制编码层、注意力层之间的信息传递。人工标记3500条维语句子和600条汉语句子用于模拟远程监督过程并验证模型的性能。实验结果表明,该方法F1值达到73.05%,并且成功构造了包含97949条维语句子的关系抽取伪标注数据集。
展开更多
关键词
关系抽取
语义相似度
语义编码
远程监督
跨语言
在线阅读
下载PDF
职称材料
题名
基于预训练语言模型的维吾尔语事件抽取
被引量:
4
1
作者
张朋捷
王磊
马博
杨雅婷
董瑞
艾孜麦提·艾瓦尼尔
机构
中国科学院新疆理化技术研究所
中国科学院大学
中国科学院新疆理化技术研究所
出处
《计算机工程与设计》
北大核心
2023年第5期1487-1494,共8页
基金
中国科学院青年创新促进会基金项目(科发人函字[2019]26号)
国家自然科学基金项目(U2003303)
+1 种基金
新疆天山创新团队基金项目(2020D14045)
国家重点研发计划基金项目(2017YFC0822505-4)。
文摘
以往的维吾尔语事件抽取研究多采用静态词向量加长短时记忆神经网络的分析方式,无法有效处理一词多义和上下文语义表示问题。针对目标语言,训练两种维吾尔语预训练语言模型,提出一种结合BiGRU的联合问答模型事件抽取方法。利用预训练语言模型获取文本的动态语义向量,融合类别表征信息,运用BiGRU进一步提取文本特征。实验结果表明,在事件识别任务上F1值达到77.96%,在事件主体抽取任务上F1值达到74.89%。相比基线模型NER方法,所提方法的F1值提高了14.08%。
关键词
预训练语言模型
维吾尔语
事件抽取
联合问答模型
双向门控循环单元
类型识别
主体抽取
Keywords
pre-trained language model
Uyghur language
event extraction
joint question answering model
BiGRU
type recognition
subject extraction
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种针对维汉的跨语言远程监督方法
2
作者
杨振宇
王磊
马博
杨雅婷
董瑞
艾孜麦提·艾瓦尼尔
王震
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆民族语音语言信息处理实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第2期271-278,共8页
基金
国家自然科学基金本地青年人才培养专项(U2003303)
国家重点研发计划(2018YFC0823002)
+3 种基金
新疆维吾尔自治区天山创新项目(2020D14045)
“天山青年”计划优秀青年科技人才项目(2019Q031)
中国科学院青年创新促进会项目(科发人函字[2019]26号)
中国科学院西部青年学者B类项目(2019-XBQNXZ-B-008)。
文摘
远程监督是关系抽取领域重要的语料扩充技术,可以在少量已标注语料的基础上快速生成伪标注语料。但是传统的远程监督方法主要应用于单语种文本,维吾尔语等低资源语言并不能使用这类方法得到伪标注语料。针对上述问题,提出一种针对维汉的跨语言远程监督方法,在无语料的情况下利用现有的汉语语料进行维语语料的自动扩充。将远程监督视为文本语义相似度计算问题而不是简单的文本查找,从实体语义和句子语义2个层面判断维语和汉语句子对是否包含同一关系,若为同一关系则将已有的汉语标注转移到维语句子上,实现维语语料从零开始的自动扩充。此外,为有效捕获实体的上下文和隐藏语义信息,提出一种带有门控机制的交互式匹配方法,通过门控单元控制编码层、注意力层之间的信息传递。人工标记3500条维语句子和600条汉语句子用于模拟远程监督过程并验证模型的性能。实验结果表明,该方法F1值达到73.05%,并且成功构造了包含97949条维语句子的关系抽取伪标注数据集。
关键词
关系抽取
语义相似度
语义编码
远程监督
跨语言
Keywords
relation extraction
semantic similarity
semantic encoding
distant supervision
cross-lingual
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于预训练语言模型的维吾尔语事件抽取
张朋捷
王磊
马博
杨雅婷
董瑞
艾孜麦提·艾瓦尼尔
《计算机工程与设计》
北大核心
2023
4
在线阅读
下载PDF
职称材料
2
一种针对维汉的跨语言远程监督方法
杨振宇
王磊
马博
杨雅婷
董瑞
艾孜麦提·艾瓦尼尔
王震
《计算机工程》
CAS
CSCD
北大核心
2023
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部