期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于指针标注的跨境民族文化实体关系抽取方法 被引量:1
1
作者 杨振平 毛存礼 +2 位作者 雷雄丽 黄于欣 张勇丙 《中文信息学报》 CSCD 北大核心 2024年第3期75-83,共9页
跨境民族文化领域文本中存在较多的领域词汇,使得模型提取领域信息困难,造成上下文领域信息缺失,在该领域中实体密度分布高,面临实体关系重叠的问题。考虑到领域信息对跨境民族文化文本语义表征有着重要的作用,该文提出一种基于指针标... 跨境民族文化领域文本中存在较多的领域词汇,使得模型提取领域信息困难,造成上下文领域信息缺失,在该领域中实体密度分布高,面临实体关系重叠的问题。考虑到领域信息对跨境民族文化文本语义表征有着重要的作用,该文提出一种基于指针标注的跨境民族文化实体关系抽取方法,在字符向量表示中融入领域词典信息来增强领域信息用于解决领域实体标注不准确问题,通过多层指针标注解决跨境民族文化领域实体关系重叠问题。实验结果表明,在跨境民族文化实体关系抽取数据集上所提出方法相比于基线方法的F_(1)值提升了2.34%。 展开更多
关键词 跨境民族文化 实体关系抽取 指针标注 领域词典信息
在线阅读 下载PDF
融合领域知识图谱的跨境民族文化分类 被引量:2
2
作者 毛存礼 王斌 +3 位作者 雷雄丽 满志博 王红斌 张亚飞 《小型微型计算机系统》 CSCD 北大核心 2022年第5期943-949,共7页
跨境民族是指居住地“跨越”了国境线,但又保留了原来共同的某些民族特色,彼此有着同一民族的认同感的民族,对于跨境民族文化中涉及到的文本分类问题可以看作领域文本细分类任务,但是,目前面临类别标签歧义的问题.为此提出一种融合领域... 跨境民族是指居住地“跨越”了国境线,但又保留了原来共同的某些民族特色,彼此有着同一民族的认同感的民族,对于跨境民族文化中涉及到的文本分类问题可以看作领域文本细分类任务,但是,目前面临类别标签歧义的问题.为此提出一种融合领域知识图谱的跨境民族文化分类方法.首先把知识图谱中的知识三元组通过TransE模型表示为实体语义向量,并且把实体语义向量与BERT预训练模型得到文本中的词语向量相融合得到增强后的文本语义表达,输入到BiGRU神经网络中进行深层语义特征提取;然后通过构建注意力权重矩阵,对特征进行权重分配,以此来提升特征的质量,最终完成跨境民族文化分类模型的训练.实验结果表明,提出的方法在跨境民族文化文本数据集上的F1值为89.6%,精确率和召回率分别为88.2%和90.1%. 展开更多
关键词 知识表示 BiGRU 向量融合 TransE BERT预训练模型 跨境民族文化分类
在线阅读 下载PDF
基于实体语义扩展的跨境民族文化文本检索 被引量:1
3
作者 毛存礼 郝鹏鹏 +3 位作者 雷雄丽 王斌 王红斌 张亚飞 《中文信息学报》 CSCD 北大核心 2022年第11期101-109,共9页
由于跨境民族相关的文化实体常出现相同实体具有不同名称表达的情况,使用当前主流的文本检索方法在跨境民族文化数据集上将面临语义稀疏的问题。该文提出一种基于实体语义扩展的跨境民族文化检索方法,利用跨境民族文化知识图谱,以知识... 由于跨境民族相关的文化实体常出现相同实体具有不同名称表达的情况,使用当前主流的文本检索方法在跨境民族文化数据集上将面临语义稀疏的问题。该文提出一种基于实体语义扩展的跨境民族文化检索方法,利用跨境民族文化知识图谱,以知识三元组的形式将跨境民族文化之间的实体关联起来,并添加实体类别标签,以此缓解跨境民族文化实体中语义信息不充分的问题。通过TransH模型对实体及扩展语义信息进行向量化表示,融合到查询文本中进行语义增强,以此提升跨境民族文化文本检索的准确性。实验结果表明,该方法比基线模型提高了5.4%。 展开更多
关键词 文本检索 跨境民族文化 知识图谱 实体语义扩展
在线阅读 下载PDF
融入领域知识的跨境民族文化生成式摘要方法 被引量:2
4
作者 赵冠博 张勇丙 +2 位作者 毛存礼 高盛祥 王奉孝 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期620-628,共9页
从跨境民族文化文本中生成具有领域知识的摘要对进一步开展跨境民族文化文本检索、问答等任务具有重要的支撑作用,当前基于深度学习的生成式文本摘要取得了较好的效果,但直接用于跨境民族文化文本摘要任务会导致生成的摘要出现领域词汇... 从跨境民族文化文本中生成具有领域知识的摘要对进一步开展跨境民族文化文本检索、问答等任务具有重要的支撑作用,当前基于深度学习的生成式文本摘要取得了较好的效果,但直接用于跨境民族文化文本摘要任务会导致生成的摘要出现领域词汇丢失的问题.为此,提出一种融入领域知识的跨境民族文化生成式摘要方法(Domain Knowledge-Culture-Generative Summary,DKCGS),在编码端将跨境民族文化领域词典编码与原文本编码融合,以此增强模型对领域词汇的表征能力;在解码端,基于指针生成网络将具有同义或跨境关系的领域词汇分布与原文本分布结合,提高模型生成文化领域词汇的准确率.同时,在通用领域文本上进行预训练并进一步初始化参数,以缓解数据稀缺导致模型训练效果不佳的问题.实验结果表明,提出的方法在跨境民族文本摘要数据集上比基线模型的Rouge-1提升了0.95,有效提升了跨境民族文化文本摘要生成的质量. 展开更多
关键词 跨境民族文化 领域知识 指针生成网络 预训练 文本摘要
在线阅读 下载PDF
融入词集合信息的跨境民族文化实体识别方法 被引量:2
5
作者 杨振平 毛存礼 +3 位作者 雷雄丽 高盛祥 陆杉 张勇丙 《中文信息学报》 CSCD 北大核心 2022年第10期88-96,共9页
跨境民族文化领域实体通常由描述民族文化特征的领域词汇组合构成,使用当前主流的基于字符表征的实体识别方法会面临领域实体边界模糊问题,造成实体识别错误。为此,该文提出一种融入词集合信息的跨境民族文化实体识别方法,利用领域词典... 跨境民族文化领域实体通常由描述民族文化特征的领域词汇组合构成,使用当前主流的基于字符表征的实体识别方法会面临领域实体边界模糊问题,造成实体识别错误。为此,该文提出一种融入词集合信息的跨境民族文化实体识别方法,利用领域词典获取的词集合增强领域实体的词边界和词语义信息。首先,构建跨境民族文化领域词典,用于获取词集合信息;其次,通过词集合注意力机制获取词集合向量之间的权重,并融入位置编码增强词集合位置信息;最后,在特征提取层融入词集合信息,增强领域实体边界信息并缓解仅使用字符特征表示所带来的词语义缺失问题。实验结果表明,在跨境民族文化文本数据集上所提出方法相比于基线方法的F_(1)值提升了2.71%。 展开更多
关键词 跨境民族文化 实体识别 词集合信息 领域词典 注意力机制
在线阅读 下载PDF
跨境民族文化的异同与互动──以中国和缅甸的德昂族为例 被引量:12
6
作者 黄光成 《云南社会科学》 CSSCI 北大核心 1999年第2期62-68,共7页
拥有共同文化渊源的同一个民族居住在不同的国度,或者说一条或多条国境线将一个历史上同一民族划分在不同的国家之中,形成了跨境的民族。跨境民族中不同国度的群体长期以来构筑的文化纽带并不会随之解构和消失;尽管他们处于不同的政... 拥有共同文化渊源的同一个民族居住在不同的国度,或者说一条或多条国境线将一个历史上同一民族划分在不同的国家之中,形成了跨境的民族。跨境民族中不同国度的群体长期以来构筑的文化纽带并不会随之解构和消失;尽管他们处于不同的政体结构和政治环境中,其政缘关系有所... 展开更多
关键词 业缘 物缘 地缘 语缘 神缘 跨境民族文化 中国 缅甸 德昂族
在线阅读 下载PDF
基于领域知识图谱和对比学习的汉越跨境民族文本检索方法 被引量:3
7
作者 刘思源 毛存礼 张勇丙 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期610-619,共10页
汉越跨境民族文本检索是一类面向领域的跨语言检索任务,旨在以一种语言作为问题查询,检索出另一种语言对应的民族、宗教、文化习俗等跨境民族文档.但在汉越跨境民族文本检索任务中存在大量不常见的领域实体,实体表达形式多样,且中文和... 汉越跨境民族文本检索是一类面向领域的跨语言检索任务,旨在以一种语言作为问题查询,检索出另一种语言对应的民族、宗教、文化习俗等跨境民族文档.但在汉越跨境民族文本检索任务中存在大量不常见的领域实体,实体表达形式多样,且中文和越南语两种语言领域实体没有直接对应关系,导致跨语言领域词对齐和语义对齐困难,进而影响汉越跨境民族文本检索模型性能.基于此,提出一种基于领域知识图谱和对比学习的汉越跨境民族文本检索方法.首先,利用多头注意力机制将汉越跨境民族领域知识图谱融入查询和文档,丰富查询和文档中不常见的跨境民族领域实体信息;然后,引入对比学习来解决跨语言查询和文档的语义表征对齐困难问题;最后,将融入知识图谱的查询和文档表征之间的相似度计算作为相关性分数.实验表明,提出的方法和基线模型相比,性能提高了4.1%. 展开更多
关键词 跨境民族文化 跨境民族知识图谱 跨语言检索 对比学习 信息检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部