期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
中外硕士论文中立场标记语对比研究
1
作者 祁瑞华 《山东外语教学》 北大核心 2025年第3期8-18,共11页
本研究基于学术语篇人际交流理论,对比分析了中国学生和英语本族语学生的硕士论文中的立场标记语的使用情况。结果表明,二者既有共性又有差异,共同点在于中国学生和英语本族语学生在硕士论文中均大量使用各项立场标记语,但在使用频数上... 本研究基于学术语篇人际交流理论,对比分析了中国学生和英语本族语学生的硕士论文中的立场标记语的使用情况。结果表明,二者既有共性又有差异,共同点在于中国学生和英语本族语学生在硕士论文中均大量使用各项立场标记语,但在使用频数上存在显著差异。这些差异不仅反映了不同文化背景下的修辞传统和学术规范,也体现了多元学术英语背景下不同变体的独特价值。基于上述发现,本研究从尊重多元学术英语变体、增强中国学生的语言资源多样性和平衡客观性与作者身份三个方面对学术写作教学提出建议。 展开更多
关键词 立场标记语 硕士论文 学术话语 对比研究
在线阅读 下载PDF
基于机器学习算法的引文情感自动识别研究——以自然语言处理领域为例 被引量:24
2
作者 徐琳宏 丁堃 +1 位作者 林原 杨阳 《现代情报》 CSSCI 2020年第1期35-40,48,共7页
[目的/意义]引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程]以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文... [目的/意义]引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程]以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文标识位置指引和情感词汇等特征,采用支持向量机(SVM)构建引文情感的自动识别系统,探索生成更大规模数据的方法。[结果/结论]实践应用证明,该系统特征的区分度较强,准确率达到93.4%,识别效果较好。引文情感的自动识别系统实用价值较强,拓宽了引文网络分析的研究方法和内容,能够完善论文评价体系。 展开更多
关键词 机器学习 引文情感分析 自动识别系统 支持向量机 自然语言处理 情感分析
在线阅读 下载PDF
俄语情感分析研究综述 被引量:1
3
作者 徐琳宏 刘鑫 +2 位作者 阎月 原伟 林鸿飞 《计算机工程与应用》 CSCD 北大核心 2022年第17期13-22,共10页
社交媒体中蕴含着用户的大量观点和评论,从中提取情感信息,有助于了解俄语区民众对热点事件、产品和服务等的真实态度,为相关政策的制定和调整提供依据,进而促进区域内国家间的合作共赢。按情感分析的流程从资源建设和自动识别两个方面... 社交媒体中蕴含着用户的大量观点和评论,从中提取情感信息,有助于了解俄语区民众对热点事件、产品和服务等的真实态度,为相关政策的制定和调整提供依据,进而促进区域内国家间的合作共赢。按情感分析的流程从资源建设和自动识别两个方面详细梳理了俄语情感分析领域的研究现状,并在此基础上对比分析了各类方法在不同数据集上性能和特征选择方案。研究结果发现俄语语料等资源的数据来源需要拓宽,且同类资源还可以进一步整合,自动识别方面主流的识别模型为机器学习和深度学习两种,整体识别准确率还有待提高。通过综述该领域的不足,探索了未来可能的研究方法,为进一步研究提供借鉴。 展开更多
关键词 俄文 情感分析 情感资源 自动分类
在线阅读 下载PDF
新冠肺炎疫情相关政策扩散特征与主题挖掘研究 被引量:5
4
作者 祁瑞华 付豪 《智库理论与实践》 CSSCI 2021年第6期55-64,共10页
[目的/意义]新型冠状病毒肺炎疫情期间,我国政府出台的各类政策在疫情防控、国家调整等方面发挥着重要作用,本文通过研究新冠肺炎疫情相关政策的扩散特征和热点主题,从时间和内容两个方面探寻重大公共卫生事件下,政府政策的扩散机制和... [目的/意义]新型冠状病毒肺炎疫情期间,我国政府出台的各类政策在疫情防控、国家调整等方面发挥着重要作用,本文通过研究新冠肺炎疫情相关政策的扩散特征和热点主题,从时间和内容两个方面探寻重大公共卫生事件下,政府政策的扩散机制和主题特点,为智库等相关研究机构研究突发事件的相关政策及其时间分布与内容主题的扩散特征提供借鉴和参考。[方法/过程]本文结合政策扩散和主题挖掘理论与方法,对2020年495条政府机构颁布的新冠肺炎疫情有关政策按照政策类型进行分类,采用时间维度研究法、主题词抽取法和社会网络分析法进行扩散特征分析,并挖掘热点主题。[结果/结论]政府颁布的疫情防控政策可分为法律法规、经济调控和文化活动三类,这三类政策从中央到省市级扩散的时间变化呈现明显的先波动后稳定的特征,体现了国家对新冠肺炎疫情的重视和政策调控的高效性。三类政策的中心主题一致,且在政策扩散过程中得到了较好的传递,三类政策主题继承、创新程度存在差异,政策主题均存在着密切关联。 展开更多
关键词 政策扩散 主题挖掘 新冠肺炎疫情
在线阅读 下载PDF
“一带一路”智库报告主题挖掘与演化研究 被引量:5
5
作者 祁瑞华 付豪 《智库理论与实践》 CSSCI 2022年第5期11-19,共9页
[目的/意义]作为国家“软实力”和“话语权”的重要组成部分,智库对政府决策、企业发展、社会舆论与公共知识传播等方面具有深刻影响。在对“一带一路”合作倡议的认知上,智库以及智库专家的研究成果,在对外合作、舆论导向、项目评估等... [目的/意义]作为国家“软实力”和“话语权”的重要组成部分,智库对政府决策、企业发展、社会舆论与公共知识传播等方面具有深刻影响。在对“一带一路”合作倡议的认知上,智库以及智库专家的研究成果,在对外合作、舆论导向、项目评估等方面发挥着重要作用,同时也能够反映“一带一路”合作倡议的工作重点等信息。本文通过量化研究中国智库对“一带一路”倡议研究的主题分布与演化历程,得到“一带一路”倡议在中国智库视角下的重点关注、研究方向和研究发展脉络,为“一带一路”倡议相关研究的推进提供整理与参考。[方法/过程]本文结合LDA2vec主题模型与词向量语义相似度计算方法,对于《全球智库报告2020》榜单中的中国智库,在2013—2020年间关于“一带一路”倡议研究的3,052份报告进行主题挖掘以及主题演化研究,并进行可视化呈现,分析主题内容与演化特征。[结果/结论]我国智库对“一带一路”倡议的研究热点主题逐年覆盖政治、经济、文化、社会、军事、环境等领域,且研究热点有着鲜明的基调,如“互利互信”“互联互通”“命运共同体”“共赢”等,主题演变的过程体现出明显的主题继承性、主题融合性等特征,这也体现出“一带一路”倡议逐渐全面的发展过程,也能够说明国内智库对“一带一路”倡议的研究重点具有持续性和拓展性。 展开更多
关键词 “一带一路” 主题挖掘 主题演化
在线阅读 下载PDF
图书评论特征抽取研究综述
6
作者 祁瑞华 杨明昕 +1 位作者 徐琳宏 关菁华 《现代情报》 CSSCI 2019年第9期160-167,共8页
[目的/意义]图书评论是出版社、图书馆和用户研究读者观点的重要线索,评论特征抽取研究是提高图书评论观点精准挖掘效率和准确率的基础性工作。[方法/过程]分别从评论特征抽取研究和图书评论特征聚类、语义表示、隐性特征抽取的典型方... [目的/意义]图书评论是出版社、图书馆和用户研究读者观点的重要线索,评论特征抽取研究是提高图书评论观点精准挖掘效率和准确率的基础性工作。[方法/过程]分别从评论特征抽取研究和图书评论特征聚类、语义表示、隐性特征抽取的典型方法等方面对国内外研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]指出图书评论特征抽取效率和准确率的提高需要考虑特征聚类、语义表示和隐性特征抽取等关键问题。 展开更多
关键词 图书评论 特征抽取 综述
在线阅读 下载PDF
基于名词掩盖的跨领域作者识别研究
7
作者 郭旭 祁瑞华 《中文信息学报》 CSCD 北大核心 2023年第1期160-168,共9页
为了提高作者识别的跨领域鲁棒性,解决作者写作规律在不同领域间的迁移问题,该文首先通过分析和实验发现:名词具有较高的领域相关性。然后,采用文本变形算法将名词掩盖掉,以此来降低相关特征的权重,从而迫使机器学习算法选择领域关联度... 为了提高作者识别的跨领域鲁棒性,解决作者写作规律在不同领域间的迁移问题,该文首先通过分析和实验发现:名词具有较高的领域相关性。然后,采用文本变形算法将名词掩盖掉,以此来降低相关特征的权重,从而迫使机器学习算法选择领域关联度更低的特征拟合样本,进而提高模型的泛化能力。在由21953个样本组成的跨领域作者识别的实验中,该文分别采用了基于字N-gram、基于BERT和基于集成学习的三种典型作者识别方法,对比了无掩盖和掩盖名词、形容词、动词、副词、功能词的作者识别,其中掩盖名词后的作者识别方法获得了较高的评价指标。实验结果表明,掩盖名词的方法可以提高作者识别的跨领域鲁棒性。 展开更多
关键词 作者识别 跨领域 迁移学习 掩盖名词
在线阅读 下载PDF
基于双向语言模型的社交媒体药物不良反应识别
8
作者 李正光 陈恒 林鸿飞 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第3期40-48,共9页
与服药相关的社交文本中隐藏着更具时效和更广泛的药物不良反应信息,但是从相对短小、稀疏的社交短文本中提取药物不良反应非常困难。基于此,本文提出一种双向语言预训练模型和注意力机制相结合的神经网络识别方法。该方法利用双向字符... 与服药相关的社交文本中隐藏着更具时效和更广泛的药物不良反应信息,但是从相对短小、稀疏的社交短文本中提取药物不良反应非常困难。基于此,本文提出一种双向语言预训练模型和注意力机制相结合的神经网络识别方法。该方法利用双向字符级语言预训练模型提取特定字符级特征,而且在提取药物不良反应的同时,通过注意力机制捕获局部和全局语义上下文信息。此外,为了提高该方法的效率,将字符级特征与词级特征相结合,并采用词级预训练和字符级预训练模型代替协同训练。在PSB 2016社交媒体挖掘共享任务2中的实验结果表明,字符特征在形态学上有助于区分药物不良反应,而注意力机制通过捕获局部和全局语义信息提高了对药物不良反应的识别性能,宏平均F_(1)值为82.2%。 展开更多
关键词 药物不良反应 社交媒体 双向语言模型 注意力机制 预训练模型
在线阅读 下载PDF
融合多级特征的俄语推特文本情感分析 被引量:7
9
作者 刘鑫 祁瑞华 +1 位作者 徐琳宏 陈恒 《小型微型计算机系统》 CSCD 北大核心 2021年第6期1176-1183,共8页
社交媒体中俄语情感信息的深入挖掘和分析,对国家制定政治、经贸和外交战略具有重要参考价值.本文针对俄语社交媒体文本口语化、不规范、形态多样等特点,提出融合俄语形态、俚语等词级特征和特殊符号、英译情感信息等句级特征的多级特... 社交媒体中俄语情感信息的深入挖掘和分析,对国家制定政治、经贸和外交战略具有重要参考价值.本文针对俄语社交媒体文本口语化、不规范、形态多样等特点,提出融合俄语形态、俚语等词级特征和特殊符号、英译情感信息等句级特征的多级特征表示方法,建立基于自注意力机制的俄语情感分类深度学习模型.针对俄语推特文本的情感分类实验表明,本文提出的多级特征能有效提升多种模型分类的F1_macro和准确率,与已有研究相比,本文模型不仅提升效果最明显,而且针对俄语情感的特征提取和分类能力更强. 展开更多
关键词 情感分析 俄语 特征融合 自注意力机制 深度学习
在线阅读 下载PDF
俄语多模态情感语料库的构建及应用 被引量:11
10
作者 徐琳宏 刘鑫 +1 位作者 原伟 祁瑞华 《计算机科学》 CSCD 北大核心 2021年第11期312-318,共7页
俄语的多模态情感分析技术是情感分析领域的研究热点,它可以通过文本、语音和图像等丰富信息自动分析和识别情感,有助于及时了解俄语区民众和国家的舆论热点。但目前俄语的多模态情感语料库还较少,因而制约了俄语情感分析技术的进一步... 俄语的多模态情感分析技术是情感分析领域的研究热点,它可以通过文本、语音和图像等丰富信息自动分析和识别情感,有助于及时了解俄语区民众和国家的舆论热点。但目前俄语的多模态情感语料库还较少,因而制约了俄语情感分析技术的进一步发展。针对该问题,在分析多模态情感语料库的相关研究及情感分类方法的基础上,首先制定了一套科学完整的标注体系,标注内容包括话语、时空和情感3个部分的11项信息;然后在语料库的整个建设和质量监控过程中,遵循情感主体原则和情感连续性原则,拟订出操作性较强的标注规范,进而构建出规模较大的俄语多模态情感语料库;最后探讨了语料库在解析情感表达特点、分析人物性格特征和构造情感识别模型等多个方面的应用。 展开更多
关键词 多模态 情感分析 语料库 俄语
在线阅读 下载PDF
基于四元数胶囊网络的知识图谱补全模型 被引量:4
11
作者 陈恒 王思懿 +3 位作者 李冠宇 祁瑞华 杨晨 王维美 《计算机工程》 CAS CSCD 北大核心 2022年第2期40-46,64,共8页
知识图谱采用RDF三元组的形式描述现实世界中的关系和头、尾实体,即(头实体,关系,尾实体)或(主语,谓语,宾语)。为补全知识图谱中缺失的事实三元组,将四元数融入胶囊神经网络模型预测缺失的知识,并构建一种新的知识图谱补全模型。采用超... 知识图谱采用RDF三元组的形式描述现实世界中的关系和头、尾实体,即(头实体,关系,尾实体)或(主语,谓语,宾语)。为补全知识图谱中缺失的事实三元组,将四元数融入胶囊神经网络模型预测缺失的知识,并构建一种新的知识图谱补全模型。采用超复数嵌入取代传统的实值嵌入来编码三元组结构信息,以尽可能全面捕获三元组全局特性,将实体、关系的四元数嵌入作为胶囊网络的输入,四元数结合优化的胶囊网络模型可以有效补全知识图谱中丢失的三元组,提高预测精度。链接预测实验结果表明,与CapsE模型相比,在数据集WN18RR中,该知识图谱补全模型的Hit@10与正确实体的倒数平均排名分别提高3.2个百分点和5.5%,在数据集FB15K-237中,Hit@10与正确实体的倒数平均排名分别提高2.5个百分点和4.4%,能够有效预测知识图谱中缺失的事实三元组。 展开更多
关键词 知识图谱 四元数 胶囊网络 知识图谱补全 链接预测
在线阅读 下载PDF
球坐标建模语义分层的知识图谱补全方法 被引量:3
12
作者 陈恒 祁瑞华 +3 位作者 朱毅 杨晨 郭旭 王维美 《计算机工程与应用》 CSCD 北大核心 2021年第15期101-108,共8页
知识图谱是真实世界三元组的结构化表示。通常,三元组表示形式为(头实体,关系,尾实体),这表示头实体和尾实体通过特定关系相互联系。针对知识图谱中广泛存在的数据稀疏问题,提出一种球坐标建模语义分层的知识图谱补全方法。使用球坐标... 知识图谱是真实世界三元组的结构化表示。通常,三元组表示形式为(头实体,关系,尾实体),这表示头实体和尾实体通过特定关系相互联系。针对知识图谱中广泛存在的数据稀疏问题,提出一种球坐标建模语义分层的知识图谱补全方法。使用球坐标系对实体和关系进行建模表示,以进行链接预测。具体来说,半径坐标旨在对不同层级的实体进行建模,半径较小的实体级别越高;角度坐标旨在区分相同层级的实体,即模长相等而角度不同的实体。该方法将实体映射到球坐标系中,可以有效建模知识图谱中普遍存在的语义分层现象。实验中,采用公开数据集WN18RR、FB15K-237与YAGO3-10进行相关的链接预测实验。实验结果表明,在WN18RR中,平均倒数排名(Mean Reciprocal Rank)比RotatE提高3.6%,Hit@10比RotatE提高1.9%;在FB15K-237中,平均倒数排名(Mean Reciprocal Rank)比ConvKB提高4.8%,Hit@10比ConvKB提高3.5%。实验证明球坐标建模语义分层的知识图谱补全方法可以有效提高三元组预测准确度。 展开更多
关键词 知识图谱 语义分层 知识图谱补全 球坐标系 链接预测
在线阅读 下载PDF
胶囊网络在知识图谱补全中的应用 被引量:5
13
作者 陈恒 李冠宇 +1 位作者 祁瑞华 王维美 《计算机工程与应用》 CSCD 北大核心 2020年第8期110-116,共7页
知识图谱补全旨在发现三元组中缺失链接,解决知识图谱数据稀疏问题。提出一种基于胶囊网络的知识图谱嵌入方法,该方法能够对关系三元组(头实体,关系,尾实体)进行建模。将三元组表示为3列矩阵,它与多个滤波器卷积以产生不同的特征映射;... 知识图谱补全旨在发现三元组中缺失链接,解决知识图谱数据稀疏问题。提出一种基于胶囊网络的知识图谱嵌入方法,该方法能够对关系三元组(头实体,关系,尾实体)进行建模。将三元组表示为3列矩阵,它与多个滤波器卷积以产生不同的特征映射;将这些特征图重建成相应的胶囊,每个胶囊是一组神经元,通过和权重点积生成较小尺寸的胶囊,然后生成一个连续矢量;该矢量和权重向量进行点积运算获得对应得分,所有分数求和的结果用来判断给定三元组的正确性。实验结果表明,和其他模型相比,该方法有效提高了三元组的预测精度,知识图谱补全的效果更好。 展开更多
关键词 知识图谱 知识图谱补全 链接预测 胶囊网络
在线阅读 下载PDF
四元数关系旋转的知识图谱补全模型 被引量:4
14
作者 陈恒 王维美 +1 位作者 李冠宇 史一民 《计算机科学》 CSCD 北大核心 2021年第5期225-231,共7页
知识图谱是真实世界三元组的结构化表示,通常三元组被表示成头实体、关系、尾实体的形式。针对知识图谱中广泛存在的数据稀疏问题,提出了一种将四元数作为关系旋转的知识图谱补全方法。文中使用极具表现力的超复数表示对实体和关系进行... 知识图谱是真实世界三元组的结构化表示,通常三元组被表示成头实体、关系、尾实体的形式。针对知识图谱中广泛存在的数据稀疏问题,提出了一种将四元数作为关系旋转的知识图谱补全方法。文中使用极具表现力的超复数表示对实体和关系进行建模,以进行链接预测。这种超复数嵌入用于表示实体,关系则被建模为四元数空间中的旋转。具体来说,将每个关系定义为超复数空间中头实体到尾实体的旋转,用于推理和建模各种关系模式,包括对称/反对称、反转和组合。在公开的数据集WN18RR和FB15K-237上进行相关的链接预测实验,实验结果表明,在WN18RR数据集中,其平均倒数排名(Mean Reciprocal Rank,MRR)比RotatE的提高了4.6%,其Hit@10比RotatE的提高了1.7%;在FB15K-237数据集中,其平均倒数排名比RotatE的提高了5.6%,其Hit@3比RotatE的提高了1.4%。该实验证明,使用四元数作为关系旋转的知识图谱补全方法可以有效提高三元组预测精度。 展开更多
关键词 知识图谱 四元数 知识图谱补全 超复数表示 链接预测
在线阅读 下载PDF
基于高阶位平面冗余的可逆信息隐藏方法 被引量:2
15
作者 顼聪 王兴田 陶永鹏 《计算机应用》 CSCD 北大核心 2022年第1期171-177,共7页
针对现有加密图像可逆信息隐藏(RDHEI)方法存在的隐藏容量低、解密标记图像质量差的问题,提出了一种新的基于高阶位平面冗余的RDHEI方法。首先,通过Logistic映射对原始图像进行分块加密,并保留块内像素高阶位平面的冗余;其次,依据块内... 针对现有加密图像可逆信息隐藏(RDHEI)方法存在的隐藏容量低、解密标记图像质量差的问题,提出了一种新的基于高阶位平面冗余的RDHEI方法。首先,通过Logistic映射对原始图像进行分块加密,并保留块内像素高阶位平面的冗余;其次,依据块内高阶位和低阶位个数是否相同的规则将加密后的图像块分为可嵌入块和不可嵌入块,并在可嵌入块中使用像素低阶位的值替换对应的高阶位值,从而实现高阶位平面冗余向低阶位平面的转移;最后,利用块内低阶位平面中腾出的嵌入空间来嵌入机密信息。在这之后,接收者利用密钥实现数据提取、图像解密和图像无损恢复的操作。在使用USC-SIPI标准图像库中的6幅图像进行的仿真实验中,在高阶位平面数等于3时,所提方法的图像的平均嵌入率为1.73 bpp,直接解密后的标记图像的平均峰值信噪比(PSNR)为47.20 dB。实验结果表明,该方法不仅提高了加密图像的信息嵌入量,而且提高了直接解密后的标记图像的PSNR值。 展开更多
关键词 加密图像 可逆信息隐藏 图像恢复 嵌入量 密钥 高阶位平面 冗余
在线阅读 下载PDF
基于位平面分块编码的可逆信息隐藏方法
16
作者 顼聪 刘朝霞 +1 位作者 陶永鹏 景雨 《火力与指挥控制》 CSCD 北大核心 2022年第12期6-13,共8页
针对当前加密图像可逆信息隐藏方法中存在的嵌入率低,标记图像直接解密后视觉质量差的问题,提出一种位平面分块编码的加密图像可逆信息隐藏方法。算法通过2D sine logistic混沌映射对图像分块加密,保留块内像素的相关性。将加密后的图... 针对当前加密图像可逆信息隐藏方法中存在的嵌入率低,标记图像直接解密后视觉质量差的问题,提出一种位平面分块编码的加密图像可逆信息隐藏方法。算法通过2D sine logistic混沌映射对图像分块加密,保留块内像素的相关性。将加密后的图像块化分成8个位平面,在低阶位平面中,根据块平面内0元素和1元素的分布情况,进行编码压缩,利用压缩后块平面内生成冗余空间进行机密信息的嵌入,图像的其余位平面部分则保持不变。在接收端,接收者获取密钥后可以进行信息提取,图像解密和图像的无损恢复。利用标准图像库中图像进行仿真实验,结果表明:随着可嵌入低位平面数的增加,算法的嵌入容量逐渐增大,在低阶平面数取3时,该算法保持较高的嵌入率时,仍然使得直接解密后的图像仍具有较高的PSNR值。 展开更多
关键词 可逆信息隐藏 加密图像 块编码 嵌入率
在线阅读 下载PDF
基于关系记忆的胶囊网络知识图谱嵌入模型
17
作者 陈恒 王思懿 +2 位作者 李正光 李冠宇 刘鑫 《计算机应用》 CSCD 北大核心 2022年第7期1985-1992,共8页
作为一种语义知识库,知识图谱(KG)使用结构化三元组的形式存储真实世界的实体及其内在关系。为了推理知识图谱中缺失的真实三元组,考虑关系记忆网络较强的三元组表征能力和胶囊网络强大的特征处理能力,提出一种基于关系记忆的胶囊网络... 作为一种语义知识库,知识图谱(KG)使用结构化三元组的形式存储真实世界的实体及其内在关系。为了推理知识图谱中缺失的真实三元组,考虑关系记忆网络较强的三元组表征能力和胶囊网络强大的特征处理能力,提出一种基于关系记忆的胶囊网络知识图谱嵌入模型。首先,通过编码实体和关系之间的潜在依赖关系和部分重要信息形成编码嵌入向量;然后,把嵌入向量与过滤器卷积以生成不同的特征图,再重组为对应的胶囊;最后,通过压缩函数和动态路由指定从父胶囊到子胶囊的连接,并根据子胶囊与权重内积的得分判断当前三元组的可信度。链接预测实验的结果表明,与CapsE模型相比,在倒数平均排名(MRR)和Hit@10评价指标上,所提模型在WN18RR数据集上分别提高了7.95%和2.2个百分点,在FB15K-237数据集上分别提高了3.82%和2个百分点。实验结果表明,所提模型可以更准确地推断出头实体和尾实体之间的关系。 展开更多
关键词 知识图谱 关系记忆网络 胶囊网络 知识图谱嵌入 动态路由
在线阅读 下载PDF
基于BERT-PGN模型的中文新闻文本自动摘要生成 被引量:15
18
作者 谭金源 刁宇峰 +1 位作者 祁瑞华 林鸿飞 《计算机应用》 CSCD 北大核心 2021年第1期127-132,共6页
针对文本自动摘要任务中生成式摘要模型对句子的上下文理解不够充分、生成内容重复的问题,基于BERT和指针生成网络(PGN),提出了一种面向中文新闻文本的生成式摘要模型——BERT-指针生成网络(BERTPGN)。首先,利用BERT预训练语言模型结合... 针对文本自动摘要任务中生成式摘要模型对句子的上下文理解不够充分、生成内容重复的问题,基于BERT和指针生成网络(PGN),提出了一种面向中文新闻文本的生成式摘要模型——BERT-指针生成网络(BERTPGN)。首先,利用BERT预训练语言模型结合多维语义特征获取词向量,从而得到更细粒度的文本上下文表示;然后,通过PGN模型,从词表或原文中抽取单词组成摘要;最后,结合coverage机制来减少重复内容的生成并获取最终的摘要结果。在2017年CCF国际自然语言处理与中文计算会议(NLPCC2017)单文档中文新闻摘要评测数据集上的实验结果表明,与PGN、伴随注意力机制的长短时记忆神经网络(LSTM-attention)等模型相比,结合多维语义特征的BERT-PGN模型对摘要原文的理解更加充分,生成的摘要内容更加丰富,全面且有效地减少重复、冗余内容的生成,Rouge-2和Rouge-4指标分别提升了1.5%和1.2%。 展开更多
关键词 生成式摘要模型 预训练语言模型 多维语义特征 指针生成网络 coverage机制
在线阅读 下载PDF
基于改进遗传算法的船舶管路布局设计 被引量:14
19
作者 董宗然 楼偶俊 管官 《计算机工程与应用》 CSCD 北大核心 2020年第19期252-260,共9页
针对船舶管路布局设计中的路径规划问题提出一种改进型遗传算法求解方法。建立船舶管路布局设计问题的模型空间、约束条件和优化目标;提出一种基于连接点网格的定长编码方法,结合该编码方法设计了适合改进遗传算法应用的适应度函数和交... 针对船舶管路布局设计中的路径规划问题提出一种改进型遗传算法求解方法。建立船舶管路布局设计问题的模型空间、约束条件和优化目标;提出一种基于连接点网格的定长编码方法,结合该编码方法设计了适合改进遗传算法应用的适应度函数和交叉、变异算子,定长编码可降低遗传算子设计复杂度和非法个体修补代价;提出在进化流程中嵌入以"去折弯"和"改模式"两种改善型变异方法构建的爬山操作,以提升算法收敛性和寻优能力。通过仿真实验验证所提算法具有可行性和先进性。 展开更多
关键词 船舶管路布局设计 遗传算法 定长编码
在线阅读 下载PDF
联合FOL规则的知识图谱表示学习方法 被引量:3
20
作者 刘藤 陈恒 李冠宇 《计算机工程与应用》 CSCD 北大核心 2021年第4期100-107,共8页
为增强知识图谱表示的预测精度和可解释性,通过改进由表示学习、规则学习和规则融合三个模块组成的IterE框架,提出一种适用各种表示学习算法的联合FOL规则的知识图谱表示学习方法,针对规则学习和融合模块,基于三元组打分函数改进规则置... 为增强知识图谱表示的预测精度和可解释性,通过改进由表示学习、规则学习和规则融合三个模块组成的IterE框架,提出一种适用各种表示学习算法的联合FOL规则的知识图谱表示学习方法,针对规则学习和融合模块,基于三元组打分函数改进规则置信度计算方法,扩展适用性,并改进软标签计算方法,放松融合要求,扩大融合的数据增量,迭代实现表示更新规则和规则增强表示。链路预测和生成解释实验表明,随着逻辑规则的加入,该方法提高了基模型的预测精度和可解释性,且在越稀疏的数据集中对提高稀疏实体表示的帮助越大。 展开更多
关键词 知识图谱补全 表示学习 FOL规则 可解释 稀疏实体
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部