期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
深空探测器多智能体强化学习自主任务规划
1
作者 孙泽翼 王彬 +2 位作者 胡馨月 熊新 金怀平 《深空探测学报(中英文)》 CSCD 北大核心 2024年第3期244-255,共12页
针对深空探测器执行附着任务时各子系统协同规划自主性、快速性和自适应性的要求,提出一种基于近端策略优化方法的多智能体强化学习协同规划,将单智能体近端策略优化算法与多智能体混合式协作机制相融合,设计了一种多智能体自主任务规... 针对深空探测器执行附着任务时各子系统协同规划自主性、快速性和自适应性的要求,提出一种基于近端策略优化方法的多智能体强化学习协同规划,将单智能体近端策略优化算法与多智能体混合式协作机制相融合,设计了一种多智能体自主任务规划模型,并引入噪声正则化优势值解决多智能体集中训练中协同策略过拟合的问题。仿真结果表明,多智能体强化学习自主任务规划方法能根据实时环境变化,对智能自主优化小天体附着任务的协作策略适时调整,与改进前的算法相比提高了任务规划成功率和规划解的质量,缩短了任务规划的时间。 展开更多
关键词 多智能体强化学习 深空探测自主任务规划 近端策略优化 小天体附着
在线阅读 下载PDF
基于混沌博弈理论的多源微波加热温度均匀性优化
2
作者 杨彪 韩泽民 +3 位作者 段绍米 黄宏彬 吴照刚 彭飞云 《材料导报》 北大核心 2025年第3期50-57,共8页
本工作研究了多源微波加热系统中材料内部整体温度均匀性的优化问题,也就是在谐振腔体存在驻波的情况下,实现温度场梯度最小的优化目标。首先,从微波频率的动态变化出发,采用热点交替的移频方法,逆转材料温域分布,实现材料间冷热点的中... 本工作研究了多源微波加热系统中材料内部整体温度均匀性的优化问题,也就是在谐振腔体存在驻波的情况下,实现温度场梯度最小的优化目标。首先,从微波频率的动态变化出发,采用热点交替的移频方法,逆转材料温域分布,实现材料间冷热点的中和,达到均匀加热的目的。然后,基于不同微波源之间的耦合程度差异,引入混沌博弈优化算法重构不同频率下各个微波源的馈入功率数值,在确保温度均匀性不变的情况下,提升材料的整体温度。最后,通过多源微波与SiC材料相互作用的仿真实例来分析加热过程,并开展对均匀性指标的有效计算。数值计算结果表明,与固定频率加热和扫频加热相比,所提出的方法均匀性分别提升了26.3%~70.2%和60.0%~62.7%,同时加热效率分别提高了2.5%~41.7%和14.2%~14.6%,能有效地改善微波加热的温度均匀性。 展开更多
关键词 微波加热 多微波源 功频协同 热点交替 混沌博弈优化算法 均匀性
在线阅读 下载PDF
基于GST与改进CNN的滚动轴承智能故障诊断 被引量:7
3
作者 于洋 马军 +1 位作者 王晓东 杨创艳 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2022年第7期2050-2060,共11页
针对滚动轴承传统故障诊断方法需要先验知识以及人工提取特征导致故障识别错误率高的问题,提出一种基于广义S变换(Generalized S transform,GST)和改进卷积神经网络(Convolutional Neural Network,CNN)的滚动轴承智能故障诊断方法。使用... 针对滚动轴承传统故障诊断方法需要先验知识以及人工提取特征导致故障识别错误率高的问题,提出一种基于广义S变换(Generalized S transform,GST)和改进卷积神经网络(Convolutional Neural Network,CNN)的滚动轴承智能故障诊断方法。使用GST将一维振动信号转换为特征信息更加丰富的时频图,更加全面提取滚动轴承的故障特征信息。通过加入弹性斜率和高斯分布的神经元噪声,提出改进的激活函数EReLTanh(Elastic Rectified Linear Tanh,EReLTanh),并基于EReLTanh激活函数构建CNN。将得到的时频图进行压缩和归一化处理,生成时频图数据集并划分数据集。利用时频图数据集训练改进CNN,实现滚动轴承的智能故障诊断。使用自制实验平台采集不同种类滚动轴承故障数据,利用t-SNE进行全连接层特征降维可视化,结果表明:使用EReLTanh激活函数的CNN模型能够将不同故障样本的特征进行准确的分类,达到故障识别要求,同时使用该数据利用S变换、小波变换、GST并结合改进CNN和未改进CNN进行对比,提出的方法准确率得到提升。通过分析和对比实验可得出结论,利用GST和改进CNN的滚动轴承智能故障诊断方法能够在实际工程中更加简单方便地判断出故障类型及损伤程度,满足实际工程的需求。 展开更多
关键词 滚动轴承 广义S变换 卷积神经网络 EReLTanh
在线阅读 下载PDF
基于YOLOv5的倾斜视角下轻型红外小目标检测算法
4
作者 张飞 王剑 张岳松 《红外技术》 北大核心 2025年第2期217-225,共9页
针对倾斜视角下的红外行人小目标难以快速准确检测的问题,提出了一种红外行人小目标轻量化实时检测网络模型DRA-YOLO。首先,使用K-means++锚框聚类自适应不同大小尺度目标,从而加快网络收敛并提高检测精度。其次,融入不同注意力机制来... 针对倾斜视角下的红外行人小目标难以快速准确检测的问题,提出了一种红外行人小目标轻量化实时检测网络模型DRA-YOLO。首先,使用K-means++锚框聚类自适应不同大小尺度目标,从而加快网络收敛并提高检测精度。其次,融入不同注意力机制来重新设计特征提取网络,提高特征定位与计算效率,并搭配改进特征金字塔结构提取关键特征和提升模型稳定性。最后,颈部去掉下采样重新搭配SimAM形成新的特征融合结构,并重新设计检测头来适应本文数据集。对比实验显示,相对原始YOLOv5s模型,在自制和公共数据集上表现突出。m AP50达到94.5%,检测速度提高20.8%,模型大小压缩至10.1 MB,降低了30.3%,且GFLOPs下降了29.1%。这些改进实现了对目标的准确快速检测,有效地平衡了模型大小、检测精度和推理速度。 展开更多
关键词 图像处理 行人检测 红外场景 模型优化 YOLOv5算法
在线阅读 下载PDF
基于预训练模型软提示微调的无监督短语抽取方法 被引量:1
5
作者 龙彪 线岩团 +1 位作者 郭军军 黄于欣 《微电子学与计算机》 2025年第1期17-25,共9页
关键短语是文章中含有重要信息的词语或短语,能够概括文章的主题和主要内容。关键短语抽取则是信息检索和文本搜索领域的重要任务。目前主流的短语抽取方法是多段式的,其中第一阶段的候选短语选取对结果有较大的影响。由于预训练语言模... 关键短语是文章中含有重要信息的词语或短语,能够概括文章的主题和主要内容。关键短语抽取则是信息检索和文本搜索领域的重要任务。目前主流的短语抽取方法是多段式的,其中第一阶段的候选短语选取对结果有较大的影响。由于预训练语言模型没有专门针对短语抽取任务进行设计,所以单纯的通过嵌入比较无法准确衡量短语和文档之间的相关性。针对上述问题,提出了一种利用软提示微调进行无监督关键短语抽取的方法。首先,引入前缀向量对单词的噪声信息和语义信息进行建模,并通过线性变换对预训练模型的输出做进一步的特征提取。其次,通过KL散度加大单词在这两种信息上的差异化,使用方差损失防止模型出现坍缩。最后,以两种信息差异化的程度一步式确定单词的重要性得到关键短语。在Inspec和SemEval2017数据集上进行了模型有效性实验,结果表明,与现有方法比较,F1分数平均提升1%。 展开更多
关键词 短语抽取 软提示微调 一步式 信息分数差
在线阅读 下载PDF
基于知识图谱与门控机制的专家再学习推理问答方法
6
作者 房晓 王红斌 《应用科学学报》 北大核心 2025年第2期288-300,共13页
现有使用预训练语言模型和知识图谱的图神经网络问答的方法主要集中于构建知识图谱子图及推理过程的研究,这类方法忽略了问题上下文与知识图谱的语义差异,不能深层次挖掘文本表示形式与知识图谱表示形式的语义特征,且缺失两种表示形式... 现有使用预训练语言模型和知识图谱的图神经网络问答的方法主要集中于构建知识图谱子图及推理过程的研究,这类方法忽略了问题上下文与知识图谱的语义差异,不能深层次挖掘文本表示形式与知识图谱表示形式的语义特征,且缺失两种表示形式的知识源对答案预测贡献度不同的综合考虑。针对上述问题,本文提出了一种基于知识图谱与门控机制的专家再学习推理问答方法。该方法将问题上下文表示及推理后的知识图谱表示进行拼接融合,并将融合后的表示向量随机分配至专家网络中,再次学习问题上下文与知识图谱所关联的实体语义特征来挖掘深层隐含知识,并结合门控机制对问题上下文及推理后的知识图谱表示精准打分,通过动态调整两种表示形式的知识源对答案预测的贡献,提升答案预测精度。在CommonsenseQA数据集和OpenBookQA数据集上进行了实验,实验结果表明所提方法的准确率比QA-GNN方法分别提高了2.08%和1.23%。 展开更多
关键词 推理问答 知识图谱 图神经网络 门控机制 专家网络
在线阅读 下载PDF
前缀标签嵌入的参数高效微调与预测分数引导Mixup的文本分类方法
7
作者 庞宇宏 线岩团 +1 位作者 相艳 黄于欣 《微电子学与计算机》 2025年第2期31-38,共8页
文本分类旨在根据文本的特征,将其划分到一个或多个类别中。目前,在面对文本对抗攻击时,传统的深度学习模型和微调预训练语言模型往往面临着过拟合问题。由于训练数据的特定性,使得模型在处理与训练数据分布不同的对抗性样本时,无法充... 文本分类旨在根据文本的特征,将其划分到一个或多个类别中。目前,在面对文本对抗攻击时,传统的深度学习模型和微调预训练语言模型往往面临着过拟合问题。由于训练数据的特定性,使得模型在处理与训练数据分布不同的对抗性样本时,无法充分泛化,进而降低了模型在对抗性攻击场景中的鲁棒性。一些参数高效的微调方法采用轻量级的模型结构,由于相对较低的表达能力使得模型无法有效捕捉对抗性攻击的复杂特征,导致其鲁棒性差。此外,在模型分类过程中,无论是用于分类的特征向量还是起到引导作用的前缀向量,对分类结果的影响机制尚未得到清晰的认识导致模型的可解释性差。本文提出一个新的方法,将前缀标签嵌入与预训练语言模型融合,在分类层面引入标签与文本相似度的打分机制,通过预测分数引导下的Mixup,有效地挖掘与分类密切相关的特征,缓解过拟合问题,提升模型的鲁棒性。同时结合多头机制,使模型获得更加丰富的特征表达,提升模型可解释性。实验表明,该框架在保持参数高效微调前提下提高了针对4种不同类型的文本攻击的鲁棒性,同时保持了干净文本的可比准确性。 展开更多
关键词 文本分类 鲁棒性 预训练语言模型 前缀标签嵌入 Mixup数据增强 参数高效微调
在线阅读 下载PDF
基于图文鲁棒性表征的社交媒体多模态命名实体识别
8
作者 袁一铭 郭军军 余正涛 《微电子学与计算机》 2025年第2期50-58,共9页
多模态命名实体识别(Multimodal Named Entity Recognition,MNER)旨在融合视觉图像信息提高文本实体识别的性能。以往的MNER研究主要集中多模态融合方法上,然而,文本和其对应的图像可能不完全匹配,而图文对齐噪声通常不可避免,不相关的... 多模态命名实体识别(Multimodal Named Entity Recognition,MNER)旨在融合视觉图像信息提高文本实体识别的性能。以往的MNER研究主要集中多模态融合方法上,然而,文本和其对应的图像可能不完全匹配,而图文对齐噪声通常不可避免,不相关的图像区域可能会误导文本信息,导致模型性能下降。为此,本文提出了一种基于跨模态语义交互掩码模型(Cross-Modal Semantic Interaction Mask model,CMSIM)的噪声鲁棒MNER方法。该方法通过跨模态交互掩码机制构建文本-图像关系感知注意mask矩阵,并基于文本-图像交互掩码过滤视觉噪声信息并融合鲁棒图文特征,从而提升命名实体识别的性能。在两个公开数据集上测试结果表明,该模型能够提升MNER任务实体识别的准确率,证明了所提方法的有效性。 展开更多
关键词 多模态命名实体识别 模态表征 对齐噪声 双向交互 注意力机制
在线阅读 下载PDF
面向水运领域的汉泰噪声平行语料过滤方法
9
作者 陈锡 陈奥博 《中国水运》 2025年第6期57-58,140,共3页
近年来,随着科研工作者们不断的努力,目前神经机器翻译模型已经具备了很好的性能,极大地促进了不同国家水上运输过程中的信息交流。但是神经机器翻译模型成功的关键是,需要有大规模且高质量的平行语料作为训练集。显然,这种大规模的平... 近年来,随着科研工作者们不断的努力,目前神经机器翻译模型已经具备了很好的性能,极大地促进了不同国家水上运输过程中的信息交流。但是神经机器翻译模型成功的关键是,需要有大规模且高质量的平行语料作为训练集。显然,这种大规模的平行语料在英法、英德和中英等高资源语言对之间很容易获取,而在低资源语言对之间却很难获取到足够规模并且高质量的平行语料,因此在低资源语言对之间训练的神经机器翻译模型的性能不佳。文中主要设计了一个基于词嵌入的方法对噪声平行语料进行评分并过滤,还分别对比了其他几种方法,最后还分析了各种过滤方法对不同种类噪声的过滤效果以及不同分词器对最后训练结果的影响。 展开更多
关键词 水上运输 噪声 过滤 机器翻译
在线阅读 下载PDF
增强人工蜂群算法求解半导体最终测试调度问题 被引量:4
10
作者 吕阳 钱斌 +1 位作者 胡蓉 张梓琪 《电子学报》 EI CAS CSCD 北大核心 2021年第9期1708-1715,共8页
本文提出一种增强人工蜂群算法(Enhanced Artificial Bee Colony,EABC),用于最小化半导体最终测试调度问题(Semiconductor Final Testing Scheduling Problem,SFTSP)的最大完工时间.该算法采用混合启发式方法初始化种群,并利用前插式解... 本文提出一种增强人工蜂群算法(Enhanced Artificial Bee Colony,EABC),用于最小化半导体最终测试调度问题(Semiconductor Final Testing Scheduling Problem,SFTSP)的最大完工时间.该算法采用混合启发式方法初始化种群,并利用前插式解码策略来提高初始解的质量.在算法搜索阶段设计多种基于问题性质的探索策略和基于贝叶斯网络的概率模型对问题解空间进行深度与宽度的协同搜索.此外,提出基于重启策略的种群更新机制以加强算法跳出局部最优的能力.实验部分构造多种对比算法来验证EABC中各关键环节的有效性.通过基于实例的数值仿真以及与NFOA(Novel Fruit fly Optimization Algorithm)、KMEA(Knowledge-based Multi-agent Evolutionary Algorithm)和CCIWO(Cooperative Co-evolutionary Invasive Weed Optimization)的算法比较验证了EABC的有效性和鲁棒性. 展开更多
关键词 半导体最终测试 人工蜂群算法 启发式规则 贝叶斯网络 多策略融合 概率模型 排序模型
在线阅读 下载PDF
改进鲸鱼算法优化多微波源功率组合的微波加热系统温度均匀性研究
11
作者 杨彪 钱禹东 +4 位作者 石裕怡 韩泽民 黄宏彬 吴照刚 彭飞云 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第11期4367-4381,共15页
多微波源组合加热系统内电磁场、温度场的均匀性不仅影响物料的加热质量,而且影响物料加热的能源效率。本文研究了多源微波加热系统中各微波源的功率分配问题,应用鲸鱼优化算法,探索提升多微波源加热物料的温度均匀性的调控方法。将加... 多微波源组合加热系统内电磁场、温度场的均匀性不仅影响物料的加热质量,而且影响物料加热的能源效率。本文研究了多源微波加热系统中各微波源的功率分配问题,应用鲸鱼优化算法,探索提升多微波源加热物料的温度均匀性的调控方法。将加热系统中的多微波源的功率组合构建成一个鲸鱼种群的优化个体。设定微波总功率为约束条件并将物料温度均匀性作为目标函数,实现多微波源功率分配达到温度均匀分布的充分条件。对鲸鱼优化算法进行改进以提高搜索精度和收敛速度,提出实现微波源跟踪到对应分配功率的一个种群初始化迭代算法,从而实现温度均匀的目标。通过Matlab和COMSOL软件对模型进行联合仿真,结合算法的寻优迭代过程和模拟加热温度求解过程,验证了改进鲸鱼优化算法相较于各对比算法对温度均匀性有更好的效果。 展开更多
关键词 微波加热 鲸鱼优化算法 温度均匀性 多源微波功率 群体智能优化 多物理场联合仿真
在线阅读 下载PDF
融入上下文特征提取的非自回归神经机器翻译 被引量:2
12
作者 赵光耀 王剑 +1 位作者 高盛祥 余正涛 《陕西理工大学学报(自然科学版)》 2024年第3期44-51,83,共9页
非自回归翻译(NAT)模型是一种消除目标句子中的顺序依赖关系的翻译模型,在推理速度上取得了显著的突破。然而该模型在翻译质量方面存在一些局限,为探究原因,主要对注意机制进行了细致而全面的初步研究,研究结果揭示了NAT模型在捕捉局部... 非自回归翻译(NAT)模型是一种消除目标句子中的顺序依赖关系的翻译模型,在推理速度上取得了显著的突破。然而该模型在翻译质量方面存在一些局限,为探究原因,主要对注意机制进行了细致而全面的初步研究,研究结果揭示了NAT模型在捕捉局部性特征方面存在明显不足。为此提出了一种通过明确引入周围词汇信息而改进NAT模型局部性能力的方法。具体而言,在编码器和解码器两个方向上引入了混合分组线性变换,以获得更具局部感知性的表示。通过在WMT14英德与WMT16英罗两个数据集上进行实验,结果表明该方法以微弱的速度代价分别提高了0.7与1.03个BLEU分数,这表明该研究方法在改善NAT模型的局部性特征提取方面具有显著的效果和潜力。 展开更多
关键词 非自回归 局部性特征 混合分组线性变换 自回归
在线阅读 下载PDF
基于深度学习与域自适应的工件涡流热成像的缺陷检测 被引量:1
13
作者 张毅 范玉刚 《红外技术》 CSCD 北大核心 2024年第3期347-353,共7页
机械设备运行过程中,标记的故障样本量小,导致建立的模型故障诊断准确率低,为此本文提出一种结合深度学习与域自适应的工件涡流热成像的缺陷检测方法。首先将注意力机制引入深度残差网络ResNet50中,加强模型的特征提取能力;然后将源域... 机械设备运行过程中,标记的故障样本量小,导致建立的模型故障诊断准确率低,为此本文提出一种结合深度学习与域自适应的工件涡流热成像的缺陷检测方法。首先将注意力机制引入深度残差网络ResNet50中,加强模型的特征提取能力;然后将源域和目标域数据送入改进的ResNet50网络中提取深度特征,并且在网络的全连接层中引入局部最大均值差异,用于缩小两域特征间的分布差异,以此实现相关子域的分布对齐;最后在网络的Softmax分类器中实现对工件金属材料的缺陷检测。在公开的磁瓦数据集和本文实验采集的金属板涡流红外图像数据集上进行实验,结果表明,本文方法对涡流红外图像的裂纹缺陷检测识别准确率较高,通过t分布随机邻居嵌入方法对分析结果可视化,验证了本文方法的优越性。 展开更多
关键词 涡流热成像 深度残差网络 注意力机制 域自适应 局部最大均值差异
在线阅读 下载PDF
融合时频特征的多源无监督域自适应轴承故障诊断方法
14
作者 金怀平 刘志泳 +2 位作者 王彬 钱斌 刘海鹏 《振动与冲击》 EI CSCD 北大核心 2024年第13期12-24,共13页
无监督域自适应已成为多工况下轴承故障诊断的一种重要方法。然而,现有多源无监督域自适应方法往往忽略不同视角信号对于跨域故障诊断的贡献,不足以全面表达轴承的故障特征。此外,这些方法的不同源域对同一目标域的预测结果存在差异。为... 无监督域自适应已成为多工况下轴承故障诊断的一种重要方法。然而,现有多源无监督域自适应方法往往忽略不同视角信号对于跨域故障诊断的贡献,不足以全面表达轴承的故障特征。此外,这些方法的不同源域对同一目标域的预测结果存在差异。为此,提出一种融合时频特征的多源无监督域自适应(time-frequency features fused multi-source unsupervised domain adaptation,TFFMUDA)轴承故障诊断方法。该方法以时域和频域信号为输入,通过特征耦合机制实现两种故障特征的互补,并利用分类器对齐策略增强了不同源域对于同一目标域的诊断一致性。通过实际轴承故障案例的试验结果表明,所提方法相较于现有无监督域自适应轴承故障诊断方法能获得更清晰的故障类决策边界并具有更好的目标域诊断精度。 展开更多
关键词 轴承故障诊断 多源无监督域自适应 时频特征 特征融合 特征耦合
在线阅读 下载PDF
混合三维分布估计算法求解分布式加工装配和车辆配送集成调度问题
15
作者 杨绍文 钱斌 +1 位作者 胡蓉 张梓琪 《电子学报》 EI CAS CSCD 北大核心 2024年第3期909-923,共15页
本文针对一类广泛存在的分布式加工装配和车辆配送集成调度问题(Integrated Scheduling Problem of Distributed Production Assembly and Vehicle Delivery,ISP_DPAVD),以最小化运输和延迟惩罚总成本为优化目标,提出一种混合三维分布... 本文针对一类广泛存在的分布式加工装配和车辆配送集成调度问题(Integrated Scheduling Problem of Distributed Production Assembly and Vehicle Delivery,ISP_DPAVD),以最小化运输和延迟惩罚总成本为优化目标,提出一种混合三维分布估计算法(Hybrid three-Dimensional Estimation of Distribution Algorithm,H3DEDA)进行求解.ISP_DPAVD包含两个耦合的子问题,即加工装配阶段子问题(子问题1)和车辆配送阶段子问题(子问题2).由于每个子问题1的解(部分解1)均会确定1个具体的子问题2,故ISP_DPAVD的解空间非常庞大.根据这一特点,在H3DEDA中,先设计结合邻域变换的启发式规则来快速获取子问题2的优良解,以实现子问题间的部分解耦并明显缩减搜索空间,再设计三维EDA引导的全局搜索和变邻域驱动的局部搜索来获取ISP_DPAVD的高质量解.通过在不同规模测试问题上的仿真实验和算法比较,验证了H3DEDA求解ISP_DPAVD的有效性. 展开更多
关键词 分布式加工装配流水车间 车辆配送 集成调度 三维分布估计算法 变邻域搜索
在线阅读 下载PDF
基于伪触发词的并行预测篇章级事件抽取方法
16
作者 秦海涛 线岩团 +1 位作者 相艳 黄于欣 《电子技术应用》 2024年第4期67-74,共8页
篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的... 篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件。针对以上问题提出一种多任务联合的并行预测事件抽取框架。首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能。最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%。 展开更多
关键词 篇章级事件抽取 多任务联合 预训练语言模型 结构化自注意力机制 并行预测
在线阅读 下载PDF
融合图文预训练的汉越多模态神经机器翻译
17
作者 韦浩翔 高盛祥 +1 位作者 余正涛 王晓聪 《电子技术应用》 2024年第12期48-54,共7页
由于汉语和越南语之间存在显著的语法差异及语料稀缺,汉越神经机器翻译任务面临名词翻译不准确的挑战。提出了一种新颖的多模态神经机器翻译方法,该方法融合了文本预训练模型和视觉语言联合预训练模型。通过文本预训练模型,能够捕获深... 由于汉语和越南语之间存在显著的语法差异及语料稀缺,汉越神经机器翻译任务面临名词翻译不准确的挑战。提出了一种新颖的多模态神经机器翻译方法,该方法融合了文本预训练模型和视觉语言联合预训练模型。通过文本预训练模型,能够捕获深层的语言结构和语义;而视觉语言联合训练模型则提供了与文本相关联的视觉上下文,这有助于模型更准确地理解和翻译名词。两种模型通过一个简洁高效的映射网络结合,并通过Gumbel门控模块动态地整合多模态信息,以优化翻译输出。在汉越及越汉翻译任务中,该方法相比传统Transformer模型分别提升了7.13和4.27的BLEU值。 展开更多
关键词 汉越神经机器翻译 视觉-语言联合预训练 多模态 注意力
在线阅读 下载PDF
联合con-GRU与ATGAT模型的情感分析三元组方法
18
作者 毕晓杰 李卫疆 《现代电子技术》 北大核心 2024年第8期149-154,共6页
情感分析三元组任务是情感分析任务的研究热点,其目的在于将方面词、情感词与情感极性组成三元组。图神经网络是提取句子特征的有效手段,但其无法关注节点与节点之间的关系,并且注意力权重赋予不合理。为此,提出一种联合双向对抗GRU与... 情感分析三元组任务是情感分析任务的研究热点,其目的在于将方面词、情感词与情感极性组成三元组。图神经网络是提取句子特征的有效手段,但其无法关注节点与节点之间的关系,并且注意力权重赋予不合理。为此,提出一种联合双向对抗GRU与基于句法注意力机制的GAT模型。利用依存句法树的句子向量和ATGAT模型提取句子情感词,并将句子用syn-str更新向量表示;再融合句法结构的向量,通过双向对抗GRU提取特征进行情感判断。在三个公开英文数据集中开展实验,结果表明,所提模型相对其他基线模型具有更优异的性能。消融实验和对比实验也说明,所提出的各个网络模型组件比其他组件能更有效地将句法信息与原句向量融合。 展开更多
关键词 情感分析 三元组 双向对抗GRU GAT模型 句法注意力机制 依存句法树 特征提取
在线阅读 下载PDF
基于要素关联图的汉越跨语言事件检索方法
19
作者 赵周颖 余正涛 +2 位作者 黄于欣 陈瑞清 朱恩昌 《现代电子技术》 北大核心 2024年第7期127-132,共6页
汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪... 汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪声文本,现有的模型不能很好地捕获事件匹配特征,匹配效果欠佳。基于此,文中提出基于要素关联图的汉越跨语言事件检索方法。首先,预训练一个汉越双语词嵌入来解决跨语言问题;然后,抽取查询文档中的关键信息(关键词和实体)以构建要素关联图;最后,通过引入一个图编码器对构建的要素图进行编码,生成结构化的事件信息来增强传统的事件检索模型。实验结果表明文中提出的方法优于传统的基线方法。 展开更多
关键词 跨语言事件检索 跨语言词嵌入 要素关联图 图神经网络 文本匹配 事件检索
在线阅读 下载PDF
基于句法结构特征的汉越神经机器翻译
20
作者 裴非非 杨舰 《信息技术》 2024年第2期15-21,共7页
在低资源神经机器翻译中,长句译文质量普遍不佳,而汉-越语言差异较大,是典型的资源匮乏型语种,对于长句的处理应尽可能保持句子语义信息不变。因此,提出一种基于句法结构特征处理长句的方法。首先,对原有语料库中长句进行句法树解析,然... 在低资源神经机器翻译中,长句译文质量普遍不佳,而汉-越语言差异较大,是典型的资源匮乏型语种,对于长句的处理应尽可能保持句子语义信息不变。因此,提出一种基于句法结构特征处理长句的方法。首先,对原有语料库中长句进行句法树解析,然后,根据句法解析树提取短句和对远离根节点的叶子节点词进行标记,最后,对提取的短句进行反向翻译生成伪平行数据作为扩充,对原有长句中标记词进行与该词语义相近词的加权组合替换训练。实验表明,该方法提高了模型性能,显著改善了长句译文质量。 展开更多
关键词 低资源神经机器翻译 长句译文 汉-越语言 语义信息 句法结构特征
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部