期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
利用单语数据改进神经机器翻译压缩模型的翻译质量 被引量:11
1
作者 李响 刘洋 +1 位作者 陈伟 刘群 《中文信息学报》 CSCD 北大核心 2019年第7期46-55,共10页
该文提出利用一个大型且精度高的神经机器翻译模型(教师模型)从单语数据中提取隐性双语知识,从而改进小型且精度低的神经机器翻译模型(学生模型)的翻译质量。该文首先提出了'伪双语数据'的教学方法,利用教师模型翻译单语数据获... 该文提出利用一个大型且精度高的神经机器翻译模型(教师模型)从单语数据中提取隐性双语知识,从而改进小型且精度低的神经机器翻译模型(学生模型)的翻译质量。该文首先提出了'伪双语数据'的教学方法,利用教师模型翻译单语数据获得的合成双语数据改进学生模型,然后提出了'负对数似然—知识蒸馏联合优化'教学方法,除了利用合成双语数据,还利用教师模型获得的目标语言词语概率分布作为知识,从而在知识蒸馏框架下提高学生模型的翻译质量。实验证明,在中英和德英翻译任务上,使用该方法训练的学生模型不仅在领域内测试集上显著超过了基线学生模型,而且在领域外测试集上的泛化性能也得到了提高。 展开更多
关键词 神经机器翻译 知识蒸馏 单语数据
在线阅读 下载PDF
基于用户回答顺序的社区问答答案质量预测研究 被引量:6
2
作者 徐安滢 吉宗诚 王斌 《中文信息学报》 CSCD 北大核心 2017年第2期132-138,共7页
近年来,随着互联网的普及和知识爆炸性的增长,社区问答网站积累了大量的用户和内容,同时也产生了大量的低质量文本,极大地影响了用户检索满意答案的效率,因此如何提升答案质量预测的性能十分重要。目前,社区问答答案质量预测方面的研究... 近年来,随着互联网的普及和知识爆炸性的增长,社区问答网站积累了大量的用户和内容,同时也产生了大量的低质量文本,极大地影响了用户检索满意答案的效率,因此如何提升答案质量预测的性能十分重要。目前,社区问答答案质量预测方面的研究大都是使用点方式(pointwise)来实现分类模型,但由于问题的难度不同,对答案的要求也有所差异,使用点方式会忽略掉部分答案的特点,所以该文使用点对方式(pairwise)来预测答案质量。另外,已有的研究工作表明,社区问答中同一问题下的答案数量特征对答案质量预测没有效果,甚至有冗余作用。对于时间差也有相同的结论,即不能提升预测性能。该文提出了一种将上述两者结合在一起的新特征,实验结果表明,该特征能显著提高社区问答答案质量预测的性能。 展开更多
关键词 答案质量预测 排序学习 社区问答 回答顺序
在线阅读 下载PDF
基于生成对抗网络的模仿学习综述 被引量:24
3
作者 林嘉豪 章宗长 +1 位作者 姜冲 郝建业 《计算机学报》 EI CSCD 北大核心 2020年第2期326-351,共26页
模仿学习研究如何从专家的决策数据中进行学习,以得到接近专家水准的决策模型.同样学习如何决策的强化学习往往只根据环境的评价式反馈进行学习,与之相比,模仿学习能从决策数据中获得更为直接的反馈.它可以分为行为克隆、基于逆向强化... 模仿学习研究如何从专家的决策数据中进行学习,以得到接近专家水准的决策模型.同样学习如何决策的强化学习往往只根据环境的评价式反馈进行学习,与之相比,模仿学习能从决策数据中获得更为直接的反馈.它可以分为行为克隆、基于逆向强化学习的模仿学习两类方法.基于逆向强化学习的模仿学习把模仿学习的过程分解成逆向强化学习和强化学习两个子过程,并反复迭代.逆向强化学习用于推导符合专家决策数据的奖赏函数,而强化学习基于该奖赏函数来学习策略.基于生成对抗网络的模仿学习方法从基于逆向强化学习的模仿学习发展而来,其中最早出现且最具代表性的是生成对抗模仿学习方法(Generative Adversarial Imitation Learning,简称GAIL).生成对抗网络由两个相对抗的神经网络构成,分别为判别器和生成器.GAIL的特点是用生成对抗网络框架求解模仿学习问题,其中,判别器的训练过程可类比奖赏函数的学习过程,生成器的训练过程可类比策略的学习过程.与传统模仿学习方法相比,GAIL具有更好的鲁棒性、表征能力和计算效率.因此,它能够处理复杂的大规模问题,并可拓展到实际应用中.然而,GAIL存在着模态崩塌、环境交互样本利用效率低等问题.最近,新的研究工作利用生成对抗网络技术和强化学习技术等分别对这些问题进行改进,并在观察机制、多智能体系统等方面对GAIL进行了拓展.本文先介绍了GAIL的主要思想及其优缺点,然后对GAIL的改进算法进行了归类、分析和对比,最后总结全文并探讨了可能的未来趋势. 展开更多
关键词 模仿学习 基于生成对抗网络的模仿学习 生成对抗模仿学习 模态崩塌 样本利用效率
在线阅读 下载PDF
带有故障性质预测的自动测试向量求解模型
4
作者 贺丽媛 黄俊华 陶继平 《电子学报》 EI CAS CSCD 北大核心 2023年第12期3540-3548,共9页
基于布尔满足模型的自动测试向量生成是芯片故障检测的关键环节,相应布尔问题的求解已然成为整个故障检测过程的效率瓶颈.本文研究了主流自动测试向量求解框架中不同算子对求解效率的影响,在保证测试向量求解流程完备性的同时引入基于... 基于布尔满足模型的自动测试向量生成是芯片故障检测的关键环节,相应布尔问题的求解已然成为整个故障检测过程的效率瓶颈.本文研究了主流自动测试向量求解框架中不同算子对求解效率的影响,在保证测试向量求解流程完备性的同时引入基于深度学习的故障分析机制,并将分析结果用于算子的自动选择和初始求解状态的确定,旨在优化整体求解进程.针对因真实电路故障数据不足导致模型学习效果欠佳的问题,本文利用生成对抗网络实现数据增广,结合多层图卷积神经网络促进高效表征学习,从而提高故障性质的预测精度.在若干真实电路上的实验结果表明,本文所提出的新框架与原有框架相比,平均求解效率提升近20%. 展开更多
关键词 自动测试向量生成 图神经网络 生成对抗网络 数据增广 算子选择
在线阅读 下载PDF
用于二值神经网络的加宽和收缩机制
5
作者 韩凯 刘传建 吴恩华 《软件学报》 2025年第10期4880-4892,共13页
二值神经网络(binary neural network,BNN)因其较少的计算和存储开销而对业界非常有吸引力,但其准确率仍然比全精度参数的网络差.大多数现有方法旨在通过利用更有效的训练技术来提高二值神经网络的性能.然而,通过实验发现量化后特征的... 二值神经网络(binary neural network,BNN)因其较少的计算和存储开销而对业界非常有吸引力,但其准确率仍然比全精度参数的网络差.大多数现有方法旨在通过利用更有效的训练技术来提高二值神经网络的性能.然而,通过实验发现量化后特征的表示能力远弱于全精度的特征.因此,提出一种加宽和收缩机制来构建高精度而紧凑的二值神经网络.首先,通过将原始全精度网络中的特征投影到高维量化特征来解决量化特征表示能力弱的问题.同时,冗余的量化特征将被消除,以避免某些特征维度的过度增长.进而建立一个紧凑但具有足够表示能力的量化神经网络.基准数据集上的实验结果表明,该方法能够以更少的参数量和计算量建立高精度二值神经网络,其准确率与全精度基线模型几乎相同,例如,二值量化的ResNet-18在ImageNet数据集上达到了70%的准确率. 展开更多
关键词 神经网络 模型量化 图像分类 目标检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部