期刊文献+
共找到245篇文章
< 1 2 13 >
每页显示 20 50 100
Optimal training sequences for MIMO systems under correlated fading
1
作者 Pang Jiyong Li Jiandong Lu Zhuo Zhao Linjing Chen Liang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第1期33-38,共6页
The optimal design of training sequences for channel estimation in multiple-input multiple-output (MIMO) systems under spatially correlated fading is considered. The channel is assumed to be a block-fading model wit... The optimal design of training sequences for channel estimation in multiple-input multiple-output (MIMO) systems under spatially correlated fading is considered. The channel is assumed to be a block-fading model with spatial correlation known at both the transmitter and the receiver. To minimize the channel estimation error, optimal training sequences are designed to exploit full information of the spatial correlation under the criterion of minimum mean square error (MMSE). It is investigated that the spatial correlation is helpful to decrease the estimation error and the proposed training sequences have good performance via simulations. 展开更多
关键词 MIMO channel estimation training sequences spatial correlation minimum mean square error
在线阅读 下载PDF
城市轨道交通信号系统测试序列自动生成方法研究 被引量:1
2
作者 张锐 司鑫悦 王成志 《都市快轨交通》 北大核心 2025年第2期140-146,共7页
针对目前国内城市轨道交通信号系统现场工程验收测试方法单一、周期长、效率低、成本高、任务重和工作量大等问题,研究一种适用于现场工程验收测试序列自动生成的方法。首先分析城轨信号系统互联互通测试案例集约束条件,将线路划分成若... 针对目前国内城市轨道交通信号系统现场工程验收测试方法单一、周期长、效率低、成本高、任务重和工作量大等问题,研究一种适用于现场工程验收测试序列自动生成的方法。首先分析城轨信号系统互联互通测试案例集约束条件,将线路划分成若干独立测试区段;其次将线路特征量转化为计算机能够识别的形式化语言,提高编辑效率和人机交互体验;然后应用辅助生成工具自动生成若干条现场可执行的工程验收测试序列;最后选取真实线路作为测试对象,验证工程验收测试效率。研究表明:相较于传统的人工设计测试序列的方法,通过形式化语言设计的测试序列,满足工程验收要求,覆盖互联互通测试案例,能够缩短现场测试时间,提高测试效率。 展开更多
关键词 城市轨道交通 信号系统 CBTC 互联互通 工程测试 形式化语言 测试顺序
在线阅读 下载PDF
基于多输入辅助分支训练的太阳能网版表面缺陷检测
3
作者 吉训生 马佩珏 《计算机工程与应用》 北大核心 2025年第15期258-268,共11页
针对太阳能网版表面缺陷检测存在目标小、类别数量不均衡和类别目标长宽比失衡问题,提出一种改进的GELAN-C的缺陷检测模型。增加多输入辅助分支和自主学习隐藏相关性融合模块,降低梯度传递深度,改善小目标检测能力。引入DBB重参数化模... 针对太阳能网版表面缺陷检测存在目标小、类别数量不均衡和类别目标长宽比失衡问题,提出一种改进的GELAN-C的缺陷检测模型。增加多输入辅助分支和自主学习隐藏相关性融合模块,降低梯度传递深度,改善小目标检测能力。引入DBB重参数化模块构成多分支解耦头,增强末端特征图表达能力,提升类别数量少的样本检测精度。通过ShapeIoU损失函数提高长宽比失衡目标的拟合度。实验结果表明,改进的GELAN-C大小两种模型mAP50和mAP50-95分别为79.0%、50.4%、78.5%、50.2%,最终分别提升4.2、4.5、4.4、6.2个百分点,而参数量和计算量没有增加,实现了太阳能网版表面缺陷的实时高精度检测。 展开更多
关键词 GELAN-C 辅助训练 重参数化 隐式相关性 ShapeIoU
在线阅读 下载PDF
代际差异视角下政府培训对进城务工人员幸福感的影响
4
作者 宁可 龚兴豪 朱哲毅 《人口与发展》 北大核心 2025年第2期16-26,共11页
进城务工人员幸福感普遍较低,政府培训被视为提升其生活质量的重要手段。研究深入探讨了政府培训对进城务工人员幸福感的影响与机制,并考察老一代和新生代之间的代际差异。在理论分析作用机制的基础上,利用2016年和2018年中国劳动力动... 进城务工人员幸福感普遍较低,政府培训被视为提升其生活质量的重要手段。研究深入探讨了政府培训对进城务工人员幸福感的影响与机制,并考察老一代和新生代之间的代际差异。在理论分析作用机制的基础上,利用2016年和2018年中国劳动力动态调查数据,用倾向得分匹配法进行了实证分析。研究表明,政府培训显著提高了进城务工人员幸福感,但作用机制存在代际差异。对于老一代进城务工人员,政府培训通过提升技能广度增强幸福感,体现在工作时间减少、加班频率降低,以及生活自由度、社会层级认知和工作尊重感提升。对于新生代务工人员,政府培训通过提升技能深度增强幸福感,表现在收入增加、正规就业机会增多及生活自由度和工作尊重感提升。 展开更多
关键词 幸福感 政府培训 进城务工人员 代际差异 显性和隐性收益
在线阅读 下载PDF
高原铁路列车运行图与维修天窗协调优化研究 被引量:1
5
作者 邓智文 刘斌 +2 位作者 田志强 董傲冉 李和壁 《深圳大学学报(理工版)》 北大核心 2025年第2期216-225,共10页
针对高原铁路列车运行图与维修天窗之间的冲突问题,对高原铁路列车运行图与维修天窗进行协调优化.综合考虑列车服务水平约束、列车运行约束、列车运行图均衡性约束及维修天窗时间约束,建立列车总旅行时间最小和维修天窗开设总时长最大... 针对高原铁路列车运行图与维修天窗之间的冲突问题,对高原铁路列车运行图与维修天窗进行协调优化.综合考虑列车服务水平约束、列车运行约束、列车运行图均衡性约束及维修天窗时间约束,建立列车总旅行时间最小和维修天窗开设总时长最大的多目标混合整数规划模型.设计基于分层序列的多目标求解算法,运用Python编程调用杉数求解器(Cardinal optimizer,COPT)求解模型,并以高原铁路某区段为案例,验证模型有效性.结果表明,在考虑列车服务水平和列车运行图均衡性等约束前提下,本模型能够兼顾列车总旅行时间最短和维修天窗开设时长最长.基于最优解绘制的列车运行图表明,列车运行图和维修天窗的协调优化结果更符合高原铁路实际旅客运输生产作业需要.研究结果为铁路运营管理部门进一步优化列车运行图编制与维修天窗开设提供科学依据. 展开更多
关键词 高原铁路 列车运行图 维修天窗 列车运行约束 均衡性 混合整数规划 分层序列法 COPT求解器
在线阅读 下载PDF
基于预训练的符号化音乐生成
6
作者 洪予晨 李金龙 《计算机应用》 北大核心 2025年第2期578-583,共6页
为解决音乐表征学习领域缺少充足成对多轨乐谱数据集的问题,提出一种音乐生成的预训练模型。首先,基于多轨音乐的生成需要保证单轨内的连续性的同时保证轨道间的和谐性的事实,提出基于Transformers的多生成器的生成模型,即基于预训练的... 为解决音乐表征学习领域缺少充足成对多轨乐谱数据集的问题,提出一种音乐生成的预训练模型。首先,基于多轨音乐的生成需要保证单轨内的连续性的同时保证轨道间的和谐性的事实,提出基于Transformers的多生成器的生成模型,即基于预训练的多轨音乐生成网络(MMGPNet)作为基线模型;其次,为利用充足的单轨乐器数据集,在生成模型上设计音乐预训练模块;最后,在预训练过程中设计一个重建任务遮盖音乐符号的属性并对它们进行重建。实验结果表明,所提模型加速了模型训练,并提高了预测准确率,且该模型生成的多轨序列在多种音乐领域的评价指标相较于MuseGAN(Multi-track sequential Generative Adversarial Network)、SymphonyNet等基线模型更接近真实音乐。听力测试结果进一步验证了所提模型的有效性。 展开更多
关键词 音乐生成 多轨音乐 序列模型 预训练模型 音乐序列表示
在线阅读 下载PDF
CONVERGENCE OF IMPLICIT ITERATIVE PROCESS WITH ERRORS FOR A FINITE FAMILY OF ASYMPTOTICALLY NONEXPANSIVE MAPPINGS 被引量:5
7
作者 谷峰 《数学物理学报(A辑)》 CSCD 北大核心 2006年第B12期1131-1143,共13页
The purpose of this article is to study the weak and strong convergence of implicit iteration process with errors to a common fixed point for a finite family of asymptotically nonexpansive mappings and nonexpansive ma... The purpose of this article is to study the weak and strong convergence of implicit iteration process with errors to a common fixed point for a finite family of asymptotically nonexpansive mappings and nonexpansive mappings in Banach spaces. The results presented in this article extend and improve the corresponding results of [1, 2, 4-9, 11-15]. 展开更多
关键词 渐近不放大映射 不放大映射 迭代序列 巴纳赫空间
在线阅读 下载PDF
基于生成对抗Transformer的电力负荷数据异常检测 被引量:11
8
作者 陆旦宏 范文尧 +3 位作者 杨婷 倪敏珏 李思琦 朱晓 《电力工程技术》 北大核心 2024年第1期157-164,共8页
电力负荷异常数据将给电力系统规划、负荷预测以及用能分析等带来较大的负面影响,因此亟须对负荷数据异常进行检测与识别。首先,针对电力负荷数据异常分类、原因及其特征开展分析。其次,改进传统Transformer编码器结构,采用多头注意力... 电力负荷异常数据将给电力系统规划、负荷预测以及用能分析等带来较大的负面影响,因此亟须对负荷数据异常进行检测与识别。首先,针对电力负荷数据异常分类、原因及其特征开展分析。其次,改进传统Transformer编码器结构,采用多头注意力层代替掩码多头注意力层,同时移除前馈网络,以提高模型对负荷时序序列的全局注意力。基于生成对抗网络(generative adversarial networks,GAN)生成器与判别器的博弈结构,提出一种改进的GAN-Transformer模型,以更好地捕捉趋势性特征并加速模型收敛。然后,引入多阶段映射与训练方法,综合焦点分数打分机制,通过分阶段负荷序列重构帮助模型更好地提取负荷数据异常特征。最后,算例分析结果表明,GAN-Transformer模型在负荷数据异常检测精确率、召回率、F_(1)值以及训练时间方面均具有更优的性能,验证了所提方法的有效性和优越性。文中研究工作为基于深度学习进一步实现电力负荷数据异常分类与数据修复提供了有益参考。 展开更多
关键词 电力负荷数据 数据异常检测 生成对抗网络(GAN)-Transformer 多阶段训练与映射 焦点分数 序列重构
在线阅读 下载PDF
联合训练下融合编解码器的序列推荐算法
9
作者 杨兴耀 党子博 +3 位作者 于炯 陈嘉颖 常梦雪 许凤 《计算机工程与设计》 北大核心 2024年第11期3289-3295,共7页
现有基于Transformer的推荐算法通常仅考虑使用编码器来进行推荐预测,缺乏利用解码器去“解码”用户行为序列的能力,不能较为准确预测用户下一次的交互行为。为解决此问题,基于阿里巴巴电子商务推荐的行为序列模型(BST)提出联合训练下... 现有基于Transformer的推荐算法通常仅考虑使用编码器来进行推荐预测,缺乏利用解码器去“解码”用户行为序列的能力,不能较为准确预测用户下一次的交互行为。为解决此问题,基于阿里巴巴电子商务推荐的行为序列模型(BST)提出联合训练下融合编解码器的序列推荐算法模型BSTEAD。通过采用联合训练机制,设置Transformer预测任务和BST预测任务。将两条预测任务的损失进行加权求和,得到最终的损失函数。在MovieLens和Goodbooks两个公共数据集上的实验结果表明,BSTEAD推荐算法与5个对比模型相比性能具有显著提升,验证了联合训练机制下解码器对推荐任务的有效性。 展开更多
关键词 用户序列 注意力机制 编码器 解码器 联合训练 序列推荐 推荐算法
在线阅读 下载PDF
基于跨模态引导和对齐的多模态预训练方法
10
作者 才华 易亚希 +2 位作者 付强 冉越 孙俊喜 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3368-3381,共14页
现有的视觉语言多模态预训练方法仅在图像和文本的全局语义上进行特征对齐,对模态间细粒度特征交互的探索不足.针对这一问题,本文提出了一种基于跨模态引导和对齐的多模态预训练方法.该方法在模态特征提取阶段,采用基于视觉序列压缩的... 现有的视觉语言多模态预训练方法仅在图像和文本的全局语义上进行特征对齐,对模态间细粒度特征交互的探索不足.针对这一问题,本文提出了一种基于跨模态引导和对齐的多模态预训练方法.该方法在模态特征提取阶段,采用基于视觉序列压缩的双流特征提取网络,在视觉编码器中联合图像和文本信息逐层引导视觉序列压缩,缓解与文本无关的冗余视觉信息对模态间细粒度交互的干扰;在模态特征对齐阶段,对图像和文本特征进行细粒度关系推理,实现视觉标记与文本标记的局部特征对齐,增强对模态间细粒度对齐关系的理解.实验结果表明,本文方法能够更好地对齐视觉文本的细粒度特征,在图文检索任务中,微调后的图像检索和文本检索的平均召回率分别达到了86.4%和94.88%,且零样本图文检索的整体指标相较于经典图文检索算法CLIP(Contrastive Language-Image Pre-training)提升了5.36%,在视觉问答等分类任务中,准确率也优于目前主流多模态预训练方法. 展开更多
关键词 多模态预训练 跨模态引导 视觉序列压缩 双流特征提取 细粒度关系推理 局部特征对齐
在线阅读 下载PDF
基于工况序列寻优的列车节能操纵策略优化 被引量:7
11
作者 赵东升 赵鹏 +2 位作者 姚向明 杨中平 张伯男 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期157-165,共9页
传统“三阶段”“四阶段”工况序列的列车操纵模式难以满足城市轨道交通复杂线路条件下的列车节能运行需求,本文提出一种基于工况序列寻优的列车节能操纵策略优化方法。将物理区间离散为多个等距离子区间,建立工况序列与子区间之间的映... 传统“三阶段”“四阶段”工况序列的列车操纵模式难以满足城市轨道交通复杂线路条件下的列车节能运行需求,本文提出一种基于工况序列寻优的列车节能操纵策略优化方法。将物理区间离散为多个等距离子区间,建立工况序列与子区间之间的映射关系,以区间总牵引能耗和运行时间最小化为目标构建列车节能操纵策略多目标优化模型。为提高模型求解效率,改进非支配排序遗传算法的交叉算子和距离算子,通过离散仿真求解列车节能操纵策略集。以福州地铁1号线的两个典型区间为对象进行案例分析,结果表明,相比传统操纵模式,优化后列车牵引能耗平均降低约19%。本文方法通过合理选择算法参数能够有效构建适应不同线路条件的运行工况序列,生成秒级运行时间划分下的列车节能操纵策略集。 展开更多
关键词 城市交通 列车节能操纵 多目标优化 运行工况序列 复杂运行环境
在线阅读 下载PDF
融入时间信息的预训练序列推荐方法 被引量:1
12
作者 陈稳中 陈红梅 +1 位作者 周丽华 方圆 《计算机科学》 CSCD 北大核心 2024年第5期45-53,共9页
序列推荐旨在根据用户与项目的历史交互序列,学习用户动态偏好,为用户推荐后续可能感兴趣的项目。基于预训练模型在适应下游任务方面具有优势,预训练机制在序列推荐中备受关注。现有序列推荐预训练方法忽略了现实中时间对用户交互行为... 序列推荐旨在根据用户与项目的历史交互序列,学习用户动态偏好,为用户推荐后续可能感兴趣的项目。基于预训练模型在适应下游任务方面具有优势,预训练机制在序列推荐中备受关注。现有序列推荐预训练方法忽略了现实中时间对用户交互行为的影响,为了更好地捕获用户与项目交互的时间语义,提出了融入时间信息的预训练序列推荐模型TPTS-Rec(Time-aware Pre-Training method for Sequence Recommendation)。首先,在嵌入层引入时间嵌入矩阵以获取用户交互项目与时间的关联信息。然后,在自注意力层采用同一时间点采样的方法以学习项目间的时间关联信息。最后,在微调阶段从时间维度扩增用户交互序列长度以缓解数据稀疏性问题。在真实数据集上的对比实验结果表明,与基线模型相比,所提模型TPTS-Rec的推荐效果有显著提升。 展开更多
关键词 序列推荐 预训练 自监督学习 互信息最大化 时间属性
在线阅读 下载PDF
基于高斯似然的精准水声信道估计 被引量:1
13
作者 杨光 乔培玥 +3 位作者 梁俊燕 秦正昌 巩小东 倪秀辉 《系统工程与电子技术》 EI CSCD 北大核心 2024年第1期334-344,共11页
针对时变水声信道的多途干扰问题,提出基于高斯似然(Gaussian likelihood,GL)的精准水声信道估计算法。GL算法将相邻信道短块的高斯概率密度函数相乘,乘积仍然服从高斯分布,且方差变小,从而进一步提高信道估计的准确性;采用叠加训练(sup... 针对时变水声信道的多途干扰问题,提出基于高斯似然(Gaussian likelihood,GL)的精准水声信道估计算法。GL算法将相邻信道短块的高斯概率密度函数相乘,乘积仍然服从高斯分布,且方差变小,从而进一步提高信道估计的准确性;采用叠加训练(superimposed training,ST)方案,将训练序列和符号序列线性叠加,使训练序列持续传输,实现对信道的实时跟踪。将ST方案、GL算法和Turbo均衡以迭代的方式相结合,估计出的符号序列作为虚拟训练序列,进一步提高时变水声信道的估计和跟踪性能。通过多次迭代计算,实现时变水声信道的精准估计和实时跟踪。最后,通过计算机仿真以及胶州湾收发节点水平距离500 m和5.5 km的海上运动实装试验,验证了所提算法的有效性。 展开更多
关键词 时变水声信道 高斯似然 叠加训练方案 虚拟训练序列
在线阅读 下载PDF
基于API序列和预训练模型的恶意软件检测 被引量:1
14
作者 窦建民 师智斌 +2 位作者 于孟洋 霍帅 张舒娟 《计算机工程与设计》 北大核心 2024年第4期974-981,共8页
针对现有方法存在特征表达受限、无法捕获API序列全局语义信息,且恶意软件数据集通常包含大量无标注数据,无法直接进行有监督学习等问题,利用自然语言预训练模型技术,提出一种基于API调用序列和预训练模型的恶意软件检测方法。使用原始... 针对现有方法存在特征表达受限、无法捕获API序列全局语义信息,且恶意软件数据集通常包含大量无标注数据,无法直接进行有监督学习等问题,利用自然语言预训练模型技术,提出一种基于API调用序列和预训练模型的恶意软件检测方法。使用原始API序列构建分词器;基于BERT模型构建出动态掩码序列模型进行无监督学习的预训练,同时获取API序列的全局动态编码表示;使用该编码构造检测模型。实验结果表明,所提方法能有效检测出恶意软件。 展开更多
关键词 恶意软件检测 预训练模型 无监督学习 动态掩码 软件调用序列 模型微调 编码表示
在线阅读 下载PDF
内隐序列学习远迁移的促进与限制因素
15
作者 戴惠 疏德明 刘电芝 《心理学探新》 CSSCI 北大核心 2024年第3期201-208,共8页
内隐序列学习的近迁移已得到证实,但内隐序列学习的远迁移能否发生及影响因素尚不明确。采用内隐序列学习经典范式,通过一阶规则、刺激呈现方式以及按键反应的同时改变设置远迁移条件,同时关注测量指标敏感性和反应刺激间隔(RSI)等影响... 内隐序列学习的近迁移已得到证实,但内隐序列学习的远迁移能否发生及影响因素尚不明确。采用内隐序列学习经典范式,通过一阶规则、刺激呈现方式以及按键反应的同时改变设置远迁移条件,同时关注测量指标敏感性和反应刺激间隔(RSI)等影响因素,以考察内隐序列学习远迁移的促进与限制因素。研究发现:(1)只有在750 ms和1000 ms较长的RSI时,才能产生更好的内隐学习和远迁移效果。(2)远迁移的产生得益于有效的内隐学习,但有效的内隐学习并不一定能产生远迁移;新异组段对内隐学习的远迁移有促进作用,但存在一定的条件限制。(3)对早期研究提出的内隐学习内在机制的强限定性提出挑战,为证实内隐学习具有超限定性提供了可能。 展开更多
关键词 内隐序列学习 远迁移 反应刺激间隔(RSI) 边缘意识
在线阅读 下载PDF
语义角色标注增强的隐式篇章关系识别
16
作者 吴一珩 李军辉 朱慕华 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期1005-1015,共11页
[目的]为了改善因将隐式篇章关系识别(implicit discourse relation recognition,IDRR)描述为文本分类任务,提出了一种新颖的IDRR方法.[方法]将IDRR视为文本生成任务并直接生成篇章单元对的连接词,随后生成的连接词被准确无歧义地映射... [目的]为了改善因将隐式篇章关系识别(implicit discourse relation recognition,IDRR)描述为文本分类任务,提出了一种新颖的IDRR方法.[方法]将IDRR视为文本生成任务并直接生成篇章单元对的连接词,随后生成的连接词被准确无歧义地映射到唯一篇章关系.具体地,首先设计了可以将无歧义性连接词转化为对应篇章关系的连接词-关系映射表;然后介绍了两种不同的连接词替换策略用于替换训练样例中的歧义性连接词;最后,将IDRR视作一个序列到序列的任务,其中目标端序列由基于语义角色标注增强的篇章单元对和两者之间的连接词组成.[结果]基于英语PDTB和中文CDTB的实验结果表明本文提出的方法达到了最先进的性能.[结论]本文方法创新性地将IDRR视为文本生成任务,并通过序列到序列模型显著提升了隐式篇章关系识别的效果,为隐含信息的精确捕捉提供了新的解决方案. 展开更多
关键词 隐式篇章关系识别 序列到序列模型 语句角色标注增强 连接词生成
在线阅读 下载PDF
铁路车站列车运行仿真和进路优化算法研究
17
作者 叶文龙 徐小明 +2 位作者 马静 洪宇欣 龙建成 《北京交通大学学报》 CSCD 北大核心 2024年第6期1-11,共11页
为解决列车在车站咽喉区的进路规划问题,在给定实际车站咽喉区场景、列车在咽喉区内的进路、列车长度以及车速等情况下,开展列车进路优化算法研究.首先,构建表征列车在车站咽喉区运行状况的时空网络,将进路问题看成一个有限资源的时空... 为解决列车在车站咽喉区的进路规划问题,在给定实际车站咽喉区场景、列车在咽喉区内的进路、列车长度以及车速等情况下,开展列车进路优化算法研究.首先,构建表征列车在车站咽喉区运行状况的时空网络,将进路问题看成一个有限资源的时空分配问题,并建立问题的网络流模型.其次,开发基于离散事件模型的算法,仿真给定列车优先权顺序条件下车站咽喉区内的行车计划,得到可行的列车进路方案.再次,基于禁忌搜索(Tabu Search, TS)算法开发列车优先权顺序优化算法,得到行车作业时间延误最小的进路方案.最后,以某车站咽喉区为研究场景进行分析.研究结果表明:提出的基于TS的列车作业优先权算法能够有效疏解列车在车站咽喉区内的进路冲突,优化列车的延迟时间和等待时间,并在4 min内达到收敛得到满意的进路方案. 展开更多
关键词 铁路运输 车站进路优化 禁忌搜索 列车作业顺序 离散事件
在线阅读 下载PDF
一种建立在GPT-2模型上的数据增强方法 被引量:2
18
作者 张小川 陈盼盼 +2 位作者 邢欣来 杨昌萌 滕达 《智能系统学报》 CSCD 北大核心 2024年第1期209-216,共8页
针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-train... 针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-trained transformer for data augmentation,PunishGPT-DA)。设计了惩罚项和超参数α,与负对数似然损失函数共同作用微调GPT-2(generative pre-training 2.0),鼓励模型关注那些预测概率较小但仍然合理的输出;使用基于双向编码器表征模型(bidirectional encoder representation from transformers,BERT)的过滤器过滤语义偏差较大的生成样本。本文方法实现了对训练集16倍扩充,与GPT-2相比,在意图识别、问题分类以及情感分析3个任务上的准确率分别提升了1.1%、4.9%和8.7%。实验结果表明,本文提出的方法能够同时有效地控制一致性和多样性需求,提升下游任务模型的训练性能。 展开更多
关键词 自然语言处理 人工智能 数据增强 句子分类 少样本 序列到序列 生成式预训练语言模型 双向编码器表征模型
在线阅读 下载PDF
基于扩散序列的多元可控文本生成
19
作者 李晨阳 张龙 +1 位作者 郑秋生 钱少华 《计算机应用》 CSCD 北大核心 2024年第8期2414-2420,共7页
随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义... 随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义。首先,在ChnSentiCorp数据集的基础上完成主题和情感属性的扩展,同时,为构建一个可生成流畅文本且情感丰富的多元可控文本生成模型,提出一种基于扩散序列的可控文本生成模型DiffuSeq-PT。该模型以扩散模型为基础架构,利用主题情感属性和文本数据在无分类器引导条件下对序列执行扩散过程,使用预训练模型ERNIE 3.0(Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation)的编码解码能力贴合扩散模型的加噪去噪过程,最终生成符合相关主题和多情感粒度的目标文本。与基准模型DiffuSeq相比,所提模型在2个公开的真实数据集(ChnSentiCorp和辩论数据集)上分别取得0.13和0.01的BERTScore值的提升,困惑度分别下降了14.318和9.46。 展开更多
关键词 扩散模型 序列扩散 预训练模型 提示 文本生成 可控生成 细粒度情感
在线阅读 下载PDF
基于大语言模型的体检总检结论自动生成研究
20
作者 郑路程 李旭涛 徐敏 《小型微型计算机系统》 CSCD 北大核心 2024年第11期2569-2575,共7页
本文研究了基于大语言模型自动生成体检总检结论的方法.与常规文本摘要生成任务不同,体检总检结论的生成特别关注体检异常检查结果,要求生成结论不仅准确,还需遵循医学领域的专业知识和标准.为此,本文基于经医疗知识问答数据微调的大型... 本文研究了基于大语言模型自动生成体检总检结论的方法.与常规文本摘要生成任务不同,体检总检结论的生成特别关注体检异常检查结果,要求生成结论不仅准确,还需遵循医学领域的专业知识和标准.为此,本文基于经医疗知识问答数据微调的大型预训练语言模型,提出了一个体检总检结论自动生成方法.该方法包括两个关键模块:1)异常信息抽取模块,利用少量标注数据增强模型在抽取科室小结中异常检查结果识别能力;2)结论项排序模块,使得生成内容符合体检总检结论的顺序规范.在真实体检数据集上的实验表明,这两个核心模块有效提升了总检结论生成质量.本文为医疗文档自动生成技术提供了新思路,展现了大语言模型在医疗人工智能应用中的前瞻性. 展开更多
关键词 体检科室小结 体检总检结论 大语言模型 异常文本抽取 结论项重排 医疗问答
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部