期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于双通道图卷积网络的多模态方面级情感分析
1
作者 张凤 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《计算机工程与科学》 北大核心 2025年第7期1321-1330,共10页
针对在多模态方面级情感分析任务中,传统方法主要关注图文模态交互的深层信息而较少关注图像和文本中与方面相关的浅层信息,导致引入与方面无关的噪声,使得模型在捕获方面与情感之间复杂关系的能力上受到限制的问题,提出一种双通道图卷... 针对在多模态方面级情感分析任务中,传统方法主要关注图文模态交互的深层信息而较少关注图像和文本中与方面相关的浅层信息,导致引入与方面无关的噪声,使得模型在捕获方面与情感之间复杂关系的能力上受到限制的问题,提出一种双通道图卷积网络模型DCGCN。在BART模型的结构上,利用注意力机制增强方面语义,通过图卷积网络获取方面增强的多模态特征,并将句法依赖、基于方面的位置依赖和方面增强的图文相关性信息聚合到GCN邻接权重矩阵中以获得感知多信息的多模态特征。实验表明,所提DCGCN模型在Twitter的2个数据集上的F_(1)值分别达到了67.4%和67.9%,提高了多模态方面级情感分析的性能。 展开更多
关键词 方面级情感分析 多模态 图卷积网络 句法依赖 注意力机制
在线阅读 下载PDF
面向域外说话人适应场景的多层级解耦个性化语音合成 被引量:1
2
作者 高盛祥 杨元樟 +3 位作者 王琳钦 莫尚斌 余正涛 董凌 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第4期11-21,共11页
个性化语音合成任务旨在合成特定说话人音色的语音。传统方法在合成域外说话人语音时,与真实语音存在明显音色差异,解耦说话人特征仍较为困难。本文提出面向训练时未出现的域外说话人适应场景下的多层级解耦个性化语音合成方法,通过不... 个性化语音合成任务旨在合成特定说话人音色的语音。传统方法在合成域外说话人语音时,与真实语音存在明显音色差异,解耦说话人特征仍较为困难。本文提出面向训练时未出现的域外说话人适应场景下的多层级解耦个性化语音合成方法,通过不同粒度特征融合,有效提升零资源条件下域外说话人语音合成性能。本文方法采用快速傅里叶卷积提取说话人全局特征,以提高模型对域外说话人的泛化能力,实现句子粒度的说话人解耦;借助语音识别模型解耦音素粒度说话人特征,并通过注意力机制捕捉音素级音色特征,实现音素粒度的说话人解耦。实验结果表明:在公开数据集AISHELL3上,本文方法对域外说话人在客观评价指标说话人特征向量余弦相似度上达到0.697,相比基线模型提高6.25%,有效提升对域外说话人音色特征建模能力。 展开更多
关键词 语音合成 零资源 说话人表征 域外说话人 特征解耦
在线阅读 下载PDF
结合混合特征提取与深度学习的长文本语义相似度计算 被引量:1
3
作者 徐捷 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《计算机工程与科学》 CSCD 北大核心 2024年第8期1513-1520,共8页
文本语义相似度计算是自然语言处理中一项非常重要的任务,但是目前对于文本语义相似度的研究多集中在短文本领域,而不是长文本。相较于短文本,长文本语义信息丰富,但同时语义信息容易分散。针对长文本语义信息分散的问题,提出一种特征... 文本语义相似度计算是自然语言处理中一项非常重要的任务,但是目前对于文本语义相似度的研究多集中在短文本领域,而不是长文本。相较于短文本,长文本语义信息丰富,但同时语义信息容易分散。针对长文本语义信息分散的问题,提出一种特征提取模型,提取出长文本的主要语义信息;对提取的语义信息使用滑窗重叠的方法输入BERT预训练模型得到文本向量表示;然后,通过双向长短期记忆网络建模长文本的前后语义联系,将其映射到语义空间内;再通过线性层增加模型表示能力;最后,通过相似语义向量内积最大化和交叉熵损失函数进行微调。实验结果表明,该模型在CNSE和CNSS数据集上F1分数分别为0.84和0.91,性能优于基线模型。 展开更多
关键词 长文本语义相似度 特征提取 BERT预训练模型 语义空间
在线阅读 下载PDF
基于新闻文本图像的鲁棒水印算法 被引量:1
4
作者 刘尧 杜庆治 +3 位作者 马迪南 龙华 邵玉斌 黄喜阳 《现代电子技术》 北大核心 2024年第3期43-50,共8页
在新闻文本图像中,现有的水印算法没有将表达文本部分的区域与其他背景区域进行区分,并且对二值水印图像嵌入时只在单通道嵌入导致鲁棒性不高。针对以上问题,提出基于新闻文本图像的鲁棒水印算法。首先将新闻文本图像进行大津阈值分割(O... 在新闻文本图像中,现有的水印算法没有将表达文本部分的区域与其他背景区域进行区分,并且对二值水印图像嵌入时只在单通道嵌入导致鲁棒性不高。针对以上问题,提出基于新闻文本图像的鲁棒水印算法。首先将新闻文本图像进行大津阈值分割(OSTU),将文本与背景区域区分开,选择文本区域进行嵌入加深对重要信息的版权保护;接着将文本图像Cr和Cb通道的文本区域进行离散小波变换(DWT)后,利用主成分分析(PCA)进行能量集中并计算各主成分贡献率,通过比较贡献率来选择嵌入的主成分;最后对主成分及水印图像进行奇异值分解(SVD)完成水印嵌入。经过实验表明,嵌入水印图像在面对滤波等大多数常规攻击的NC值都在0.99以上,表明该算法有较强的鲁棒性,同时该算法在嵌入水印后图像的PSNR均值为45.66 dB,保证了不可感知性。 展开更多
关键词 图像水印 大津阈值分割 主成分分析 小波变换 奇异值分解 NC值
在线阅读 下载PDF
基于多种分词情况的中文命名实体识别
5
作者 田地 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期350-356,共7页
针对中文词语边界不明确,词语和句子上下文关系被忽略的问题,设计一种基于多种分词情况的歧义分词信息抑制算法.在预处理中根据预训练的词汇频率表计算语句中不同分词的权重,将最有可能的分词情况与其他分词情况进行区分,合并至语句中,... 针对中文词语边界不明确,词语和句子上下文关系被忽略的问题,设计一种基于多种分词情况的歧义分词信息抑制算法.在预处理中根据预训练的词汇频率表计算语句中不同分词的权重,将最有可能的分词情况与其他分词情况进行区分,合并至语句中,在自注意力机制提取语句上下文信息时加入分词权重信息,添加正确分词有效的边界信息,抑制歧义分词错误的前后文关系.对比MarkBert与W2NER算法,在公开数据集Resume、 MSRA、 Weibo、 OntoNotes中的试验结果表明,歧义分词信息抑制算法的预测准确率、句子长度增加时的鲁棒性、数据集增大时的预测准确率均有更好的表现. 展开更多
关键词 命名实体识别 预训练模型 自注意力 词边界信息
在线阅读 下载PDF
基于多路信息聚合协同解码的单通道语音增强
6
作者 莫尚斌 王文君 +2 位作者 董凌 高盛祥 余正涛 《计算机应用》 CSCD 北大核心 2024年第8期2611-2617,共7页
为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复... 为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复数谱特征,由4层Conformer分别从时间和频率维度对提取特征建模,采用残差连接将双路编码器提取的语音幅度、复数特征引入三路信息聚合解码器,并利用所提通道-时频注意力(CTF-Attention)机制根据语音能量分布情况调节解码器中聚合信息,有效缓解解码时可用声学信息缺失严重的问题。在公开数据集Voice Bank DEMAND上的实验结果表明,与用于单通道语音增强的协作学习框架(GaGNet)相比,MIACD在客观评价指标宽带感知评估语音质量(WB-PESQ)上提升了5.1%,短时客观可懂度(STOI)达到96.7%,验证所提方法可充分利用语音信息重构信号,有效抑制噪声并提升语音可理解性。 展开更多
关键词 声学特征 多路信息聚合 双路编码器 三路信息聚合解码器 通道-时频注意力机制
在线阅读 下载PDF
基于双向胶囊网络的恶意评论检测
7
作者 李公瑾 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《计算机工程与科学》 CSCD 北大核心 2024年第10期1765-1774,共10页
为了解决现有检测模型无法准确识别语言风格多变、语意隐晦的恶意评论问题,提出了一种基于双向胶囊网络的恶意评论检测模型。首先,利用BERT模型对评论文本进行词嵌入,创建输入矩阵;其次,将输入矩阵传递给双向特征提取层,该层由堆叠的LST... 为了解决现有检测模型无法准确识别语言风格多变、语意隐晦的恶意评论问题,提出了一种基于双向胶囊网络的恶意评论检测模型。首先,利用BERT模型对评论文本进行词嵌入,创建输入矩阵;其次,将输入矩阵传递给双向特征提取层,该层由堆叠的LSTM、双向胶囊网络和注意力网络组成,从正向和反向同时捕获文本的深层语义信息,将生成的正向和反向矩阵拼接起来并输入到注意力机制中,聚焦与恶意评论相关的词语并生成输出向量;再次,拼接输出向量与语境辅助特征向量,丰富特征表示;最后,将拼接向量输入到全连接层中,通过Sigmoid激活函数对评论文本进行分类。在维基百科恶意评论数据集上进行的实验表明,相较于现有研究,基于双向胶囊网络的恶意评论检测模型性能提升显著,能够捕获评论文本中更丰富的语义信息,有效检测恶意评论。 展开更多
关键词 BERT语言模型 双向胶囊网络 语境辅助特征 恶意评论检测
在线阅读 下载PDF
基于SURF的小波域自适应水印算法 被引量:2
8
作者 李帅 龙华 +3 位作者 杜庆治 马迪南 周筝 梁昌侯 《现代电子技术》 2023年第17期70-76,共7页
数字水印技术作为信息隐藏的分支领域,是进行数字版权保护的有效手段。针对水印嵌入强度的不确定性问题,同时为增强水印抵抗旋转攻击的能力,提出一种基于加速鲁棒特征(SURF)的小波域自适应水印算法。首先,对原始载体图像进行两级离散小... 数字水印技术作为信息隐藏的分支领域,是进行数字版权保护的有效手段。针对水印嵌入强度的不确定性问题,同时为增强水印抵抗旋转攻击的能力,提出一种基于加速鲁棒特征(SURF)的小波域自适应水印算法。首先,对原始载体图像进行两级离散小波变换(DWT),提取低频子带进行奇异值分解(SVD);然后对水印图像进行奇异值分解,利用加性嵌入规则将水印图像的奇异值矩阵叠加到原始载体图像的奇异值矩阵中,再经过逆变换即可得到含水印载体图像;利用加速鲁棒特征算法对经过旋转攻击的含水印载体图像进行旋转校正。对于嵌入强度不确定性,构建适应度函数,利用麻雀搜索算法(SSA)对其寻优进而达到水印嵌入强度自适应的目的。实验结果表明,含水印的载体图像有良好的不可感知性,峰值信噪比(PSNR)在40 dB以上。所提算法对于常见的水印攻击具有较强的鲁棒性,归一化相关系数(NC)大多都在0.98以上。 展开更多
关键词 数字水印 小波变换 加速鲁棒特征 麻雀搜索算法 离散小波变换 奇异值分解
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部