-
题名融入法因层次结构的法因预测IHLCP模型
被引量:1
- 1
-
-
作者
黄思嘉
彭艳兵
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2024年第1期146-155,共10页
-
文摘
该文针对当前法律智能体系可解释性差、低频易混淆法因预测效果不佳、民事纠纷研究过少的问题,设计了一种可解释性层次法因预测IHLCP模型,并将法因之间的层次依赖关系作为模型可解释性的来源进行了研究。模型首先基于案件的语义差异性对事实描述进行编码,然后通过改进的seq2seq-attention模块来预测法因路径,并利用法因内部的文本信息过滤事实描述中的噪声信息,以获得可靠的预测效果。该文设计的IHLCP模型在CIVIL、FSC和CAIL这三个大规模公开数据集上分别达到了当前最好的效果(CIVIL数据集:ACC-91.0%,PRE-67.5%,RECALL-57.9%,F1-62.3%。FSC数据集:ACC-94.9%,PRE-78.8%,RECALL-75.9%,F1-77.3%。CAIL数据集:ACC-92.3%,PRE-90.9%,RECALL-89.7%,F1-90.3%),其中ACC和F1值分别最高提升了6.6%和13.4%。实验结果表明,该设计能够帮助系统理解法因,弥补了当前法律智能体系在低频、易混淆法因预测上的不足,同时提升了模型的可解释性。
-
关键词
层次法因预测
可解释性
语义差异性
数据不平衡
低频类别预测
-
Keywords
hierarchical legal cause prediction
interpretability
semantic differences
data imbalance
few-shot prediction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于梯度和流形的超像素分割算法
被引量:1
- 2
-
-
作者
陈彤
廖闻剑
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《计算机应用与软件》
北大核心
2024年第1期240-245,296,共7页
-
基金
国家重点研发计划项目(2017YFB1400704)。
-
文摘
当今许多图像处理任务常用超像素作为降维手段和边缘优化的依据。针对现有方法分割数量过于依赖经验和存在离散点的问题,提出一种基于梯度和流形距离的超像素数量的分割方法,自适应估算图像适合的超像素数量,令细节的分割更为精准同时减少背景区域的过分割。以BSDS500数据集进行实验,该方法在各项指标上有较好表现,尤其解决了离散点问题,在紧致度上得到巨大提升。
-
关键词
测地线距离
自适应
梯度
超像素
孤立点消除
-
Keywords
Geodesic distance
Adaptive
Gradient
Superpixel
Outlier elimination
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-
-
题名基于BERT和GCN的引文推荐模型
被引量:4
- 3
-
-
作者
查云杰
汪洋
-
机构
南京烽火天地通信科技有限公司
武汉邮电科学研究院
南京烽火星空通信发展有限公司
-
出处
《计算机应用与软件》
北大核心
2021年第1期41-45,50,共6页
-
文摘
采用一个组织良好的数据集和基于深度学习的模型,实现根据上下文获得论文的引文推荐。模型包括一个文档编码器和一个上下文编码器,使用图卷积网络层(GCN)和预训练模型BERT[1]的双向编码器表示。通过修改相关的PeerRead数据集,建立一个PeerReadPlus新数据集,它包含引用文献的上下文语句和论文元数据。结果表明,在采用BERT进行上下文编码,改进上下文侧的表示学习后,该模型的性能获得了显著的提升,平均精度均值(MAP)和召回率(Recall@K)均提高了28%以上。
-
关键词
BERT
GCN
上下文感知
深度学习
引文推荐
-
Keywords
BERT
GCN
Context awareness
Deep learning
Citation recommendation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征融合的恶意代码分类研究
被引量:15
- 4
-
-
作者
张景莲
彭艳兵
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第8期281-286,295,共7页
-
基金
国家重点研发计划“现代服务业共性关键技术研发及应用示范”(2017YFB1400704)
-
文摘
基于特征码匹配的静态分析方法提取的特征滞后于病毒发展,且不能检测出未知病毒。为此,从病毒反编译文件及其灰度图出发进行特征提取及融合,采用机器学习中的随机森林(RF)算法对恶意代码家族进行分类,提取恶意代码的操作码指令和灰度图纹理2个局部特征,并将颜色直方图作为恶意代码的全局特征。实验结果表明,融合恶意代码特征与RF算法可实现恶意代码家族的有效分类,平均准确率达到99.59 %。
-
关键词
恶意代码
机器学习
灰度图纹理
颜色直方图
随机森林
-
Keywords
malware code
machine learning
grayscale texture
color histogram
Random Forest(RF)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于角度间隔嵌入特征的端到端声纹识别模型
被引量:5
- 5
-
-
作者
王康
董元菲
-
机构
南京烽火天地通信科技有限公司
武汉邮电科学研究院
-
出处
《计算机应用》
CSCD
北大核心
2019年第10期2937-2941,共5页
-
基金
国家重点研发计划项目(2017YFB1400704)~~
-
文摘
针对传统身份认证矢量(i-vector)与概率线性判别分析(PLDA)结合的声纹识别模型步骤繁琐、泛化能力较弱等问题,构建了一个基于角度间隔嵌入特征的端到端模型。该模型特别设计了一个深度卷积神经网络,从语音数据的声学特征中提取深度说话人嵌入;选择基于角度改进的A-Softmax作为损失函数,在角度空间中使模型学习到的不同类别特征始终存在角度间隔并且同类特征间聚集更紧密。在公开数据集VoxCeleb2上进行的测试表明,与i-vector结合PLDA的方法相比,该模型在说话人辨认中的Top-1和Top-5上准确率分别提高了58.9%和30%;而在说话人确认中的最小检测代价和等错误率上分别减小了47.9%和45.3%。实验结果验证了所设计的端到端模型更适合在多信道、大规模的语音数据集上学习到有类别区分性的特征。
-
关键词
声纹识别
端到端模型
损失函数
卷积神经网络
深度说话人嵌入
-
Keywords
voiceprint recognition
end-to-endmodel
loss function
convolutional neuralnetwork
deep speaker embedding
-
分类号
TN912.34
[电子电信—通信与信息系统]
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GAN模型优化的神经机器翻译
被引量:8
- 6
-
-
作者
明玉琴
夏添
彭艳兵
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2020年第4期47-54,共8页
-
文摘
在机器翻译任务中,输入端的一些微小的干扰信息,可能引起NMT的模型翻译性能的下降。该文提出了一种融入对抗学习的神经机器翻译方法。给出一个源句子序列,构造了一个将源句子添加了微小噪声的新序列,并且两者的语义相近。然后把这两个序列交由编码器处理,产生各自的向量表示;并将处理结果交给判别器和解码器做进一步处理,最后比较加入噪声前后的翻译性能。实验表明,在多个语言对的翻译任务上,使用该模型的方法不仅提升了翻译性能,而且对噪声输入也表现出了鲁棒性。
-
关键词
NMT
对抗学习
TRANSFORMER
BLEU
-
Keywords
NMT
adversarial learning
Transformer
BLEU
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名基于对偶学习策略的单图像超分辨率重建网络
被引量:5
- 7
-
-
作者
陈金玲
彭艳兵
李念
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《计算机应用研究》
CSCD
北大核心
2021年第7期2235-2240,共6页
-
基金
国家重点研发计划资助项目(2017YFB1400704)。
-
文摘
针对单图像低分辨率到高分辨率映射具有不适定性、特征图空间信息利用率低下以及网络参数量过大的问题,提出了一种基于渐进上采样的对偶学习算法用于图像的超分辨率重建。首先采用深度可分离卷积使得模型参数量显著减少;再基于亚像素卷积构建渐进上采样网络来高效利用特征图上下文信息;最后利用对偶学习策略构建闭环反馈网络,通过对偶关系相互约束映射空间以获取最佳重建函数。在Set5、Set14、BSDS100、Urban100、Manga109基准数据集上与其他主流的超分辨率方法相比,该算法表现出更优越的性能:有效减少了网络9%的参数量,在×4、×8放大因子下能重建出更清晰的图像,同时能有效缓解图像边缘失真和伪影现象,并且×8放大时的平均峰值信噪比和结构相似度(PSNR/SSIM)分别为26.90/0.751、24.84/0.645、24.74/0.619、22.30/0.560、24.38/0.706。
-
关键词
超分辨率重建
深度可分离卷积
渐进上采样
亚像素卷积
对偶学习
-
Keywords
super-resolution reconstruction
depth separable convolution
progressive convolution
sub-pixel convolution
dual learning
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GAN的全时间尺度语音增强方法
被引量:3
- 8
-
-
作者
沈梦强
于文年
易黎
宋南
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第6期115-122,130,共9页
-
基金
国家重点研发计划(2017YFB1400704)。
-
文摘
现有语音增强方法在时域端到端语音增强中无法学习全面时间尺度特征信息且中间层序列建模不充分。提出从全面时间尺度进行语音降噪的方法。通过线性插值方式对输入特征序列进行扩充,获得比原输入数据具有更高分辨率的时间特征,使得模型能够从更细时间尺度上进行特征提取,并利用间隔抽样方法对每一层编码后的特征进行下采样,在较粗时间尺度上计算越来越多的高维特征,使网络模型能够捕获深层次的有用信息。同时,在网络模型中引入ConformerBlock作为中间层,其中,多头注意力机制和卷积模块能够增强中间层网络的序列建模能力,突出中间向量的表征信息,根据语音和噪声线性叠加的原理,采用联合噪声训练生成对抗网络的方法使网络从目标语音和噪声2个角度获取有用信息,进一步提升模型降噪能力。在公开语音增强测试数据集上的实验结果表明,该方法降噪后语音的各项指标均得到显著提升,相比Wave-U-net模型,在PESQ、STOI和SSNR这3项主要指标上分别提升了2.75%、1.06%、6.34%。
-
关键词
全时间尺度
高分辨率
线性插值
Conformer模块
生成对抗网络
-
Keywords
full-time scale
high resolution
linear interpolation
Conformer module
Generative Adversarial Network(GAN)
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名基于多任务联合学习的跨视角地理定位方法
被引量:3
- 9
-
-
作者
王先兰
周金坤
穆楠
王晨
-
机构
武汉邮电科学研究院
四川师范大学计算机科学学院
南京烽火天地通信科技有限公司
-
出处
《计算机应用》
CSCD
北大核心
2023年第5期1625-1635,共11页
-
基金
国家自然科学基金资助项目(62006165)。
-
文摘
针对现有跨视角地理定位方法中视点不变特征与视角转换方法割裂导致的性能提升瓶颈问题,提出多任务联合学习模型(MJLM)。MJLM由前置图像生成模型和后置图像检索模型组成。前置生成模型首先使用逆透视映射(IPM)进行坐标变换,显式地弥合空间域差,使投影图像与真实卫星图的空间几何特征大致相同;然后通过提出的跨视角生成对抗网络(CVGAN)隐式地对图像内容及纹理进行细粒度的匹配和修复,并合成出更平滑且真实的卫星图像。后置检索模型由多视角多监督网络(MMNet)构成,能够兼顾多尺度特征和多监督学习的图像检索任务。在University-1652(无人机定位数据集)上进行实验,结果显示MJLM对无人机(UAV)定位任务的平均精确率(AP)及召回率(R@1)分别达到89.22%和87.54%,与LPN(Local Pattern Network)和MSBA(MultiScale Block Attention)相比,MJLM在R@1上分别提升了15.29%和1.07%。可见,MJLM能在一个聚合框架体系内联合处理跨视角图像生成任务及检索任务,实现基于视角转换与视点不变特征方法的融合,有效提升跨视角地理定位的精度和鲁棒性,验证UAV定位的可行性。
-
关键词
跨视角地理定位
无人机图像定位
视角转换
特征提取
深度学习
-
Keywords
cross-view geo-localization
Unmanned Aerial Vehicle(UAV)image localization
view transformation
feature extraction
deep learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于DPI的应用指纹自动提取方法研究
被引量:3
- 10
-
-
作者
饶亲苗
彭艳兵
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《计算机应用与软件》
北大核心
2021年第4期328-333,共6页
-
文摘
基于DPI的流量识别方法,通过匹配应用流量报文独有的特征字符串来识别移动应用程序产生的流量,具有较好的识别效果,但特征字符串需要人为提取。对此,提出一种通过全面观察移动应用程序产生的流量报文以自动学习移动应用指纹的方法。实验结果表明,该方法用于移动网络流量识别时的应用覆盖率可达83.3%,流覆盖率、字节覆盖率均可达较高水平。
-
关键词
深度报文检测
移动网络
流量识别
应用指纹
应用覆盖率
-
Keywords
Deep packet inspection
Mobile network
Traffic identification
Application fingerprint
Application coverage
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于多视角多监督网络的无人机图像定位方法
被引量:2
- 11
-
-
作者
周金坤
王先兰
穆楠
王晨
-
机构
武汉邮电科学研究院
四川师范大学计算机科学学院
南京烽火天地通信科技有限公司
-
出处
《计算机应用》
CSCD
北大核心
2022年第10期3191-3199,共9页
-
基金
国家自然科学基金资助项目(62006165)。
-
文摘
针对现有跨视角图像匹配算法精度低的问题,提出了一种基于多视角多监督网络(MMNet)的无人机(UAV)定位方法。首先,所提方法融合卫星视角和UAV视角,在统一的网络架构下学习全局和局部特征并以多监督方式训练分类网络并执行度量任务。具体来说,MMNet主要采用了重加权正则化三元组损失(RRT)学习全局特征,该损失利用重加权和距离正则化加权策略来解决多视角样本不平衡以及特征空间结构紊乱的问题。同时,为了关注目标地点中心建筑的上下文信息,MMNet对特征图进行方形环切割来获取局部特征。然后,分别用交叉熵损失和RRT执行分类和度量任务。最终,使用加权策略聚合全局和局部特征来表征目标地点图像。通过在当前流行的UAV数据集University-1652上进行实验,可知MMNet在UAV定位任务的召回率Recall@1 (R@1)及平均精准率(AP)上分别达到83.97%和86.96%。实验结果表明,相较于LCM、SFPN等方法,MMNet显著提升了跨视角图像的匹配精度,进而增强了UAV图像定位的实用性。
-
关键词
无人机图像定位
跨视角图像匹配
地理定位
度量学习
深度学习
-
Keywords
Unmanned Aerial Vehicle(UAV)image localization
cross-view image matching
geo-localization
metric learning
deep learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于隐变量模型的恶意登录行为在线检测方法
被引量:1
- 12
-
-
作者
陈雪
彭艳兵
陈前
刘泽正
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
南京信息工程大学
-
出处
《信息安全研究》
CSCD
2023年第1期22-28,共7页
-
基金
国家重点研发计划项目(2017YFB1400704)。
-
文摘
恶意登录行为的分类与检测对运营商监管网络安全具有重要意义,但恶意登录行为的检测技术普遍存在模型运算过程庞大、缺乏实时性、无法高效率处理高维数据等问题.为此,提出一种基于隐变量的恶意登录行为在线检测方法.通过深入解析暴力破解原理,提取流量特征匹配度较高的特征,进行特征向量的构建以实现特征增强,并使用轻量级的最大期望(expectation maximization,EM)算法代替传统复杂的机器学习和深度学习算法实现恶意登录行为流量检测.在此基础上引入基于隐变量机制的EM算法强化模型对关键特征的提取能力,从而提升恶意登录行为的流量检测准确率.在公开数据集CIC-IDS-2017上的实验结果表明,该方法的精确率达到98.7%,误报率低至2.38%;相比多层感知机算法的精确率提高了23.7%,相比基于CDF阈值分割算法的召回率提高12.8%,误报率降低4.19%.
-
关键词
恶意登录
暴力破解
EM算法
隐变量
高斯分布
-
Keywords
malicious login
brute-force cracking
EM algorithm
hidden variables
Gaussian distribution
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-