期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于Boosting优先经验重放的协同计算卸载方法 被引量:1
1
作者 黄毅 王文轩 +3 位作者 崔允贺 陈意 郭春 申国伟 《计算机应用研究》 北大核心 2025年第3期777-787,共11页
现有计算卸载方法没有考虑终端设备和边缘服务器的不同任务排队情况,导致计算卸载模型的时延估计存在偏差。更重要的是,现有基于强化学习的计算卸载方法通过计算时序差分(temporal difference,TD)误差进行经验重放,无法精确评估历史经... 现有计算卸载方法没有考虑终端设备和边缘服务器的不同任务排队情况,导致计算卸载模型的时延估计存在偏差。更重要的是,现有基于强化学习的计算卸载方法通过计算时序差分(temporal difference,TD)误差进行经验重放,无法精确评估历史经验的重要性,导致卸载决策精度降低。为解决上述问题,在移动蜂窝网络边缘计算场景下,考虑多设备、多服务器的计算卸载问题,提出一种基于Boosting优先经验重放的协同计算卸载方法—COOPERANT。针对任务调度问题,COOPERANT构建了终端设备任务排队模型及服务器任务排队模型;针对任务卸载问题,COOPERANT设计了融合Boosting的优先经验重放算法、任务卸载联合优化模型、计算卸载多智能体深度强化学习模型及COOPERANT网络更新策略。实验证明,相比于遗传算法、蚁群算法、鲸鱼优化算法、MADDPG算法、TD-MADDPG算法以及MAPPO算法,COOPERANT能够有效降低系统时延和能耗开销,提升网络收敛速度。 展开更多
关键词 计算卸载 BOOSTING 多智能体深度强化学习 优先经验重放
在线阅读 下载PDF
基于分布增强的深度变分文本聚类模型
2
作者 申奥 黄瑞章 +2 位作者 薛菁菁 陈艳平 秦永彬 《计算机应用》 北大核心 2025年第8期2457-2463,共7页
针对深度变分文本聚类模型在实际应用中遇到的分布信息缺失和分布坍塌问题,提出一种基于分布增强的深度变分文本聚类模型(DVCMD)。该模型通过分布信息增强的方法,整合增强潜在语义分布至原始潜在语义分布,从而提高潜在分布的信息完整性... 针对深度变分文本聚类模型在实际应用中遇到的分布信息缺失和分布坍塌问题,提出一种基于分布增强的深度变分文本聚类模型(DVCMD)。该模型通过分布信息增强的方法,整合增强潜在语义分布至原始潜在语义分布,从而提高潜在分布的信息完整性和准确性;同时,采用分布一致性约束策略促使模型学习一致的语义表征,从而提高模型通过学习的语义分布对数据真实信息的表达能力,进而提升聚类性能。实验结果表明,与现有的深度聚类模型和结构语义增强聚类模型相比,DVCMD的归一化互信息(NMI)指标在Abstract、BBC、Reuters-10k和BBCSports这4个真实数据集上分别至少提升了0.16、9.01、2.30和2.72个百分点,验证了模型的有效性。 展开更多
关键词 深度文本聚类 分布增强 变分自编码器 语义表征 分布一致性约束
在线阅读 下载PDF
基于意图正则化的深度半监督文本聚类
3
作者 徐乐 黄瑞章 +1 位作者 白瑞娜 秦永彬 《计算机应用》 北大核心 2025年第7期2145-2152,共8页
针对现有半监督文本聚类方法无法同时在表示学习和聚类过程中考虑用户意图的问题,提出基于意图正则化的深度半监督文本聚类(IRDSTC)模型。通过引入意图正则化策略,设计意图正则化的表示学习(IRRL)模块和意图正则化的聚类(IRC)模块。首先... 针对现有半监督文本聚类方法无法同时在表示学习和聚类过程中考虑用户意图的问题,提出基于意图正则化的深度半监督文本聚类(IRDSTC)模型。通过引入意图正则化策略,设计意图正则化的表示学习(IRRL)模块和意图正则化的聚类(IRC)模块。首先,根据用户提供的意图约束信息构建意图矩阵,以捕获用户对文本之间关系的期望。其次,将该矩阵应用到表示学习阶段和聚类阶段:在表示学习阶段,将深度模型提取的中间层表示转换为表示关联性矩阵,并结合意图矩阵构造正则项,以利用用户意图驱动表示学习;在聚类阶段,根据聚类迭代得到的类簇分配概率构造分配一致性矩阵,并结合意图矩阵构造正则项,以实现用户意图对聚类过程的指导。实验结果表明,IRDSTC模型在Reu-10k、BBC、ACM和Abstract数据集上相较于其他聚类方法在聚类准确率(ACC)、标准化互信息(NMI)和调整兰德指数(ARI)上均具有更好的表现。具体而言,相较于次优模型改进的深度嵌入聚类(IDEC),IRDSTC模型的NMI分别提升了28.26%、32.58%、27.13%和34.94%,表明IRDSTC模型具有更好的聚类效果。 展开更多
关键词 意图 正则化 半监督 文本聚类
在线阅读 下载PDF
COURIER:基于非抢占式优先排队和优先经验重放DRL的边缘计算任务调度与卸载方法 被引量:2
4
作者 杨秀文 崔允贺 +2 位作者 钱清 郭春 申国伟 《计算机科学》 CSCD 北大核心 2024年第5期293-305,共13页
边缘计算(Edge Computing,EC)将计算、存储等资源部署在网络边缘,以满足业务对时延和能耗的要求。计算卸载是EC中的关键技术之一。现有的计算卸载方法在估计任务排队时延时使用M/M/1/∞/∞/FCFS或M/M/n/∞/∞/FCFS排队模型,未考虑高时... 边缘计算(Edge Computing,EC)将计算、存储等资源部署在网络边缘,以满足业务对时延和能耗的要求。计算卸载是EC中的关键技术之一。现有的计算卸载方法在估计任务排队时延时使用M/M/1/∞/∞/FCFS或M/M/n/∞/∞/FCFS排队模型,未考虑高时延敏感型任务的优先执行问题,使得一些对时延要求不敏感的计算任务长期占用计算资源,导致系统的时延开销过大。此外,现有的经验重放方法大多采用随机采样方式,该方式不能区分经验的优劣,造成经验利用率低,神经网络收敛速度慢。基于确定性策略深度强化学习(Deep Reinforcement Learning,DRL)的计算卸载方法存在智能体对环境的探索能力弱和鲁棒性低等问题,降低了求解计算卸载问题的精度。为解决以上问题,考虑边缘计算中多任务移动设备、多边缘服务器的计算卸载场景,以最小化系统时延和能耗联合开销为目标,研究任务调度与卸载决策问题,并提出了基于非抢占式优先排队和优先经验重放DRL的计算卸载方法(Computation Offloading qUeuing pRioritIzed Experience Replay DRL,COURIER)。COURIER针对任务调度问题,设计了非抢占式优先排队模型(M/M/n/∞/∞/NPR)以优化任务的排队时延;针对卸载决策问题,基于软演员-评论家(Soft Actor Critic,SAC)提出了优先经验重放SAC的卸载决策机制,该机制在目标函数中加入信息熵,使智能体采取随机策略,同时优化机制中的经验采样方式以加快网络的收敛速度。仿真实验结果表明,COURIER能有效降低EC系统时延和能耗联合开销。 展开更多
关键词 边缘计算 计算卸载 非抢占式优先排队 信息熵 深度强化学习 优先经验重放
在线阅读 下载PDF
基于自适应结构学习的深度文本聚类 被引量:2
5
作者 潘伟 黄瑞章 +1 位作者 任丽娜 薛菁菁 《计算机工程》 CAS CSCD 北大核心 2024年第11期89-97,共9页
近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图... 近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图结构信息未得到完全挖掘,限制了结合结构信息的深度文本聚类性能。为此,提出一种基于自适应结构学习的深度文本聚类模型DCMBS。首先,设计一种阈值构图方法,动态调整近邻文本数量,解决因近邻文本固定存在结构信息不精确的问题;其次,引入一种拓扑探索近邻的方法,对近邻文本进行多阶挖掘,解决以往方法只进行一阶挖掘存在结构信息不完整的问题。此外,设计了1个阈值衰减策略,避免拓扑过程中因拓扑阶数增加导致学习泛化。在4个真实数据集的实验结果表明,DCMBS与现有较好的聚类模型相比,准确度、归一化互信息(NMI)和调整兰德指数(ARI)平均提高了6.83、2.93、6.23个百分点。 展开更多
关键词 阈值 深度文本聚类 文本结构信息 图神经网络 自适应结构学习
在线阅读 下载PDF
Corrective-Net:面向多标签文本分类的标签关联学习模块
6
作者 肖新正 黄瑞章 +3 位作者 陈艳平 秦永彬 宋玉梅 周裕林 《计算机工程与科学》 CSCD 北大核心 2024年第6期1092-1100,共9页
在目前的多标签文本分类任务中,主要面临以下2个问题:(1)侧重文本表示学习,对标签之间的关联信息建模不充分;(2)尽管使用了标签关联信息来改善多标签分类任务,但对标签关联的建模过于依赖人工预定义的外部知识,而外部知识的获取成本高昂... 在目前的多标签文本分类任务中,主要面临以下2个问题:(1)侧重文本表示学习,对标签之间的关联信息建模不充分;(2)尽管使用了标签关联信息来改善多标签分类任务,但对标签关联的建模过于依赖人工预定义的外部知识,而外部知识的获取成本高昂,限制了其实际应用。针对以上问题,提出了一种面向多标签文本分类的标签关联学习模块Corrective-Net。该模块可以在不依赖外部知识的前提下,自动学习数据中的标签关联信息;同时,它还可以利用标签关联信息,对基础分类模块的初始预测结果进行修正,使得最终预测兼顾语义信息和标签关联信息,以获得更精准的多标签预测结果。在AAPD和SO数据集上的大量实验表明,Corrective-Net具有通用性和有效性,通过分析标签修正对各个标签性能的影响,得到了显式的标签关联信息,并进行了可视化。 展开更多
关键词 标签关联 标签修正 多标签 文本分类 可视化
在线阅读 下载PDF
融合多尺度跨度特征的谓语中心词识别模型
7
作者 施竣潇 陈艳平 穆肇南 《计算机工程》 CAS CSCD 北大核心 2024年第10期137-144,共8页
针对谓语中心词识别模型中存在缺失跨度长度信息和多尺度跨度关联信息等问题,提出一种融合多尺度跨度特征的汉语谓语中心词识别模型。首先,使用ChineseBERT预训练语言模型和双向长短期记忆(BiLSTM)网络提取文本中包含上下文信息的字符... 针对谓语中心词识别模型中存在缺失跨度长度信息和多尺度跨度关联信息等问题,提出一种融合多尺度跨度特征的汉语谓语中心词识别模型。首先,使用ChineseBERT预训练语言模型和双向长短期记忆(BiLSTM)网络提取文本中包含上下文信息的字符向量序列;其次,利用线性神经网络对字符向量进行初步识别,形成跨度遮蔽矩阵;然后,将字符向量序列二维化表示为跨度信息矩阵,使用多尺度卷积神经网络(MSCNN)对跨度信息矩阵进行运算,提取跨度的多尺度关联信息;最后,采用特征嵌入神经网络嵌入跨度的长度信息,丰富跨度的特征向量以识别谓语中心词。实验结果表明,该模型能够有效融合跨度的多尺度关联信息和长度信息,提升谓语中心词识别的性能,相比于同类模型中性能最优的谓语中心词识别模型的F1值提升了0.43个百分点。 展开更多
关键词 谓语中心词识别 多尺度卷积 ChineseBERT预训练语言模型 跨度长度信息 多尺度跨度关联信息
在线阅读 下载PDF
融合时序行为链与事件类型的类案检索方法 被引量:1
8
作者 詹力林 秦永彬 +2 位作者 黄瑞章 王华 陈艳平 《计算机应用》 北大核心 2025年第6期1741-1747,共7页
针对现有的类案检索(LCR)方法缺乏对案情要素的有效利用而容易被案例内容的语义结构相似性误导的问题,提出一种融合时序行为链与事件类型的类案检索方法。首先,采取序列标注的方法识别案情描述中的法律事件类型,并利用案例文本中的行为... 针对现有的类案检索(LCR)方法缺乏对案情要素的有效利用而容易被案例内容的语义结构相似性误导的问题,提出一种融合时序行为链与事件类型的类案检索方法。首先,采取序列标注的方法识别案情描述中的法律事件类型,并利用案例文本中的行为要素构建时序行为链,以突出案情的关键要素,从而使模型聚焦于案例的核心内容,进而解决现有方法易被案例内容的语义结构相似性误导的问题;其次,利用分段编码构造时序行为链的相似性向量表征矩阵,从而增强案例间行为要素的语义交互;最后,通过聚合评分器,从时序行为链、法律事件类型、犯罪类型这3个角度衡量案例的相关性,从而增加案例匹配得分的合理性。实验结果表明,相较于SAILER(Structure-Aware pre-traIned language model for LEgal case Retrieval)方法,所提方法在LeCaRD(Legal Case Retrieval Dataset)上的P@5值提升了4个百分点、P@10值提升了3个百分点、MAP值提升了4个百分点,而NDCG@30值提升了0.8个百分点。可见,该方法能有效利用案情要素来避免案例内容的语义结构相似性的干扰,并能为类案检索提供可靠的依据。 展开更多
关键词 案情要素 行为要素 事件类型 时序行为链 聚合评分器
在线阅读 下载PDF
EFormer:基于分频和广注意力的高效Transformer医学图像配准模型
9
作者 黄星宇 王丽会 +3 位作者 唐堃 程欣宇 张健 叶晨 《计算机科学》 北大核心 2025年第7期151-160,共10页
医学图像配准对于多种后处理步骤至关重要。目前基于卷积和Transformer的单流或双流网络架构能够实现良好的配准性能,但在配准性能与计算效率之间仍然难以取得平衡。为了解决这个问题,提出了一种高效的Transformer配准网络EFormer。其... 医学图像配准对于多种后处理步骤至关重要。目前基于卷积和Transformer的单流或双流网络架构能够实现良好的配准性能,但在配准性能与计算效率之间仍然难以取得平衡。为了解决这个问题,提出了一种高效的Transformer配准网络EFormer。其主要由分频器模块(Frequency Division Module, FDM)和广注意力模块(Broad Attention Module, BAM)组成。具体而言,在编解码器中使用多个FDM模拟双流网络并行提取局部-全局信息以提高计算效率;利用BAM增强多个FDM中局部信息的传递以保留配准中重要的语义特征。在3个数据集上的定性和定量比较实验结果表明,相比主流配准模型,EFormer在DSC,ASSD,HD95和雅可比行列式负值百分比4个评价指标上分别至少优化了1.3%,2.6%,0.6%和95%。此外,使用EFormer-tiny时,计算效率(Flops)优化了14%,表明EFormer能够以最快的计算速度在基于Transformer的网络中实现最佳的配准结果。 展开更多
关键词 医学图像配准 分频 广注意力 高效Transformer
在线阅读 下载PDF
面向复杂刑事案件的涉案金额识别方法
10
作者 田如君 林川 +3 位作者 黄瑞章 陈艳平 杨志 秦永彬 《计算机工程与设计》 北大核心 2025年第6期1556-1563,共8页
针对现有涉案金额识别方法在复杂案件(一案多人)上面临金额的所属关系易混淆及意图多样性问题,提出一种面向复杂刑事案件的涉案金额识别推理方法。通过分析裁判文书的逻辑结构,抽取文书中的金额相关要素并结合文书的特征构建金额共现图... 针对现有涉案金额识别方法在复杂案件(一案多人)上面临金额的所属关系易混淆及意图多样性问题,提出一种面向复杂刑事案件的涉案金额识别推理方法。通过分析裁判文书的逻辑结构,抽取文书中的金额相关要素并结合文书的特征构建金额共现图,用图的形式对金额的归属关系进行表示,使用图神经网络(graph neural network, GNN)在金额共现图中学习要素节点之间的语义依赖信息和结构信息,获取其深层的节点特征,实现对涉案金额的识别和推理。在公共比赛数据集LAIC2021(Legal AI Challenge 2021)上的准确率(Accuracy, Acc)值达到94.75%,比当前最优模型提升了3.7%,在某省人民法院裁判文书复杂案件数据集上的Acc值达到74.16%。 展开更多
关键词 刑事案件 涉案金额识别 裁判文书逻辑结构 金额共现图 图神经网络 司法智能 特征融合
在线阅读 下载PDF
结合二维增强融合机制的事件论元抽取方法
11
作者 王潞翔 陈艳平 +2 位作者 黄辉 黄瑞章 秦永彬 《计算机工程与应用》 北大核心 2025年第10期111-119,共9页
针对现有的事件论元抽取研究中触发词和论元间缺少交互以及通道内部缺少交互的问题,提出结合二维增强融合机制的事件论元抽取模型(two-dimensional enhanced fusion mechanism for event argument extraction,W2-ARG)。在句子中的触发... 针对现有的事件论元抽取研究中触发词和论元间缺少交互以及通道内部缺少交互的问题,提出结合二维增强融合机制的事件论元抽取模型(two-dimensional enhanced fusion mechanism for event argument extraction,W2-ARG)。在句子中的触发词两边插入标识符,引入事件类型信息的同时增强触发词和论元的交互,并单独编码触发词以突出其在句子中的语义信息。将论元抽取建模为二维化表示的标签预测,通过膨胀卷积捕获不同距离的单词的语义交互。使用通道注意力模块增强通道内部的交互,以强化通道内的信息传递。最后利用拉普拉斯算子来突出事件论元在语义空间中的位置特征,提升模型对事件论元的识别精度。模型在ACE05-EN、ERE-EN数据集上进行了实验,实验结果表明该方法的性能相较其他基于分类的事件论元抽取方法提升明显。 展开更多
关键词 事件论元抽取 句子平面化表示 通道注意力 拉普拉斯算子 BERT
在线阅读 下载PDF
结合实体边界偏移的序列标注优化方法
12
作者 余婧 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机应用》 北大核心 2025年第8期2522-2529,共8页
针对序列标注模型在命名实体识别(NER)任务中出现的识别的实体边界与真实的实体边界之间存在位置偏差的问题,提出一种结合实体边界偏移的序列标注优化方法。首先,引入边界偏移量的概念量化每个词与实体边界之间的位置关系,计算每个词与... 针对序列标注模型在命名实体识别(NER)任务中出现的识别的实体边界与真实的实体边界之间存在位置偏差的问题,提出一种结合实体边界偏移的序列标注优化方法。首先,引入边界偏移量的概念量化每个词与实体边界之间的位置关系,计算每个词与最近实体边界的相对偏移量,再利用这些偏移量生成实体边界的候选跨度;其次,利用交并比(IoU)作为筛选标准过滤低质量的候选跨度,以保留最有可能代表实体边界的候选跨度;最后,通过边界调整模块,根据候选跨度更新标签序列中实体边界的位置,从而优化整个标签序列的实体边界,并提升实体识别的性能。实验结果表明,所提方法在数据集CLUENER2020、Resume-zh和MSRA上的F1值分别达到了80.48%、96.42%和94.80%,验证了该方法对NER任务的有效性。 展开更多
关键词 命名实体识别 序列标注 边界偏移 交并比 边界调整
在线阅读 下载PDF
结合位置感知的命名实体识别方法
13
作者 王纪恬 陈艳平 +2 位作者 黄蓉 黄瑞章 秦永彬 《广西科学》 北大核心 2025年第1期96-105,共10页
命名实体识别(Named Entity Recognition,NER)的性能影响自然语言处理中诸多下游任务。跨度分类是命名实体识别常用的方法,由于其需要枚举每一个跨度,因此存在高复杂度和大量负实例问题。此外,对每个跨度的独立预测不仅忽略了词与词之... 命名实体识别(Named Entity Recognition,NER)的性能影响自然语言处理中诸多下游任务。跨度分类是命名实体识别常用的方法,由于其需要枚举每一个跨度,因此存在高复杂度和大量负实例问题。此外,对每个跨度的独立预测不仅忽略了词与词之间的依赖关系和位置信息,而且导致模型获取的语义信息较为单一,从而忽略了全局信息。针对上述问题,本文提出结合位置感知的命名实体识别方法。具体来说,首先使用位置编码增强词与词之间的位置特征,序列融合了绝对位置信息和相对位置信息,从而得到关注语序的语义信息,预测可能的实体边界;然后对候选实体边界进行匹配组合并过滤生成带有标签信息的候选实体实例;最后使用具有局部信息感知的标签注意力机制和多层感知机联合判断候选实体的标签。实验结果表明,本文提出模型在ACE2005、GENIA和CoNLL-2003数据集上的F 1分数分别达到90.02%、81.33%和94.52%,该结果充分验证了所提模型在不同数据集上的有效性,进一步证明了其在命名实体识别任务中的优越性能。 展开更多
关键词 命名实体识别 嵌套命名实体识别 边界检测 位置编码 神经网络
在线阅读 下载PDF
基于提示标签协同的关系抽取方法
14
作者 冉哲宇 陈艳平 +2 位作者 王凯 黄瑞章 秦永彬 《计算机科学与探索》 北大核心 2025年第6期1580-1587,共8页
提示学习可以将下游任务转换为预训练任务形式的掩码预测任务。然而,将提示学习应用于关系抽取任务时,由于掩码的输出是标签类别的语义向量表示,容易导致生成空间过大而对掩码语义解析度不足。针对这一问题,提出了一种基于提示标签协同... 提示学习可以将下游任务转换为预训练任务形式的掩码预测任务。然而,将提示学习应用于关系抽取任务时,由于掩码的输出是标签类别的语义向量表示,容易导致生成空间过大而对掩码语义解析度不足。针对这一问题,提出了一种基于提示标签协同的关系抽取方法。为每个关系类构建两组同义词标签。其中一组用于学习掩码表示,另一组用于强化标签语义。在掩码语言模型中引入约束层以对掩码表示进行双向约束。使得两组同义词标签间隐含差异的语义和先验知识能够融入到关系表示中。由于同义词标签是基于知识初始化的,它们在潜在变量空间中可能不是最优的,应该与周围的上下文相关联。因此,在训练过程中,同义词标签表示会与掩码共同参与优化。提出的方法能够提高模型对标签语义的认知能力,同时优化掩码表示,从而提升模型对掩码的语义解析能力。实验结果表明,该方法在标准和小样本设置的三个公共数据集上均明显优于对比方法,证明了该方法的有效性。 展开更多
关键词 提示学习 提示标签协同 掩码语言模型
在线阅读 下载PDF
基于探测间隔变化的OpenFlow交换机超时嗅探方法
15
作者 杨致远 崔允贺 +1 位作者 陈意 郭春 《信息网络安全》 北大核心 2025年第2期295-305,共11页
软件定义网络(SDN)通过分离控制平面和数据平面实现了网络的集中化、可编程化和灵活化。但这种架构也使SDN面临新的攻击威胁,针对SDN交换机的超时嗅探是其面临的主要安全威胁之一。现有的超时嗅探方法忽略了超时的最大值、探测包的生成... 软件定义网络(SDN)通过分离控制平面和数据平面实现了网络的集中化、可编程化和灵活化。但这种架构也使SDN面临新的攻击威胁,针对SDN交换机的超时嗅探是其面临的主要安全威胁之一。现有的超时嗅探方法忽略了超时的最大值、探测包的生成时间以及超时之间的关系对于探测超时的影响,导致出现探测失败、超时类型识别错误和超时值探测精度低的问题。为解决上述问题,文章提出一种基于探测间隔变化的OpenFlow交换机流表项超时机制嗅探方法—TIMIC。该方法先通过调整探测包的发送间隔获得超时值,再通过该超时值判断具体的超时机制及更精确的超时值。实验结果表明,TIMIC在不同的超时机制下都能成功探测超时类型和超时值,且探测出的超时值能够保持较小的探测误差。在通用的超时设置下,TIMIC发送的超时探测包更少,探测成本更低。 展开更多
关键词 软件定义网络 超时机制嗅探 探测间隔
在线阅读 下载PDF
基于大语言模型的多输入中文拼写纠错方法
16
作者 马灿 黄瑞章 +2 位作者 任丽娜 白瑞娜 伍瑶瑶 《计算机应用》 北大核心 2025年第3期849-855,共7页
中文拼写纠错(CSC)是自然语言处理(NLP)中的一项重要研究任务,现有的基于大语言模型(LLM)的CSC方法由于LLM的生成机制,会生成和原文存在语义偏差的纠错结果。因此,提出基于LLM的多输入CSC方法。该方法包含多输入候选集合构建和LLM纠错... 中文拼写纠错(CSC)是自然语言处理(NLP)中的一项重要研究任务,现有的基于大语言模型(LLM)的CSC方法由于LLM的生成机制,会生成和原文存在语义偏差的纠错结果。因此,提出基于LLM的多输入CSC方法。该方法包含多输入候选集合构建和LLM纠错两阶段:第一阶段将多个小模型的纠错结果构建为多输入候选集合;第二阶段使用LoRA(Low-Rank Adaptation)对LLM进行微调,即借助LLM的推理能力,在多输入候选集合中预测出没有拼写错误的句子作为最终的纠错结果。在公开数据集SIGHAN13、SIGHAN14、SIGHAN15和修正后的SIGHAN15上的实验结果表明,相较于使用LLM直接生成纠错结果的方法Prompt-GEN-1,所提方法的纠错F1值分别提升了9.6、24.9、27.9和34.2个百分点,相较于表现次优的纠错小模型,所提方法的纠错F1值分别提升了1.0、1.1、0.4和2.4个百分点,验证了所提方法能提升CSC任务的效果。 展开更多
关键词 中文拼写纠错 大语言模型 模型集成 模型微调 提示学习
在线阅读 下载PDF
基于特征组合的异构图注意力网络关系抽取
17
作者 闫家鑫 陈艳平 +2 位作者 杨卫哲 黄瑞章 秦永彬 《计算机应用》 北大核心 2025年第8期2470-2476,共7页
关系抽取旨在从句子中提取2个实体之间的预定义语义关系。传统基于图神经网络的关系抽取方法一般通过依赖树构建句子的图表示结构;然而,使用依赖树构建出的图结构表达能力单一,且无法完整捕捉到目标实体丰富的语法结构信息。针对这些问... 关系抽取旨在从句子中提取2个实体之间的预定义语义关系。传统基于图神经网络的关系抽取方法一般通过依赖树构建句子的图表示结构;然而,使用依赖树构建出的图结构表达能力单一,且无法完整捕捉到目标实体丰富的语法结构信息。针对这些问题,提出基于特征组合的异构图注意力网络(HGAT)关系抽取方法。首先,抽取句子中的原子特征,并通过组合这些原子特征得到句子的组合特征;其次,把组合特征和关系标签表示为异构图上的两种节点以构建“特征-关系二部图”;最后,使用图注意力网络动态地更新节点,进而实现关系抽取。所提方法能有效利用组合特征和句子中的语法结构信息,进而提升关系抽取的性能。在ACE05英文数据集和SemEval-2010 task 8数据集上的实验结果表明,所提方法分别达到了84.11%和90.67%的F1值,证明了所提方法的有效性。 展开更多
关键词 关系抽取 原子特征 特征组合 异构图 图注意力网络
在线阅读 下载PDF
联合边界生成的多目标学习的嵌套命名实体识别
18
作者 徐章杰 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机应用》 北大核心 2025年第7期2229-2236,共8页
命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对... 命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对跨度间边界语义信息模糊的问题,提出一种联合边界生成的多目标学习NER模型。该模型通过联合NER任务和边界生成任务,以多目标学习的方式进行共同训练。其中:使用边界生成任务作为辅助任务引导模型网络关注跨度的边界信息,以增强跨度的边界语义,进而提升NER的性能。在ACE2004、ACE2005和GENIA数据集上进行测试,所提模型的F1值分别达到了87.83%、86.90%和81.65%,实验结果充分验证了该模型在不同数据集上的有效性,也进一步验证了该模型在命名实体识别任务中的优越性能。 展开更多
关键词 命名实体识别 跨度分类 多目标学习 边界生成 神经网络
在线阅读 下载PDF
基于掩码注意力与多特征卷积网络的关系抽取方法
19
作者 卢展跃 陈艳平 +2 位作者 杨卫哲 黄瑞章 秦永彬 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期12-22,共11页
关系抽取旨在抽取2个命名实体之间的语义关系。近年来,提示学习通过拼接提示模板并进行掩码预测的方式,统一了预训练语言模型训练和微调过程的优化目标,在关系抽取领域取得优异的性能。然而,固定的提示模板与关系实例间的弱语义关联导... 关系抽取旨在抽取2个命名实体之间的语义关系。近年来,提示学习通过拼接提示模板并进行掩码预测的方式,统一了预训练语言模型训练和微调过程的优化目标,在关系抽取领域取得优异的性能。然而,固定的提示模板与关系实例间的弱语义关联导致模型对复杂关系的语义感知能力差。针对这一问题,本文提出一种基于掩码注意力与多特征卷积网络的关系抽取方法。该方法采用三仿射注意力机制将提示模板中的掩码与关系实例的语义空间进行交互映射,形成二维掩码语义,并利用多特征卷积网络和多层感知机提取二维掩码语义中的关系信息。该方法通过建立掩码与关系实例间的显式语义依赖,增强提示模型对复杂关系的语义感知能力。该方法在数据集SemEval、SciERC和CLTC上的F_(1)值分别达到91.4%、91.2%和82.6%,验证了该方法的有效性。 展开更多
关键词 自然语言处理 关系抽取 提示学习 三仿射注意力机制 卷积神经网络
在线阅读 下载PDF
融合深度强化学习的卷积神经网络联合压缩方法
20
作者 马祖鑫 崔允贺 +4 位作者 秦永彬 申国伟 郭春 陈意 钱清 《计算机工程与应用》 北大核心 2025年第6期210-219,共10页
随着边缘计算、边缘智能等概念的兴起,卷积神经网络的轻量化部署逐渐成为研究热点。传统的卷积神经网络压缩技术通常分阶段地、独立地执行剪枝与量化策略,但这种方式没有考虑剪枝与量化过程的相互影响,使其无法达到最优的剪枝与量化结果... 随着边缘计算、边缘智能等概念的兴起,卷积神经网络的轻量化部署逐渐成为研究热点。传统的卷积神经网络压缩技术通常分阶段地、独立地执行剪枝与量化策略,但这种方式没有考虑剪枝与量化过程的相互影响,使其无法达到最优的剪枝与量化结果,影响压缩后的模型性能。针对以上问题,提出一种基于深度强化学习的神经网络联合压缩方法——CoTrim。CoTrim同时执行通道剪枝与权值量化,利用深度强化学习算法搜索出全局最优的剪枝与量化策略,以平衡剪枝与量化对网络性能的影响。在CIFAR-10数据集上对VGG和ResNet进行实验,实验表明,对于常见的单分支卷积和残差卷积结构,CoTrim能够在精度损失仅为2.49个百分点的情况下,将VGG16的模型大小压缩至原来的1.41%。在复杂数据集Imagenet-1K上对紧凑网络MobileNet和密集连接网络DenseNet进行实验,实验表明,对于深度可分离卷积结构以及密集连接结构,CoTrim依旧能保证精度损失在可接受范围内将模型压缩为原始大小的1/5~1/8。 展开更多
关键词 卷积神经网络 深度强化学习 模型压缩 通道剪枝 权值量化 边缘智能
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部