期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于意图正则化的深度半监督文本聚类
1
作者 徐乐 黄瑞章 +1 位作者 白瑞娜 秦永彬 《计算机应用》 北大核心 2025年第7期2145-2152,共8页
针对现有半监督文本聚类方法无法同时在表示学习和聚类过程中考虑用户意图的问题,提出基于意图正则化的深度半监督文本聚类(IRDSTC)模型。通过引入意图正则化策略,设计意图正则化的表示学习(IRRL)模块和意图正则化的聚类(IRC)模块。首先... 针对现有半监督文本聚类方法无法同时在表示学习和聚类过程中考虑用户意图的问题,提出基于意图正则化的深度半监督文本聚类(IRDSTC)模型。通过引入意图正则化策略,设计意图正则化的表示学习(IRRL)模块和意图正则化的聚类(IRC)模块。首先,根据用户提供的意图约束信息构建意图矩阵,以捕获用户对文本之间关系的期望。其次,将该矩阵应用到表示学习阶段和聚类阶段:在表示学习阶段,将深度模型提取的中间层表示转换为表示关联性矩阵,并结合意图矩阵构造正则项,以利用用户意图驱动表示学习;在聚类阶段,根据聚类迭代得到的类簇分配概率构造分配一致性矩阵,并结合意图矩阵构造正则项,以实现用户意图对聚类过程的指导。实验结果表明,IRDSTC模型在Reu-10k、BBC、ACM和Abstract数据集上相较于其他聚类方法在聚类准确率(ACC)、标准化互信息(NMI)和调整兰德指数(ARI)上均具有更好的表现。具体而言,相较于次优模型改进的深度嵌入聚类(IDEC),IRDSTC模型的NMI分别提升了28.26%、32.58%、27.13%和34.94%,表明IRDSTC模型具有更好的聚类效果。 展开更多
关键词 意图 正则化 半监督 文本聚类
在线阅读 下载PDF
融合时序行为链与事件类型的类案检索方法 被引量:1
2
作者 詹力林 秦永彬 +2 位作者 黄瑞章 王华 陈艳平 《计算机应用》 北大核心 2025年第6期1741-1747,共7页
针对现有的类案检索(LCR)方法缺乏对案情要素的有效利用而容易被案例内容的语义结构相似性误导的问题,提出一种融合时序行为链与事件类型的类案检索方法。首先,采取序列标注的方法识别案情描述中的法律事件类型,并利用案例文本中的行为... 针对现有的类案检索(LCR)方法缺乏对案情要素的有效利用而容易被案例内容的语义结构相似性误导的问题,提出一种融合时序行为链与事件类型的类案检索方法。首先,采取序列标注的方法识别案情描述中的法律事件类型,并利用案例文本中的行为要素构建时序行为链,以突出案情的关键要素,从而使模型聚焦于案例的核心内容,进而解决现有方法易被案例内容的语义结构相似性误导的问题;其次,利用分段编码构造时序行为链的相似性向量表征矩阵,从而增强案例间行为要素的语义交互;最后,通过聚合评分器,从时序行为链、法律事件类型、犯罪类型这3个角度衡量案例的相关性,从而增加案例匹配得分的合理性。实验结果表明,相较于SAILER(Structure-Aware pre-traIned language model for LEgal case Retrieval)方法,所提方法在LeCaRD(Legal Case Retrieval Dataset)上的P@5值提升了4个百分点、P@10值提升了3个百分点、MAP值提升了4个百分点,而NDCG@30值提升了0.8个百分点。可见,该方法能有效利用案情要素来避免案例内容的语义结构相似性的干扰,并能为类案检索提供可靠的依据。 展开更多
关键词 案情要素 行为要素 事件类型 时序行为链 聚合评分器
在线阅读 下载PDF
基于大语言模型的多输入中文拼写纠错方法
3
作者 马灿 黄瑞章 +2 位作者 任丽娜 白瑞娜 伍瑶瑶 《计算机应用》 北大核心 2025年第3期849-855,共7页
中文拼写纠错(CSC)是自然语言处理(NLP)中的一项重要研究任务,现有的基于大语言模型(LLM)的CSC方法由于LLM的生成机制,会生成和原文存在语义偏差的纠错结果。因此,提出基于LLM的多输入CSC方法。该方法包含多输入候选集合构建和LLM纠错... 中文拼写纠错(CSC)是自然语言处理(NLP)中的一项重要研究任务,现有的基于大语言模型(LLM)的CSC方法由于LLM的生成机制,会生成和原文存在语义偏差的纠错结果。因此,提出基于LLM的多输入CSC方法。该方法包含多输入候选集合构建和LLM纠错两阶段:第一阶段将多个小模型的纠错结果构建为多输入候选集合;第二阶段使用LoRA(Low-Rank Adaptation)对LLM进行微调,即借助LLM的推理能力,在多输入候选集合中预测出没有拼写错误的句子作为最终的纠错结果。在公开数据集SIGHAN13、SIGHAN14、SIGHAN15和修正后的SIGHAN15上的实验结果表明,相较于使用LLM直接生成纠错结果的方法Prompt-GEN-1,所提方法的纠错F1值分别提升了9.6、24.9、27.9和34.2个百分点,相较于表现次优的纠错小模型,所提方法的纠错F1值分别提升了1.0、1.1、0.4和2.4个百分点,验证了所提方法能提升CSC任务的效果。 展开更多
关键词 中文拼写纠错 大语言模型 模型集成 模型微调 提示学习
在线阅读 下载PDF
联合边界生成的多目标学习的嵌套命名实体识别
4
作者 徐章杰 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机应用》 北大核心 2025年第7期2229-2236,共8页
命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对... 命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对跨度间边界语义信息模糊的问题,提出一种联合边界生成的多目标学习NER模型。该模型通过联合NER任务和边界生成任务,以多目标学习的方式进行共同训练。其中:使用边界生成任务作为辅助任务引导模型网络关注跨度的边界信息,以增强跨度的边界语义,进而提升NER的性能。在ACE2004、ACE2005和GENIA数据集上进行测试,所提模型的F1值分别达到了87.83%、86.90%和81.65%,实验结果充分验证了该模型在不同数据集上的有效性,也进一步验证了该模型在命名实体识别任务中的优越性能。 展开更多
关键词 命名实体识别 跨度分类 多目标学习 边界生成 神经网络
在线阅读 下载PDF
基于先验驱动的体素内不相干运动的参数估计
5
作者 胡国栋 叶晨 《计算机科学》 北大核心 2025年第6期211-218,共8页
体素内不相干运动(Intravoxel Incoherent Motion,IVIM)模型利用扩散加权磁共振成像的原理(Diffusion-weighted Magnetic Resonance Imaging,DWI),能够无损获得生物活体组织的水分子扩散系数(D)和血液灌注信息(F,D^(*))。但是传统的IVI... 体素内不相干运动(Intravoxel Incoherent Motion,IVIM)模型利用扩散加权磁共振成像的原理(Diffusion-weighted Magnetic Resonance Imaging,DWI),能够无损获得生物活体组织的水分子扩散系数(D)和血液灌注信息(F,D^(*))。但是传统的IVIM参数估计方法对噪音敏感,特别是在肝脏等受呼吸运动影响的腹部器官,因此参数估计效果不佳。为了提高参数估计模型的噪音鲁棒性,提出一个先验驱动的神经网络(Prior-Driven Neural Network,PDNN),利用全监督训练自适应学习到的先验知识去指导无监督训练。使用均方误差根(Root Mean Square Errors,RMSE)在不同信噪比上评估模型的噪音鲁棒性,采用变异系数(Coefficient of Variation,CV)分布来区分肝脏健康组和肝硬化组之间的显著性差异,并与非线性最小二乘、基于体素的深度学习方法IVIM-NET optim和基于领域信息的2D卷积网络SSUN比较。结果表明,所提出的方法具有最好的噪音鲁棒性,拟合参数[D,F,D^(*)]在所有信噪比上的RMSE指标比次优方法分别低27.63%,23.72%,31.46%。此外,所提方法能更好地保存组织结构信息,有效区分了健康肝脏和肝硬化(CV分布具有显著性差异,P<0.05)。 展开更多
关键词 体素内不相干运动成像 参数估计 肝硬化 深度学习
在线阅读 下载PDF
CHAIN:基于重合支配的边缘计算节点放置算法 被引量:1
6
作者 赵徐炎 崔允贺 +4 位作者 蒋朝惠 钱清 申国伟 郭春 李显超 《计算机应用》 CSCD 北大核心 2023年第9期2812-2818,共7页
边缘计算将计算资源部署在离终端用户更近的边缘计算节点,从待选的位置中选择合适的边缘计算节点部署位置能提升边缘计算服务的节点容量以及用户服务质量(QoS)。然而,目前对于如何放置边缘计算节点以降低边缘计算成本的研究较少。此外,... 边缘计算将计算资源部署在离终端用户更近的边缘计算节点,从待选的位置中选择合适的边缘计算节点部署位置能提升边缘计算服务的节点容量以及用户服务质量(QoS)。然而,目前对于如何放置边缘计算节点以降低边缘计算成本的研究较少。此外,在边缘服务的时延等QoS因素的约束下,目前尚没有一种边缘计算节点部署算法能最大限度地提高边缘服务的鲁棒性同时最小化边缘节点部署成本。针对上述问题,首先,通过建立计算节点、用户传输时延和鲁棒性的模型将边缘计算节点放置问题转化为带约束条件的最小支配集问题;随后,提出重合支配的概念,基于重合支配衡量网络鲁棒性,设计了基于重合支配的边缘计算节点放置算法——CHAIN(edge server plaCement algoritHm based on overlApping domINation)。仿真实验结果表明,与面向覆盖的近似算法和面向基站的随机算法相比,CHAIN的系统时延降低了50.54%与50.13%。 展开更多
关键词 边缘计算 边缘计算节点放置 鲁棒性 部署成本 重合支配
在线阅读 下载PDF
基于掩码提示与门控记忆网络校准的关系抽取方法 被引量:2
7
作者 魏超 陈艳平 +2 位作者 王凯 秦永彬 黄瑞章 《计算机应用》 CSCD 北大核心 2024年第6期1713-1719,共7页
针对关系抽取(RE)任务中实体关系语义挖掘困难和预测关系有偏差等问题,提出一种基于掩码提示与门控记忆网络校准(MGMNC)的RE方法。首先,利用提示中的掩码学习实体之间在预训练语言模型(PLM)语义空间中的潜在语义,通过构造掩码注意力权... 针对关系抽取(RE)任务中实体关系语义挖掘困难和预测关系有偏差等问题,提出一种基于掩码提示与门控记忆网络校准(MGMNC)的RE方法。首先,利用提示中的掩码学习实体之间在预训练语言模型(PLM)语义空间中的潜在语义,通过构造掩码注意力权重矩阵,将离散的掩码语义空间相互关联;其次,采用门控校准网络将含有实体和关系语义的掩码表示融入句子的全局语义;再次,将它们作为关系提示校准关系信息,随后将句子表示的最终表示映射至相应的关系类别;最后,通过更好地利用提示中掩码,并结合传统微调方法的学习句子全局语义的优势,充分激发PLM的潜力。实验结果表明,所提方法在SemEval(SemEval-2010 Task 8)数据集的F1值达到91.4%,相较于RELA(Relation Extraction with Label Augmentation)生成式方法提高了1.0个百分点;在SciERC(Entities, Relations, and Coreference for Scientific knowledge graph construction)和CLTC(Chinese Literature Text Corpus)数据集上的F1值分别达到91.0%和82.8%。所提方法在上述3个数据集上均明显优于对比方法,验证了所提方法的有效性。相较于基于生成式的方法,所提方法实现了更优的抽取性能。 展开更多
关键词 关系抽取 掩码 门控神经网络 预训练语言模型 提示学习
在线阅读 下载PDF
基于事件表示和对比学习的深度事件聚类方法 被引量:2
8
作者 蒋小霞 黄瑞章 +2 位作者 白瑞娜 任丽娜 陈艳平 《计算机应用》 CSCD 北大核心 2024年第6期1734-1742,共9页
针对现有深度聚类方法不考虑事件信息及其结构特点而难以有效划分事件类型的问题,提出一种基于事件表示和对比学习的深度事件聚类方法(DEC_ERCL)。首先,利用信息识别手段从非结构化文本中识别结构化的事件信息,避免冗余信息对事件语义... 针对现有深度聚类方法不考虑事件信息及其结构特点而难以有效划分事件类型的问题,提出一种基于事件表示和对比学习的深度事件聚类方法(DEC_ERCL)。首先,利用信息识别手段从非结构化文本中识别结构化的事件信息,避免冗余信息对事件语义的影响;其次,将事件的结构信息集成于自编码器中学习低维稠密的事件表示,并以此作为下游聚类划分的依据;最后,为有效建模事件之间的细微差异,在特征学习过程中加入多正例对比损失。在数据集DuEE、FewFC、Military和ACE2005上的实验结果表明,相较于其他深度聚类方法,所提方法在准确率和标准化互信息(NMI)评价指标上均表现更好;相较于次优的方法,DEC_ERCL的聚类准确率分别提升了17.85%、9.26%、7.36%和33.54%,表明了DEC_ERCL具有更好的事件聚类效果。 展开更多
关键词 深度聚类 文本聚类 事件表示 事件结构 对比学习
在线阅读 下载PDF
结合大语言模型与动态提示的裁判文书摘要方法
9
作者 张滨滨 秦永彬 +1 位作者 黄瑞章 陈艳平 《计算机应用》 2025年第9期2783-2789,共7页
针对裁判文书案件结构复杂、涉案事实冗余且案情分布广泛的问题,现有的大语言模型(LLM)难以有效关注结构信息并可能会产生事实错误关联,从而导致结构信息缺失和事实不一致。因此,提出一种结合LLM与动态提示的裁判文书摘要方法DPCM(Dynam... 针对裁判文书案件结构复杂、涉案事实冗余且案情分布广泛的问题,现有的大语言模型(LLM)难以有效关注结构信息并可能会产生事实错误关联,从而导致结构信息缺失和事实不一致。因此,提出一种结合LLM与动态提示的裁判文书摘要方法DPCM(Dynamic Prompt Correction Method)。首先,利用LLM进行单样本学习,以生成裁判文书摘要。其次,计算原文与摘要之间的高维相似性,以检测摘要中可能存在的结构缺失或事实不一致的问题:如果发现问题,将错误摘要与原文拼接,并加入提示词,随后再次进行单样本学习,以修正并生成新的摘要,且再次进行相似性检测,如果问题仍然存在,则重复此生成与检测过程。最后,通过这种反复迭代的方式动态调整提示词,以逐步优化生成的摘要。在CAIL2020公共司法摘要数据集上的实验结果表明,相较于Least-To-Most-Prompting、Zero-Shot-Reasoners和Self_Consistency_Cot等方法,所提方法在Rouge-1、Rouge-2、Rouge-L、BERTscore、FactCC(Factual Consistency)指标上均有所提高。 展开更多
关键词 敏感信息 数据集构建 数据增强 BERT 命名实体识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部