期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
计算机辅助维吾尔族花帽纹样绘制方法的实现
1
作者 刘淑娴 李晓华 《计算机应用与软件》 CSCD 北大核心 2013年第4期124-127,共4页
新疆维吾尔族小花帽誉满中外,其品种样式之丰富,纹样绣法之多,工艺制作之精美,在国内各民族帽饰系列中堪称之最,在世界民族服饰艺术之林中也为少见。通过对维吾尔花帽的分析研究,研究维吾尔花帽的构图规律,分析基本图案纹样的特征,研究... 新疆维吾尔族小花帽誉满中外,其品种样式之丰富,纹样绣法之多,工艺制作之精美,在国内各民族帽饰系列中堪称之最,在世界民族服饰艺术之林中也为少见。通过对维吾尔花帽的分析研究,研究维吾尔花帽的构图规律,分析基本图案纹样的特征,研究计算机辅助维吾尔花帽图案纹样建模的关键技术,寻求计算机辅助设计在民族服饰传统图案绘制中的应用方法,从而实现计算机辅助设计在民族服装服饰设计中的应用探索。 展开更多
关键词 纹样 BÉZIER曲线 花帽
在线阅读 下载PDF
多模态知识图谱融合技术研究综述 被引量:17
2
作者 陈囿任 李勇 +1 位作者 温明 孙驰 《计算机工程与应用》 CSCD 北大核心 2024年第13期36-50,共15页
多模态知识图谱融合了视觉、文本等多种模态信息,并以图的形式展现知识结构。随着人工智能的发展,多模态知识图谱在推荐系统、智能问答和知识搜索等领域发挥了重要作用。与传统知识图谱相比,多模态知识图谱可以多维度理解和展现知识,有... 多模态知识图谱融合了视觉、文本等多种模态信息,并以图的形式展现知识结构。随着人工智能的发展,多模态知识图谱在推荐系统、智能问答和知识搜索等领域发挥了重要作用。与传统知识图谱相比,多模态知识图谱可以多维度理解和展现知识,有更好的表示和应用能力。为了深入研究多模态知识图谱,对多模态知识图谱价值及类别进行了详细的分析与阐述,根据多模态知识图谱构建中融合方法的不同,从多源异构数据文本转换、表示学习、实体对齐、特征抽取方面进行对比和总结,重点对跨模态知识图谱融合技术分类叙述。对多模态知识图谱的应用进展进行了分析,并探讨了多模态知识图谱的局限性,提出了多模态知识图谱领域今后的研究方向。 展开更多
关键词 多模态知识图谱 语言模型 融合技术 预训练技术
在线阅读 下载PDF
压延车间能源信息采集关键技术研究与系统实现
3
作者 聂鑫鹏 袁逸萍 +1 位作者 祁雷 朱广贺 《现代制造工程》 CSCD 北大核心 2024年第6期75-81,共7页
结合铝箔压延车间的工艺流程以及能耗数据特点,提出了一套基于物联网的压延车间能源信息采集系统。针对采集过程中遇到的能耗数据缺失问题,设计了一套缺失数据处理流程,其中利用到了WOA-CNN-LSTM混合神经网络算法来插补缺失数据。系统... 结合铝箔压延车间的工艺流程以及能耗数据特点,提出了一套基于物联网的压延车间能源信息采集系统。针对采集过程中遇到的能耗数据缺失问题,设计了一套缺失数据处理流程,其中利用到了WOA-CNN-LSTM混合神经网络算法来插补缺失数据。系统的开发采用了MQTT协议、JAVA语言及SpringBoot框架等技术。实现了对生产流程的能源信息采集、统计与监管,改善了压延车间能源信息采集过程中的数据缺失问题,提高了数据准确度。 展开更多
关键词 压延车间 能源信息采集 缺失数据 鲸鱼优化算法 卷积神经网络 长短期记忆网络
在线阅读 下载PDF
一类新疆民族风格的织物图案生成方法 被引量:15
4
作者 赵海英 徐正光 张彩明 《图学学报》 CSCD 北大核心 2012年第2期1-8,共8页
独具文化内涵的新疆民族织物图案是中华民族艺术瑰宝的重要组成部分。为了生成一类具有民族特色或风格的新疆织物图案,如何自动分割织物图案提取风格特征是一个关键问题。论文以需求为驱动,提出了纹样基因的概念。首先利用连通区域标记... 独具文化内涵的新疆民族织物图案是中华民族艺术瑰宝的重要组成部分。为了生成一类具有民族特色或风格的新疆织物图案,如何自动分割织物图案提取风格特征是一个关键问题。论文以需求为驱动,提出了纹样基因的概念。首先利用连通区域标记法切割图案,提取分割区域特征,根据投票原则过滤获得纹样基因;然后设计六边形构型,嵌入纹样基因;按构型旋转变换生成具有民族风格的织物图案。以提取维吾尔族和哈萨克族两类民族织物图案纹样基因,利用六边形结构堆砌生成图案进行仿真实验,并对图案的风格相似度进行评价。结论是基于纹样基因的生成算法,不仅能够丰富图案风格化设计素材,而且为传承民族图案风格设计提供新途径。 展开更多
关键词 纹样基因 特征筛选 六边形堆砌 风格生成
在线阅读 下载PDF
基于外部排序的字串左右熵快速计算方法 被引量:2
5
作者 张海军 彭成 栾静 《计算机工程与应用》 CSCD 北大核心 2011年第19期18-20,共3页
左右熵在自然语言处理领域有着广泛应用,但目前尚无有效方法实施大规模语料中海量模式的左右熵快速计算。提出了一种计算方法,对于某长度字串计算熵,首先按长度提取语料中的全部字串,使用外部排序和归并获取字串的出现频率,然后分别剔... 左右熵在自然语言处理领域有着广泛应用,但目前尚无有效方法实施大规模语料中海量模式的左右熵快速计算。提出了一种计算方法,对于某长度字串计算熵,首先按长度提取语料中的全部字串,使用外部排序和归并获取字串的出现频率,然后分别剔除首尾字符构造待计算字串的频率提供文件,最后使用文件记录频率对比来计算右熵和左熵。分析和实验表明,该方法的计算量同语料规模成线性关系,适于大规模语料中海量字串的左右熵计算。 展开更多
关键词 自然语言处理 左右熵 统计特征 新词检测
在线阅读 下载PDF
基于局部区域拟合模型的磁共振图像分割与偏移估计算法 被引量:1
6
作者 任鸽 曹兴芹 杨勇 《计算机应用》 CSCD 北大核心 2011年第12期3350-3352,3356,共4页
磁共振(MR)图像的灰度通常是不均匀的,这种不均匀性是由于成像设备的缺陷导致产生了一种光滑的偏移场。一般的基于灰度统计特性的分割算法都是假设目标区域和背景区域图像的灰度分别是一致的,因此该类算法不能很好地应用于磁共振图像的... 磁共振(MR)图像的灰度通常是不均匀的,这种不均匀性是由于成像设备的缺陷导致产生了一种光滑的偏移场。一般的基于灰度统计特性的分割算法都是假设目标区域和背景区域图像的灰度分别是一致的,因此该类算法不能很好地应用于磁共振图像的分割。提出一种基于局部拟合模型的磁共振图像分割与偏移估计算法:利用图像的局部区域的灰度特性建立恢复图像的灰度、偏移量,以及区域指示函数之间的能量函数,然后分别针对恢复图像的灰度、偏移量以及指示函数进行优化。该算法可以同时对磁共振图像进行分割与偏移估计。实验结果表明该算法优于目前比较流行的磁共振图像分割与去偏移算法如变分水平集方法。 展开更多
关键词 图像分割 水平集 偏移估计 磁共振图像
在线阅读 下载PDF
基于数字孪生的电极箔化成车间调度系统研究
7
作者 左怡鑫 袁逸萍 +1 位作者 朱广贺 刘鹏飞 《机床与液压》 北大核心 2025年第15期71-78,共8页
化成工艺是电极箔生产过程中的关键工艺环节。为了应对化成车间作业过程中的扰动事件,如紧急插单和生产过程信息监控不足等,导致生产偏离原调度计划且无法快速响应这些扰动问题,提出一种基于数字孪生的电极箔化成车间动态调度方法。通... 化成工艺是电极箔生产过程中的关键工艺环节。为了应对化成车间作业过程中的扰动事件,如紧急插单和生产过程信息监控不足等,导致生产偏离原调度计划且无法快速响应这些扰动问题,提出一种基于数字孪生的电极箔化成车间动态调度方法。通过构建电极箔化成车间动态调度数字孪生框架及其相应的数学模型,加快物理车间与虚拟车间的实时交互,以提升调度效率。针对化成车间生产调度问题,设计改进粒子群算法对调度问题进行求解。最后,以企业实际的紧急插单为例,验证了动态调度系统与改进粒子群算法在解决化成车间动态调度问题时的有效性。 展开更多
关键词 数字孪生 化成车间 动态调度 改进粒子群算法
在线阅读 下载PDF
基于注意力机制的深层特征融合MOOC评论情感分析
8
作者 韦金矿 贾灿 +1 位作者 王鹏飞 艾孜尔古丽·玉素甫 《现代电子技术》 北大核心 2025年第14期63-70,共8页
在线教育因大众对多样化学习的渴求及技术进步而迅猛发展。分析中国大学MOOC网站上在线评论的情感倾向,对于课程的优化及平台的高质量发展具有重要意义。针对目前文本情感分析任务中存在的难以充分提取和融合文本特征信息、泛化性能不... 在线教育因大众对多样化学习的渴求及技术进步而迅猛发展。分析中国大学MOOC网站上在线评论的情感倾向,对于课程的优化及平台的高质量发展具有重要意义。针对目前文本情感分析任务中存在的难以充分提取和融合文本特征信息、泛化性能不足的问题,提出一种基于注意力机制的深层特征融合MOOC评论情感分析模型,即BERT-RAP。利用BERT提取出文本的丰富语义,通过BiLSTM进一步提取序列信息来更好地捕捉文本的特征表达,同时采用注意力机制捕捉序列中最相关的部分;之后对MOOC评论文本进行关键词提取,并将关键词词嵌入与注意力加权的BiLSTM输出通过亲和力矩阵进行特征交互,以便模型融合不同的特征来挖掘更深层的语义。由于数据可能存在较大离群值,采用百分比池化方法在一定程度上降低模型对离群值的敏感程度,从而提高模型的鲁棒性。最后通过情感分类器获得文本所属情感。实验结果表明,在MOOC评论数据集上,与文本情感分析基线模型相比,所提模型情感分类效果更佳。 展开更多
关键词 MOOC评论文本 情感分析 语义提取 特征融合 BERT模型 BiLSTM 自注意力机制 百分比池化方法
在线阅读 下载PDF
基于超图的自监督推荐算法
9
作者 贾小暾 温明 +3 位作者 杨晓龙 陈宝涛 李爱荣 任媛媛 《计算机工程与设计》 北大核心 2025年第3期834-840,共7页
为改善基于图神经网络的推荐模型在实际推荐场景中面临数据出现噪声和倾斜分布时性能下降的问题,提出一种基于超图的自监督推荐算法。采用超图Transformer捕捉用户与物品之间的全局关系,引入自监督学习以增强数据,提高模型的鲁棒性。在... 为改善基于图神经网络的推荐模型在实际推荐场景中面临数据出现噪声和倾斜分布时性能下降的问题,提出一种基于超图的自监督推荐算法。采用超图Transformer捕捉用户与物品之间的全局关系,引入自监督学习以增强数据,提高模型的鲁棒性。在实际数据集上的训练结果表明,模型在提升推荐效果方面表现优异,特别是在解决数据稀疏性和噪声问题上表现出较强的能力。通过消融实验进一步验证了这些发现,展现了该算法在现代推荐系统中的应用潜力。 展开更多
关键词 噪声数据 推荐算法 超图 全局关系 自监督学习 交互图 数据增强
在线阅读 下载PDF
多模态知识图谱的人才智能评价
10
作者 王彬昊 温明 +3 位作者 杨晓龙 袁梓馨 郑长青 董少华 《计算机工程与设计》 北大核心 2025年第5期1519-1525,共7页
针对以往传统的人工评测方法,经研究提出一种基于多模态知识图谱的人才智能评价方法,通过对文本信息和非文本信息进行编码,结合适当的语境和外部知识。通过整合上述语境和外部知识捕捉多模态语义表达的要点,精确做出评价并给予分数;分... 针对以往传统的人工评测方法,经研究提出一种基于多模态知识图谱的人才智能评价方法,通过对文本信息和非文本信息进行编码,结合适当的语境和外部知识。通过整合上述语境和外部知识捕捉多模态语义表达的要点,精确做出评价并给予分数;分别使用基于Transformer的编码器对所有的文本、图像和评价指标特征进行编码,使用交叉注意层在它们之间交换信息。在两个公开数据集和我们自己构建的数据集上进行大量实验,通过与其它基线方法进行比较,表明该方法在捕获关键语义信息和信息匹配方面明显优于其它基线方法。 展开更多
关键词 多模态 知识图谱 人才智能评价 交叉注意层 深度学习 基线方法 捕获关键语义信息
在线阅读 下载PDF
基于深度学习与D-S理论的多模态数据特征融合算法
11
作者 张燕 《吉林大学学报(理学版)》 北大核心 2025年第3期855-860,共6页
针对传统多模态数据特征融合算法存在融合效果较差的问题,提出一种基于深度学习与D-S(Dempster-Shafer)理论的多模态数据特征融合算法.首先,在深度学习框架内,采用受限Boltzmann机(RBM)对多模态数据进行训练,根据数据的特性和任务需求,... 针对传统多模态数据特征融合算法存在融合效果较差的问题,提出一种基于深度学习与D-S(Dempster-Shafer)理论的多模态数据特征融合算法.首先,在深度学习框架内,采用受限Boltzmann机(RBM)对多模态数据进行训练,根据数据的特性和任务需求,构建RBM模型结构进行多模态数据特征选择.其次,根据选取的特征选择计算同类模态数据之间的距离,确定信任函数,并设定阈值以删除异常数据,实现同类模态数据初步融合.最后,通过计算异类模态数据与不同等级特征之间的距离,确定异类数据的信任函数,结合D-S理论实现多模态数据特征融合.实验结果表明,该算法的纯度最高达1.0,标准化互信息最高达0.3,表明该算法可以获取精准的多模态数据特征融合结果. 展开更多
关键词 深度学习 D-S理论 多模态数据特征 融合
在线阅读 下载PDF
基于数据增强与主题知识共享的低资源情感分类
12
作者 蒋卓林 王宝乐 +2 位作者 艾孜尔古丽·玉素甫 韦金矿 王鹏飞 《中文信息学报》 北大核心 2025年第4期117-125,共9页
针对低资源语言社交媒体文本的情感分类是低资源语言舆情分析的基础。低资源语言数据集资源不足,标注困难。数据集的大小以及标签的不平衡会影响情感分类模型的性能。针对上述问题,该文提出了一种适用于低资源语言情感分析的数据增强方... 针对低资源语言社交媒体文本的情感分类是低资源语言舆情分析的基础。低资源语言数据集资源不足,标注困难。数据集的大小以及标签的不平衡会影响情感分类模型的性能。针对上述问题,该文提出了一种适用于低资源语言情感分析的数据增强方法,该方法改进了传统的数据增强方法,提高了数据增强样本生成的质量,用于缓解低资源和标签不平衡情况下的过拟合问题。同时,除了提取文本本身的情感特征,还通过引入主题特征,与语义信息进行融合编码,最终完成情感分类任务。实验结果表明,在构建的维吾尔语数据集上,其准确率与F 1值和多个基线模型相比均有提升,分别达到89.8%和90.3%的分类效果。最后,该模型在公开的英文数据集上也有很好的性能,具有良好的跨语言理解能力。 展开更多
关键词 文本情感分析 低资源 数据增强 预训练模型
在线阅读 下载PDF
基于QSA数组计算序列中所有NE重复模式的算法 被引量:3
13
作者 木妮娜.玉素甫 古丽娜.玉素甫 张海军 《计算机科学》 CSCD 北大核心 2014年第3期249-252,262,共5页
序列中重复模式的识别与提取算法在数据挖掘、模式识别、数据压缩、生物信息学等领域中具有广泛的实际应用。提出一种全新的基于QSA数组计算所有带有约束条件的NE重复模式的算法RPT。算法设计中充分考虑了NE重复模式的特征,以建立特征... 序列中重复模式的识别与提取算法在数据挖掘、模式识别、数据压缩、生物信息学等领域中具有广泛的实际应用。提出一种全新的基于QSA数组计算所有带有约束条件的NE重复模式的算法RPT。算法设计中充分考虑了NE重复模式的特征,以建立特征和重复模式检测结果之间的统计联系;算法中的约束条件包括最小周期pmin和最大间距gmax,其可用于筛选符合条件的NE重复模式,并可按照递增序输出所有NE重复模式的出现位置。与已有的基于后缀索引的算法相比,此算法的空间效率得到了提高。在分类属性数据样本集上进行的实验表明,算法RPT对生物序列尤其是DNA序列以及维吾尔语Web文本中NE重复模式的识别与提取都很有效。 展开更多
关键词 重复模式 数据挖掘 统计特征 约束条件 生物计算 维吾尔语Web文本
在线阅读 下载PDF
基于词缀的维吾尔谚语识别关键技术研究
14
作者 穆妮热.穆合塔尔 李晓 +2 位作者 杨雅婷 艾孜尔古丽 周喜 《智能系统学报》 CSCD 北大核心 2018年第3期452-457,共6页
在自然语言理解、机器翻译、舆情分析等自然语言处理领域中,维吾尔谚语识别是整个文本实体识别的重要组成部分。为满足维吾尔谚语信息化的需求,本文构建了比较完善的维吾尔谚语语料库。同时,从传统语言学角度对维吾尔谚语的语法、语义... 在自然语言理解、机器翻译、舆情分析等自然语言处理领域中,维吾尔谚语识别是整个文本实体识别的重要组成部分。为满足维吾尔谚语信息化的需求,本文构建了比较完善的维吾尔谚语语料库。同时,从传统语言学角度对维吾尔谚语的语法、语义结构进行分析,构建了一个由维吾尔谚语功能语类(词缀)组成的、专属维吾尔谚语规则的知识库,并将此知识库与自然语言处理技术相结合,实现一个既能够从文本中识别出维吾尔谚语,又能提供维汉互译等功能的信息软件系统。该系统也为开展计算机理解与处理维吾尔文字奠定了一个崭新的基础。 展开更多
关键词 维吾尔谚语 谚语词缀 谚语规则 词缀覆盖率 谚语规则库 谚语语料库 识别系统
在线阅读 下载PDF
现代维吾尔语句子成分分析技术研究
15
作者 努尔艾合买提.艾买提 艾孜尔古丽 玉素甫.艾白都拉 《计算机工程与科学》 CSCD 北大核心 2015年第12期2339-2344,共6页
句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分... 句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分析算法;探索现代维吾尔语谓语的识别算法设计、其他句子成分的识别、自动界定预测算法等研究现代维吾尔语句子成分分析问题;解决现代维吾尔语句子成分分析系统实现、实验数据分析等现代维吾尔语句子成分分析问题。 展开更多
关键词 信息处理 维吾尔语 短语结构 句子成分
在线阅读 下载PDF
基于联邦迁移的跨项目软件缺陷预测 被引量:2
16
作者 宋慧玲 李勇 张文静 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第3期122-128,共7页
跨项目软件缺陷预测基于已标注的多源项目数据构建模型,可以解决软件历史数据不足和标注代价高的问题.但在传统跨项目缺陷预测中,源项目数据持有者为了保护软件数据的商业隐私,而导致的“数据孤岛”问题直接影响了跨项目预测的模型性能... 跨项目软件缺陷预测基于已标注的多源项目数据构建模型,可以解决软件历史数据不足和标注代价高的问题.但在传统跨项目缺陷预测中,源项目数据持有者为了保护软件数据的商业隐私,而导致的“数据孤岛”问题直接影响了跨项目预测的模型性能.本文提出基于联邦迁移的跨项目软件缺陷预测方法(FT-CPDP).首先,针对数据隐私泄露和项目间特征异构问题,提出基于联邦学习与迁移学习相结合的模型算法,打破各数据持有者间的“数据壁垒”,实现隐私保护场景下的跨项目缺陷预测模型.其次,在联邦通信过程中添加满足隐私预算的噪声来提高隐私保护水平,最后构建卷积神经网络模型实现软件缺陷预测.基于NASA软件缺陷预测数据集进行实验,结果表明与传统跨项目缺陷预测方法相比,本文提出的FT-CPDP方法在实现软件数据隐私保护的前提下,模型的综合性能表现较优. 展开更多
关键词 软件缺陷预测 联邦学习 迁移学习 差分隐私 卷积神经网络
在线阅读 下载PDF
基于主题感知和语义增强的作文自动评分方法 被引量:1
17
作者 陈宇航 杨勇 +4 位作者 先木斯亚·买买提明 帕力旦·吐尔逊 樊小超 任鸽 刁宇峰 《计算机工程》 CAS CSCD 北大核心 2024年第8期363-371,共9页
作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提... 作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提出一种基于主题感知和语义增强的作文自动评分模型。该模型采用多头注意力机制提取作文的浅层语义特征并感知作文主题特征,同时利用BERT的中间层句法特征和深层语义特征增强对作文语义的理解。在此基础上,融合不同维度的特征并用于作文自动评分。实验结果表明,该模型在公共数据集ASAP的8个子集上均表现出了显著的性能优势,相比于通义千问等基线模型,其能够有效提升作文自动评分性能,平均二次加权的卡帕值(QWK)达到80.25%。 展开更多
关键词 作文自动评分 语义增强 主题感知 特征融合 预训练语言模型
在线阅读 下载PDF
一种基于数据增强的科技文献关键词提取模型 被引量:4
18
作者 程芮 张海军 《情报杂志》 CSSCI 北大核心 2024年第1期135-141,120,共8页
[研究目的]科技文献关键词提取研究具有重要价值,目前研究中关键词提取方法存在较大误差且只能提取文本中的关键词,难以根据深层语义信息提炼出更符合文本核心主旨的词语。本研究针对关键词提取对上下文隐含语义挖掘不足导致的局限性和... [研究目的]科技文献关键词提取研究具有重要价值,目前研究中关键词提取方法存在较大误差且只能提取文本中的关键词,难以根据深层语义信息提炼出更符合文本核心主旨的词语。本研究针对关键词提取对上下文隐含语义挖掘不足导致的局限性和重点信息关注不足问题开展研究。[研究方法]提出一种基于数据增强的关键词提取模型(GPT-2 BiLSTM Mul-Attention,GPBA),通过语言模型进行数据增强,并结合BiLSTM+Mul-Attention提取模型进行多特征语义信息融合理解。[研究结论]实验结果表明,基于数据增强的关键词提取模型GPBA总体表现优于其他基线模型,并且能更精确地凝练和提取文本中的关键词。 展开更多
关键词 科技文献 关键词提取模型 数据增强 语义信息 评估指标
在线阅读 下载PDF
基于语义拼写理解和门控注意力机制的不良言论检测 被引量:1
19
作者 周险兵 樊小超 +2 位作者 杨勇 刁宇峰 任鸽 《计算机应用与软件》 北大核心 2024年第1期112-118,125,共8页
如何自动检测网络传播的不良言论信息是自然语言处理研究领域的热门研究内容之一。针对不良言论中语义表达和拼写习惯的特点,提出一种基于语义拼写理解和门控注意力机制的不良言论检测方法。该方法采用自注意力机制获取文本的语义特征,... 如何自动检测网络传播的不良言论信息是自然语言处理研究领域的热门研究内容之一。针对不良言论中语义表达和拼写习惯的特点,提出一种基于语义拼写理解和门控注意力机制的不良言论检测方法。该方法采用自注意力机制获取文本的语义特征,采用卷积神经网络提取文本的拼写特征,采用前期特征融合和门控注意力机制相结合的方式融合语义和拼写特征。在两个公共数据集上的实验结果表明,提出的模型能够有效地提取不良言论的语义特征,提高不良言论检测的性能。 展开更多
关键词 不良言论检测 语义拼写理解 自注意力机制 早期融合 门控注意力机制
在线阅读 下载PDF
面向可解释性的软件缺陷预测主动学习方法 被引量:1
20
作者 王越 李勇 张文静 《现代电子技术》 北大核心 2024年第20期101-108,共8页
针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本... 针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本放入源项目中以训练预测器。其次,利用领域知识对选定样本进行扰动,构建局部数据集,并通过线性模型在该数据集上模拟数据选择策略的行为,以实现模型的可解释性。实验结果显示:该方法在数据标注方面的指标性能要优于传统的主动学习基准方法;同时,在可解释性方面,该方法的RMSE指标也均低于LIME、全局代理模型以及RuleFit,能较好地解释“黑盒”模型。该方法不仅可以有效提高软件缺陷数据的标注效率,还可以实现模型的可解释性。 展开更多
关键词 软件缺陷预测 主动学习 可解释性 数据标注 数据选择策略 深度学习
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部