期刊文献+
共找到641篇文章
< 1 2 33 >
每页显示 20 50 100
融合Word2Vec词嵌入的多核卷积神经网络音乐歌词多情感分类方法 被引量:3
1
作者 张昱 冯亚寒 丁千惠 《科学技术与工程》 北大核心 2024年第20期8598-8605,共8页
目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神... 目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神经网络作为分类器的音乐歌词多情感分类方法。该方法首先结合音乐歌词文本,进行数据预处理和可视化分析;其次利用Word2Vec词嵌入提取歌词局部特征,构建特征情感向量,挖掘歌词中情感信息,将歌词转化为更利于分类器模型输入的词向量;最后在分类器中,选用卷积神经网络模型,并在此基础上采用不同高度卷积核的方式构建新模型以此得到多情感分类。结果表明:音乐歌词多情感分类的结果达到94.26%,与传统CNN相比,分类精确率提高了6.86%,取得了良好性能。 展开更多
关键词 自然语言处理 情感分类 卷积神经网络 词嵌入 文本分类 音乐歌词
在线阅读 下载PDF
融合位置和实体类别信息的中文命名实体识别 被引量:1
2
作者 杨竣辉 李苏晋 《计算机工程》 北大核心 2025年第3期113-121,共9页
词语作为一种上下文信息在中文命名实体识别(NER)任务中发挥着重要作用。以往基于字符的中文NER方法虽然在一定程度上取得了成功,但仍存在词语信息嵌入方式简单、特征捕捉方式单一,且忽视了潜在词的影响、未能充分利用词语信息的问题。... 词语作为一种上下文信息在中文命名实体识别(NER)任务中发挥着重要作用。以往基于字符的中文NER方法虽然在一定程度上取得了成功,但仍存在词语信息嵌入方式简单、特征捕捉方式单一,且忽视了潜在词的影响、未能充分利用词语信息的问题。针对上述问题,提出一种改进的中文NER方法。首先,通过基于全遮蔽技术的预训练模型RoBERTa-wwm将文本表示为字符级嵌入向量;其次,使用门控空洞卷积神经网络(DGCNN)模型进一步捕捉文本的特征信息;然后,在键值记忆网络(KV-MemNN)模型中采用位置实体类别组合机制(PECM)更有效地融合词语信息并缓解潜在词冲突所带来的影响;最后,利用条件随机场(CRF)模型对预测结果进行约束得到最佳标签序列。实验结果表明,该方法在Weibo、MSRA和Resume数据集上的F1值分别达到71.82%、95.00%和96.14%,相比于融合词语信息的FLAT模型分别提升了11.50、0.88、0.69百分点,同时在不同实体上的识别表现整体优于RoBERTa-wwm+CRF和Lattice LSTM模型。此外,通过预训练模型的对比和消融实验进一步证明了KV-MemNN和RoBERTa-wwm模型的有效性。 展开更多
关键词 命名实体识别 键值记忆网络 词语信息 位置信息 实体类别信息
在线阅读 下载PDF
基于混沌理论和专利挖掘的技术不连续演化特征研究
3
作者 任海英 梁宇航 《情报杂志》 北大核心 2025年第4期181-189,共9页
[研究目的]针对技术不连续演化定量研究的不足,结合混沌理论与专利挖掘方法,揭示技术不连续演化的混沌特征,在技术不连续演化阶段为技术预测提供混沌分析视角。[研究方法]以语音识别技术为例,首先检索专利数据并构建申请数据时间序列,... [研究目的]针对技术不连续演化定量研究的不足,结合混沌理论与专利挖掘方法,揭示技术不连续演化的混沌特征,在技术不连续演化阶段为技术预测提供混沌分析视角。[研究方法]以语音识别技术为例,首先检索专利数据并构建申请数据时间序列,通过关联维数和李亚普洛夫指数识别技术演化系统的混沌特征及其局部混沌期。之后,对不同时间窗口的数据构建LDA主题模型和共词网络,分析技术主题及相关节点在局部混沌期前、中、后的演化特征,并预测潜在新兴技术。[研究结果/结论]实验结果表明,语音识别技术演化过程中,技术不连续演化阶段与局部混沌期高度重合,为“混沌是技术不连续演化的内在特征”提供实证依据。此外,新兴技术在局部混沌期内产生,并表现为技术主题的稳定发展和相关节点中心性的提升。不仅反映新兴技术对语音识别技术系统的深远影响,而且揭示其未来演化方向。 展开更多
关键词 混沌理论 专利文本 专利挖掘 技术演化 主题模型 共词网络 语音识别技术 关联维数 李亚普洛夫指数
在线阅读 下载PDF
基于语义加权网络的重点领域科学基金资助态势识别研究 被引量:1
4
作者 王伟 梁继文 杨建林 《现代情报》 北大核心 2025年第1期46-59,111,共15页
[目的/意义]科学基金制度是各国(地区)提升科学研究水平的重要方式,准确识别科学基金的资助方向和资助成效是感知科技发展态势的关键。[方法/过程]为识别科学基金资助态势,在提出关键短语抽取规则后,利用语义相似度消除同、近义词的歧... [目的/意义]科学基金制度是各国(地区)提升科学研究水平的重要方式,准确识别科学基金的资助方向和资助成效是感知科技发展态势的关键。[方法/过程]为识别科学基金资助态势,在提出关键短语抽取规则后,利用语义相似度消除同、近义词的歧义影响,利用动态滑动窗口和语义相似度构建语义加权的词共现网络,并基于社团划分方法识别基金主题。在集成电路领域比较1812项中国国家自然科学基金和2807项美国国家科学基金的资助主题分布、资助力度变化和资助效果,该方法能够准确识别基金主题分布和资助成效。[结果/结论]中国国家自然科学基金和美国国家科学基金均涵盖了集成电路领域的主要研究主题,在重点资助方向和资助力度上有较大差异;中国国家自然科学基金资助的论文平均被引频次相对较低,受资助机构相对单一。 展开更多
关键词 科学基金 资助态势 社团划分 词共现网络 主题分析 集成电路
在线阅读 下载PDF
基于word2vec和LSTM的饮食健康文本分类研究 被引量:43
5
作者 赵明 杜会芳 +1 位作者 董翠翠 陈长松 《农业机械学报》 EI CAS CSCD 北大核心 2017年第10期202-208,共7页
为了对饮食文本信息高效分类,建立一种基于word2vec和长短期记忆网络(Long-short term memory,LSTM)的分类模型。针对食物百科和饮食健康文本特点,首先利用word2vec实现包含语义信息的词向量表示,并解决了传统方法导致数据表示稀疏及维... 为了对饮食文本信息高效分类,建立一种基于word2vec和长短期记忆网络(Long-short term memory,LSTM)的分类模型。针对食物百科和饮食健康文本特点,首先利用word2vec实现包含语义信息的词向量表示,并解决了传统方法导致数据表示稀疏及维度灾难问题,基于K-means++根据语义关系聚类以提高训练数据质量。由word2vec构建文本向量作为LSTM的初始输入,训练LSTM分类模型,自动提取特征,进行饮食宜、忌的文本分类。实验采用48 000个文档进行测试,结果显示,分类准确率为98.08%,高于利用tf-idf、bag-of-words等文本数值化表示方法以及基于支持向量机(Support vector machine,SVM)和卷积神经网络(Convolutional neural network,CNN)分类算法结果。实验结果表明,利用该方法能够高质量地对饮食文本自动分类,帮助人们有效地利用健康饮食信息。 展开更多
关键词 文本分类 word2vec 词向量 长短期记忆网络 K-means++
在线阅读 下载PDF
基于word2vec和双向LSTM的情感分类深度模型 被引量:45
6
作者 黄贤英 刘广峰 +1 位作者 刘小洋 阳安志 《计算机应用研究》 CSCD 北大核心 2019年第12期3583-3587,3596,共6页
针对社交网络文本传统情感分类模型存在先验知识依赖以及语义理解不足的问题,提出一种基于word2vec和双向长短时记忆循环神经网络的情感分类模型--WEEF-BILSTM。采用基于CBOW (continuous bag-of-words)方式的word2vec模型针对语料训练... 针对社交网络文本传统情感分类模型存在先验知识依赖以及语义理解不足的问题,提出一种基于word2vec和双向长短时记忆循环神经网络的情感分类模型--WEEF-BILSTM。采用基于CBOW (continuous bag-of-words)方式的word2vec模型针对语料训练词向量,减小词向量间的稀疏度,通过双向LSTM神经网络获取更为完整的文本上下文信息从而提取出深度词向量特征,继而使用one-versus-one SVM对其进行情感分类。实验结果表明,提出的WEEF-BILSTM模型较其他模型分类效果更好,能达到更优的准确率和F值。 展开更多
关键词 文本分类 情感分析 双向长短时记忆循环神经网络 词向量 社交网络
在线阅读 下载PDF
结合依存图卷积的中文文本相似度计算研究 被引量:1
7
作者 胡书林 张华军 +1 位作者 邓小涛 王征华 《计算机工程》 北大核心 2025年第3期76-85,共10页
目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能... 目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能使用静态词嵌入来表征词的语义向量。针对此问题,根据依存句法分析构建依存图,通过分词掩码映射与注意力混合池化的方法实现动态词嵌入表征词节点的语义特征,然后使用图卷积网络提取依存图中词节点之间的依存关系信息,最终读出依存图,将其作为句子的特征向量,从语义与句法2个层面计算句子间的相似度。在表示型与交互型2种结构模型上应用所提方法,并在BQ_Corpus与ATEC数据集上进行实验,结果显示,该模型的准确率最高分别达到87.12%与88.33%,结合依存句法信息后模型的各项评估指标均有提升。 展开更多
关键词 图卷积神经网络 依存句法分析 动态词嵌入 文本相似度 注意力机制
在线阅读 下载PDF
融合Word2Vec的半积累引用共词网络的领域主题演化研究 被引量:13
8
作者 程秀峰 邹晶晶 +1 位作者 叶光辉 夏立新 《情报学报》 CSSCI CSCD 北大核心 2023年第7期801-815,共15页
发现并厘清学科及领域的发展路径和演化脉络,对科学研究和学科发展具有重要意义。针对传统共词分析法的不足和主题演化分析维度的单一性问题,本文提出了一种基于引用共词网络的主题发现与演化分析方法,并以情报学领域为例进行了实证研... 发现并厘清学科及领域的发展路径和演化脉络,对科学研究和学科发展具有重要意义。针对传统共词分析法的不足和主题演化分析维度的单一性问题,本文提出了一种基于引用共词网络的主题发现与演化分析方法,并以情报学领域为例进行了实证研究。通过引用关系定义“引用共现”关联,并融合词嵌入技术构建关键词网络;使用社区探测法识别领域主题,采用后离散分析法,从内容结构和发展趋势两个角度进行学科主题演化分析,并可视化呈现主题演化路径及发展趋势。研究结果表明,本文所构建网络比传统共词网络能呈现粒度更优的主题聚类效果,并且能较好地呈现主题动态演化趋势,是共词分析法的有效补充。 展开更多
关键词 主题演化 引用共词网络 word2Vec模型 时间序列 战略坐标
在线阅读 下载PDF
基于Word界面的网络试题库系统的设计与实现 被引量:8
9
作者 马瑞民 顾洪博 韩玉祥 《大庆石油学院学报》 CAS 北大核心 2003年第4期54-57,共4页
介绍了基于Word界面的网络试题库系统的设计方法和该系统的实现过程。结合基于Word的功能特点,重点阐述了基于Word界面的C/S模式的实现过程,以及自动组卷策略和流程。分析了用户操作权限和网络数据支持平台,及该系统数据与网络数据的安... 介绍了基于Word界面的网络试题库系统的设计方法和该系统的实现过程。结合基于Word的功能特点,重点阐述了基于Word界面的C/S模式的实现过程,以及自动组卷策略和流程。分析了用户操作权限和网络数据支持平台,及该系统数据与网络数据的安全性;同时,论述了该系统基于Word界面模式的主要特点。 展开更多
关键词 word界面 网络 试题库 组卷策略
在线阅读 下载PDF
基于主路径分析和引文文本挖掘的关键核心技术基础研究结构识别 被引量:2
10
作者 陶治宇 刘小平 +1 位作者 梁爽 李函羲 《情报杂志》 北大核心 2025年第2期72-81,共10页
[研究目的]准确识别关键核心技术的基础研究结构,为聚力突破“卡脖子”关键核心技术提供参考。[研究方法]提出了一套用以识别关键核心技术基础研究结构的理论框架--科技知识树,构建了针对“纯基础研究-应用型基础研究-关键核心技术-常... [研究目的]准确识别关键核心技术的基础研究结构,为聚力突破“卡脖子”关键核心技术提供参考。[研究方法]提出了一套用以识别关键核心技术基础研究结构的理论框架--科技知识树,构建了针对“纯基础研究-应用型基础研究-关键核心技术-常规技术”关联的分析方法,通过综合应用复杂网络分析与文本挖掘技术,理清了基础研究与应用研究间的知识流动关系,识别出了关键核心技术的基础研究结构。[研究结果/结论]以集成电路技术为例进行实证分析,识别得到关键核心技术分布于21个领域,涵盖11类应用型基础研究,包括Petri网、算法优化、光子学原理等;14类纯基础研究,包括半导体原理、数字电路建构原理等。经验证,提出的方法能够有效识别支撑技术研发的基础研究结构,为成果转化、技术攻关与基础研究布局提供了参考。 展开更多
关键词 关键核心技术 基础研究 科技知识树 引文文本挖掘 集成电路 主路径分析 共词网络分析
在线阅读 下载PDF
基于词向量网络的科研主题演化分析:语义漂移过程的揭示
11
作者 王宏宇 石锴文 +3 位作者 王晓光 金壮 郑阳 黄菡 《情报学报》 北大核心 2025年第10期1287-1299,共13页
作为表征学科领域知识结构的经典知识网络,共词网络方法受特征关键词共现关系稀疏、关键词同义不同形及语料利用不充分等因素影响,在面对大规模学科领域数据时,难以精准描绘关键词间的语义关联关系。从理论与方法论层面对共词网络进行扩... 作为表征学科领域知识结构的经典知识网络,共词网络方法受特征关键词共现关系稀疏、关键词同义不同形及语料利用不充分等因素影响,在面对大规模学科领域数据时,难以精准描绘关键词间的语义关联关系。从理论与方法论层面对共词网络进行扩展,以全面揭示学科领域研究主题在宏观、微观等层面上的语义演化过程具有现实意义。本文将学科领域特征关键词视为网络顶点,通过全局词嵌入模型(global vectors for word representation,GloVe)获取特征关键词的向量表示,并将对应词向量间的归一化余弦相似度设定为网络连边权重,构建全连接、无向的词向量网络。进一步地,本文详细分析了学科领域词向量网络的作用与特征,提出基于词向量网络的科研主题语义漂移分析框架,并就其表征的语义关联关系与共词网络中的共现关系进行比较分析。研究发现,本文提出的学科领域词向量网络作为一类特殊的知识网络,是特征关键词的共词网络在语义超空间上的映射,具有明显的社区结构和时序演化分析价值。与共词网络方法相比,学科领域词向量网络在表征学科领域的关键概念上具有一致性,并在反映学科领域知识结构时更具稳定性和全面性,能够精细化揭示科研主题在微观层面上产生的语义漂移等更细粒度的演化过程。 展开更多
关键词 知识网络 共词网络 词向量网络 词嵌入 语义演化
在线阅读 下载PDF
图推理嵌入动态自注意力网络的文档级关系抽取 被引量:1
12
作者 李云洁 王丹阳 +2 位作者 刘海涛 汪华东 汪培庄 《智能系统学报》 北大核心 2025年第1期52-63,共12页
文档级关系抽取是指从文档中抽取所有具有语义关系的实体对并判断其关系类别,与句子级关系抽取不同,这里实体关系的确定需要根据文档中多个句子推理得到。现有方法主要采用自注意力进行文档级关系抽取,但是运用自注意力进行文档级关系... 文档级关系抽取是指从文档中抽取所有具有语义关系的实体对并判断其关系类别,与句子级关系抽取不同,这里实体关系的确定需要根据文档中多个句子推理得到。现有方法主要采用自注意力进行文档级关系抽取,但是运用自注意力进行文档级关系抽取需要面临两个技术挑战:即长文本语义编码存在的高计算复杂度和关系预测需要的复杂推理建模,故提出一种图推理嵌入动态自注意力网络(graph reasoning embedded dynamic self-attention network,GSAN)模型。该模型借助门限词选择机制动态选择重要词计算自注意力实现对长文本语义依赖的高效建模,同时考虑以选择词为全局语义背景与实体候选、文档节点一起构建文档图,将文档图的图推理聚合信息嵌入到动态自注意力模块中,实现模型对复杂推理建模的能力。在公开的文档级关系数据集CDR和DocRED上的实验结果表明,文中提出的模型较其他基线模型有显著提升。 展开更多
关键词 文档级关系抽取 图推理 动态自注意力网络 自注意力机制 门限词选择机制 文档图 图注意力网络 关键词
在线阅读 下载PDF
细粒度标记的结点自适应方面情感三元组抽取 被引量:1
13
作者 赵园春 韩虎 徐学锋 《计算机工程与应用》 北大核心 2025年第13期208-216,共9页
情感分析在自然语言处理领域扮演着重要的角色,作为情感分析的子任务,方面情感三元组抽取能够从评论中抽取用户对产品或服务的意见,从而在商家做决策时提供关键性数据支撑,因此具有较大的研究价值。然而现有的方面情感三元组抽取方法存... 情感分析在自然语言处理领域扮演着重要的角色,作为情感分析的子任务,方面情感三元组抽取能够从评论中抽取用户对产品或服务的意见,从而在商家做决策时提供关键性数据支撑,因此具有较大的研究价值。然而现有的方面情感三元组抽取方法存在词对边界考虑不足、词对标记冗余和语言学特征利用有限的问题。为了解决这些问题,提出了一种基于细粒度标记的结点自适应方面情感三元组抽取算法。设计细粒度词对标记方案,项的首尾边界使用相异的标记,去除项中冗余的词间标记。在两个通道上使用结点自适应网络分别对句法依赖信息与句法类型信息进行挖掘,同时使用卷积注意力捕捉评论文本的全局与局部语义依赖关系,从而增强模型对语言学特征的提取。最后,使用推理层获取词间关系,使用解码层获取方面-意见-情感三元组。实验结果表明,该模型不仅解决了现有标记方案存在的问题,还能高效挖掘语言学特征,在4个公开数据集上其综合评级指标值取得了较优的结果。 展开更多
关键词 方面情感三元组抽取 细粒度词对标记 结点自适应网络 句法依赖树 卷积注意力
在线阅读 下载PDF
基于WordNet词义消歧的系统融合 被引量:12
14
作者 刘宇鹏 李生 赵铁军 《自动化学报》 EI CSCD 北大核心 2010年第11期1575-1580,共6页
最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了... 最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了用词义消歧(Word sense disambiguation,WSD)来指导混淆网络中的对齐.同时骨架翻译的选择也是通过计算句子间的相似度来获得的,句子的相似性计算使用了二分图的最大匹配算法.为了使得基于WordNet词义消歧方法融入到系统中,本文将翻译错误率(Translation error rate,TER)算法进行了改进,实验结果显示本方法的性能好于经典的TER算法的性能. 展开更多
关键词 系统融合 翻译错误率 词义消歧 混淆网络
在线阅读 下载PDF
基于TB-IDACNN的新闻推荐模型
15
作者 辛春花 鲁晓波 何婷 《计算机工程与设计》 北大核心 2025年第5期1387-1394,共8页
针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络... 针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络等深度学习模型的优势,综合考虑新闻的动态特性和静态特性,实现个性化新闻推荐。在MIND和Adressa数据集上的结果表明,相比其它几种先进的新闻推荐模型,所提模型可以获得更好的推荐性能,能够有效满足用户在新闻推荐任务中的需求。 展开更多
关键词 动态神经网络 新闻推荐 词嵌入模型 内积注意力机制 卷积神经网络 词向量化 平均加权池化
在线阅读 下载PDF
基于引文内容的跨文献知识实体共现网络构建与分析
16
作者 聂维民 欧石燕 《现代情报》 北大核心 2025年第9期32-45,共14页
[目的/意义]目前的共词网络仅能捕获知识实体在同一文献中的关联,难以建模跨文献的知识实体关联,并且缺乏语义信息。此外,现有的跨文献知识实体网络在建模知识实体的跨文献关联等方面仍存在不足。因此,有必要探索更加完善的跨文献知识... [目的/意义]目前的共词网络仅能捕获知识实体在同一文献中的关联,难以建模跨文献的知识实体关联,并且缺乏语义信息。此外,现有的跨文献知识实体网络在建模知识实体的跨文献关联等方面仍存在不足。因此,有必要探索更加完善的跨文献知识实体共现网络构建方法。[方法/过程]本文结合引文内容分析的研究成果,提出一种基于施引文本—被引片段对的跨文献知识实体共现网络的构建方法,并通过微观引文重要性来区分知识实体的同文献关联和跨文献关联。随后,本文将构建的跨文献知识实体共现网络与传统共词网络、基于施引文本的知识实体共现网络进行了比较分析。[结果/结论]自然语言处理领域的实证研究表明,本文构建的网络规模更大,知识实体间关联更为丰富,且具有一定的稀疏性和“小世界”特性。在知识实体重要性评估中,基于该类网络的加权度中心性方法蕴含着更丰富的信息,与频次方法具有较高的相关性,且表现出更强的区分能力。通过该网络挖掘的研究主题更为集中凝练。本文综合运用了知识网络、实体计量和引文内容分析等领域的方法,不仅有效推动了这些领域的边界延展与交叉融合,还为相关研究提供了新的方法论支撑。此外,本文对推动科学文献的知识发现与利用、提升研究人员的认知效率具有重要意义。 展开更多
关键词 知识实体 实体计量 知识网络 引文内容分析 共词网络
在线阅读 下载PDF
融合字符与词语特征的混合神经网络情感分析模型
17
作者 李嘉琦 杨环 高辉 《计算机工程与应用》 北大核心 2025年第13期227-234,共8页
汉语语句中没有明显的分隔符,这导致传统基于词语划分的编码模型可能会丢失句子内部的语义信息,特别是在处理情感分析等任务时显得更为复杂。为克服这一难题,借鉴字符级和词语级特征融合的思路,提出了一种融合特征模型。该模型将句子划... 汉语语句中没有明显的分隔符,这导致传统基于词语划分的编码模型可能会丢失句子内部的语义信息,特别是在处理情感分析等任务时显得更为复杂。为克服这一难题,借鉴字符级和词语级特征融合的思路,提出了一种融合特征模型。该模型将句子划分为两种级别的编码,采用Bi-GRU结构提取字符序列中的包含上下文信息的特征关系,并引入注意力机制,使用CNN网络结构提取词语之间的局部特征关系,利用不同大小的卷积核获得不同距离的局部特征,最后将二者特征进行融合,获得全局特征信息。在三个公开数据集Weibo、CIN和Chnsenticorp上的准确率分别达到了81.32%、76.03%和96.28%,相比于以字符编码为基础的MCNN-IFGS模型,分别提高了1.02个百分点、0.13个百分点和1.05个百分点,结果表明在中文情感分析任务中,融合特征模型的表现明显优于单独使用字符级或词语级特征的模型,能够显著提升模型的性能和鲁棒性,更有效地提取文本的语义信息。 展开更多
关键词 情感分析 混合神经网络 字符特征 词语特征 双向门控循环单元
在线阅读 下载PDF
语言引导视觉的小样本航拍图像目标检测
18
作者 张智 易华挥 郑锦 《北京航空航天大学学报》 北大核心 2025年第7期2338-2348,共11页
针对现有航拍图像目标检测方法在航拍数据集变化时,即拍摄视角、图像质量、照明条件、背景环境等发生大幅变化,以及目标外观变化明显、目标类别新增时,不经过对新数据集全样本训练,而采用原有数据集直接推理,检测精度大幅下降的问题,提... 针对现有航拍图像目标检测方法在航拍数据集变化时,即拍摄视角、图像质量、照明条件、背景环境等发生大幅变化,以及目标外观变化明显、目标类别新增时,不经过对新数据集全样本训练,而采用原有数据集直接推理,检测精度大幅下降的问题,提出语言引导视觉的小样本航拍图像目标检测方法。采用词语-区域对齐分支取代传统目标检测网络中的分类分支,得到同时具有语言和视觉信息的词语-区域对齐分类分数作为预测分类结果,进而将目标检测和词语定位统一为一个任务,并利用语言引导提升视觉目标检测精度。针对输入文本语言变化引起小样本目标检测精度波动的情况,设计语言视觉偏置网络,挖掘语言特征和视觉特征的关联关系,提升语言视觉的匹配度,缩小精度波动,并进一步提升小样本目标检测精度。在UAVDT、Visdrone、AeriaDrone、VEDAI、CARPK_PUCPR数据集上的大量实验结果证明了所提方法的优越性能,在UAVDT航拍数据集上所提方法在30样本时平均精度均值(mAP)可达14.6%,相比航拍图像检测方法簇检测器(ClusDet)、密度图引导的目标检测网络(DMNet)、全局-局部自适应网络(GLSAN)和粗粒度密度图网络(CDMNet)在全样本训练的精度,分别提高了0.9%、−0.1%、−2.4%和−2.2%;在CARPK_PUCPR数据集上所提方法在30样本时mAP可达58.0%,相比通用目标检测方法全卷积单阶段目标检测器(FCOS)、自适应训练样本选择(ATSS)、广义焦点损失V2(GFLV2)和交并比感知密集目标检测器(VFNET)在全样本训练的精度,分别提高了1.0%、0.8%、0.1%和0.3%,体现了所提方法强大的小样本泛化和迁移能力。 展开更多
关键词 航拍图像 小样本 词语-区域对齐分支 语言视觉偏置网络 目标检测
在线阅读 下载PDF
基于频率感知与义原增强的文本防御编码
19
作者 罗浩岚 刘万平 +1 位作者 王宝娟 黄东 《计算机工程与设计》 北大核心 2025年第3期749-755,共7页
针对文本防御编码未考虑训练样本中词频的影响,同义词集缺乏囊括性且存在一定噪声的问题,提出一种基于频率感知与义原增强的编码训练方法。引入样本单词频率,利用编码器区分为样本中的低频词与非低频词,分别训练其鲁棒性;替换词集采用... 针对文本防御编码未考虑训练样本中词频的影响,同义词集缺乏囊括性且存在一定噪声的问题,提出一种基于频率感知与义原增强的编码训练方法。引入样本单词频率,利用编码器区分为样本中的低频词与非低频词,分别训练其鲁棒性;替换词集采用义原增强后的样本数据,能够有效扩充现有词集;编码算法能使样本有效训练确保模型原始准确率。在常见数据集上的实验结果表明,编码训练下的模型分类准确率优于之前防御方法,分别在TextCNN与LSTM上降低模型平均误差到3.6%与4.2%。 展开更多
关键词 文本防御编码 深度神经网络 文本分类 同义词替换攻击 频率感知 义原增强 文本对抗样本
在线阅读 下载PDF
基于多特征融合的唇语识别模型
20
作者 张甜愉 吕博 +2 位作者 周蓉 王琳 蒲梦杨 《电子测量技术》 北大核心 2025年第12期166-175,共10页
在单词级唇语识别研究中,使用三维卷积神经网络与残差网络的主流模型往往难以捕捉唇运动的几何动态,并且对细节依赖性高。为了缓解该问题,本文提出了一种基于多特征融合的端到端单词级唇语识别模型,该模型集成了像素级纹理细节特征、几... 在单词级唇语识别研究中,使用三维卷积神经网络与残差网络的主流模型往往难以捕捉唇运动的几何动态,并且对细节依赖性高。为了缓解该问题,本文提出了一种基于多特征融合的端到端单词级唇语识别模型,该模型集成了像素级纹理细节特征、几何级轮廓形状特征和词边界特征,实现了从时间和空间、像素级与几何级等多个维度的特征融合。其中,纹理细节特征提供精细化的局部信息;轮廓形状特征反应唇部几何结构及动态变化;词边界特征则引导模型关注有效时间帧。此外,本文将空间通道注意力机制整合到3D CNN和ResNet-18中以增强纹理细节特征提取,并利用全局上下文网络对时空图卷积网络进行改进后将其引入模型以捕捉几何级轮廓形状特征。实验表明,输入为灰度视频时,本文模型在公开的大规模单词级唇语识别数据集LRW上的准确率达到89.3%,相较于相同条件下单一或部分特征模型提升1.3%~3.9%,且高于大部分现有模型,验证了所提模型的有效性;同时,实验发现,使用彩色视频作为输入时,模型准确率进一步提高,为89.7%,验证了色彩信息对唇语识别的影响。 展开更多
关键词 单词级唇语识别 多特征融合 像素级纹理细节特征 几何级轮廓形状特征 时空图卷积神经网络
在线阅读 下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部