期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
基于ERNIE-CAB-CNN的稀土专利文本分类模型
1
作者 廖列法 石利娇 《电子技术应用》 2025年第1期18-24,共7页
针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷... 针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷积神经网络(Convolutional Neural Networks,CNN)构建了一个用于稀土专利文本分类的创新模型ERNIE-CAB-CNN。模型使用ERNIE对专利文本进行向量化,得到语义信息更加丰富的向量表示后,通过CAB为文本中各个类别的重要特征赋予较高权值,使模型可以更准确地区分不同类别的特征。最后用CNN进一步提取文本中其他关键局部特征,得到的最终文本向量表示用于分类。通过Patsnap专利数据库官方网站检索下载稀土专利数据构建数据集进行实验,实验结果表明,稀土专利文本分类模型ERNIE-CAB-CNN在测试集上分类的准确率、精确率、F1分数分别为82.68%、83.2%、82.06%,取得了良好的分类效果。 展开更多
关键词 稀土专利分类 文本分类 类别注意力 ERNIE CNN 特征提取
在线阅读 下载PDF
基于并联残差膨胀卷积网络的短文本实体关系联合抽取
2
作者 曾伟 奚雪峰 崔志明 《现代电子技术》 北大核心 2025年第2期169-178,共10页
关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题... 关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题。为此,文中提出一种基于并联残差膨胀卷积网络的短文本实体关系联合抽取方法。该方法利用BERT生成语义特征信息,采用并联残差膨胀卷积网络来捕获语义信息,从而提升上下文信息的捕获能力并缓解噪声。联合抽取框架通过抽取潜在关系来过滤无关关系,然后再抽取实体以预测三元组,从而解决关系冗余和重叠问题,并提高计算效率。实验结果表明,与现有的主流模型相比,所提模型在三个公共数据集NYT、WebNLG和DuIE上的F1值分别为90.9%、91.3%和73.5%,相较于基线模型均有提升,验证了该模型的有效性。 展开更多
关键词 实体关系抽取 短文本 残差膨胀卷积网络 语义特征 联合抽取 BERT编码器
在线阅读 下载PDF
融合MacBERT和Talking⁃Heads Attention实体关系联合抽取模型 被引量:1
3
作者 王春亮 姚洁仪 李昭 《现代电子技术》 北大核心 2024年第5期127-131,共5页
针对现有的医学文本关系抽取任务模型在训练过程中存在语义理解能力不足,可能导致关系抽取的效果不尽人意的问题,文中提出一种融合MacBERT和Talking⁃Heads Attention的实体关系联合抽取模型。该模型首先利用MacBERT语言模型来获取动态... 针对现有的医学文本关系抽取任务模型在训练过程中存在语义理解能力不足,可能导致关系抽取的效果不尽人意的问题,文中提出一种融合MacBERT和Talking⁃Heads Attention的实体关系联合抽取模型。该模型首先利用MacBERT语言模型来获取动态字向量表达,MacBERT作为改进的BERT模型,能够减少预训练和微调阶段之间的差异,从而提高模型的泛化能力;然后,将这些动态字向量表达输入到双向门控循环单元(BiGRU)中,以便提取文本的上下文特征。BiGRU是一种改进的循环神经网络(RNN),具有更好的长期依赖捕获能力。在获取文本上下文特征之后,使用Talking⁃Heads Attention来获取全局特征。Talking⁃Heads Attention是一种自注意力机制,可以捕获文本中不同位置之间的关系,从而提高关系抽取的准确性。实验结果表明,与实体关系联合抽取模型GRTE相比,该模型F1值提升1%,precision值提升0.4%,recall值提升1.5%。 展开更多
关键词 MacBERT BiGRU 关系抽取 医学文本 Talking⁃Heads Attention 深度学习 全局特征 神经网络
在线阅读 下载PDF
基于多级语义对齐的图像-文本匹配算法
4
作者 李艺茹 姚涛 +2 位作者 张林梁 孙玉娟 付海燕 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期551-558,共8页
图像中的区域特征更关注于图像中的前景信息,背景信息往往被忽略,如何有效的联合局部特征和全局特征还没有得到充分地研究。为解决上述问题,加强全局概念和局部概念之间的关联得到更准确的视觉特征,提出一种基于多级语义对齐的图像-文... 图像中的区域特征更关注于图像中的前景信息,背景信息往往被忽略,如何有效的联合局部特征和全局特征还没有得到充分地研究。为解决上述问题,加强全局概念和局部概念之间的关联得到更准确的视觉特征,提出一种基于多级语义对齐的图像-文本匹配算法。提取局部图像特征,得到图像中的细粒度信息;提取全局图像特征,将环境信息引入到网络的学习中,从而得到不同的视觉关系层次,为联合的视觉特征提供更多的信息;将全局-局部图像特征进行联合,将联合后的视觉特征和文本特征进行全局-局部对齐得到更加精准的相似度表示。通过大量的实验和分析表明:所提算法在2个公共数据集上具有有效性。 展开更多
关键词 图像-文本匹配 跨模态信息处理 特征提取 神经网络 特征融合
在线阅读 下载PDF
基于用户兴趣模型的大学生就业信息推荐方法 被引量:1
5
作者 南楠 张玉香 吴冉 《数字通信世界》 2024年第2期60-62,共3页
为提高推荐就业信息与大学生偏好就业信息的匹配程度,文章将个体就业需求作为前提条件,设计一种基于用户兴趣模型的大学生就业信息推荐方法。首先,利用兴趣模型中的关联规则,对高校提供的就业信息中兴趣特征点进行匹配;其次,在既定的分... 为提高推荐就业信息与大学生偏好就业信息的匹配程度,文章将个体就业需求作为前提条件,设计一种基于用户兴趣模型的大学生就业信息推荐方法。首先,利用兴趣模型中的关联规则,对高校提供的就业信息中兴趣特征点进行匹配;其次,在既定的分类规则下,根据就业文本信息的内容对其进行类别划分;最后,根据用户浏览高校就业信息、在就业招聘界面的停留时间等,针对大学生偏好进行计算。对比实验结果表明:本文中设计的推荐方法应用效果良好,按照规范使用该方法进行大学生就业信息推荐,能够增加推荐就业信息与大学生偏好就业信息的匹配程度,为大学生提供更加优质的就业服务,提高大学生就业质量。 展开更多
关键词 用户兴趣模型 特征信息提取 就业文本信息 推荐方法 就业信息 大学生
在线阅读 下载PDF
基于域特定特征的CLIP提示优化算法
6
作者 张跃文 王九杭 覃荣华 《现代电子技术》 北大核心 2024年第18期41-46,共6页
当测试数据与训练数据遵循不同的分布时,神经网络会经历领域转移。领域泛化(DG)的目标是学习一个可处理未知域的通用模型,以此来解决这个问题。以往的方法通过数据增强或者特征空间对齐的方式来提取域不变特征,但在提取的过程中又会产... 当测试数据与训练数据遵循不同的分布时,神经网络会经历领域转移。领域泛化(DG)的目标是学习一个可处理未知域的通用模型,以此来解决这个问题。以往的方法通过数据增强或者特征空间对齐的方式来提取域不变特征,但在提取的过程中又会产生新的域特定特征,导致模型泛化的性能较差。针对这些问题,提出一个简单而有效的框架——ERCLIP,通过ERCLIP来实现大规模预训练模型CLIP在DG中的应用。ERCLIP通过主动提取域特定特征,并将其融入文本提示,实现图像语义的精准描述。并且提出一个文本提示优化器,动态地优化提示向量。在公开数据集OfficeHome、VLCS与PACS上的实验结果表明,ERCLIP在OfficeHome上的平均准确率为83.4%,在VLCS上为83.5%,在PACS上为96.5%,在所有算法里取得最优结果。 展开更多
关键词 域不变特征 ERCLIP 领域泛化 神经网络 特征提取 文本提示
在线阅读 下载PDF
基于多视图关注网络的图文多模态情感分析模型
7
作者 丛子涵 张思佳 《现代电子技术》 北大核心 2024年第12期157-164,共8页
针对现有多模态情感分类模型无法全面、准确地捕获复杂的情感信息,以及融合过程中没有充分挖掘两者之间的潜在关联,导致模型结构冗余复杂、计算效率低下的问题,提出一种多视图关注网络(MPF-Net)模型。该模型通过引入多维感知特征捕获机... 针对现有多模态情感分类模型无法全面、准确地捕获复杂的情感信息,以及融合过程中没有充分挖掘两者之间的潜在关联,导致模型结构冗余复杂、计算效率低下的问题,提出一种多视图关注网络(MPF-Net)模型。该模型通过引入多维感知特征捕获机制,全面而精确地获取图像和文本中蕴含的情感信息;其次,采用增强的记忆互动学习机制,使模型能够更加有效地提取和融合单模态特征,并在多轮迭代中不断更新和优化这些特征,从而捕捉到更深层次的情感细节;再构建一个高级深度学习框架,该框架采用生成对抗网络(GAN)与池化技术的深度融合单元,以实现复杂数据特征的高效提取与整合;最后,在保留原有特征信息的基础上进行特征整合,同时通过降维技术降低模型的复杂性,提高计算效率。在公开数据集MVSA-Single和MVSA-Multiple以及自建数据集上通过实验验证所提模型的准确性,结果表明,与多个基线模型对比,所提模型的准确率和F1值均有所提高。 展开更多
关键词 多模态情感分析 对抗学习 多视图网络 生成对抗网络 文本特征提取 特征融合
在线阅读 下载PDF
卷积神经网络在情感特征提取中的应用
8
作者 肖英剑 陈婷 《集成电路应用》 2024年第11期246-247,共2页
阐述对比传统机器学习方法和CNN模型在情感特征提取中的表现,发现CNN能够有效捕捉文本中的局部语义特征和长距离依赖关系,提高情感分类准确率。探讨CNN在多模态情感分析中的应用特点。
关键词 卷积神经网络 情感特征提取 文本分类 情感分析 深度学习
在线阅读 下载PDF
中文文本挖掘的特征导航机制 被引量:12
9
作者 林鸿飞 战学刚 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2000年第3期240-243,共4页
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点 ,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项 ,而且有助于改善向量空间模型中各个分量间的斜交... 文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点 ,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项 ,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制 。 展开更多
关键词 文本挖掘 文本特征抽取 概念导航 信息处理
在线阅读 下载PDF
文本分类中基于核的非线性判别 被引量:4
10
作者 刘海峰 姚泽清 +1 位作者 刘守生 王倩 《应用科学学报》 CAS CSCD 北大核心 2008年第6期627-631,共5页
针对文本分类问题中的特征降维问题,改进最大散度差鉴别准则,引入核变换作为前处理,使最大散度差鉴别准则可适用于更广泛的文本分类情形.提出一种基于核的非线性鉴别方法用于文本特征抽取.借助于核变换解决了散度差准则在用于文本分类... 针对文本分类问题中的特征降维问题,改进最大散度差鉴别准则,引入核变换作为前处理,使最大散度差鉴别准则可适用于更广泛的文本分类情形.提出一种基于核的非线性鉴别方法用于文本特征抽取.借助于核变换解决了散度差准则在用于文本分类时线性可分性较差的问题.在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩.文本分类试验结果表明,这种非线性方法与无核的最大散度差方法相比,F1值提高了4.7%,具有明显的效率上的优势. 展开更多
关键词 文本分类 特征抽取 散度差 核变换
在线阅读 下载PDF
基于统计的中文关键短语自动抽取 被引量:5
11
作者 张永刚 梁颖红 +1 位作者 颜振祥 姚建民 《江南大学学报(自然科学版)》 CAS 2010年第1期26-29,共4页
用统计的方法从单文本中自动抽取关键短语。在实验中验证了频度、首位置作为特征的有效性。用各种方法过滤非法词串,综合短语位置和统计特征对候选短语进行权重计算,并依据关键短语分布规律选择关键短语。另外,通过分析关键短语分布特点... 用统计的方法从单文本中自动抽取关键短语。在实验中验证了频度、首位置作为特征的有效性。用各种方法过滤非法词串,综合短语位置和统计特征对候选短语进行权重计算,并依据关键短语分布规律选择关键短语。另外,通过分析关键短语分布特点为N元短语在过滤、按比例选择方面提供了依据。获得了比较好的实验结果:TOP5精确率21.80%,召回率28.27%,F-measure 25%;TOP10精确率17.10%,召回率44.50%,F-measure 30.80%。 展开更多
关键词 关键短语抽取 文本特征 互信息 N元短语
在线阅读 下载PDF
基于潜在语义索引的文本摘要方法 被引量:17
12
作者 林鸿飞 高仁璟 《大连理工大学学报》 CAS CSCD 北大核心 2001年第6期744-748,共5页
因特网上的在线文本自动编制摘要可以帮助用户有选择地阅读 .给出了基于潜在语义索引的文本摘要方法 .它采用向量空间模型作为文本表示方法 ,利用潜在语义索引来减少词汇间的“斜交”现象 ,在语义空间上进行项、句子、段落与文本之间的... 因特网上的在线文本自动编制摘要可以帮助用户有选择地阅读 .给出了基于潜在语义索引的文本摘要方法 .它采用向量空间模型作为文本表示方法 ,利用潜在语义索引来减少词汇间的“斜交”现象 ,在语义空间上进行项、句子、段落与文本之间的相似度计算 ,而不是单纯地依赖于特征项的频率信息 .依据对于文本主题的表现能力来确定摘要的各个组成部分及其组成方式 .此外 ,给出了文本摘要的评估方法 . 展开更多
关键词 人工智能 语义信息 文本摘要 潜在语义索引 微量空间模型 特征抽取 摘要评价 因特网
在线阅读 下载PDF
一种基于散度差组合型文本特征降维方法 被引量:2
13
作者 刘海峰 姚泽清 +1 位作者 王元元 张述祖 《微电子学与计算机》 CSCD 北大核心 2008年第8期69-71,75,共4页
讨论了文本分类中特征降维的主要方法及其特点,分析了基于散度差准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度... 讨论了文本分类中特征降维的主要方法及其特点,分析了基于散度差准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.试验结果表明,这种方法在文本分类上的效率较好. 展开更多
关键词 文本分类 特征抽取 特征降维 散度差
在线阅读 下载PDF
基于ETM^+的遥感影像信息提取研究 被引量:7
14
作者 武文波 陈静 《甘肃农业大学学报》 CAS CSCD 2008年第5期142-146,共5页
以沈阳市苏家屯区为试验区,对ETM+图像的光谱信息和纹理信息进行综合分析,以达到提高影像分类精度的目的.利用光谱信息提取水体、植被;采用基于灰度共生矩阵的纹理量的分类法,通过TM5波段提取灰度共生矩阵和灰度联合矩阵,计算并提取最... 以沈阳市苏家屯区为试验区,对ETM+图像的光谱信息和纹理信息进行综合分析,以达到提高影像分类精度的目的.利用光谱信息提取水体、植被;采用基于灰度共生矩阵的纹理量的分类法,通过TM5波段提取灰度共生矩阵和灰度联合矩阵,计算并提取最能反映类别差异的纹理量值将光谱信息混淆的水田、旱田、居民地用分离,得到最终的分类结果.结果表明:将纹理特征应用于图像分类中可区分光谱混淆的地类,光谱与纹理特征结合得到的分类精度要高于单纯光谱的分类精度. 展开更多
关键词 遥感影像 光谱特征 纹理特征 灰度共生矩阵 分层提取 土地利用
在线阅读 下载PDF
一种基于类别的混合型文本特征降维 被引量:1
15
作者 刘海峰 刘守生 姚泽清 《微电子学与计算机》 CSCD 北大核心 2010年第10期13-17,共5页
提出了一种基于特征选择和特征抽取的混合型文本特征降维方法.通过一种改进的优势率方法进行初次特征选择,将文本表示为以类别属性为行向量的矩阵形式;再使用一种改进的最大散度差特征抽取方法进行二次特征抽取.在最大限度减少信息损失... 提出了一种基于特征选择和特征抽取的混合型文本特征降维方法.通过一种改进的优势率方法进行初次特征选择,将文本表示为以类别属性为行向量的矩阵形式;再使用一种改进的最大散度差特征抽取方法进行二次特征抽取.在最大限度减少信息损失的前提下实现了文本特征的二次降维.对中文文本的分类实验结果表明,提出的特征降维方法具有良好的分类效果. 展开更多
关键词 文本分类 特征选择 特征抽取 特征降维
在线阅读 下载PDF
小波域内背景图像的文本信息提取研究 被引量:2
16
作者 张晓威 郑雄波 郭健 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2008年第3期314-318,共5页
提出了一种基于二维小波分解的背景图像文本提取算法.该算法首先对图像进行二维小波变换,设置滑动窗扫描高频子带,计算滑动窗内图像的小波纹理特征,采用k-均值聚类算法将图像分为文本区域、简单背景区域和复杂背景区域,最后对文本区域... 提出了一种基于二维小波分解的背景图像文本提取算法.该算法首先对图像进行二维小波变换,设置滑动窗扫描高频子带,计算滑动窗内图像的小波纹理特征,采用k-均值聚类算法将图像分为文本区域、简单背景区域和复杂背景区域,最后对文本区域进行形态运算,精确地定位文本区域.实验结果表明,该算法能够准确地从背景图像中提取出不同语种、字体、大小和排列方式的文本信息. 展开更多
关键词 小波变换 文本提取 K-均值聚类 纹理特征 数学形态学
在线阅读 下载PDF
术语定义抽取的特征选择框架 被引量:1
17
作者 潘湑 顾宏斌 赵芷晴 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2012年第3期399-404,共6页
为了进一步提升航空领域术语定义抽取的精度和效率,提出了一种不依赖已有特征选择方法的特征选择框架。该框架结合了分类特征的类间分布差异和类内分布差异,更好地表达了术语定义内部各子概念间特征分布的差异对划分类别的贡献。在分析... 为了进一步提升航空领域术语定义抽取的精度和效率,提出了一种不依赖已有特征选择方法的特征选择框架。该框架结合了分类特征的类间分布差异和类内分布差异,更好地表达了术语定义内部各子概念间特征分布的差异对划分类别的贡献。在分析该框架和传统过滤器特征选择方法对特征分布的影响的基础上,在航空领域术语定义语料库中对实验结果进行了对比。结果表明,本文提出的方法在使用平衡随机森林方法时,取得的最好成绩为F1-measure=0.652,F2-measure=0.761,所需特征比例从30%~40%降低到20%~30%;在使用直接分类方法时,F1-measure成绩提高了2.57倍,F2-measure成绩提高了3.11倍,均优于过滤器方法和Fisher Score方法。 展开更多
关键词 特征选择 不平衡语料 定义抽取 文本分类 小析取项
在线阅读 下载PDF
基于特征融合的中文文本情感分析方法 被引量:9
18
作者 赵宏 傅兆阳 王乐 《兰州理工大学学报》 CAS 北大核心 2022年第3期94-102,共9页
针对现有的中文文本情感分析方法不能从句法结构、上下文信息和局部语义特征等方面综合考量文本语义信息的问题,提出一种基于特征融合的中文文本情感分析方法.首先,采用Jieba分词工具对评论文本进行分词和词性标注,并采用词向量训练工具... 针对现有的中文文本情感分析方法不能从句法结构、上下文信息和局部语义特征等方面综合考量文本语义信息的问题,提出一种基于特征融合的中文文本情感分析方法.首先,采用Jieba分词工具对评论文本进行分词和词性标注,并采用词向量训练工具GloVe获取融入词性的预训练词向量;然后,将词向量分别作为引入Self-Attention的BiGRU和TextCNN的输入,使用引入Self-Attention的BiGRU从文本的句法结构和文本的上下文信息两个方面综合提取全局特征,使用TextCNN提取文本的局部语义特征;最后,将全局特征和局部语义特征进行融合,并使用Softmax进行文本情感分类.实验结果表明,本文方法可以有效提高文本情感分析的准确率. 展开更多
关键词 中文文本情感分析 特征融合 特征提取 语义特征 自注意力机制 深度学习混合模型
在线阅读 下载PDF
基于遗传优化SVM文本图像识别算法研究 被引量:2
19
作者 杨春蓉 刘捡平 《科技通报》 北大核心 2012年第10期163-164,167,共3页
提出一采用遗传优化支持向量机的文本图像识别方法。改进的思路为首先采用图像采集设备获得图像,并进行预处理,然后提取字符的特征向量,采用主成分分析对特征向量进行降维处理,最后采用遗传优化的支持向量机进行字符识别。实验结果表明... 提出一采用遗传优化支持向量机的文本图像识别方法。改进的思路为首先采用图像采集设备获得图像,并进行预处理,然后提取字符的特征向量,采用主成分分析对特征向量进行降维处理,最后采用遗传优化的支持向量机进行字符识别。实验结果表明,提出的方法使得文本图像识率达到97%以上。 展开更多
关键词 支持向量机 特征提取 图像识别 文本图像 遗传算法
在线阅读 下载PDF
基于前向神经网络的与内容无关的笔迹鉴别 被引量:2
20
作者 周琳霞 黎明 +1 位作者 刘高航 杨小芹 《南昌航空工业学院学报》 CAS 2002年第1期27-34,共8页
与内容无关的笔迹鉴别是属于图象处理和模式识别领域的一项课题 ,有着广泛的实用前景。本文提出了一种基于前向神经网络的与内容无关的笔迹鉴别的方法。文中讨论了提取笔迹灰度图象特征和用前向神经网络分类器进行鉴别两大问题。对笔迹... 与内容无关的笔迹鉴别是属于图象处理和模式识别领域的一项课题 ,有着广泛的实用前景。本文提出了一种基于前向神经网络的与内容无关的笔迹鉴别的方法。文中讨论了提取笔迹灰度图象特征和用前向神经网络分类器进行鉴别两大问题。对笔迹灰度图提取了 3大类 18个灰度特征 ,而前向神经网络分类器由一种新的遗传算法同时优化设计其结构和权重矢量。通过对 10人、每人 6幅笔迹灰度图象用 18个灰度特征进行鉴别试验 ,结果显示此方法设计的前向神经网络分类器收敛率高 ,比常用的最近邻分类器有更高的识别正确率。 展开更多
关键词 前向神经网络 笔迹鉴别 特征提取 文本独立 遗传算法
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部