期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于LSTM-Attention神经网络的文本特征提取方法 被引量:29
1
作者 赵勤鲁 蔡晓东 +1 位作者 李波 吕璐 《现代电子技术》 北大核心 2018年第8期167-170,共4页
针对当前文本分类神经网络不能充分提取词语与词语和句子与句子之间的语义结构特征信息的问题,提出一种基于LSTM-Attention的神经网络实现文本特征提取的方法。首先,分别使用LSTM网络对文本的词语与词语和句子与句子的特征信息进行提取... 针对当前文本分类神经网络不能充分提取词语与词语和句子与句子之间的语义结构特征信息的问题,提出一种基于LSTM-Attention的神经网络实现文本特征提取的方法。首先,分别使用LSTM网络对文本的词语与词语和句子与句子的特征信息进行提取;其次,使用分层的注意力机制网络层分别对文本中重要的词语和句子进行选择;最后,将网络逐层提取得到的文本特征向量使用softmax分类器进行文本分类。实验结果表明,所提方法可以有效地提取文本的特征,使得准确率得到提高。将该方法应用在IMDB,yelp2013和yelp2014数据集上进行实验,分别得到52.4%,66.0%和67.6%的正确率。 展开更多
关键词 LSTM-Attention 注意力机制 文本分类 神经网络 文本特征提取 softmax
在线阅读 下载PDF
空中交通管制中的危险源关键特征提取 被引量:2
2
作者 蔡志鹏 曾维理 郭子逸 《航空计算技术》 2023年第6期35-39,共5页
空中交通管制危险源特征提取是针对空中交通危险源记录的关键信息检索任务。基于文本特征的提取方法仅依据统计结果来对术语的重要性进行排序。通过引入专家知识来提取符合危险源定义的特征,提出了一种基于专家知识的特征提取方法来定... 空中交通管制危险源特征提取是针对空中交通危险源记录的关键信息检索任务。基于文本特征的提取方法仅依据统计结果来对术语的重要性进行排序。通过引入专家知识来提取符合危险源定义的特征,提出了一种基于专家知识的特征提取方法来定义危险源特征并构建危险源分析框架。算法通过迭代对专家知识进行提炼和积累。实验结果表明,基于专家知识的特定语言处理后得到的数据集可以提取更多信息量的候选特征,以便通过k-means算法构建危险源记录的分析语境。该特征提取模型比其他四种算法获得了更高的精度,在空中交通管制运行数据集和通导数据集中分别达到82%和86%。此外,信息丰富的危险特征为安全管理部门的决策提供了支持,降低了隐患排查的成本。 展开更多
关键词 文本特征提取 空中交通管制 规范化 危险源 领域知识
在线阅读 下载PDF
基于特征融合的中文新闻文本情感分类方法研究 被引量:3
3
作者 冯宇航 邵剑飞 +1 位作者 张小为 邵建龙 《现代电子技术》 2023年第3期62-68,共7页
针对现有的新闻文本情感分析任务中,单一模型提取文本特征的片面性,且无法充分提取新闻文本语义等特征问题,提出一种基于门控单元特征融合的BERT-CNN情感分析方法。该方法分别采用BERT语言预训练模型与卷积神经网络(CNN)对新闻文本的特... 针对现有的新闻文本情感分析任务中,单一模型提取文本特征的片面性,且无法充分提取新闻文本语义等特征问题,提出一种基于门控单元特征融合的BERT-CNN情感分析方法。该方法分别采用BERT语言预训练模型与卷积神经网络(CNN)对新闻文本的特征向量进行提取;然后采用门控循环单元对提取到的文本特征进行特征融合;再输入到Softmax层进行新闻文本分类;最后从精准率、召回率和F_(1)-Score三个维度对比BERT、BERT-CNN、BERT-DPCNN和BERT-ERNIE的实验结果。实验结果表明,当分类场景更换为情感识别时,BERT-CNN依旧具有强大的语义捕捉能力,证明了BERT-CNN的泛化能力;另外,从原BERT的提升效果看,基于门控单元特征融合的BERT-CNN方法(提升2.07%)比词向量的方法(提升0.31%)更高。这一结果也证明了基于门控单元特征融合的BERT-CNN方法的有效性。 展开更多
关键词 情感分析 文本特征提取 特征融合 文本分类 情感识别 语义捕捉
在线阅读 下载PDF
基于LDA的英汉维文本聚类系统的设计与实现 被引量:2
4
作者 田亮 吐尔根.依布拉音 +1 位作者 艾山.吾买尔 卡哈尔江.阿比的热西提 《现代电子技术》 北大核心 2019年第3期122-126,共5页
以英汉维三种大规模文本聚类为目标,针对三种语言的特点实现基于LDA模型的静态文本聚类系统。因为存在博客、微博等网络媒体的文本不太规范及涉及的话题范围广泛等现象,对文本特征的提取及聚类算法的选择带来一定的难度。通过对样本文... 以英汉维三种大规模文本聚类为目标,针对三种语言的特点实现基于LDA模型的静态文本聚类系统。因为存在博客、微博等网络媒体的文本不太规范及涉及的话题范围广泛等现象,对文本特征的提取及聚类算法的选择带来一定的难度。通过对样本文本的分析,计算出适当的聚类数k,再调用LDA算法将文本聚为k类并给出每类文本的关键词。测试结果表明,该系统能将英汉维三种语言的文本相似度高的聚为一类,可显著提高聚类效果。 展开更多
关键词 文本聚类 LDA模型 多语言 文本特征提取 相似度聚类 权重
在线阅读 下载PDF
基于主题模型的法院文本典型案例推荐 被引量:3
5
作者 吕宾 侯伟亮 《微电子学与计算机》 CSCD 北大核心 2018年第2期128-132,共5页
考虑到案件不能量化、业务法官经验局限以及相似案件的认定缺乏统一的标准和尺度等因素,提出一种基于主题模型的法院文本典型案例推荐模型,基于本模型从相似度最大的文本中利用正则和加权的方法根据法院文本中判决年限和对应刑法给出推... 考虑到案件不能量化、业务法官经验局限以及相似案件的认定缺乏统一的标准和尺度等因素,提出一种基于主题模型的法院文本典型案例推荐模型,基于本模型从相似度最大的文本中利用正则和加权的方法根据法院文本中判决年限和对应刑法给出推荐.同时对案件进行深度挖掘和分析,将相似度最高的案件定为最优推荐案件推荐给用户.实验结果表明,提出的基于主题模型的文本相似度计算方法跟传统的方法相比能够取得更好的F值. 展开更多
关键词 主题模型LDA 多粒度文本特征提取 文本相似度 法院判决文本
在线阅读 下载PDF
基于多视图关注网络的图文多模态情感分析模型
6
作者 丛子涵 张思佳 《现代电子技术》 北大核心 2024年第12期157-164,共8页
针对现有多模态情感分类模型无法全面、准确地捕获复杂的情感信息,以及融合过程中没有充分挖掘两者之间的潜在关联,导致模型结构冗余复杂、计算效率低下的问题,提出一种多视图关注网络(MPF-Net)模型。该模型通过引入多维感知特征捕获机... 针对现有多模态情感分类模型无法全面、准确地捕获复杂的情感信息,以及融合过程中没有充分挖掘两者之间的潜在关联,导致模型结构冗余复杂、计算效率低下的问题,提出一种多视图关注网络(MPF-Net)模型。该模型通过引入多维感知特征捕获机制,全面而精确地获取图像和文本中蕴含的情感信息;其次,采用增强的记忆互动学习机制,使模型能够更加有效地提取和融合单模态特征,并在多轮迭代中不断更新和优化这些特征,从而捕捉到更深层次的情感细节;再构建一个高级深度学习框架,该框架采用生成对抗网络(GAN)与池化技术的深度融合单元,以实现复杂数据特征的高效提取与整合;最后,在保留原有特征信息的基础上进行特征整合,同时通过降维技术降低模型的复杂性,提高计算效率。在公开数据集MVSA-Single和MVSA-Multiple以及自建数据集上通过实验验证所提模型的准确性,结果表明,与多个基线模型对比,所提模型的准确率和F1值均有所提高。 展开更多
关键词 多模态情感分析 对抗学习 多视图网络 生成对抗网络 文本特征提取 特征融合
在线阅读 下载PDF
基于胶囊网络和高斯自注意力的用户评论情感分析 被引量:1
7
作者 纪明宇 赵雪峰 +1 位作者 贾国庆 李勃毅 《现代电子技术》 2021年第7期95-100,共6页
针对传统卷积神经网络和循环神经网络在文本情感分析领域对文本特征提取存在的语义丢失、无法识别文本关键词等问题进行改进,提出一种结合高斯自注意力机制的双通道文本特征提取模型。首先,该模型利用改进的胶囊网络和词性词向量提取更... 针对传统卷积神经网络和循环神经网络在文本情感分析领域对文本特征提取存在的语义丢失、无法识别文本关键词等问题进行改进,提出一种结合高斯自注意力机制的双通道文本特征提取模型。首先,该模型利用改进的胶囊网络和词性词向量提取更深层次的文本特征;然后,使用双向长短期记忆网络提取双向的语义依赖;最后,加入高斯自注意力层得到输入信息对分类结果的注意力分布。模型在两个标准数据集上进行验证,与传统的用户评论情感分析模型相比,在准确率和F1值上均取得了明显的提升。 展开更多
关键词 情感分析 高斯自注意力机制 文本特征提取 胶囊网络 双通道模型 实验分析
在线阅读 下载PDF
基于人工智能的搜索引擎在数字图书中的应用 被引量:2
8
作者 黄文娟 《信息技术》 2019年第11期93-96,102,共5页
针对传统搜索引擎算法搜索内容需要占用大量人工劳动进行标记,反馈信息和用户搜索信息匹配度低,无法理解人类语言输入等缺点,文中结合自然语言算法对信息的整合过程及理解用户语言过程进行优化。通过建立语料库、提取文本特征信息和模... 针对传统搜索引擎算法搜索内容需要占用大量人工劳动进行标记,反馈信息和用户搜索信息匹配度低,无法理解人类语言输入等缺点,文中结合自然语言算法对信息的整合过程及理解用户语言过程进行优化。通过建立语料库、提取文本特征信息和模型训练等方法,提出了适用于智能搜索引擎的新型检索算法。文中在CSI语料库、AWS爬虫数据等数据集中进行了测试,测试结果表明,该算法只需进行前期的人工干预和标记,便可以自行搜集专业信息并自行展开机器学习和训练,从而降低维护及使用成本。 展开更多
关键词 搜索引擎算法 人工智能 自然语言处理 文本特征提取 文本分类
在线阅读 下载PDF
基于半监督学习的涉及未成年人案件文书识别方法 被引量:2
9
作者 杨圣豪 吴玥悦 +3 位作者 毛佳昕 刘奕群 张敏 马少平 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期29-38,46,共11页
案件文书作为司法信息公开的重要内容,需要在审判之后向公众公开,某些涉及未成年人的案件文书极有可能会造成未成年人的个人隐私信息泄露。为了能从大量案件文书中准确地识别出涉及未成年人信息的文书,进而有针对性地对其进行隐私保护... 案件文书作为司法信息公开的重要内容,需要在审判之后向公众公开,某些涉及未成年人的案件文书极有可能会造成未成年人的个人隐私信息泄露。为了能从大量案件文书中准确地识别出涉及未成年人信息的文书,进而有针对性地对其进行隐私保护处理。同时,为解决现实数据集因有标注样本缺乏而难以进行有效的有监督学习的问题,文中提出了基于半监督学习的涉及未成年人案件文书识别方法。首先,对案件文书语料文本进行预处理后分别使用Word2Vec和BERT-wwm-ext对文本进行特征提取,将长语料文本转换为可作为分类模型输入的数据格式;接着,采用PU学习方法训练分类模型,在正例样本极少的情况下借助大量未标注样本构建有效的分类器;然后,在分类模型预测结果的基础上,使用主动学习方法获取关键词并对模型预测结果进行筛选处理,以进一步提升预测效果。在基于现实场景比例构建的测试集上,文中提出的案件文书识别方法取得了98.67%的召回率和81.02%的准确率。 展开更多
关键词 文本分类 文本特征提取 深度学习 半监督学习
在线阅读 下载PDF
基于知识图谱的智能问答系统实现与应用 被引量:7
10
作者 董天波 《数字技术与应用》 2022年第3期165-167,共3页
本文首先对知识图谱智能问答分析系统发展现状简要分析,然后从深度学习的文本特征提取技术原理、规则引擎基本原理、智能问答系统基本原理等方面分析研究原理和理论依据,从依托工程、实践基础等方面分析研究实践依据,基于知识图谱的智... 本文首先对知识图谱智能问答分析系统发展现状简要分析,然后从深度学习的文本特征提取技术原理、规则引擎基本原理、智能问答系统基本原理等方面分析研究原理和理论依据,从依托工程、实践基础等方面分析研究实践依据,基于知识图谱的智能问答分析系统实现理论和实践依据阐述研究的关键点和难点,最后阐述基于知识图谱的智能问答分析系统技术路线,并从IT设备质量信息文本特征提取技术、IT设备质量信息知识发现技术、IT设备质量事件智能问答技术等方面阐述基于知识图谱的智能问答分析系统实现与研究方案。 展开更多
关键词 文本特征提取 规则引擎 智能问答系统 知识图谱 知识发现技术 深度学习 IT设备 质量事件
在线阅读 下载PDF
英语作文自动评分系统研究与实现 被引量:2
11
作者 张锐捷 宋万里 +3 位作者 刘琪 范圆圆 姜戴锐 葛艺芃 《现代信息科技》 2019年第4期27-29,共3页
随着近几年来人工智能技术的发展,计算机技术被越来越多地应用到教育领域,英语作文自动评分就是其中的一个方面。为达到英语作文自动评分的要求,该系统提取作文内容等一系列特征进行综合考评,使用自然语言处理、文本特征提取、潜在语法... 随着近几年来人工智能技术的发展,计算机技术被越来越多地应用到教育领域,英语作文自动评分就是其中的一个方面。为达到英语作文自动评分的要求,该系统提取作文内容等一系列特征进行综合考评,使用自然语言处理、文本特征提取、潜在语法分析等技术,实现英语作文自动评分功能。本系统可通过添加自定义的停用词词典,而扩展运用到更多的场景。 展开更多
关键词 自动评分 潜在语义分析 文本特征提取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部