期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于双向长短期记忆模型的网民负面情感分类研究 被引量:38
1
作者 吴鹏 应杨 沈思 《情报学报》 CSSCI CSCD 北大核心 2018年第8期845-853,共9页
网民负面情感在网络舆情情感分析中具有重要意义,但已有研究缺乏自动化识别海量短文本中网民负面情感的多分类方法。本文利用词嵌入技术学习词语的特征表示,通过增加文本的情感特征生成具有情感意义的词向量,并训练双向长短期记忆模型... 网民负面情感在网络舆情情感分析中具有重要意义,但已有研究缺乏自动化识别海量短文本中网民负面情感的多分类方法。本文利用词嵌入技术学习词语的特征表示,通过增加文本的情感特征生成具有情感意义的词向量,并训练双向长短期记忆模型得到网民负面情感识别模型,在判断网民情感极性的基础上,识别网民的愤怒、悲伤和恐惧三种负面情感,并结合案例数据与SVM、LSTM和CNN等模型进行对比分析。实验表明,具有情感语义的词向量比词向量更适合情感分析任务;利用双向长短期记忆模型可以得到较好的情感识别效果;判断网民情感极性基础上识别网民负面情感的分类方式优于直接判断网民的负面情感的方式。 展开更多
关键词 网络舆情 负面情感分析 情感词向量 双向长短期记忆模型
在线阅读 下载PDF
基于CNN-BiLSTM-Attention模型的胡麻产量预测
2
作者 李星宇 李玥 高玉红 《江苏农业学报》 北大核心 2025年第7期1342-1349,共8页
本研究提出了一种用于胡麻产量预测的基于深度学习方法的卷积神经网络(CNN)-双向长短期记忆网络(BiLSTM)-注意力机制(Attention)模型,该模型整合了卷积神经网络的空间特征提取能力、双向长短期记忆网络的时序动态建模能力以及注意力机... 本研究提出了一种用于胡麻产量预测的基于深度学习方法的卷积神经网络(CNN)-双向长短期记忆网络(BiLSTM)-注意力机制(Attention)模型,该模型整合了卷积神经网络的空间特征提取能力、双向长短期记忆网络的时序动态建模能力以及注意力机制的特征自适应加权功能。基于气候数据、植被指数和2000-2020年产量对模型进行训练。试验结果表明,CNN-BiLSTM-Attention模型预测精度显著优于传统模型,其均方根误差(RMSE)达到316.98 kg/hm^(2),决定系数(R^(2))达到0.83。该模型在年际气候变化条件下保持了良好的稳定性和较高的精确度。本研究为胡麻产量预测提供了技术支持,其模块化设计框架还可推广应用于其他作物的生长监测与产量预估。 展开更多
关键词 胡麻 产量预测 深度学习 卷积神经网络 双向长短期记忆模型
在线阅读 下载PDF
基于力-电-温度信号和CNN-BiLSTM模型的磷酸铁锂电池SOC估计
3
作者 马昊远 吴焱 +3 位作者 王通 胡锦洋 李佳 黄钰期 《储能科学与技术》 北大核心 2025年第7期2865-2874,共10页
锂电池的荷电状态(state of charge,SOC)是电池管理系统的重要参数,但其与电池内部复杂的电化学特性高度关联,无法直接测量。近年来,基于数据驱动的方法在SOC估计领域展现了极大的潜力,然而其对输入数据的精确性有较高要求。磷酸铁锂电... 锂电池的荷电状态(state of charge,SOC)是电池管理系统的重要参数,但其与电池内部复杂的电化学特性高度关联,无法直接测量。近年来,基于数据驱动的方法在SOC估计领域展现了极大的潜力,然而其对输入数据的精确性有较高要求。磷酸铁锂电池因存在电压平台问题,其电压波动和噪声会严重影响SOC估计的精度,本文针对这一问题,通过实验和数据驱动结合的方法,引入电池膨胀力作为新的输入维度,融合电池的电化学特性与机械特性,有效补偿了电压平台问题对SOC估计结果的影响。本研究在4种环境温度和2种动态电流测试工况下进行了实验,利用所得数据对神经网络模型进行训练和测试,以评估SOC估计精度并验证本方法的可行性和普适性。此外,本文还提出了一种基于卷积神经网络(convolutional neural network,CNN)和双向长短期记忆网络(bidirectional long short-term memory,Bi-LSTM)的混合模型,兼顾序列数据的局部模式与长期依赖关系,进一步提升SOC估计的可靠性。结果表明,本文提出的方法可以显著提高磷酸铁锂电池SOC估计精度,相比未引入膨胀力信号,均方根误差(root-mean-square error,RMSE)平均下降了43.82%。同时,CNNBiLSTM模型相比其他常规神经网络模型,RMSE最多降低了53.88%。本研究为高精度SOC估计提供了新的思路,对提升电池管理系统的性能具有重要意义。 展开更多
关键词 磷酸铁锂电池 荷电状态估计 膨胀力 数据驱动 双向长短期记忆模型
在线阅读 下载PDF
基于KOA-BiLSTM的矿井淋水井筒风温预测模型及可解释性分析
4
作者 秦跃平 唐飞 +3 位作者 王海蓉 王鹏 郭铭彦 王世斌 《中国安全科学学报》 北大核心 2025年第7期40-47,共8页
为提高矿井淋水井筒风温预测的准确性、稳定性及模型的可解释性,首先,通过皮尔逊相关性系数分析特征变量;其次,采用开普勒优化算法(KOA)优化双向长短期记忆网络(BiLSTM)模型,建立基于KOA-BiLSTM的矿井淋水井筒风温预测模型;然后,在相同... 为提高矿井淋水井筒风温预测的准确性、稳定性及模型的可解释性,首先,通过皮尔逊相关性系数分析特征变量;其次,采用开普勒优化算法(KOA)优化双向长短期记忆网络(BiLSTM)模型,建立基于KOA-BiLSTM的矿井淋水井筒风温预测模型;然后,在相同样本条件下,与反向传播(BP)、随机森林(RF)、最小二乘增强(LSBoost)和支持向量机(SVM)算法进行综合对比;最后,利用沙普利可加性特征解释算法(SHAP)进行可解释性分析及实例验证。研究结果表明:KOA-BiLSTM模型的绝对误差范围为-1.24~0.5℃,比优化前模型的预测精度提高3.98%;与另外4个模型相比,该模型的平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方误差(MSE)等均为最佳,表明该模型具有最优的预测效果和泛化能力;SHAP分析表明:井口风流温度对预测结果影响最大,而地面压力影响最小;KOA-BiLSTM模型实例验证的绝对误差范围为-0.49~0.38℃,预测精度可满足实际工作需要。 展开更多
关键词 开普勒优化算法(KOA)-双向长短期记忆网络(BiLSTM)模型 淋水井筒 风温预测模型 可解释性分析 皮尔逊相关性
在线阅读 下载PDF
基于ProtBert预训练模型的HLA-Ⅰ和多肽的结合预测算法 被引量:1
5
作者 周丰丰 张亚琪 《吉林大学学报(理学版)》 CAS 北大核心 2023年第3期651-657,共7页
针对现有的第Ⅰ类HLA(HLA-Ⅰ)分子与多肽结合亲和力预测算法在特征构造时依赖传统序列评分函数的问题,为突破用经典机器学习算法构造氨基酸序列特征的局限性,提出一种基于蛋白质预训练模型ProtBert的HLA-Ⅰ与多肽的结合预测算法ProHLAⅠ... 针对现有的第Ⅰ类HLA(HLA-Ⅰ)分子与多肽结合亲和力预测算法在特征构造时依赖传统序列评分函数的问题,为突破用经典机器学习算法构造氨基酸序列特征的局限性,提出一种基于蛋白质预训练模型ProtBert的HLA-Ⅰ与多肽的结合预测算法ProHLAⅠ.该算法利用生命体语言与文本语言在组成上的共性,将氨基酸序列类比句子,通过整合ProtBert预训练模型、BiLSTM编码和注意力机制的网络结构优势,对HLA-Ⅰ序列和多肽序列进行特征提取,从而实现HLA-Ⅰ独立于位点的多肽结合预测.实验结果表明,该模型在两组独立测试集中均取得了最优性能. 展开更多
关键词 HLA-Ⅰ结合肽预测 自然语言处理 注意力机制 BERT模型 双向长短期记忆模型(BiLSTM)
在线阅读 下载PDF
滚动轴承的退化特征信息融合与剩余寿命预测
6
作者 张建宇 王留震 +1 位作者 肖勇 马雅楠 《中国机械工程》 北大核心 2025年第7期1553-1561,共9页
针对滚动轴承剩余寿命预测的需求,提出一种基于稀疏自编码器(SAE)和双向长短期记忆网络(BiLSTM)的预测模型。以滚动轴承全寿命振动数据为研究对象,通过构建反双曲变换的状态退化指标和频域谐波退化因子形成退化指标集,并利用SAE特征融... 针对滚动轴承剩余寿命预测的需求,提出一种基于稀疏自编码器(SAE)和双向长短期记忆网络(BiLSTM)的预测模型。以滚动轴承全寿命振动数据为研究对象,通过构建反双曲变换的状态退化指标和频域谐波退化因子形成退化指标集,并利用SAE特征融合提取关键特征,消除冗余信息。同时,结合BiLSTM模型捕捉时序特征,实现全周期寿命预测。实验结果表明,所提模型优于支持向量回归、极限学习机、卷积神经网络等模型,预测误差更小,泛化能力更强。 展开更多
关键词 稀疏自编码器特征融合 双向长短期记忆网络预测模型 滚动轴承 反双曲特征指标 频域谐波退化因子
在线阅读 下载PDF
融合FastText模型和注意力机制的网络新闻文本分类模型 被引量:10
7
作者 王婉 张向先 +1 位作者 卢恒 张莉曼 《现代情报》 CSSCI 2022年第3期40-47,共8页
[目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用... [目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用融合注意力机制的Bi LSTM;tte模型实现新闻文本分类。[结果/结论]实验结果显示,融合了Fast Text模型与注意力机制的网络新闻文本分类模型使F1值从90.62%提升到92.03%,说明本文提出的文本分类模型能够提升网络新闻文本分类的精确率,对网络新闻平台提升知识组织效率、优化服务水平具有重要参考价值。 展开更多
关键词 网络新闻 文本分类 注意力机制 双向长短期记忆神经网络模型
在线阅读 下载PDF
基于自注意力机制的多特征融合槽抽取模型 被引量:2
8
作者 牛迪 《南京理工大学学报》 CAS CSCD 北大核心 2022年第1期69-75,共7页
在任务型人机对话系统中,槽抽取任务是至关重要的一个环节。为了提高槽抽取模型的识别准确率,该文提出了一种利用自注意力机制融合文本的多特征维度特征的方法。该方法在常规的双向长短期记忆模型(Bi-directional long short-term memor... 在任务型人机对话系统中,槽抽取任务是至关重要的一个环节。为了提高槽抽取模型的识别准确率,该文提出了一种利用自注意力机制融合文本的多特征维度特征的方法。该方法在常规的双向长短期记忆模型(Bi-directional long short-term memory,Bi-LSTM)和条件随机场(Conditional random field,CRF)的槽抽取模型基础框架之上,引入了自注意力机制融合多维度的特征,如意图特征、词特征、词典特征、字符特征等。通过融合这些特征,槽抽取模型的槽提取能力得到了提升。实验结果证明,该方法的槽抽取F1值能达到97.99%,比常规模型最大提升了3%。 展开更多
关键词 槽抽取 自注意力 双向长短期记忆模型 多特征融合
在线阅读 下载PDF
基于AB-CNN-BiLSTM心衰死亡率预测模型 被引量:8
9
作者 郭汉 帅仁俊 +1 位作者 马力 李文煜 《计算机应用与软件》 北大核心 2021年第4期37-42,共6页
为了更有效地分配医疗资源并辅助医生诊疗,需要对ICU患者的死亡率做出更快、更准确的预测,提出一种融合注意力机制的CNN-BiLSTM ICU患者心衰死亡率预测模型。对MIMICIII数据集提供的入院48小时的数据进行一系列预处理操作;通过卷积神经... 为了更有效地分配医疗资源并辅助医生诊疗,需要对ICU患者的死亡率做出更快、更准确的预测,提出一种融合注意力机制的CNN-BiLSTM ICU患者心衰死亡率预测模型。对MIMICIII数据集提供的入院48小时的数据进行一系列预处理操作;通过卷积神经网络模型(CNN)及双向长短期记忆神经网络模型(BiLSTM)考虑不同参数之间的空间联系,同时关注数据时间维度上的变化;引入注意力机制赋予特征权重。实验表明,该预测模型能够有效地对ICU患者心衰死亡率进行预测,提高死亡率预测的准确性。 展开更多
关键词 心衰死亡率 数据预处 卷积神经网络 双向长短期记忆神经网络模型 注意力机制
在线阅读 下载PDF
基于多模型融合的电力运检命名实体识别 被引量:3
10
作者 孙玉芹 肖静婷 王海超 《科学技术与工程》 北大核心 2023年第36期15545-15552,共8页
为有效解决构建电力运检知识图谱的关键步骤之一的电力运检命名实体识别问题,通过构建一种基于Stacking多模型融合的隐马尔可夫-条件随机场-双向长短期记忆网络(hidden Markov-conditional random fields-bi-directional long short-ter... 为有效解决构建电力运检知识图谱的关键步骤之一的电力运检命名实体识别问题,通过构建一种基于Stacking多模型融合的隐马尔可夫-条件随机场-双向长短期记忆网络(hidden Markov-conditional random fields-bi-directional long short-term,HCB)模型方法研究了电力运检命名实体识别问题。HCB模型分为两层,第一层使用隐马尔可夫模型(hidden Markov model,HMM)、条件随机场(conditional random fields,CRF)和双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)模型进行训练预测,再将预测结果输入第二层的CRF模型进行训练,经过双层模型训练预测得出最后的命名实体。结果表明:在电力运检命名实体识别问题上HCB模型的精确率、召回率及F1值等指标明显优于单模型以及其他的融合模型。可见HCB模型能有效解决电力运检命名实体识别问题。 展开更多
关键词 电力运检知识图谱 模型融合 命名实体识别 隐马尔可夫-条件随机场-双向长短期记忆网络(HCB)模型
在线阅读 下载PDF
基于深度学习的二进制变种协议字段划分方法
11
作者 安晓明 王忠勇 +3 位作者 翟慧鹏 巩克现 王玮 孙鹏 《计算机工程与设计》 北大核心 2024年第4期982-988,共7页
为提高二进制变种协议字段格式划分的准确率,提出一种基于深度学习的方法,能够自动挖掘协议报文序列的深层字段特征完成协议的字段格式划分。引入一种字段列特征数据集的提取方法,在传统的双向长短期记忆条件随机场网络模型的基础上增... 为提高二进制变种协议字段格式划分的准确率,提出一种基于深度学习的方法,能够自动挖掘协议报文序列的深层字段特征完成协议的字段格式划分。引入一种字段列特征数据集的提取方法,在传统的双向长短期记忆条件随机场网络模型的基础上增加协议字段列特征提取模块,搭建一种专门解决二进制变种协议字段格式划分的神经网络PRO-BILSTM-CRF。与二进制未知协议字段格式划分方法以及几种主流网络模型的对比实验结果表明,在变种协议字段格式划分任务上,提出模型能够取得更高准确率。 展开更多
关键词 二进制变种协议 深度学习 双向长短期记忆模型 条件随机场 特征提取 字段格式划分 协议逆向工程
在线阅读 下载PDF
基于上下文知识增强型Transformer网络的抑郁检测 被引量:4
12
作者 张亚洲 和玉 +1 位作者 戎璐 王祥凯 《计算机工程》 CAS CSCD 北大核心 2024年第8期75-85,共11页
抑郁症作为一种常见的心理健康问题,严重影响人们的日常生活甚至是生命安全。鉴于目前的抑郁症检测存在主观性和人工干预等缺点,基于深度学习的自动检测方式成为热门研究方向。对于最易获取的文本模态而言,主要的挑战在于如何建模抑郁... 抑郁症作为一种常见的心理健康问题,严重影响人们的日常生活甚至是生命安全。鉴于目前的抑郁症检测存在主观性和人工干预等缺点,基于深度学习的自动检测方式成为热门研究方向。对于最易获取的文本模态而言,主要的挑战在于如何建模抑郁文本中的长距离依赖与序列依赖。为解决该问题,提出一种基于上下文知识的增强型Transformer网络模型RoBERTa-BiLSTM,旨在从抑郁文本序列中充分提取和利用上下文特征。结合序列模型与Transformer模型优点,建模单词间上下文交互,为抑郁类别揭示与信息表征提供参考。首先,利用RoBERTa方法将词汇嵌入到语义向量空间;其次,利用双向长短期记忆网络(BiLSTM)模型有效捕获长距离上下文语义;最后,在DAIC-WOZ和EATD-Corpus 2个大规模数据集上进行实证研究。实验结果显示,RoBERTa-BiLSTM模型的准确率分别达到0.74和0.93以上,召回率分别达到0.66和0.56以上,能够准确地检测抑郁症。 展开更多
关键词 抑郁检测 序列模型 深度学习 Transformer模型 双向长短期记忆模型
在线阅读 下载PDF
多特征融合的专利功效短语抽取
13
作者 游新冬 赵颖 +1 位作者 刘佳琦 吕学强 《计算机工程与设计》 北大核心 2024年第5期1413-1419,共7页
为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到B... 为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到BiLSTM或Transformer进行编码,使用CRF解码得到对应输入的标签序列,得到专利功效短语。实验采用新能源汽车领域的专利文本作为训练数据,尝试组合不同的特征进行实验,实验结果表明,所提模型在准确率、召回率、F1值上均取得了明显提升,验证了多特征融合在功效短语抽取任务上的有效性。 展开更多
关键词 多特征融合 专利功效短语 深度学习 词语抽取 双向长短期记忆模型 条件随机场模型 词向量模型
在线阅读 下载PDF
船用发电汽轮机多特征耦合故障预测方法
14
作者 卓越 倪何 肖鹏飞 《舰船科学技术》 北大核心 2024年第11期125-133,共9页
针对发电汽轮机运行参数高度耦合、故障特征参数预测困难的问题,综合运用中值回归经验模态分解、卷积神经网络和双向长短期记忆模型,提出一种适用于发电汽轮机的多特征故障预测方法。首先,通过中值回归经验模态分解(Median Regression E... 针对发电汽轮机运行参数高度耦合、故障特征参数预测困难的问题,综合运用中值回归经验模态分解、卷积神经网络和双向长短期记忆模型,提出一种适用于发电汽轮机的多特征故障预测方法。首先,通过中值回归经验模态分解(Median Regression Empirical Mode Decomposition,MREMD)对故障相关参数进行趋势提取;然后,以各参数运行趋势为训练集的输入特征向量,构建可以提取训练集时空特征的卷积-双向长短期记忆(Convolution Bidirectional Long Short-Term Memory,CNN-BiLSTM)模型;为提高模型的收敛速度,采用麻雀搜索算法(Sparrow Search Algorithm,SSA)对模型超参数进行优化。经实际案例验证,该方法可有效通过故障相关参数的波动预测故障参数的发展趋势,为系统的预警和应急处置提供参考。 展开更多
关键词 发电汽轮机 故障预测 模态分解 趋势提取 卷积—双向长短期记忆模型
在线阅读 下载PDF
基于EEG和面部视频的多模态连续情感识别 被引量:2
15
作者 雪雯 陈景霞 +1 位作者 胡凯蕾 刘洋 《陕西科技大学学报》 北大核心 2024年第1期169-176,共8页
针对脑电(Electroencephalogram, EEG)通道间和时间上情绪强度的改变很难被捕捉,以及不同被试的面部特征情绪上的相似性难以挖掘的问题,文章提出了一种基于EEG和面部视频的多模态连续情感识别模型.采用基于时空注意力机制(Spatial-Tempo... 针对脑电(Electroencephalogram, EEG)通道间和时间上情绪强度的改变很难被捕捉,以及不同被试的面部特征情绪上的相似性难以挖掘的问题,文章提出了一种基于EEG和面部视频的多模态连续情感识别模型.采用基于时空注意力机制(Spatial-Temporal Attention)的卷积和双向长短期记忆神经网络的组合模型(STA-CNNBiLSTM)对EEG中提取的功率谱密度(Power Spectral Density, PSD)特征进行深层特征学习与情感分类;采用引入自注意力机制的预训练卷积神经网络(SA-CNN)对人脸面部几何特征进行学习与情感分类.采用决策级融合算法,对两个模态的分类结果进行迭代学习与融合,得到最终多模态情感分类结果.在公开数据集MAHNOB-HCI进行了大量对比验证实验,在FER2013数据集的面部几何特征上对SA-CNN模型进行了预训练.在独立被试的实验中,所提模型在效价维度二分类的平均准确率为75.50%,在唤醒维度二分类的平均准确率为79.00%,均优于单模态上的最高平均准确率.和目前流行的模型LSSVM、SE-CNN和AM-LSTM相比较,所提模型的分类效果更优,验证了所提时空注意力机制能够捕捉更多的EEG时空特征,自注意力机制能够关注到不同被试面部特征的相似性,进而提高了多模态情感识别的性能. 展开更多
关键词 EEG 多模态情感识别 卷积双向长短期记忆组合模型 时空注意力机制 自注意力机制
在线阅读 下载PDF
面向行政执法案件文本的事件抽取研究 被引量:1
16
作者 屈潇雅 李兵 温立强 《计算机工程》 CAS CSCD 北大核心 2024年第9期63-71,共9页
行政执法的智能化水平是国家治理能力现代化的体现,数据是智能化发展的重要依托。在行政执法领域,各行政机关存储大量以文本形式记录的历史案件,这种非结构化的数据价值密度较低、可利用性不强。利用事件抽取技术从行政执法案件文本中... 行政执法的智能化水平是国家治理能力现代化的体现,数据是智能化发展的重要依托。在行政执法领域,各行政机关存储大量以文本形式记录的历史案件,这种非结构化的数据价值密度较低、可利用性不强。利用事件抽取技术从行政执法案件文本中快速高效地抽取案件职权类型、案发时间、案发地点等结构化信息,可推动行政机关对历史案件信息的利用和智能化执法办案研究。收集整理某城市的真实案例数据,并通过人工标注构建一个行政执法领域的数据集,根据行政执法案件文本的无触发词、文档级、格式不固定等文本特征,提出结合基于Transformer的双向编码器表示(BERT)和基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型的两阶段事件抽取方法,通过文本多分类和序列标注依次完成事件类型检测和事件论元抽取任务。实验结果表明,事件类型检测任务的F1值达到99.54%,事件论元抽取任务的F1值达到97.36%,实现了对案件信息的有效抽取。 展开更多
关键词 行政执法案件 事件抽取 两阶段方法 基于Transformer的双向编码器表示模型 基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型
在线阅读 下载PDF
基于方剂数据集的知识图谱构建研究 被引量:4
17
作者 李灿 镇可涵 +1 位作者 唐东昕 解丹 《世界中医药》 CAS 北大核心 2024年第9期1329-1333,共5页
目的:构建基于方剂数据集的知识图谱,以系统性地展示方剂实体及其之间的关系。方法:首先建立方剂数据处理与知识图谱构建的规范化流程,获取方剂数据集,然后在4种常用命名实体识别模型中遴选最优模型进行实体抽取,最后利用Neo4j图数据库... 目的:构建基于方剂数据集的知识图谱,以系统性地展示方剂实体及其之间的关系。方法:首先建立方剂数据处理与知识图谱构建的规范化流程,获取方剂数据集,然后在4种常用命名实体识别模型中遴选最优模型进行实体抽取,最后利用Neo4j图数据库构建知识图谱。结果:最终遴选出基于Transformer的双向编码模型-双向长短期记忆网络-条件随机场(BERT-BiLSTM-CRF)模型,从数据集中抽取出症状、中西医病名、中医证候等医学实体,平均F1值达90.55%,形成了规范的方剂数据集并构建了方剂知识图谱。结论:利用本文方法抽取出的医学实体为中医药的临床实践和科学研究提供了系统性展示方剂实体及其之间关系的可靠数据基础。所建立的方剂知识图谱实现了中药方剂的知识检索,不仅有助于发现方剂数据中的潜在知识与内在关系,而且为中医药领域的信息整合和知识发现提供了坚实基础,推动中医药的现代化进程。 展开更多
关键词 方剂 数据处理 知识图谱 规范化 命名实体识别 Neo4j图数据库 基于Transformer的双向编码模型-双向长短期记忆网络-条件随机场模型 中医药
在线阅读 下载PDF
基于改进Bi-LSTM-CRF的农业问答系统研究 被引量:12
18
作者 白皓然 孙伟浩 +1 位作者 金宁 马皓冉 《中国农机化学报》 北大核心 2023年第2期99-105,共7页
针对农业领域问答系统面临的实体识别困难的问题,提出一种基于改进Bi-LSTM-CRF的实体识别方法。首先通过BERT预训练模型的预处理,生成基于上下文信息的词向量,然后将训练出的词向量输入Bi-LSTM-CRF做进一步的训练处理,最后,利用Python的... 针对农业领域问答系统面临的实体识别困难的问题,提出一种基于改进Bi-LSTM-CRF的实体识别方法。首先通过BERT预训练模型的预处理,生成基于上下文信息的词向量,然后将训练出的词向量输入Bi-LSTM-CRF做进一步的训练处理,最后,利用Python的Django框架设计农业领域的实体识别、实体查询、农知问答等子系统。经过试验对比,所提出的改进的Bi-LSTM-CRF在农业信息领域具有更好的实体识别能力,在农业信息语料库上的精确率、召回率和F1值分别为93.23%、91.08%和92.16%。实现农业领域实体识别和农业信息问答的知识图谱网站演示,对农业信息化的发展具有重要意义。 展开更多
关键词 智能问答系统 知识图谱 双向长短期记忆模型(Bi-LSTM) 条件随机场(CRF)
在线阅读 下载PDF
增强领域特征的电力审计文本分类方法 被引量:3
19
作者 陈平 匡尧 +2 位作者 胡景懿 王向阳 蔡静 《计算机应用》 CSCD 北大核心 2020年第S01期109-112,共4页
针对电力审计领域的文本具有行业特征明显、文本特征相似度高、分类边界模糊的特性,提出了增强领域特征的电力审计文本分类方法。首先构建面向电力审计的专业词典,提出EF-Doc2VecC模型再联合专业词典增强文本的特征,最后送入BiLSTM分类... 针对电力审计领域的文本具有行业特征明显、文本特征相似度高、分类边界模糊的特性,提出了增强领域特征的电力审计文本分类方法。首先构建面向电力审计的专业词典,提出EF-Doc2VecC模型再联合专业词典增强文本的特征,最后送入BiLSTM分类器实现专业领域的文本分类。实验结果表明,针对专业性显著的电力审计类文本分类,EF-Doc2Vec模型,在召回率、特异性、准确率和F1值分类指标上比对照模型Doc2VecC分别高出4,2,2,2个百分点;针对通用领域文本分类,EF-Doc2VecC模型在召回率、差异性、准确率和F1值分类指标上比对照模型Doc2VecC高出3,3,4,4个百分点。另外,EF-Doc2VecC模型在电力审计类的文本分类性能分别比通用领域高出4,5,3,3个百分点。因此,提出的文本向量表示方法及文本分类方法,不仅能提升通用领域的文本分类性能,还能显著提升垂直领域的文本细粒度分类性能。 展开更多
关键词 电力审计 文本分类 增强特征 Doc2VecC 双向长短期记忆模型
在线阅读 下载PDF
基于迁移学习的细粒度实体分类方法的研究 被引量:11
20
作者 冯建周 马祥聪 《自动化学报》 EI CSCD 北大核心 2020年第8期1759-1766,共8页
细粒度实体分类(Fine-grained entity type classification,FETC)旨在将文本中出现的实体映射到层次化的细分实体类别中.近年来,采用深度神经网络实现实体分类取得了很大进展.但是,训练一个具备精准识别度的神经网络模型需要足够数量的... 细粒度实体分类(Fine-grained entity type classification,FETC)旨在将文本中出现的实体映射到层次化的细分实体类别中.近年来,采用深度神经网络实现实体分类取得了很大进展.但是,训练一个具备精准识别度的神经网络模型需要足够数量的标注数据,而细粒度实体分类的标注语料非常稀少,如何在没有标注语料的领域进行实体分类成为难题.针对缺少标注语料的实体分类任务,本文提出了一种基于迁移学习的细粒度实体分类方法,首先通过构建一个映射关系模型挖掘有标注语料的实体类别与无标注语料实体类别间的语义关系,对无标注语料的每个实体类别,构建其对应的有标注语料的类别映射集合.然后,构建双向长短期记忆(Bidirectional long short term memory,BiLSTM)模型,将代表映射类别集的句子向量组合作为模型的输入用来训练无标注实体类别.基于映射类别集中不同类别与对应的无标注类别的语义距离构建注意力机制,从而实现实体分类器以识别未知实体分类.实验证明,我们的方法取得了较好的效果,达到了在无任何标注语料前提下识别未知命名实体分类的目的. 展开更多
关键词 细粒度实体分类 迁移学习 双向长短期记忆模型 注意力 机制
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部