期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于ANN-KF-BiLSTM的桥梁温度多步预测
1
作者 闫文佳 江鸥 +1 位作者 李鸿先 徐嘉璐 《重庆交通大学学报(自然科学版)》 北大核心 2025年第6期131-138,共8页
利用深度学习中学习特征能力较强的人工神经网络(ANN)模型和学习时间序列能力较强的双向长短期记忆网络(BiLSTM)模型,辅以卡尔曼滤波(KF)对人工神经网络模型的结果进行动态调整,基于stacking集成策略融合ANN和BiLSTM模型,构建了一个既... 利用深度学习中学习特征能力较强的人工神经网络(ANN)模型和学习时间序列能力较强的双向长短期记忆网络(BiLSTM)模型,辅以卡尔曼滤波(KF)对人工神经网络模型的结果进行动态调整,基于stacking集成策略融合ANN和BiLSTM模型,构建了一个既能利用气象温度又能记忆桥梁自身温度时间序列的ANN-KF-BiLSTM模型。以云南省某连续刚构桥的温度预测为例,验证了该模型的有效性。研究结果表明:ANN-KF-BiLSTM模型在桥梁温度多步预测中表现出明显优势,在预测时间步数小于96时,拟合程度超过0.89,在预测步数达到168时,平均拟合程度仍可达到约0.76;相较于基准模型,ANN-KF-BiLSTM模型拟合程度更高,预测稳定性更好。研究结果改善了当前利用深度学习模型预测桥梁温度集中于单步预测的状况,为桥梁温度的多步预测提供了一种有效的方法。 展开更多
关键词 桥梁工程 桥梁温度 双向长短期记忆网络 卡尔曼滤波 ANN-KF-bilstm模型
在线阅读 下载PDF
基于Hyperband-CNN-BiLSTM模型的车辆油耗预测方法
2
作者 吐尔逊·买买提 孙慧 刘亚楼 《科学技术与工程》 北大核心 2025年第9期3896-3904,共9页
为了有效地预测车辆的燃油消耗,提高燃油经济性并推动节能减排,提出一种基于Hyperband-CNN-BiLSTM的机动车油耗预测方法。首先基于实际道路测试收集到的车辆运行状态数据和油耗数据,分析了影响车辆油耗的显著性因素;其次结合卷积神经网... 为了有效地预测车辆的燃油消耗,提高燃油经济性并推动节能减排,提出一种基于Hyperband-CNN-BiLSTM的机动车油耗预测方法。首先基于实际道路测试收集到的车辆运行状态数据和油耗数据,分析了影响车辆油耗的显著性因素;其次结合卷积神经网络(convolutional neural network,CNN)强大的特征提取能力和双向长短期记忆网络(bidirectional long short-term memory,BiLSTM)在处理时序数据方面的优势,构建了基于CNN-BiLSTM的车辆油耗预测组合模型;然后,为提高模型预测准确性,通过Hyperband优化算法对组合模型进行优化,并将车辆油耗影响因素作为模型输入特征,对模型进行训练,实现对车辆油耗的建模和预测;最后,选取CNN、LSTM、BiLSTM、CNN-LSTM、CNN-BiLSTM作为对比模型,对Hyperband-CNN-BiLSTM预测模型效果进行评价。结果表明,相较于其他模型,Hyperband-CNN-BiLSTM模型的平均绝对误差(mean absolute error,MAE)和均方根误差(root mean squared error,RMSE)最小,分别为0.05769和0.11925,R^(2)最大,为0.99176,模型预测效果最佳。 展开更多
关键词 Hyperband 油耗预测 卷积神经网络(CNN) 双向长短期记忆网络(bilstm) 组合模型
在线阅读 下载PDF
Intelligent modeling method for OV models in DoDAF2.0 based on knowledge graph
3
作者 ZHANG Yue JIANG Jiang +3 位作者 YANG Kewei WANG Xingliang XU Chi LI Minghao 《Journal of Systems Engineering and Electronics》 2025年第1期139-154,共16页
Architecture framework has become an effective method recently to describe the system of systems(SoS)architecture,such as the United States(US)Department of Defense Architecture Framework Version 2.0(DoDAF2.0).As a vi... Architecture framework has become an effective method recently to describe the system of systems(SoS)architecture,such as the United States(US)Department of Defense Architecture Framework Version 2.0(DoDAF2.0).As a viewpoint in DoDAF2.0,the operational viewpoint(OV)describes operational activities,nodes,and resource flows.The OV models are important for SoS architecture development.However,as the SoS complexity increases,constructing OV models with traditional methods exposes shortcomings,such as inefficient data collection and low modeling standards.Therefore,we propose an intelligent modeling method for five OV models,including operational resource flow OV-2,organizational relationships OV-4,operational activity hierarchy OV-5a,operational activities model OV-5b,and operational activity sequences OV-6c.The main idea of the method is to extract OV architecture data from text and generate interoperable OV models.First,we construct the OV meta model based on the DoDAF2.0 meta model(DM2).Second,OV architecture named entities is recognized from text based on the bidirectional long short-term memory and conditional random field(BiLSTM-CRF)model.And OV architecture relationships are collected with relationship extraction rules.Finally,we define the generation rules for OV models and develop an OV modeling tool.We use unmanned surface vehicles(USV)swarm target defense SoS architecture as a case to verify the feasibility and effectiveness of the intelligent modeling method. 展开更多
关键词 system of systems(SoS)architecture operational viewpoint(OV)model meta model bidirectional long short-term memory and conditional random field(bilstm-CRF) model generation systems modeling language
在线阅读 下载PDF
融合CNN与BiLSTM模型的短期电能负荷预测 被引量:3
4
作者 杨桂松 高炳涛 何杏宇 《小型微型计算机系统》 CSCD 北大核心 2024年第9期2253-2260,共8页
针对卷积神经网络(CNN)在捕捉预测序列间历史相关性方面的不足以及在变量复杂情况下出现的无法精准提取预测关键信息的问题,提出一种将双向长短期记忆网络(BiLSTM)与卷积神经网络结合的CNN-BiLSTM模型.首先,采用数据预处理方法保证数据... 针对卷积神经网络(CNN)在捕捉预测序列间历史相关性方面的不足以及在变量复杂情况下出现的无法精准提取预测关键信息的问题,提出一种将双向长短期记忆网络(BiLSTM)与卷积神经网络结合的CNN-BiLSTM模型.首先,采用数据预处理方法保证数据的正确性和完整性,并对数据进行分析以探究多变量之间的相关性;其次,通过CNN与L1正则化对多维输入特征进行特征筛选,选取与预测相关的重要性特征向量;最后,使用BiLSTM对CNN输出的关键特征信息进行保存,形成向量与预测序列,并通过分析时序特征的潜在特点,提取用户的内在消费模式.实验比较了该模型与其他时序模型在不同时间分辨率下的预测效果,实验结果表明,CNN-BiLSTM模型在不同的回望时间间隔下表现出了最佳的预测性能,能够实现更好的短期负荷预测. 展开更多
关键词 卷积神经网络 双向长短期记忆网络 特征筛选 CNN-bilstm模型 短期负荷预测
在线阅读 下载PDF
基于MISSA-CNN-BiLSTM模型的尾矿坝位移预测
5
作者 刘迪 杨辉 +2 位作者 卢才武 阮顺领 江松 《中国安全科学学报》 CAS CSCD 北大核心 2024年第9期145-154,共10页
为应对尾矿坝位移预测所面临的复杂情况和精度要求,提出一种基于多算法耦合的尾矿坝位移动态预测模型。首先,基于时间序列分解模型将累计位移分为趋势项和周期项,利用高斯回归时间序列预测模型预测趋势项位移;然后,运用不同Copula函数... 为应对尾矿坝位移预测所面临的复杂情况和精度要求,提出一种基于多算法耦合的尾矿坝位移动态预测模型。首先,基于时间序列分解模型将累计位移分为趋势项和周期项,利用高斯回归时间序列预测模型预测趋势项位移;然后,运用不同Copula函数研究诱发因素与周期项位移的整体相关性,鉴于周期项位移影响因素多样性与强非线性的特点,采用多策略融合的改进麻雀搜索算法改进麻雀搜索算法(MISSA)-卷积神经网络(CNN)-双向长短期记忆(BiLSTM)模型预测周期项位移;最后,将高斯回归趋势项位移预测值和MISSA-CNN-BiLSTM周期项位移预测值叠加。结果表明:尾矿坝累积位移预测值与实测值基本一致,预测结果相关性系数R为0.996,均方根误差(RMSE)为0.13 mm,建立的MISSA-CNN-BiLSTM多算法耦合模型预测精度较高,且能较好地预测尾矿坝位移的阶跃型变化。 展开更多
关键词 改进麻雀搜索算法(MISSA) 卷积神经网络(CNN) 双向长短期记忆(bilstm) 尾矿坝 位移预测 深度学习模型
在线阅读 下载PDF
CEEMDAN-CNN-BiLSTM混合模型矿区地表沉降预测
6
作者 王凯 肖星星 +2 位作者 余永明 贾庆磊 赵思仲 《导航定位学报》 CSCD 北大核心 2024年第5期156-163,共8页
为了进一步发挥全球卫星导航系统(GNSS)实时监测优势,对时序数据中的潜藏特征与隐藏信息进行深度挖掘,提高地表沉降预测精度,提出基于自适应噪声完备集合经验模态分解(CEEMDAN)、卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)的CEEMDA... 为了进一步发挥全球卫星导航系统(GNSS)实时监测优势,对时序数据中的潜藏特征与隐藏信息进行深度挖掘,提高地表沉降预测精度,提出基于自适应噪声完备集合经验模态分解(CEEMDAN)、卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)的CEEMDAN-CNN-BiLSTM混合地表沉降预测方法:以皖北某大型煤矿开采工作面与工业广场区域为验证对象,对比分析稳定区域和重点监测区域数据形态;然后基于CEEMDAN重构监测站高程数据分量,输入CNN模型提取分量隐含信息;最后构建BiLSTM模型,实现对沉降监测点位数据的短期预测。实验结果表明,相较于传统的CNN和长短期记忆模型,CEEMDAN-CNN-BiLSTM混合模型可有效降低预测误差,其中平均绝对百分比误差(MAPE)的降低范围为40%~90%,而均方根(RMS)误差的降低范围为52%~87%;该模型在时空特征捕捉和泛化能力方面表现性能较好,可为GNSS时间序列短期预测提供更为精准和可靠的解决方案。 展开更多
关键词 沉降预测 自动化监测 时序数据 混合模型 自适应噪声完备集合经验模态分解(CEEMDAN)-卷积神经网络(CNN)-双向长短期记忆网络(bilstm)
在线阅读 下载PDF
滚动轴承的退化特征信息融合与剩余寿命预测
7
作者 张建宇 王留震 +1 位作者 肖勇 马雅楠 《中国机械工程》 北大核心 2025年第7期1553-1561,共9页
针对滚动轴承剩余寿命预测的需求,提出一种基于稀疏自编码器(SAE)和双向长短期记忆网络(BiLSTM)的预测模型。以滚动轴承全寿命振动数据为研究对象,通过构建反双曲变换的状态退化指标和频域谐波退化因子形成退化指标集,并利用SAE特征融... 针对滚动轴承剩余寿命预测的需求,提出一种基于稀疏自编码器(SAE)和双向长短期记忆网络(BiLSTM)的预测模型。以滚动轴承全寿命振动数据为研究对象,通过构建反双曲变换的状态退化指标和频域谐波退化因子形成退化指标集,并利用SAE特征融合提取关键特征,消除冗余信息。同时,结合BiLSTM模型捕捉时序特征,实现全周期寿命预测。实验结果表明,所提模型优于支持向量回归、极限学习机、卷积神经网络等模型,预测误差更小,泛化能力更强。 展开更多
关键词 稀疏自编码器特征融合 双向长短期记忆网络预测模型 滚动轴承 反双曲特征指标 频域谐波退化因子
在线阅读 下载PDF
整合BiLSTM-CRF网络和词典资源的中文电子病历实体识别 被引量:34
8
作者 李纲 潘荣清 +1 位作者 毛进 操玉杰 《现代情报》 CSSCI 2020年第4期3-12,58,共11页
[目的/意义]通过整合BiLSTM-CRF神经网络和具有先验领域知识的词典资源,提高中文电子病历领域中的实体识别效果。[方法/过程]采用BiLSTM-CRF神经网络模型,以CCKS-2017测评任务提供的脱敏中文电子病历数据为实验数据集,结合Word2Vec和外... [目的/意义]通过整合BiLSTM-CRF神经网络和具有先验领域知识的词典资源,提高中文电子病历领域中的实体识别效果。[方法/过程]采用BiLSTM-CRF神经网络模型,以CCKS-2017测评任务提供的脱敏中文电子病历数据为实验数据集,结合Word2Vec和外部词典构造神经网络的词嵌入输入改进实体识别模型。[结果/结论]与传统的CRF和单纯的BiLSTM-CRF模型相比,引入先验知识的词典资源可以取得更好的实体识别效果,F1值达到最高的90.41%。深度学习模型BiLSTM-CRF能够显著提升传统CRF方法的实体识别效果,同时先验的词典知识能进一步增强神经网络的性能。 展开更多
关键词 实体识别 长短期记忆网络 条件随机场 电子病历 词典资源 深度学习 bilstm-CRF神经网络模型
在线阅读 下载PDF
基于双向长短时记忆网络的地铁应急知识抽取与推理
9
作者 叶雨涛 王鹏玲 +2 位作者 徐瑞华 肖晓芳 葛健豪 《同济大学学报(自然科学版)》 北大核心 2025年第3期420-429,共10页
为解决文本类地铁应急处置流程存在的流程顺序关系不明确、流程执行人员模糊等问题,提出了基于BiLSTM-CRF(Bidirectional Long Short-Term Memory-Conditional Random Field)的地铁应急处置知识抽取与推理方法。首先,利用BiLSTM-CRF方... 为解决文本类地铁应急处置流程存在的流程顺序关系不明确、流程执行人员模糊等问题,提出了基于BiLSTM-CRF(Bidirectional Long Short-Term Memory-Conditional Random Field)的地铁应急处置知识抽取与推理方法。首先,利用BiLSTM-CRF方法对地铁应急处置流程的文本资料进行命名实体识别,完成文本资料的知识抽取;其次,选用TransD模型对识别后实体数据进行知识推理,从而完成以实体和属性对为节点、关系对为边的知识图谱构建;最后,利用Neo4j图数据库对构建的地铁应急处置流程知识图谱进行了可视化展示和案例分析。研究结果表明,基于BiLSTM-CRF的知识抽取模型的精确率、召回率和F1值均达到了90%以上,且基于BiLSTM-CRF的TransD模型的推理结果准确率提升了22.92%,保证了知识图谱构建的准确性,可为地铁应急管理提供决策支持。 展开更多
关键词 地铁应急处置 知识图谱 条件随机场的双向长短时网络 TransD模型 知识抽取
在线阅读 下载PDF
机床夹具设计知识图谱构建及应用
10
作者 张称心 孙家盛 段阳 《机电工程》 北大核心 2025年第1期106-116,共11页
针对目前机床夹具设计领域中存在的知识挖掘深度不足、利用率不高且过度依赖设计人员经验等问题,提出了一种基于自顶向下方式的机床夹具设计知识图谱构建方法。首先,将机床夹具设计知识分为原理规则类和功能描述类,利用本体建模语言(OWL... 针对目前机床夹具设计领域中存在的知识挖掘深度不足、利用率不高且过度依赖设计人员经验等问题,提出了一种基于自顶向下方式的机床夹具设计知识图谱构建方法。首先,将机床夹具设计知识分为原理规则类和功能描述类,利用本体建模语言(OWL)对这两类知识进行了本体建模,构建了知识图谱的模式层;其次,在模式层的指导下,以机床夹具设计原理规则文档和设计实例为数据源,利用双向长短期记忆网络-条件随机场算法(BiLSTM-CRF)对其进行了知识抽取,得到了结构化的机床夹具设计知识;然后,运用Neo4j图数据库存储结构化的机床夹具设计知识,得到了知识图谱的数据层;最后,以轴承套筒法兰的夹具设计为例,对该方法的可行性进行了验证;考虑到企业对同一夹具结构的不同技术需求,提出了一种基于图形数据科学算法(GDS)的相似元件替代法,对夹具知识图谱中47个定位元件节点进行了相似度计算,得到了1081条相似度数据样本,并构建了综合评判模型。研究结果表明:当相似度阈值设置为0.76时,将定位元件进行替换的精确率达到了84%。通过建立知识图谱,完成了机床夹具设计的两类知识的有效关联,为构建数据驱动的机床夹具智能设计奠定了基础。 展开更多
关键词 机械设计 智能设计 知识图谱 知识抽取 知识融合 本体建模语言 双向长短期记忆网络-条件随机场算法 图形数据科学算法
在线阅读 下载PDF
基于蜣螂优化算法-双向长短时记忆网络的隧道软弱围岩变形预测
11
作者 张建 《地球科学与环境学报》 北大核心 2025年第4期634-645,共12页
隧道软弱围岩变形预测是确保隧道建设及施工运营安全等诸多环节中的核心要素。目前隧道软弱围岩变形预测主要依托围岩变形监测数据,而监测数据统计分析结果的可靠性、鲁棒性及泛化性依然不能满足工程建设的要求。针对该问题,对比LSTM、B... 隧道软弱围岩变形预测是确保隧道建设及施工运营安全等诸多环节中的核心要素。目前隧道软弱围岩变形预测主要依托围岩变形监测数据,而监测数据统计分析结果的可靠性、鲁棒性及泛化性依然不能满足工程建设的要求。针对该问题,对比LSTM、BiLSTM、CNN-LSTM、GRU、CNN-RNN模型的准确性、可靠性和稳定性,优选出BiLSTM模型为初步预测模型;考虑双向长短时记忆(BiLSTM)网络的灵活交互性和蜣螂优化(DBO)算法的数据驱动优势,构建基于深度学习的隧道软弱围岩变形预测模型——DBO-BiLSTM模型;最后,以西十高速铁路云岭一号隧道断面软弱围岩为案例,运用DBO-BiLSTM模型和BiLSTM模型对该隧道软弱围岩变形进行预测,并与监测数据进行对比。结果表明:DBO-BiLSTM模型较BiLSTM模型预测结果更优,其均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、平均百分比误差(MAPE)、判定系数(R2)分别为0.0016、0.0406、0.0318、1.43%、0.9985;云岭一号隧道软弱围岩变形情况均经历了先陡增后缓增、最终趋于稳定的过程,拱顶沉降最大累计变形量为14.79 mm,水平收敛最大累计变形量为16.80 mm。 展开更多
关键词 隧道工程 围岩 变形预测 DBO-bilstm模型 深度学习 长短时记忆网络 蜣螂优化算法
在线阅读 下载PDF
Tomato Growth Height Prediction Method by Phenotypic Feature Extraction Using Multi-modal Data
12
作者 GONG Yu WANG Ling +3 位作者 ZHAO Rongqiang YOU Haibo ZHOU Mo LIU Jie 《智慧农业(中英文)》 2025年第1期97-110,共14页
[Objective]Accurate prediction of tomato growth height is crucial for optimizing production environments in smart farming.However,current prediction methods predominantly rely on empirical,mechanistic,or learning-base... [Objective]Accurate prediction of tomato growth height is crucial for optimizing production environments in smart farming.However,current prediction methods predominantly rely on empirical,mechanistic,or learning-based models that utilize either images data or environmental data.These methods fail to fully leverage multi-modal data to capture the diverse aspects of plant growth comprehensively.[Methods]To address this limitation,a two-stage phenotypic feature extraction(PFE)model based on deep learning algorithm of recurrent neural network(RNN)and long short-term memory(LSTM)was developed.The model integrated environment and plant information to provide a holistic understanding of the growth process,emploied phenotypic and temporal feature extractors to comprehensively capture both types of features,enabled a deeper understanding of the interaction between tomato plants and their environment,ultimately leading to highly accurate predictions of growth height.[Results and Discussions]The experimental results showed the model's ef‐fectiveness:When predicting the next two days based on the past five days,the PFE-based RNN and LSTM models achieved mean absolute percentage error(MAPE)of 0.81%and 0.40%,respectively,which were significantly lower than the 8.00%MAPE of the large language model(LLM)and 6.72%MAPE of the Transformer-based model.In longer-term predictions,the 10-day prediction for 4 days ahead and the 30-day prediction for 12 days ahead,the PFE-RNN model continued to outperform the other two baseline models,with MAPE of 2.66%and 14.05%,respectively.[Conclusions]The proposed method,which leverages phenotypic-temporal collaboration,shows great potential for intelligent,data-driven management of tomato cultivation,making it a promising approach for enhancing the efficiency and precision of smart tomato planting management. 展开更多
关键词 tomato growth prediction deep learning phenotypic feature extraction multi-modal data recurrent neural net‐work long short-term memory large language model
在线阅读 下载PDF
融合MAML与BiLSTM的微博负面情感多分类方法 被引量:6
13
作者 徐超 叶宁 +1 位作者 徐康 王汝传 《计算机工程与应用》 CSCD 北大核心 2022年第5期179-185,共7页
随着社交网络的不断发展,微博成为人们日常生活中分享观点和感情的重要平台,分析用户的情感倾向可以有效地应用于舆情控制、民意调查、商品推荐等工作。传统的深度学习算法在面对新的工作任务时,往往需要大量数据重新训练才能得到较好... 随着社交网络的不断发展,微博成为人们日常生活中分享观点和感情的重要平台,分析用户的情感倾向可以有效地应用于舆情控制、民意调查、商品推荐等工作。传统的深度学习算法在面对新的工作任务时,往往需要大量数据重新训练才能得到较好准确率。针对这一情况,提出了一种基于MAML(model-agnostic meta-learning)与BiLSTM(双向长短时记忆网络)的微博负面情感多分类方法。对微博文本进行词向量化表示,构建MAML与BiLSTM结合的模型,其中BiLSTM实现对微博负面情感的分类,通过随机梯度下降更新参数;MAML中的元学习器则通过计算多次训练的损失总和,进行第二次梯度下降,更新元学习器参数。通过更新后得到的元学习器可以在面对新的微博负面情感分类任务时快速迭代。实验结果表明:相较于目前流行的模型,在微博负面情感数据集上,准确率、召回率和F1值分别提高了1.68个百分点、2.86个百分点和2.27个百分点。 展开更多
关键词 双向长短时记忆网络(bilstm) MAML 微博 情感分析
在线阅读 下载PDF
基于BiLSTM-CRF的商情实体识别模型 被引量:42
14
作者 张应成 杨洋 +3 位作者 蒋瑞 全兵 张利君 任晓雷 《计算机工程》 CAS CSCD 北大核心 2019年第5期308-314,共7页
结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的... 结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的前向、后向文本特征,并通过CRF提取出双向本文特征中相应的实体。实验结果表明,与传统机器学习算法CRF相比,该模型3类实体的精确率、召回率和F1值平均提升15.21%、12.06%和13.70%。 展开更多
关键词 条件随机场 双向长短时记忆网络 语言模型 命名实体识别 深度学习
在线阅读 下载PDF
基于BiLSTM模型的定义抽取方法 被引量:9
15
作者 阳萍 谢志鹏 《计算机工程》 CAS CSCD 北大核心 2020年第3期40-45,共6页
定义抽取是从非结构化文本中自动识别定义句的任务,定义抽取问题可建模为句子中术语及相应定义的序列标注问题,并利用标注结果完成抽取任务。针对传统的定义抽取方法在抽取定义特征过程中费时且容易造成错误传播的不足,提出一个基于双... 定义抽取是从非结构化文本中自动识别定义句的任务,定义抽取问题可建模为句子中术语及相应定义的序列标注问题,并利用标注结果完成抽取任务。针对传统的定义抽取方法在抽取定义特征过程中费时且容易造成错误传播的不足,提出一个基于双向长短时记忆(BiLSTM)的序列标注神经网络模型,对输入文本进行自动化定义抽取。通过将原始数据输入到BiLSTM神经网络中,完成输入句的特征表示,并采用基于LSTM的解码器进行解码得到标注结果。在Wikipedia英文数据集上的实验结果表明,该方法的精确率、召回率和F1值分别为94.21%、90.10%和92.11%,有效提升了基准模型效果。 展开更多
关键词 定义抽取 双向长短时记忆模型 序列标注 LSTM模型 深度神经网络
在线阅读 下载PDF
基于BiLSTM代理模型的RFID标签天线快速多目标设计 被引量:3
16
作者 洪涛 贺则昊 +2 位作者 王翠 陈家焱 周娟 《微波学报》 CSCD 北大核心 2021年第1期21-27,共7页
为快速完成超高频(UHF)标签天线多目标设计,构建了基于双向长短期记忆(BiLSTM)神经网络的新型天线性能预测代理模型,并使用带精英策略的非支配排序遗传算法(NSGA-II)配合静态惩罚对RFID标签天线进行多目标寻优。首先按照RFID标签天线延... 为快速完成超高频(UHF)标签天线多目标设计,构建了基于双向长短期记忆(BiLSTM)神经网络的新型天线性能预测代理模型,并使用带精英策略的非支配排序遗传算法(NSGA-II)配合静态惩罚对RFID标签天线进行多目标寻优。首先按照RFID标签天线延伸的趋势将天线结构序列化并依次输入BiLSTM网络结构,结合响应集训练出适用于RFID标签天线的代理模型。进一步地,为最大程度搜索可行域内,尤其是可行域边界的所有标签天线形式,在NSGA-II算法中引入静态惩罚,最终完成RFID标签天线低回波损耗、小型化、宽频带的多目标快速设计。设计实例表明,该方法在超高频RFID标签天线领域的预测精度、计算代价等方面综合表现优于现有天线设计方法,具有适用性和实用价值。 展开更多
关键词 射频识别 超高频 代理模型 双向长短期记忆 多目标天线设计
在线阅读 下载PDF
基于改进金豺算法的短期负荷预测 被引量:4
17
作者 谢国民 王润良 《电力系统及其自动化学报》 CSCD 北大核心 2024年第3期65-74,共10页
针对电力负荷序列波动性和预测精度不高的问题,提出一种基于变分模态分解、排列熵和改进金豺算法优化双向长短期记忆网络的预测模型。首先,利用变分模态分解重构原始负荷序列,再采用排列熵理论对分解后的子序列进行熵值重组;然后,利用... 针对电力负荷序列波动性和预测精度不高的问题,提出一种基于变分模态分解、排列熵和改进金豺算法优化双向长短期记忆网络的预测模型。首先,利用变分模态分解重构原始负荷序列,再采用排列熵理论对分解后的子序列进行熵值重组;然后,利用改进金豺算法对双向长短期记忆网络的参数进行优化,并对每个子序列建立预测模型;最后,组合各模型结果得到最终预测值。实验结果表明,本文模型预测精度更高,与真实值拟合度更好。 展开更多
关键词 变分模态分解 改进金豺算法 双向长短期记忆 组合模型 短期负荷预测
在线阅读 下载PDF
基于MacBERT与对抗训练的机器阅读理解模型 被引量:1
18
作者 周昭辰 方清茂 +2 位作者 吴晓红 胡平 何小海 《计算机工程》 CAS CSCD 北大核心 2024年第5期41-50,共10页
机器阅读理解旨在让机器像人类一样理解自然语言文本,并据此进行问答任务。近年来,随着深度学习和大规模数据集的发展,机器阅读理解引起了广泛关注,但是在实际应用中输入的问题通常包含各种噪声和干扰,这些噪声和干扰会影响模型的预测... 机器阅读理解旨在让机器像人类一样理解自然语言文本,并据此进行问答任务。近年来,随着深度学习和大规模数据集的发展,机器阅读理解引起了广泛关注,但是在实际应用中输入的问题通常包含各种噪声和干扰,这些噪声和干扰会影响模型的预测结果。为了提高模型的泛化能力和鲁棒性,提出一种基于掩码校正的来自Transformer的双向编码器表示(Mac BERT)与对抗训练(AT)的机器阅读理解模型。首先利用Mac BERT对输入的问题和文本进行词嵌入转化为向量表示;然后根据原始样本反向传播的梯度变化在原始词向量上添加微小扰动生成对抗样本;最后将原始样本和对抗样本输入双向长短期记忆(Bi LSTM)网络进一步提取文本的上下文特征,输出预测答案。实验结果表明,该模型在简体中文数据集CMRC2018上的F1值和精准匹配(EM)值分别较基线模型提高了1.39和3.85个百分点,在繁体中文数据集DRCD上的F1值和EM值分别较基线模型提高了1.22和1.71个百分点,在英文数据集SQu ADv1.1上的F1值和EM值分别较基线模型提高了2.86和1.85个百分点,优于已有的大部分机器阅读理解模型,并且在真实问答结果上与基线模型进行对比,结果验证了该模型具有更强的鲁棒性和泛化能力,在输入的问题存在噪声的情况下性能更好。 展开更多
关键词 机器阅读理解 对抗训练 预训练模型 掩码校正的来自Transformer的双向编码器表示 双向长短期记忆网络
在线阅读 下载PDF
基于BERT的多模型融合的Web攻击检测方法 被引量:1
19
作者 袁平宇 邱林 《计算机工程》 CAS CSCD 北大核心 2024年第11期197-206,共10页
传统Web攻击检测方法准确率不高,不能有效防范Web攻击。针对该问题,提出一种基于变换器的双向编码器表示(BERT)的预训练模型、文本卷积神经网络(TextCNN)和双向长短期记忆网络(BiLSTM)多模型融合的Web攻击检测方法。先将HTTP请求进行预... 传统Web攻击检测方法准确率不高,不能有效防范Web攻击。针对该问题,提出一种基于变换器的双向编码器表示(BERT)的预训练模型、文本卷积神经网络(TextCNN)和双向长短期记忆网络(BiLSTM)多模型融合的Web攻击检测方法。先将HTTP请求进行预处理,再通过BERT进行训练得到具备上下文依赖的特征向量,并用TextCNN模型进一步提取其中的高阶语义特征,作为BiLSTM的输入,最后利用Softmax函数进行分类检测。在HTTP CSIC 2010和恶意URL检测两个数据集上对所提方法进行验证,结果表明,与支持向量机(SVM)、逻辑回归(LR)等传统的机器学习方法和现有较新的方法相比,基于BERT的多模型融合的Web攻击检测方法在准确率、精确率、召回率和F1值指标上均表现更优(准确率和F1值的最优值都在99%以上),能准确检测Web攻击。 展开更多
关键词 Web攻击检测 基于变换器的双向编码器表示 多模型融合 HTTP请求 文本卷积神经网络 双向长短期记忆网络
在线阅读 下载PDF
基于上下文知识增强型Transformer网络的抑郁检测 被引量:1
20
作者 张亚洲 和玉 +1 位作者 戎璐 王祥凯 《计算机工程》 CAS CSCD 北大核心 2024年第8期75-85,共11页
抑郁症作为一种常见的心理健康问题,严重影响人们的日常生活甚至是生命安全。鉴于目前的抑郁症检测存在主观性和人工干预等缺点,基于深度学习的自动检测方式成为热门研究方向。对于最易获取的文本模态而言,主要的挑战在于如何建模抑郁... 抑郁症作为一种常见的心理健康问题,严重影响人们的日常生活甚至是生命安全。鉴于目前的抑郁症检测存在主观性和人工干预等缺点,基于深度学习的自动检测方式成为热门研究方向。对于最易获取的文本模态而言,主要的挑战在于如何建模抑郁文本中的长距离依赖与序列依赖。为解决该问题,提出一种基于上下文知识的增强型Transformer网络模型RoBERTa-BiLSTM,旨在从抑郁文本序列中充分提取和利用上下文特征。结合序列模型与Transformer模型优点,建模单词间上下文交互,为抑郁类别揭示与信息表征提供参考。首先,利用RoBERTa方法将词汇嵌入到语义向量空间;其次,利用双向长短期记忆网络(BiLSTM)模型有效捕获长距离上下文语义;最后,在DAIC-WOZ和EATD-Corpus 2个大规模数据集上进行实证研究。实验结果显示,RoBERTa-BiLSTM模型的准确率分别达到0.74和0.93以上,召回率分别达到0.66和0.56以上,能够准确地检测抑郁症。 展开更多
关键词 抑郁检测 序列模型 深度学习 Transformer模型 双向长短期记忆模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部