针对现有小麦条锈病预测方法没有利用病害发生因素之间的语义信息,存在预测难度大、准确率低等问题,利用知识图谱(Knowledge Graph,KG)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)处理多源异构复杂数据的各...针对现有小麦条锈病预测方法没有利用病害发生因素之间的语义信息,存在预测难度大、准确率低等问题,利用知识图谱(Knowledge Graph,KG)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)处理多源异构复杂数据的各自优势,提出一种基于KG与Bi-LSTM结合的小麦条锈病预测方法。首先,构建小麦条锈病知识图谱,将与小麦条锈病发生相关的环境信息转换为特征向量;其次,利用特征向量训练Bi-LSTM模型,得到基于Bi-LSTM的小麦条锈病预测模型;最后,利用小麦条锈病数据库数据进行试验。结果表明,KG丰富了进行病害预测所描述的语义信息,提升了Bi-LSTM提取高层病害预测特征的能力,从而提高了病害预测的准确率。在小麦条锈病数据库上的预测准确率达到93.21%,比基于Bi-LSTM的病害预测方法提高了4.5个百分点。该方法能较好预测小麦条锈病,为小麦条锈病的预报预警和综合防治提供科学依据。展开更多
非侵入式负荷监测(NILM)通过分析电力总线数据估计单个负荷的功率波形,是电力系统能耗管理的关键技术之一。随着用户对设备能耗管理需求的增加,NILM的准确性成为研究的重点之一,但它容易受到功率类型、功率水平和负荷变化的影响。单一N...非侵入式负荷监测(NILM)通过分析电力总线数据估计单个负荷的功率波形,是电力系统能耗管理的关键技术之一。随着用户对设备能耗管理需求的增加,NILM的准确性成为研究的重点之一,但它容易受到功率类型、功率水平和负荷变化的影响。单一NILM模型面对不同类型的负荷时准确性差异较大,使用单一方法难以在各类负荷上均取得理想效果。因此,提出一种基于堆叠集成学习的非侵入式负荷高精度辨识方法 AMEL(Aggregation Method based on Ensemble Learning)。首先,选择在各种类型的负荷中表现最优的几种方法构建NILM模型库;其次,建立一个基于多层感知机(MLP)的NILM模型偏好框架,以实现对不同负荷的高精度监测。在UK-DALE数据集上的实验结果表明,与典型的NILM方法相比,所提方法的平均绝对误差(MAE)平均降低了35.6%,F1、召回率和马修斯相关系数(MCC)分别平均提升了33.5%、30.6%和32.1%。此外,通过比较现有的堆叠集成方法和各类设备的辨识波形,验证了所提方法的有效性。展开更多
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona...针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。展开更多
目前,文本分类的研究主要集中在通过优化文本分类器来增强分类性能。然而,标签和文本之间的联系并没有得到很好的利用。尽管BERT对文本特征的处理表现出了非常好的效果,但对文本和标签的特征提取还有一定的提升空间。文中通过结合标签...目前,文本分类的研究主要集中在通过优化文本分类器来增强分类性能。然而,标签和文本之间的联系并没有得到很好的利用。尽管BERT对文本特征的处理表现出了非常好的效果,但对文本和标签的特征提取还有一定的提升空间。文中通过结合标签混淆模型(Label Confusion Model,LCM),提出一种基于BERT和LCM的文本分类模型(Model Based on BERT and Label Confusion,BLC),对文本和标签的特征进一步做了处理。充分利用BERT每一层的句向量和最后一层的词向量,结合双向长短时记忆网络(Bi-LSTM)得到文本表示,来替代BERT原始的文本特征表示。标签在进入LCM之前,使用自注意力网络和Bi-LSTM提高标签之间相互依赖关系,从而提高最终的分类性能。在4个文本分类基准数据集上的实验结果证明了所提模型的有效性。展开更多
异常肺音听诊识别是儿童支气管肺部疾病诊断的一种重要手段。针对儿童异常肺音分类研究常用的声谱图图像识别方法计算资源大、识别率不高等问题,提出了一种结合梅尔倒谱系数(Mel frequency cepstral coefficients,MFCC)特征、卷积神经网...异常肺音听诊识别是儿童支气管肺部疾病诊断的一种重要手段。针对儿童异常肺音分类研究常用的声谱图图像识别方法计算资源大、识别率不高等问题,提出了一种结合梅尔倒谱系数(Mel frequency cepstral coefficients,MFCC)特征、卷积神经网络(convolutional neural network,CNN)与双向长短时记忆网络(bidirectional long short-term memory,BiLSTM)的混合模型,用于儿童异常肺音的分类方法。该方法通过CNN对MFCC特征进行空间特性提取,利用BiLSTM对MFCC音频特征进行时序特性提取,建立了BCNnet(BILSTM CNN network)模型。文章收集并建立了一个儿童肺音数据集,在该数据集上,所提方法平均准确率可达75.3%,与以声谱图为输入的CNN(并行池化)模型相比,准确率提高了3.7个百分点,且在模型大小和识别速度上均有改善。展开更多
为快速构建并准确预测温度作用引起的斜拉桥主梁应变用于结构状态评估,基于某大跨度斜拉桥主梁超过1年的温度和应变监测数据,提出了一种基于迁移学习和双向长短时记忆(bi-directional long short-term memory,Bi-LSTM)神经网络的斜拉桥...为快速构建并准确预测温度作用引起的斜拉桥主梁应变用于结构状态评估,基于某大跨度斜拉桥主梁超过1年的温度和应变监测数据,提出了一种基于迁移学习和双向长短时记忆(bi-directional long short-term memory,Bi-LSTM)神经网络的斜拉桥温度-应变映射模型建立方法。首先,利用解析模态分解(analytical mode decomposition,AMD)去噪应变数据,得到仅由温度引起的应变响应;其次,选择温度和某一测点应变数据构成数据集,采用Bi-LSTM神经网络训练该数据集,并通过网络结构和超参数优化建立温度-应变Bi-LSTM基准模型;最后,利用迁移学习方法,将已训练好的基准模型中部分参数迁移到其他温度-应变数据集,建立相应的温度-应变映射被迁移模型,并与未采用迁移学习的神经网络训练方法进行对比。研究结果表明,相比直接建立的温度-应变Bi-LSTM神经网络映射模型,采用迁移学习方法建立的被迁移模型,其拟合精度均高于所用的基准模型,且训练时间短,预测误差小。展开更多
文摘针对现有小麦条锈病预测方法没有利用病害发生因素之间的语义信息,存在预测难度大、准确率低等问题,利用知识图谱(Knowledge Graph,KG)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)处理多源异构复杂数据的各自优势,提出一种基于KG与Bi-LSTM结合的小麦条锈病预测方法。首先,构建小麦条锈病知识图谱,将与小麦条锈病发生相关的环境信息转换为特征向量;其次,利用特征向量训练Bi-LSTM模型,得到基于Bi-LSTM的小麦条锈病预测模型;最后,利用小麦条锈病数据库数据进行试验。结果表明,KG丰富了进行病害预测所描述的语义信息,提升了Bi-LSTM提取高层病害预测特征的能力,从而提高了病害预测的准确率。在小麦条锈病数据库上的预测准确率达到93.21%,比基于Bi-LSTM的病害预测方法提高了4.5个百分点。该方法能较好预测小麦条锈病,为小麦条锈病的预报预警和综合防治提供科学依据。
文摘非侵入式负荷监测(NILM)通过分析电力总线数据估计单个负荷的功率波形,是电力系统能耗管理的关键技术之一。随着用户对设备能耗管理需求的增加,NILM的准确性成为研究的重点之一,但它容易受到功率类型、功率水平和负荷变化的影响。单一NILM模型面对不同类型的负荷时准确性差异较大,使用单一方法难以在各类负荷上均取得理想效果。因此,提出一种基于堆叠集成学习的非侵入式负荷高精度辨识方法 AMEL(Aggregation Method based on Ensemble Learning)。首先,选择在各种类型的负荷中表现最优的几种方法构建NILM模型库;其次,建立一个基于多层感知机(MLP)的NILM模型偏好框架,以实现对不同负荷的高精度监测。在UK-DALE数据集上的实验结果表明,与典型的NILM方法相比,所提方法的平均绝对误差(MAE)平均降低了35.6%,F1、召回率和马修斯相关系数(MCC)分别平均提升了33.5%、30.6%和32.1%。此外,通过比较现有的堆叠集成方法和各类设备的辨识波形,验证了所提方法的有效性。
文摘针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。
文摘风速变化的间歇性和波动性给风功率的精准预测带来极大挑战,充分挖掘风电功率与风速等关键因素的内在规律是提高风电功率预测精度的有效途径。提出一种结合时间模式注意力(time pattern attention,TPA)机制的多层堆叠双向长短期记忆网络的超短期风电功率预测方法。首先,利用基于密度的含噪声空间聚类方法(den⁃sity based spatial clustering with noise,DBSCAN)和线性回归算法进行风功率数据集的异常值检测,利用k最邻近(k⁃nearest neighbor,KNN)插值法重构异常点数据;其次,综合考虑风电功率与各气象特征的内在关联性,在MBLSTM网络中引入TPA机制合理分配时间步长权重,捕捉风电功率时间序列潜在逻辑规律;最后,利用实验仿真数据进行分析验证本文方法的有效性,该方法能够充分挖掘风功率与风速影响因素的关系,从而提高其预测精度。
文摘目前,文本分类的研究主要集中在通过优化文本分类器来增强分类性能。然而,标签和文本之间的联系并没有得到很好的利用。尽管BERT对文本特征的处理表现出了非常好的效果,但对文本和标签的特征提取还有一定的提升空间。文中通过结合标签混淆模型(Label Confusion Model,LCM),提出一种基于BERT和LCM的文本分类模型(Model Based on BERT and Label Confusion,BLC),对文本和标签的特征进一步做了处理。充分利用BERT每一层的句向量和最后一层的词向量,结合双向长短时记忆网络(Bi-LSTM)得到文本表示,来替代BERT原始的文本特征表示。标签在进入LCM之前,使用自注意力网络和Bi-LSTM提高标签之间相互依赖关系,从而提高最终的分类性能。在4个文本分类基准数据集上的实验结果证明了所提模型的有效性。