期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于改进TF-IIGM算法的畜禽疫病诊断模型研究
1
作者 郭晓利 李奇峰 +5 位作者 刘羽 张俊 赵红涛 杨淦 蒋瑞祥 余礼根 《计算机科学》 北大核心 2025年第S1期140-146,共7页
针对畜禽疫病文本中特征项权重分配不准导致诊断准确率较低的问题,利用提出的TF-IIGM-NW(Term Frequency-Improved Inverse Gravity Moment With Normalization and Weighting)改进算法结合Word2vec词向量进行文本向量化表示。该方法在T... 针对畜禽疫病文本中特征项权重分配不准导致诊断准确率较低的问题,利用提出的TF-IIGM-NW(Term Frequency-Improved Inverse Gravity Moment With Normalization and Weighting)改进算法结合Word2vec词向量进行文本向量化表示。该方法在TF-IIGM(Term Frequency-Improved Inverse Gravity Moment)算法的基础之上,对其进行归一化处理并结合基于关键词抽取算法设定的规则,进一步提升文本内核心关键词权重,然后将其与结合Word2vec词向量获取的文本向量化表示结果输入支持向量机(Support Vector Machine,SVM)进行畜禽疫病诊断。为了验证算法的有效性,基于自建的羊疫病文本数据集,将改进算法与现有词向量常见处理方式进行对比分析。结果表明,基于TF-IIGM-NW算法的macro-F1值与micro-F1值分别达到96.73%,96.76%;与传统经典算法TF-IDF(Term Frequency-Inverse Document Frequency)相比,分别提升2.25%,2.26%;与TF-IIGM算法相比,分别提高0.90%,0.97%。改进算法能够有效提升疫病诊断性能。通过SVM在每类疫病上的实验结果分析表明,羊口疮疫病类别最易被错判。 展开更多
关键词 TF-IIGM 权重 向量化表示 疫病诊断 SVM
在线阅读 下载PDF
基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究 被引量:4
2
作者 余礼根 郭晓利 +3 位作者 赵红涛 杨淦 张俊 李奇峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期287-294,共8页
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona... 针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。 展开更多
关键词 畜禽疫病 文本分词 预训练语言模型 双向长短时记忆网络 条件随机场
在线阅读 下载PDF
融合文本与知识图谱的蛋鸡疫病智能诊断模型 被引量:1
3
作者 王书君 童勤 +5 位作者 刘羽 李奇峰 王朝元 高荣华 余礼根 李海燕 《农业工程学报》 EI CAS CSCD 北大核心 2024年第17期265-272,共8页
针对利用单一文本描述进行蛋鸡疫病诊断存在关联信息分析不够全面、未能提供完整蛋鸡疫病知识,进而导致在复杂蛋鸡疫病诊断中存在准确率不高等问题,该研究提出一种采用基于转换器的双向编码预训练模型(bidirectional encoder representa... 针对利用单一文本描述进行蛋鸡疫病诊断存在关联信息分析不够全面、未能提供完整蛋鸡疫病知识,进而导致在复杂蛋鸡疫病诊断中存在准确率不高等问题,该研究提出一种采用基于转换器的双向编码预训练模型(bidirectional encoder representation from transformers,BERT)融合蛋鸡典型疫病知识图谱和文本的方法,结合双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络构建了BERT-LHDKG(BERT-laying hens disease knowledge graph)诊断模型,实现对滑液囊支原体、新城疫、传染性鼻炎等38种蛋鸡典型疫病的智能诊断。模型通过引入表示知识图谱的三元组向量,使模型更全面地结合疫病文本和知识图谱数据对蛋鸡发病情况进行综合分析;通过增加BERT模型的Embedding结构,将文本特征向量与三元组向量在BERT模型内部相加形成融合向量,有助于模型提取更有用的特征进行疫病分析和诊断。性能对比试验结果显示,BERT-LHDKG诊断模型的宏准确率为94.27%,宏召回率为94.12%,宏F1为94.01%,与TextCNN、结合CNN(convolutional neural networks)的BERT模型、结合BiLSTM的ERNIE模型等深度学习模型相比,宏准确率分别提升了10.02、2.64、2.18个百分点,宏召回率分别提升了10.28、2.29、2.29个百分点,宏F1分别提升了10.66、2.51、2.19个百分点。对于蛋鸡养殖过程中容易发生的病毒性疫病、细菌性疫病、中毒性疫病和代谢性疫病,BERT-LHDKG诊断模型的宏F1分别为96.43%、95.57%、96.72%、98.24%,性能均优于其他对比模型。研究结果表明融入知识图谱可以使模型将疫病文本中的实体、关系链接到知识图谱中对应的实体,丰富文本的语义信息,提升模型全面理解文本内容的能力,进而提高模型进行疫病诊断的准确性和鲁棒性,为畜禽疫病智能诊断提供了新的思路;此外,基于BERT-LHDKG诊断模型开发的蛋鸡疫病诊断Web系统以人机对话的形式提高了养殖户远程诊断蛋鸡疫病的灵活性。 展开更多
关键词 蛋鸡疫病 知识图谱 文本 BERT模型 智能诊断
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部