期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
马钱子致大鼠体内毒性的研究——“装袋”算法和16S rRNA基因测序技术在毒理学研究中的应用 被引量:2
1
作者 王曦烨 宝乐尔 +2 位作者 姜明洋 李丹 白梅荣 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2024年第2期404-422,共19页
目的中药马钱子(Strychnos nux-vomica L.,SN)在临床上具有消肿止痛的功效,然而,由于含有生物碱类成分,马钱子具有一定毒性。人们对马钱子毒性所引起的大鼠内源性代谢变化及其对肠道微生物群代谢失调的潜在影响知之甚少,因此,马钱子的... 目的中药马钱子(Strychnos nux-vomica L.,SN)在临床上具有消肿止痛的功效,然而,由于含有生物碱类成分,马钱子具有一定毒性。人们对马钱子毒性所引起的大鼠内源性代谢变化及其对肠道微生物群代谢失调的潜在影响知之甚少,因此,马钱子的毒理学研究对其安全性评价具有重要意义。本研究将代谢组学和16S rRNA基因测序技术相结合来探索马钱子的致毒机制。方法通过急性、蓄积性和亚急性毒性试验,分别确定马钱子的中毒剂量、毒性强度和毒性靶器官。超高效液相色谱-质谱联用技术用于分析大鼠灌胃马钱子后的血清、肝脏和肾脏样本。利用基于装袋算法的决策树和K最近邻(K nearest neighbor,KNN)模型对组学数据进行分类。从大鼠粪便中提取样本后,使用高通量测序平台对细菌的16s rRNA V3-V4区域进行分析。结果装袋算法提高了样本分类的准确率。共鉴定出12个生物标志物,这些生物标志物的代谢失调可能是马钱子致体内毒性的原因。拟杆菌、粪厌氧棒菌、颤螺菌、双茎体菌等与肾肝功能的生理指标密切相关,这表明马钱子引起的肝肾损害可能与这些肠道细菌的代谢紊乱有关。结论本文揭示了马钱子的体内致毒机制,为马钱子临床上的安全合理使用提供了科学依据。 展开更多
关键词 马钱子 致毒机制 代谢组学 肠道菌群 装袋算法
在线阅读 下载PDF
BP神经网络算法结合超高效液相色谱-质谱联用技术研究红花治疗慢性酒精性肝损伤的作用机制 被引量:1
2
作者 王曦烨 韩晓静 +2 位作者 姜明洋 白梅荣 许良 《质谱学报》 EI CAS CSCD 北大核心 2024年第6期897-906,I0006,共11页
临床上,红花对慢性酒精性肝损伤(chronic alcoholic liver injury,CALI)有很好的疗效,但治疗机制不甚明确。因此,阐明红花治疗CALI的分子作用机制对药物的进一步开发及应用具有重要意义。以雄性Wistar大鼠为研究对象,模型组大鼠以8 mL/k... 临床上,红花对慢性酒精性肝损伤(chronic alcoholic liver injury,CALI)有很好的疗效,但治疗机制不甚明确。因此,阐明红花治疗CALI的分子作用机制对药物的进一步开发及应用具有重要意义。以雄性Wistar大鼠为研究对象,模型组大鼠以8 mL/kg酒精连续灌胃28天,建立CALI模型;给药组大鼠分别以高(4.290 3 g/kg)、中(1.430 1 g/kg)、低(0.476 7 g/kg)剂量灌胃红花提取物。采用大鼠血清代谢组学分析方法结合超高效液相色谱-质谱技术鉴定与CALI相关的潜在生物标志物,并研究红花对这些生物标志物的调控机制。利用MATLAB软件建立BP神经网络模型处理组学数据的分类问题。从苏木精和伊红(H&E)染色实验发现,高剂量红花提取物减轻了肝细胞的损伤程度;与模型组相比,高剂量红花组中的丙氨酸氨基转移酶(ALT)和天冬氨酸氨基转移酶(AST)的表达水平降低,表明高剂量红花提取物具有肝保护作用。BP神经网络模型的分类准确率为95.8%,分类效果良好。通过火山图分析共鉴定出20种与CALI相关的生物标志物,红花可以对这些生物标志物产生回调效果。研究表明,红花可能通过对甘油三酯、脂肪酸、磷脂、胆汁酸、氨基酸、维生素E代谢的调控作用而对CALI产生治疗效果。本研究可为红花的推广和临床应用提供了理论基础。 展开更多
关键词 红花 慢性酒精性肝损伤 代谢组学 超高效液相色谱-质谱(UHPLC-MS) BP神经网络算法
在线阅读 下载PDF
基于改进YOLOv10n的石榴病害检测
3
作者 乔世成 潘春宇 +3 位作者 白明宇 党珊珊 赵晨雨 王国忱 《沈阳农业大学学报》 北大核心 2025年第4期93-102,共10页
[目的]针对复杂背景、多变环境和多尺度目标下的石榴病害检测识别精度不高、泛化能力不足、特征提取复杂的问题,提出一种石榴病害检测模型MBC-YOLOv10n。[方法]首先,在YOLOv10n模型的所有C2f中通过融合混合局部通道注意力机制(ML⁃CA),... [目的]针对复杂背景、多变环境和多尺度目标下的石榴病害检测识别精度不高、泛化能力不足、特征提取复杂的问题,提出一种石榴病害检测模型MBC-YOLOv10n。[方法]首先,在YOLOv10n模型的所有C2f中通过融合混合局部通道注意力机制(ML⁃CA),增强模型对石榴病害特征的敏感性,提高检测病害的精确度。其次,考虑到石榴病害的多变性和多尺度的特征,结合双向特征金字塔网络(BiFPN),通过不同尺度特征融合,在不增加参数的同时提升模型的精确度和召回率。最后,加入卷积注意力模块(CBAM),通过空间和通道注意力机制,增强模型对复杂背景的抗干扰能力。[结果]MBC-YOLOv10n的平均精度均值(MAP50)较原模型提升1.3%,达到90.1%,精确度(Precision)较原模型增加2.4%,达到90.5%,召回率(Recall)较原模型增加2.0%,达到88.4%,MAP50~95较原模型提升5.0%,达到57.9%,参数量仅为2.9 M,对石榴病害的检测能力明显增强。MBC-YOLOv10n模型具有良好的检测精度,且参数量较少,在保证高精度检测的同时,具备轻量化特性。[结论]改进后的MBC-YOLOv10n能够的在自然环境下有效检测石榴病害,兼顾高精度、轻量化,为智慧农业中石榴病害的早期预警与精确防控提供技术支持,也为后续病害检测模型的优化与应用推广奠定理论基础。 展开更多
关键词 石榴病害 MLCA BiFPN CBAM
在线阅读 下载PDF
基于卷积神经网络的农作物病害检测研究综述
4
作者 乔世成 党珊珊 +3 位作者 何海祝 关强 王郝日钦 路扬 《山西农业大学学报(自然科学版)》 北大核心 2025年第2期113-127,共15页
我国是农业大国,拥有广大的农作物种植面积和丰富的农业资源。然而,近年来,农作物病害问题日益严重。农作物病害不仅直接影响产量和质量,还会造成农民的经济损失,威胁粮食安全和生态环境,对我国农业可持续发展构成了巨大威胁。因此,对... 我国是农业大国,拥有广大的农作物种植面积和丰富的农业资源。然而,近年来,农作物病害问题日益严重。农作物病害不仅直接影响产量和质量,还会造成农民的经济损失,威胁粮食安全和生态环境,对我国农业可持续发展构成了巨大威胁。因此,对农作物病害的精准检测是提高我国农业发展的关键因素。随着深度学习的不断发展,无损检测技术已得到广泛应用,利用卷积神经网络进行农作物病害的精准检测成为近年来研究的热点。卷积神经网络具有较好的图像检测与识别能力,能够适应多种病害类型,实现高效、准确的大规模检测,被广泛应用于农作物病害的精准检测中。本文首先介绍了卷积神经网络结构;然后探讨了几种典型的检测农作物病害的卷积神经网络模型;其次分析了其它神经网络研究情况并进行总结;重点讨论了目前基于小样本学习、小目标检测、网络轻量化改进的卷积神经网络热点研究问题;之后对未来农作物病害检测所面临的挑战和展望进行了总结,如针对数据集标注困难、模型缺乏泛化能力、小样本小目标数据集识别精度较低等问题,提出了建立更高质量的农作物病害数据集、优化小样本小目标数据集下的网络模型结构以及对农作物病害无损检测进行实时监测与预警等研究展望,以期为不断推进农业技术创新和应用、为我国农作物病害的精准检测研究提供参考依据。 展开更多
关键词 卷积神经网络 小样本 小目标 轻量化
在线阅读 下载PDF
基于层次数据增强的多维度特征融合社交媒体抑郁症识别
5
作者 李世琪 刁宇峰 +3 位作者 张浩 杨亮 林鸿飞 樊小超 《计算机工程与应用》 北大核心 2025年第19期127-136,共10页
抑郁症作为一种常见的精神障碍,因其数据样本稀缺且难以获取,抑郁识别任务在特征的捕获方面正面临极大挑战。提出了基于层次的数据增强技术,通过同义词替换和句法树结构调整方法生成新的抑郁文本,丰富抑郁数据集。在此基础上,构建了一... 抑郁症作为一种常见的精神障碍,因其数据样本稀缺且难以获取,抑郁识别任务在特征的捕获方面正面临极大挑战。提出了基于层次的数据增强技术,通过同义词替换和句法树结构调整方法生成新的抑郁文本,丰富抑郁数据集。在此基础上,构建了一个融合多维度特征的社交媒体抑郁症识别模型,该模型整合了文本的风格特征、情感特征和语境特征,并引入多头注意力机制,突出抑郁特征中的关键信息,从而对抑郁文本进行精准分类。实验结果表明,提出的方法有效扩充了样本数据,并在多维度上准确提取了抑郁特征,使得抑郁识别的准确率达到了92%,验证了模型的有效性。 展开更多
关键词 社交媒体 抑郁症识别 数据增强 多维度特征
在线阅读 下载PDF
多语言平行情感语料库的构建与研究
6
作者 张浩 李世琪 +3 位作者 刁宇峰 杨亮 林鸿飞 樊小超 《计算机科学与探索》 北大核心 2025年第9期2506-2519,共14页
在自然语言处理领域,多语平行语料库的构建与应用日益成为研究热点,其在跨文化交流、机器翻译、情感分析及智慧问答等领域的应用价值愈发凸显。特别是在“一带一路”倡议背景下,深化中蒙两国在文化、经济及社会领域的交流合作具有重要... 在自然语言处理领域,多语平行语料库的构建与应用日益成为研究热点,其在跨文化交流、机器翻译、情感分析及智慧问答等领域的应用价值愈发凸显。特别是在“一带一路”倡议背景下,深化中蒙两国在文化、经济及社会领域的交流合作具有重要意义。因此,该研究构建了一个涵盖中文、传统蒙文和新蒙文的多语平行情感语料库,以推动蒙文体系下的情感分析研究。该语料库的构建不仅有助于深化中蒙两国间的文化交流与合作,还将促进我国民族团结及蒙古族文化的传承与发展。该研究基于SMP2020-EWECT和OCEMOTION两个公开中文情感分析数据集,采用先进的机器翻译技术,将中文文本自动翻译为传统蒙文和新蒙文,并通过机器校对与人工校对相结合的双重验证机制,确保语料库的准确性和高质量。对该语料库进行详尽的数据分析,以确保文本的多样性与平衡性,涵盖不同领域和情感类别,保证语料库在多种自然语言处理任务中的广泛适用性和代表性。通过一系列系统性的实验,探索了多种情感分析模型在蒙文数据上的性能表现,实验结果验证了该语料库在情感分析任务中的可用性和研究价值。 展开更多
关键词 自然语言处理 多语言平行语料库 传统蒙文 新蒙文
在线阅读 下载PDF
基于ZigBee技术的矿井智能头盔 被引量:7
7
作者 包奇金宝 梁慧军 《实验室研究与探索》 CAS 北大核心 2010年第4期38-39,65,共3页
煤矿瓦斯检测点由于安装位置较远,瓦斯浓度信号滞后,已经严重影响了煤矿的安全生产。以ZigBee无线通信协议为研究对象,选用902~928MHz的频段,构建超低功耗无线传感器网络。使用嵌入式操作系统,打造智能头盔语音终端,作为无线传感器网... 煤矿瓦斯检测点由于安装位置较远,瓦斯浓度信号滞后,已经严重影响了煤矿的安全生产。以ZigBee无线通信协议为研究对象,选用902~928MHz的频段,构建超低功耗无线传感器网络。使用嵌入式操作系统,打造智能头盔语音终端,作为无线传感器网络节点,实时采集井下环境的各项参数。提出了一种新颖的煤矿安全监测方案,实现对矿区瓦斯浓度、温度、湿度的在线监测和智能预警,还可以使用无线语音通话通信功能,及时与地面控制中心沟通,以进一步降低煤矿生产中的安全隐患。实践证明,该方案对于井下复杂的工况具有一定的可行性和应用性。 展开更多
关键词 ZIGBEE 无线传感器网络 语音通信 煤矿安全
在线阅读 下载PDF
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:2
8
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于高光谱图谱融合的蓝莓可溶性固形物含量检测
9
作者 孙枭雄 刘大洋 朱良宽 《森林工程》 北大核心 2025年第3期603-613,共11页
可溶性固形物含量(soluble solids content,SSC)是衡量水果内部质量的重要指标,为此,提出一种基于高光谱图谱融合的无损检测方法,用于预测蓝莓的SSC。采用3种典型的波长降维算法,包括蒙特卡罗无信息变量消除(monte carlo uninformative ... 可溶性固形物含量(soluble solids content,SSC)是衡量水果内部质量的重要指标,为此,提出一种基于高光谱图谱融合的无损检测方法,用于预测蓝莓的SSC。采用3种典型的波长降维算法,包括蒙特卡罗无信息变量消除(monte carlo uninformative variable elimination,MC-UVE)、竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)和连续投影算法(successive projections algorithm,SPA),用于筛选有效波长。此外,提出一种结合局部二值模式(local binary patterns,LBP)和灰度共生矩阵(gray level co-occurrence matrix,GLCM)提取图像特征的策略。基于光谱特征、图像特征和融合特征,分别建立偏最小二乘(partial least squares,PLS)、反向传播神经网络(back propagation neural network,BPNN)和支持向量机(support vector machine,SVM)模型进行SSC预测。研究结果表明,利用CARS算法提取的光谱特征融合LBP+GLCM算法提取的图像特征建立的BPNN模型,具有最佳的预测精度。该模型的决定系数(R2)为0.9261,均方根误差(root mean square error of prediction,RMSEP)为0.3641。该研究表明高光谱图谱融合技术在无损预测蓝莓SSC中具有较大应用潜力。 展开更多
关键词 可溶性固形物含量 无损检测 信息融合 特征提取 机器学习
在线阅读 下载PDF
水果病虫害无损检测技术研究进展 被引量:8
10
作者 乔世成 田有文 +3 位作者 何宽 姚萍 古文君 王建平 《食品科学》 EI CAS CSCD 北大核心 2019年第11期227-234,共8页
水果的病害和虫害是影响水果品质等级鉴定的重要因素。水果在生长、加工、贮藏、运输过程中容易受到病菌侵染和害虫侵蚀,这将造成水果品质降低,同时对食品安全也会造成不良影响。本文综述了X射线成像技术、计算机视觉技术、核磁共振技... 水果的病害和虫害是影响水果品质等级鉴定的重要因素。水果在生长、加工、贮藏、运输过程中容易受到病菌侵染和害虫侵蚀,这将造成水果品质降低,同时对食品安全也会造成不良影响。本文综述了X射线成像技术、计算机视觉技术、核磁共振技术、光谱技术、新兴传感器技术等无损检测技术在水果病虫害识别与检测中的应用进展,并分析各技术的优势和劣势,重点介绍了高光谱成像技术在水果病虫害识别与检测方面的应用进展,分析存在的问题、展望发展趋势,为后续研究提供参考。 展开更多
关键词 水果 病害 虫害 无损检测技术 高光谱成像技术
在线阅读 下载PDF
基于代谢组学方法的红花治疗急性酒精性肝损伤的作用机制研究 被引量:1
11
作者 王曦烨 阿都沁夫 +2 位作者 韩晓静 姜明洋 白梅荣 《分析科学学报》 CAS CSCD 北大核心 2024年第4期373-380,共8页
红花在临床上对急性酒精性肝损伤(Acute Alcoholic Liver Injury,AALI)有很好的疗效,但治疗机制不甚明确。因此,阐明红花治疗AALI的分子作用机制对药物的进一步开发及应用具有十分重要的意义。实验以雄性Wistar大鼠为研究对象,模型组大... 红花在临床上对急性酒精性肝损伤(Acute Alcoholic Liver Injury,AALI)有很好的疗效,但治疗机制不甚明确。因此,阐明红花治疗AALI的分子作用机制对药物的进一步开发及应用具有十分重要的意义。实验以雄性Wistar大鼠为研究对象,模型组大鼠灌胃8 mL/kg的酒精以建立AALI模型,给药组大鼠以4.29 g/kg/天的剂量灌胃红花提取物。利用大鼠血清代谢组学分析方法鉴定与AALI相关的潜在生物标志物,并研究红花对这些生物标志物的调控机制。从苏木精和伊红(H&E)染色实验发现,灌胃后红花提取物减轻了肝细胞的损伤程度;与模型组相比,红花组中的丙氨酸氨基转移酶(ALT)和天冬氨酸氨基转移酶(AST)的表达水平降低,表明红花提取物具有肝保护作用。通过分析火山图,共鉴定出30种与AALI相关的生物标志物。在这些生物标志物中,红花可以对21个标志物产生回调效果。研究发现,红花可能通过对脂肪酸、磷脂、胆汁酸、氨基酸、核苷酸代谢的调控作用从而对AALI产生治疗效果。本文为红花的推广和临床应用提供了理论基础。 展开更多
关键词 红花 急性酒精性肝损伤 代谢组学 超高效液相色谱-质谱
在线阅读 下载PDF
基于主题感知和语义增强的作文自动评分方法 被引量:1
12
作者 陈宇航 杨勇 +4 位作者 先木斯亚·买买提明 帕力旦·吐尔逊 樊小超 任鸽 刁宇峰 《计算机工程》 CAS CSCD 北大核心 2024年第8期363-371,共9页
作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提... 作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提出一种基于主题感知和语义增强的作文自动评分模型。该模型采用多头注意力机制提取作文的浅层语义特征并感知作文主题特征,同时利用BERT的中间层句法特征和深层语义特征增强对作文语义的理解。在此基础上,融合不同维度的特征并用于作文自动评分。实验结果表明,该模型在公共数据集ASAP的8个子集上均表现出了显著的性能优势,相比于通义千问等基线模型,其能够有效提升作文自动评分性能,平均二次加权的卡帕值(QWK)达到80.25%。 展开更多
关键词 作文自动评分 语义增强 主题感知 特征融合 预训练语言模型
在线阅读 下载PDF
基于语义拼写理解和门控注意力机制的不良言论检测 被引量:1
13
作者 周险兵 樊小超 +2 位作者 杨勇 刁宇峰 任鸽 《计算机应用与软件》 北大核心 2024年第1期112-118,125,共8页
如何自动检测网络传播的不良言论信息是自然语言处理研究领域的热门研究内容之一。针对不良言论中语义表达和拼写习惯的特点,提出一种基于语义拼写理解和门控注意力机制的不良言论检测方法。该方法采用自注意力机制获取文本的语义特征,... 如何自动检测网络传播的不良言论信息是自然语言处理研究领域的热门研究内容之一。针对不良言论中语义表达和拼写习惯的特点,提出一种基于语义拼写理解和门控注意力机制的不良言论检测方法。该方法采用自注意力机制获取文本的语义特征,采用卷积神经网络提取文本的拼写特征,采用前期特征融合和门控注意力机制相结合的方式融合语义和拼写特征。在两个公共数据集上的实验结果表明,提出的模型能够有效地提取不良言论的语义特征,提高不良言论检测的性能。 展开更多
关键词 不良言论检测 语义拼写理解 自注意力机制 早期融合 门控注意力机制
在线阅读 下载PDF
基于深度强化学习的数据中心热感知能耗优化方法 被引量:4
14
作者 李丹阳 吴良基 +1 位作者 刘慧 姜静清 《计算机科学》 CSCD 北大核心 2024年第S01期726-733,共8页
随着数据中心规模的不断扩大,所引起的高能耗、高运营成本和环境污染等问题日益严重,严重影响了数据中心的可持续性。大多数数据中心能耗优化方法为了降低计算能耗,会将任务集中在尽可能少的服务器上,但这样做往往会导致数据中心热点的... 随着数据中心规模的不断扩大,所引起的高能耗、高运营成本和环境污染等问题日益严重,严重影响了数据中心的可持续性。大多数数据中心能耗优化方法为了降低计算能耗,会将任务集中在尽可能少的服务器上,但这样做往往会导致数据中心热点的产生,并且提高了冷却能耗。为了解决这一问题,文中首先对数据中心进行建模,并将数据中心总能耗优化问题建模为一个任务调度问题,并且要求调度过程中不产生数据中心热点。为了解决该问题,文中提出了一种基于深度强化学习的数据中心任务调度方法,并使用奖励塑造对该方法进行优化,在不产生热点的前提下降低数据中心的总能耗。最后,通过仿真环境和真实数据中心负载跟踪数据进行了实验。仿真实验结果表明,所提方法相比其他现有的调度方法能够更好地降低数据中心总能耗,最多降低了25.5%。此外,提出的优化方法还不会产生热点,这进一步证明了其优越性。 展开更多
关键词 数据中心 能耗优化 热点 任务调度 深度强化学习 奖励塑造
在线阅读 下载PDF
基于片段抽取原型网络的古籍文本断句标点提示学习方法
15
作者 高颖杰 林民 +2 位作者 斯日古楞 李斌 张树钧 《计算机应用》 CSCD 北大核心 2024年第12期3815-3822,共8页
针对古籍信息处理中自动断句及标点任务依赖大规模标注语料的现象,在考虑高质量、大规模样本的训练成本昂贵且难以获取的背景下,提出一种基于片段抽取原型网络的古籍文本断句标点提示学习方法。首先,通过对支持集加入结构化提示信息形... 针对古籍信息处理中自动断句及标点任务依赖大规模标注语料的现象,在考虑高质量、大规模样本的训练成本昂贵且难以获取的背景下,提出一种基于片段抽取原型网络的古籍文本断句标点提示学习方法。首先,通过对支持集加入结构化提示信息形成有效的提示模板,从而提高模型的学习效率;其次,结合标点位置提取器和原型网络分类器,有效减少传统序列标注方法中的误判影响及非标点标签的干扰。实验结果表明,与Siku-BERT-BiGRU-CRF(Siku-Bidirectional Encoder Representation from Transformer-Bidirectional Gated Recurrent Unit-Conditional Random Field)方法相比,在《史记》数据集上所提方法的F1值提升了2.47个百分点。此外,在公开的多领域古籍数据集CCLUE上,所提方法的精确率和F1值分别达到了91.60%和93.12%,说明所提方法利用少量训练样本就能对多领域古籍进行有效的自动断句标点。因此,所提方法为多领域古籍文本的自动断句及标点任务的深入研究以及提高模型的学习效率提供了新的思路和方法。 展开更多
关键词 古籍智能整理 片段抽取原型网络 提示学习 自动断句标点 深度学习
在线阅读 下载PDF
一种基于特征重要度的文本分类特征加权方法 被引量:25
16
作者 刘赫 刘大有 +1 位作者 裴志利 高滢 《计算机研究与发展》 EI CSCD 北大核心 2009年第10期1693-1703,共11页
针对文本分类中的特征加权问题,提出了一种基于特征重要度的特征加权方法.该方法基于实数粗糙集理论,通过定义特征重要度,将特征对分类的决策信息引入到特征权重中.然后,在标准文本数据集Reuters-21578 Top10和WebKB上进行了实验.结果表... 针对文本分类中的特征加权问题,提出了一种基于特征重要度的特征加权方法.该方法基于实数粗糙集理论,通过定义特征重要度,将特征对分类的决策信息引入到特征权重中.然后,在标准文本数据集Reuters-21578 Top10和WebKB上进行了实验.结果表明,该方法能改善样本空间的分布状态,使同类样本更加紧凑,异类样本更加松散,从而简化从样本到类别的映射关系.最后,使用Nave Bayes,kNN和SVM分类器在上述数据集上对该方法进行了实验.结果表明,该方法能提高分类的准确率、召回率和F1值. 展开更多
关键词 文本分类 特征加权 特征重要度 粗糙集 决策表
在线阅读 下载PDF
权吸引子传播算法及其在文本聚类中的应用 被引量:10
17
作者 管仁初 裴志利 +2 位作者 时小虎 杨晨 梁艳春 《计算机研究与发展》 EI CSCD 北大核心 2010年第10期1733-1740,共8页
吸引子传播算法(affinity propagation,AP)是一种新的高效聚类算法.由于AP算法简单易用,它已被广泛应用到数据挖掘的各个领域.在AP算法中,相似性度量具有重要作用.另一方面,传统的文本挖掘常采用向量空间模型和满足欧氏空间的相似性度量... 吸引子传播算法(affinity propagation,AP)是一种新的高效聚类算法.由于AP算法简单易用,它已被广泛应用到数据挖掘的各个领域.在AP算法中,相似性度量具有重要作用.另一方面,传统的文本挖掘常采用向量空间模型和满足欧氏空间的相似性度量.这种方法的优点是简单且易于实现,但随着数据规模的膨胀,向量空间将变得高维稀疏并将导致计算复杂度快速增长.为解决此问题,给出了相似特征集、排斥特征集和仲裁特征集的概念,在这些概念的基础上提出了一种能够包含文本结构信息的非欧空间相似性度量方法.并提出了一种新的聚类算法,称之为权吸引子传播算法(weight affinity propagation,WAP).为检验提出算法的聚类效果,选用标准数据集Reuters-21578进行了验证.实验结果表明WAP明显优于k-means聚类算法、具备非线性特征的SOFM聚类算法和采用经典相似性度量的吸引子传播算法等3种经典聚类算法. 展开更多
关键词 吸引子传播算法 相似特征集 排斥特征集 仲裁特征集 文本聚类
在线阅读 下载PDF
自由空间激光通信中APT粗跟踪研究 被引量:21
18
作者 卢宁 柯熙政 张华 《红外与激光工程》 EI CSCD 北大核心 2010年第5期943-949,共7页
自由空间激光通信APT(Acquisition,Pointing and Tracking)系统主要由粗跟踪系统和精跟踪系统组成,粗跟踪系统主要是完成对目标信号的捕获,以确保入射的信标光在精跟踪控制系统的动态范围内。介绍了粒子滤波在APT粗跟踪系统中的应用,针... 自由空间激光通信APT(Acquisition,Pointing and Tracking)系统主要由粗跟踪系统和精跟踪系统组成,粗跟踪系统主要是完成对目标信号的捕获,以确保入射的信标光在精跟踪控制系统的动态范围内。介绍了粒子滤波在APT粗跟踪系统中的应用,针对粒子滤波在跟踪算法中存在的问题进行了改进,设计了颜色和轮廓双重信息融合的似然模型;为提高目标跟踪算法在异常情况下的有效性,采用了异常检测和恢复策略,并设计了跟踪光斑目标的模拟系统。实验表明:所提出的多信息融合的似然模型跟踪算法在目标尺度变化、背景干扰、姿态变化、部分遮挡等环境下均能稳定地跟踪目标,提高了大气激光通信链路的可靠性。 展开更多
关键词 自由空间激光通信 目标跟踪 APT 粒子滤波
在线阅读 下载PDF
基于关联规则的条件函数依赖发现及数据修复 被引量:5
19
作者 张春生 图雅 +2 位作者 翁慧 李艳 魏国利 《计算机应用研究》 CSCD 北大核心 2016年第2期384-387,共4页
大数据时代,数据的来源复杂,数据质量存在严重问题,有些数据不准确、缺失或存在错误。不正确的数据严重影响了数据挖掘的质量,给决策造成重大的影响。关于缺失数据的修复方法很多,其中条件函数依赖就是一个有效的方法,在如何发现条件函... 大数据时代,数据的来源复杂,数据质量存在严重问题,有些数据不准确、缺失或存在错误。不正确的数据严重影响了数据挖掘的质量,给决策造成重大的影响。关于缺失数据的修复方法很多,其中条件函数依赖就是一个有效的方法,在如何发现条件函数依赖方面已经有了很多研究成果。提出一种应用关联规则构建条件函数依赖的方法,由于关联规则通过数据挖掘得到,具有一定的隐蔽性,不是一般的方法能够发现,所以,由关联规则构建的条件函数依赖具有一定的应用价值,给出了构建方法,并通过实验证明其有效性。 展开更多
关键词 关联规则 条件函数依赖 一致性 数据修复 大数据 缺失数据
在线阅读 下载PDF
一种改进的降噪自编码神经网络不平衡数据分类算法 被引量:16
20
作者 张成刚 宋佳智 +1 位作者 姜静清 裴志利 《计算机应用研究》 CSCD 北大核心 2017年第5期1329-1332,共4页
针对少数类样本合成过采样技术(synthetic minority over-sampling technique,SMOTE)在合成少数类新样本时会带来噪声问题,提出了一种改进降噪自编码神经网络不平衡数据分类算法(SMOTE-SDAE)。该算法通过SMOTE方法合成少数类新样本以均... 针对少数类样本合成过采样技术(synthetic minority over-sampling technique,SMOTE)在合成少数类新样本时会带来噪声问题,提出了一种改进降噪自编码神经网络不平衡数据分类算法(SMOTE-SDAE)。该算法通过SMOTE方法合成少数类新样本以均衡原始数据集,考虑到合成样本过程中会产生噪声的影响,利用降噪自编码神经网络算法的逐层无监督降噪学习和有监督微调过程,有效实现对过采样数据集的降噪处理与数据分类。在UCI不平衡数据集上实验结果表明,相比传统SVM算法,该算法显著提高了不平衡数据集中少数类的分类精度。 展开更多
关键词 神经网络 过采样 不平衡数据 分类
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部