期刊文献+
共找到347,633篇文章
< 1 2 250 >
每页显示 20 50 100
基于注意力ConvLSTM模型的人脸图像年龄估计研究
1
作者 秦瑾 焦勇 +1 位作者 李泽鹏 毛智勇 《计算机应用与软件》 北大核心 2025年第1期383-390,共8页
针对人脸图像在空间和时间序列上对细粒度特征方面年龄估计准确性不高的问题,提出一种基于注意力机制的卷积长短时记忆网络模型(Convolution Long-Short Term Memory, ConvLSTM)。在ConvLSTM模型的上一层隐藏状态和当前输入状态之间引... 针对人脸图像在空间和时间序列上对细粒度特征方面年龄估计准确性不高的问题,提出一种基于注意力机制的卷积长短时记忆网络模型(Convolution Long-Short Term Memory, ConvLSTM)。在ConvLSTM模型的上一层隐藏状态和当前输入状态之间引入注意力机制对年龄估计产生显著影响的特征因子增加权重;通过平均池化得到通道权重因子,并对注意力权重进行归一化操作,得到新的输入状态;利用新的输入状态通过ConvLSTM模型实现特征提取和年龄估计。为验证模型的有效性,以FG-NET和MORPH人脸数据集为实验对象,以平均绝对误差(Mean Absolute Error, MAE)和累积指数(Cumulative Score, CS)为评价指标。实验结果表明,算法模型在FG-NET和MORPH人脸数据集上平均绝对误差分别为3.60和2.45;在MORPH数据集上累积指数达到89.3%;与非注意力ConvLSTM模型和LSTM模型相比其累积指数平均提高0.80百分点和4.60百分点;在算法模型复杂度方面也具有良好表现。 展开更多
关键词 深度学习 注意力机制 convlstm模型 人脸图像 年龄估计
在线阅读 下载PDF
基于POI-ConvLSTM模型的周期来压预测研究 被引量:1
2
作者 尹春雷 《煤炭工程》 北大核心 2024年第9期121-126,共6页
针对综采工作面周期来压预测的技术难题,研究了理论分析、数据采集与预处理、模型评估与优化等方法,提出了具有时空关联分析与POI(Point of Intersesting)数据的ConvLSTM模型,利用多源数据融合得到周期来压预测的最优解,实现工作面环境... 针对综采工作面周期来压预测的技术难题,研究了理论分析、数据采集与预处理、模型评估与优化等方法,提出了具有时空关联分析与POI(Point of Intersesting)数据的ConvLSTM模型,利用多源数据融合得到周期来压预测的最优解,实现工作面环境状态的实时感知和预测。试验结果表明:基于POI-ConvLSTM的工作面周期来压预测模型,均方误差为0.159,R 2评价指标为0.999,相比于Seq2Seq和ConvLSTM模型的均方误差分别降低了68.07%和4.22%。可见,融合了多元数据POI-ConvLSTM模型的预测精度更高,普适性更强,能够准确地提前预测周期来压问题。 展开更多
关键词 POI convlstm 周期来压 时空关联
在线阅读 下载PDF
基于ConvLSTM模型的短文本情感分类研究 被引量:2
3
作者 张志远 万双双 《现代电子技术》 北大核心 2019年第22期159-163,共5页
CNN在处理短文本情感分类时,使用卷积层抽取局部特征,用最大池化层选取局部特征最大值,易忽略其长期序列特性。该文使用一种新的深度学习模型ConvLSTM,利用长LSTM替代CNN中的最大池化层,以减少局部信息的丢失并捕获句子序列中的长期依... CNN在处理短文本情感分类时,使用卷积层抽取局部特征,用最大池化层选取局部特征最大值,易忽略其长期序列特性。该文使用一种新的深度学习模型ConvLSTM,利用长LSTM替代CNN中的最大池化层,以减少局部信息的丢失并捕获句子序列中的长期依赖关系。在IMDB影评数据集和Amazon评论数据集上的实验表明,该模型较CNN和单纯的LSTM在准确率、召回率和F值等方面均有较明显的提高。 展开更多
关键词 短文本 情感分类 CNN LSTM convlstm模型 深度学习模型
在线阅读 下载PDF
基于ConvLSTM(卷积长短期记忆网络)模型的地铁车站基坑开挖变形预测
4
作者 吴迪 孙建军 卢让贤 《城市轨道交通研究》 北大核心 2025年第11期98-103,共6页
[目的]基坑工程变形预测对于确保施工安全具有重要意义。传统的预测方法在处理基坑变形的复杂时空演化特征方面存在局限性,因此,需要对基坑变形的时空耦合预测方法进行深入分析。[方法]以上海轨道交通21号线龙东大道站基坑工程为案例,... [目的]基坑工程变形预测对于确保施工安全具有重要意义。传统的预测方法在处理基坑变形的复杂时空演化特征方面存在局限性,因此,需要对基坑变形的时空耦合预测方法进行深入分析。[方法]以上海轨道交通21号线龙东大道站基坑工程为案例,提出了一种基于ConvLSTM(卷积长短期记忆网络)模型的基坑变形预测方法。分析了案例车站基坑工程概况,以该基坑C区3个测点为研究对象,阐述了监测数据采集及预处理的方法。构建了基于ConvLSTM的基坑变形预测模型结构图,采用Adam优化器对模型进行了训练。对不同开挖阶段下这3个测点的地下连续墙水平位移实测值与预测值进行了对比,采用均方根误差、平均绝对误差和拟合优度3个指标对预测结果进行了预测精度评价,以验证所提方法的有效性和实用性。[结果及结论]所提方法能同时捕捉基坑变形的空间特征和时间序列特性,预测精度显著优于传统方法,3个测点的均方根误差分别为1.32 mm、1.20 mm和1.26 mm。所建模型对基坑关键变形特征(如最大变形位置、变形拐点)识别准确,能有效支持基坑工程实时监测和预警。 展开更多
关键词 地铁车站 基坑变形预测 卷积长短期记忆网络 深度学习 时空建模
在线阅读 下载PDF
Residual Attention-BiConvLSTM:一种新的全球电离层TEC map预测模型
5
作者 王浩然 刘海军 +5 位作者 袁静 乐会军 李良超 陈羿 单维锋 袁国铭 《地球物理学报》 北大核心 2025年第2期413-430,共18页
电离层总电子含量(TEC)预测对提高全球卫星导航系统(GNSS)的精度具有重要意义.现有的TEC map预测模型主要通过顺序堆叠时空特征提取单元来实现.这种模型搭建方法会因多个卷积层顺序堆叠而损失细粒度的TEC map的空间特征,导致模型精度不... 电离层总电子含量(TEC)预测对提高全球卫星导航系统(GNSS)的精度具有重要意义.现有的TEC map预测模型主要通过顺序堆叠时空特征提取单元来实现.这种模型搭建方法会因多个卷积层顺序堆叠而损失细粒度的TEC map的空间特征,导致模型精度不够;还会由于多层堆叠导致梯度消失或梯度爆炸问题.本文借鉴残差注意力(Residual Attention)的思想,在TEC map预测模型中增加了残差注意力模块,提出了Residual Attention-BiConvLSTM模型.该模型中的残差注意力模块能同时提取粗、细粒度空间特征,并对其进行加权.本文在全球TEC map数据上与ConvLSTM、ConvGRU、ED-ConvLSTM和C1PG进行了对比实验.实验结果表明,本文所提出的Residual Attention-BiConvLSTM模型的RMSE、MAE、MAPE和R^(2)在太阳活动高年和年均优于对比模型.本文还在一次磁暴事件中对比了5种模型的预测效果.实验结果表明,大磁暴发生时,本文模型与C1PG相近,优于其他3种对比模型.本文的研究工作为电离层map预测模型搭建提供一个新思路. 展开更多
关键词 电离层TEC map预测 残差注意力模块 Residual Attention-Biconvlstm 时空预测模型
在线阅读 下载PDF
AConvLSTM U-Net:基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型
6
作者 李苏强 王周阳 +1 位作者 产思贤 周小龙 《南方医科大学学报》 北大核心 2025年第5期1082-1092,共11页
目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以... 目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以增强特征提取能力。其次,采用双路径稠密卷积(DPD)连接编码器和解码器,在跳跃连接中引入双向ConvLSTM以获取丰富的语义信息。然后,解码路径上使用基于空间和通道注意力的解码块(scSE),以提升对重要信息的关注。最后,设计了全尺寸深度监督模块(DS),并结合联合损失函数对模型进行优化,以进一步提高分割精度。结果AConvLSTM U-Net在颌骨囊肿病灶分割的实验结果在MCC、DSC和JSC方面分别达到93.8443%、93.9067%、88.5133%,性能均优于所有被比较的分割模型。结论所提出的算法在颌骨囊肿数据集上表现出较高的准确性与鲁棒性,优于多种主流方法,展现了AConvLSTM U-Net在颌骨囊肿图像分割的优越性能和辅助诊断的巨大潜力。 展开更多
关键词 注意力机制 多尺度颌骨囊肿分割模型 稠密卷积
在线阅读 下载PDF
一种基于改进的SA-ConvLSTM模型的北极月均海冰密集度时空预测方法
7
作者 赵相禹 王志勇 +2 位作者 李振今 荆芳 程思龙 《海洋学报》 2025年第10期111-125,共15页
针对融冰期北极海冰密集度预测精度不高的问题,本文构建了一种基于改进的SA-Conv-LSTM模型进行北极海冰密集度预测的方法,用于实现未来1年内月均海冰密集度数据的二维时空预测。该方法以SA-ConvLSTM模型为核心单元,通过引入Seq2Seq预测... 针对融冰期北极海冰密集度预测精度不高的问题,本文构建了一种基于改进的SA-Conv-LSTM模型进行北极海冰密集度预测的方法,用于实现未来1年内月均海冰密集度数据的二维时空预测。该方法以SA-ConvLSTM模型为核心单元,通过引入Seq2Seq预测结构和类VGG16编解码器结构,有针对性地解决时间序列输出步长选择过程不确定的问题,并设置一种组合损失函数来优化训练过程,以进一步提升海冰密集度分布的时空预测精度。以北冰洋为实验区,基于美国国家冰雪数据中心(NSIDC)与国家海洋和大气管理局(NOAA)联合发布的海冰密集度气候月均数据,预测了2023年北极海冰密集度的时空分布,并与真实数据进行了对比分析。结果表明:与传统LSTM、Conv-LSTM以及未改进的SA-ConvLSTM模型相比,本文改进模型在各项指标上均表现出较大优势,其中:均方根误差分别下降13.18%、36.10%和22.58%;相关系数分别提高1.90%、5.97%和3.31%;结构相似性指数分别增加5.38%、15.00%和10.30%;海冰面积偏差分别降低了83.46%、76.53%和60.30%。此外,通过对2012年与2020年极端融冰年份的预测结果分析,进一步验证了该模型在异常气候条件下的稳定性与鲁棒性,显示出良好的适应性与实际应用潜力。本文时空预测模型在融冰期能够更准确地预测海冰的空间分布,能捕捉复杂的时空变化信息及细节。 展开更多
关键词 时空预测 海冰密集度 SA-convlstm 组合损失函数 自注意力
在线阅读 下载PDF
阿舍勒矿集区VMS型矿床深部勘查模型研究 被引量:2
8
作者 邓震 孟贵祥 +5 位作者 祁光 汤贺军 薛融晖 秦纪华 吴晓贵 王晓娟 《地质学报》 北大核心 2025年第3期1046-1060,共15页
阿舍勒是我国西北典型的VMS型铜锌多金属矿床,随矿床勘查开发持续深入,矿床成矿模式和勘查模型得到不断完善,并在指导矿床深边部找矿勘查的过程中起到了积极作用。本文通过回顾阿舍勒矿(集)区勘查(找矿预测)模型从共性到个性、由浅至深... 阿舍勒是我国西北典型的VMS型铜锌多金属矿床,随矿床勘查开发持续深入,矿床成矿模式和勘查模型得到不断完善,并在指导矿床深边部找矿勘查的过程中起到了积极作用。本文通过回顾阿舍勒矿(集)区勘查(找矿预测)模型从共性到个性、由浅至深、从简单到综合的勘查过程,对基于不同尺度矿床(体)结构模型建立的有效地质勘查模型进行了梳理,提出基于矿集区尺度研究的“裂隙簇式多通道火山喷发带”地质勘查结构模型,并从“就矿找矿”综合勘查思路和“多元”综合勘查思路两方面出发,对阿舍勒矿集区VMS型铜多金属矿床深部综合勘查模型进行探讨。 展开更多
关键词 阿舍勒矿集区 VMS矿床 矿床模型 结构模型 深部勘查模型
在线阅读 下载PDF
考虑局部胶结破损热力学行为的结构性黄土二元介质本构模型 被引量:3
9
作者 王番 郅彬 +4 位作者 刘恩龙 王小婵 邓博团 李金华 张辉 《岩土力学》 北大核心 2025年第1期97-109,共13页
建立考虑局部胶结破损机制的本构模型是黄土力学核心任务之一,是解决黄土工程稳定性分析/评价的关键理论基础。基于热力学方法和岩土破损力学,建立了一个宏-细观热力学本构模型,它能够定量描述局部胶结破损的热力学行为及细观尺度应力-... 建立考虑局部胶结破损机制的本构模型是黄土力学核心任务之一,是解决黄土工程稳定性分析/评价的关键理论基础。基于热力学方法和岩土破损力学,建立了一个宏-细观热力学本构模型,它能够定量描述局部胶结破损的热力学行为及细观尺度应力-应变非均匀分布特征,提高了模型对变形的预测精度,其在数学形式上同剑桥模型类似。首先,通过热力学能量守恒定律,确定结构性黄土压缩变形过程中的结构破损功数学表达式,并发现结构性黄土局部损伤耗散的热力学行为主要来源:(1)破损集合体与未破损集合体之间的相互摩擦作用;(2)未破损集合体向破损集合体转换时,部分细观结构破损的不可逆热力学行为。基于此认识,建立了考虑胶结破损热力学行为的宏-细观本构模型框架,并通过分析结构性黄土变形机制(摩擦+胶结+破损共同作用),确定其自由能、耗散能和破损耗散能表达式;推导了一个考虑体积破损和剪切破损演化规律的损伤屈服函数及本构关系。通过所建立本构关系对已有试验数据进行预测,验证其合理性。 展开更多
关键词 结构性黄土 本构模型 局部破损 热力学 二元介质模型
在线阅读 下载PDF
大语言模型综述与展望 被引量:17
10
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
面向模型量化的安全性研究综述 被引量:1
11
作者 陈晋音 曹志骐 +1 位作者 郑海斌 郑雅羽 《小型微型计算机系统》 北大核心 2025年第6期1473-1490,共18页
随着边缘智能设备的飞速发展,为了在资源受限的边缘端设备上部署参数和存储需求巨大的深度模型,模型压缩技术显得至关重要.现有的模型压缩主要包含剪枝、量化、知识蒸馏和低秩分解4类,量化凭借推理快、功耗低、存储少的优势,使它成为了... 随着边缘智能设备的飞速发展,为了在资源受限的边缘端设备上部署参数和存储需求巨大的深度模型,模型压缩技术显得至关重要.现有的模型压缩主要包含剪枝、量化、知识蒸馏和低秩分解4类,量化凭借推理快、功耗低、存储少的优势,使它成为了边缘端部署的常用技术.然而,已有的量化方法主要关注的是模型量化后的模型精度损失和内存占用情况,而忽略模型量化可能面临的安全性威胁.因此,针对模型量化的安全性研究显得尤为重要.本文首次针对模型量化的安全性问题展开分析,首先定义了模型量化的攻防理论,其次按照模型量化前和模型量化过程中两个阶段对量化攻击方法和量化防御方法进行分析归纳,整理了针对不同攻击任务进行的通用基准数据集与主要评价指标,最后探讨了模型量化的安全性研究及其应用,以及未来潜在研究方向,进一步推动模型量化的安全性研究发展和应用. 展开更多
关键词 模型量化 模型安全 对抗攻击 后门攻击 隐私窃取 公平性 模型防御
在线阅读 下载PDF
基于PLP-net轻量化模型的马铃薯捡拾收获中杂质检测方法 被引量:1
12
作者 潘志国 邱保华 +4 位作者 杨然兵 张还 张健 李莹莹 邓志熙 《农业工程学报》 北大核心 2025年第12期208-218,共11页
针对目前马铃薯杂质检测算法存在的运算量高、内存占用大、实时性差等问题,该研究提出了一种基于PLP-net的轻量化检测模型。首先,通过重构骨干网络架构并优化检测头网络,显著降低模型运算量;其次,引入ECA(efficient channel attention)... 针对目前马铃薯杂质检测算法存在的运算量高、内存占用大、实时性差等问题,该研究提出了一种基于PLP-net的轻量化检测模型。首先,通过重构骨干网络架构并优化检测头网络,显著降低模型运算量;其次,引入ECA(efficient channel attention)注意力机制强化关键特征提取能力,并采用Focal-DIoU损失函数(focal and distance-IoU loss)优化边界框回归过程来解决数据集中杂质样本失衡的问题,构建基础模型PL-net。然后,基于模型稀疏化训练结果,精确剪除冗余通道,有效缩减运算量及内存占用,提升模型实时性,后经微调训练后构建PLP-net轻量化模型。为实现工程化应用,该研究采用TensorRT推理部署框架将PLP-net部署至嵌入式设备,并基于PyQt5(Python Qt5 binding)框架开发了可视化交互系统以满足马铃薯杂质检测的生产需求。试验结果表明:与YOLOv8n模型相比,PLP-net在计算效率方面明显提升,浮点运算量降低7.2 G,模型体积压缩2.1 MB,推理速度提升99.4帧/s。使用TensorRT加速和未使用TensorRT加速的PLP-net模型相较于YOLOv8n分别提升18.4帧/s和11.4帧/s。PLP-net模型可为后续马铃薯杂质智能分拣提供技术支撑。 展开更多
关键词 马铃薯杂质 PLP-net 轻量化 模型剪枝 模型部署
在线阅读 下载PDF
基于改进YOLO 11模型的棉田地表残膜识别方法研究 被引量:1
13
作者 孟庆建 翟志强 +3 位作者 张连朴 吕继东 王虎挺 张若宇 《农业机械学报》 北大核心 2025年第5期17-25,48,共10页
为实现残膜回收机在自然环境中快速、准确地识别棉田地表残膜目标,本文提出了一种基于DCA-YOLO 11轻量化模型的棉田地表残膜识别方法。以4JMLE-210型残膜回收机工作后棉田地表残膜为研究对象,在不同时间段采集地表残膜图像900幅,通过透... 为实现残膜回收机在自然环境中快速、准确地识别棉田地表残膜目标,本文提出了一种基于DCA-YOLO 11轻量化模型的棉田地表残膜识别方法。以4JMLE-210型残膜回收机工作后棉田地表残膜为研究对象,在不同时间段采集地表残膜图像900幅,通过透视变换、图像裁剪、数据清洗、数据增强等预处理,最终得到5215幅残膜样本图像,按照4∶1划分为训练集和测试集,实现了对棉田地表残膜的数据集构建。通过在YOLO 11模型主干网络中增加深度可分离卷积(DWConv)模块代替通用卷积(Conv)模块,用于减少计算复杂度和参数量;通过在输出检测端末尾加入CBAM卷积块注意力机制模块来提高模型的感知能力,减少边缘与背景干扰;通过用ADown模块替换主干网络中的Conv模块,实现残膜特征图不同层之间的下采样,减少特征图空间维度,保留关键信息来提高残膜目标检测准确性。试验结果表明,在复杂自然环境下,DCA-YOLO 11模型精确率P为81.9%,召回率R为80.9%,平均精度均值mAP(重叠率0.5)为86.7%,参数量为2.20×10^(6),处理速度为80 f/s。通过对不同模型进行对比试验,DCA-YOLO 11模型检测精确率比YOLO v10、YOLO v9、YOLO v8分别高2.9、2.3、3.8个百分点,召回率比YOLO v10、YOLO v9、YOLO v8分别高2.0、1.0、1.8个百分点,处理速度比YOLO v9、YOLO v8分别提升12.7%、14.2%,略低于YOLO v10。DCA-YOLO 11模型在保证精度的同时,模型最小,参数量最少,证明其轻量化与优越性。模型通过泛化性试验,其在验证数据集上的检测结果,R^(2)为0.72,平均绝对误差和均方根误差分别为4.92个和2.72个,提出的DCA-YOLO 11轻量化模型泛化性较好。该研究可为残膜回收机械在复杂环境下精准、高效捡拾残膜以及残膜回收机回收率车载视觉估测提供理论依据与数据基础。 展开更多
关键词 残膜识别 YOLO 11模型 目标检测 模型轻量化
在线阅读 下载PDF
数字加速主义的阿喀琉斯之踵——基于大模型发展的哲学反思 被引量:5
14
作者 吴静 《江汉论坛》 北大核心 2025年第1期104-111,共8页
从判别式人工智能到生成式人工智能的发展使得作为技术基底的大语言模型不但引起了空前的关注,也成为科技创新产业竞相追逐的新热点。在内在结构方面,大语言模型虽展现出强大的泛化和涌现能力,但也存在泛化能力差、过度拟合、数据偏差... 从判别式人工智能到生成式人工智能的发展使得作为技术基底的大语言模型不但引起了空前的关注,也成为科技创新产业竞相追逐的新热点。在内在结构方面,大语言模型虽展现出强大的泛化和涌现能力,但也存在泛化能力差、过度拟合、数据偏差等问题,其“涌现”现象也难以预测和控制。同时,大语言模型面临数据抗衰和模型退化的发展瓶颈。随着时间推移,性能受“模型漂移”的影响在多模态、多任务领域明显下降,商业化落地受阻,部分企业的先发优势难以超越。尽管大语言模型的突飞猛进被视为信息社会新阶段的标志,但是其发展面临着有待解决的挑战和限制,以及背后旷日持久的能源和财力消耗。因此,唯有深入研究大语言模型技术的底层逻辑和运行原理,进行针对性测试和评估,批判性地审视其生成的价值逻辑,才能更有针对性地处理大语言模型对社会关系产生的影响,从而更好地解决人机协同及交互界面等问题。 展开更多
关键词 模型 泛化 模型退化 价值
在线阅读 下载PDF
融合知识图谱和大模型的高校科研管理问答系统设计 被引量:5
15
作者 王永 秦嘉俊 +1 位作者 黄有锐 邓江洲 《计算机科学与探索》 北大核心 2025年第1期107-117,共11页
科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科... 科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科研知识图谱。利用同时进行意图分类和实体提取的多任务模型进行语义解析。借助解析结果来生成查询语句,并从知识图谱中检索信息来回复常规问题。将大语言模型与知识图谱相结合,以辅助处理开放性问题。在意图和实体具有关联的数据集上的实验结果表明,采用的多任务模型在意图分类和实体识别任务上的F1值分别为0.958和0.937,优于其他对比模型和单任务模型。Cypher生成测试表明了自定义Prompt在激发大语言模型涌现能力方面的成效,利用大语言模型实现文本生成Cypher的准确率达到85.8%,有效处理了基于知识图谱的开放性问题。采用知识图谱、传统模型和大语言模型搭建的问答系统的准确性为0.935,很好地满足了智能问答的需求。 展开更多
关键词 知识图谱 多任务模型 意图分类 命名实体识别 大语言模型
在线阅读 下载PDF
大模型驱动的矿产资源智能预测超级智能体构建方法探索 被引量:2
16
作者 王永志 温世博 +7 位作者 李博文 陈星宇 董宇浩 田江涛 王斌 Muhammed Atif BILAL 纪政 孙丰月 《地学前缘》 北大核心 2025年第4期38-45,共8页
矿产资源预测是数学地球科学领域的一项重要研究内容,需使用多种软件处理跨专业地学数据,面临处理过程复杂、工作量巨大、语义难对齐等诸多问题,给研究人员带来巨大挑战。随着新一代生成式人工智能的大模型、智能体等出现,极大地推动了... 矿产资源预测是数学地球科学领域的一项重要研究内容,需使用多种软件处理跨专业地学数据,面临处理过程复杂、工作量巨大、语义难对齐等诸多问题,给研究人员带来巨大挑战。随着新一代生成式人工智能的大模型、智能体等出现,极大地推动了各行业的变革性发展,亦赋能矿产资源预测向智能预测跨越。本文提出一种大模型驱动的矿产资源智能预测超级智能体方法,以多模态大模型(如DeepSeek、通义千问)为基础底座,依托通用智能体技术创建由管理智能体和智能体群构成的超级智能体。智能体群包括地质智能体群、地球物理智能体群、地球化学智能体群、遥感智能体群等,每个智能体群含有多个单一智能体或小型智能体群,每个智能体访问具体的工具(本地自定义、网络及自动生成)、数据等。智能预测超级智能体自动感知外界发送的预测要求,由管理智能体串行或并行调用多个智能体群、单一智能体(如生成二维图)、工具(如插值)、访问数据等完成矿产资源智能化预测任务。以地球化学图生成为例,深度剖析通过智能体与大模型交互完成任务的内部运行机制,一键式智能生成一种或多种地球化学图,证明智能计算方法的有效性。通过将大模型、智能体与矿产资源预测业务三者深度融合,在输入为文字或语音时即可完成零代码的预测任务,为创建矿产资源智能预测新范式提供有益探索。 展开更多
关键词 矿产资源预测 智能预测 模型 大语言模型 智能体 超级智能体
在线阅读 下载PDF
基于区块链的大模型数据监管体系设计 被引量:2
17
作者 李守伟 张嘉政 +1 位作者 何海波 陈明辉 《信息安全研究》 北大核心 2025年第8期682-692,共11页
大模型(large model,LM)在自然语言处理、图像、语音识别等领域展现出巨大潜力,成为推动科技革命与社会进步的关键力量.但大模型技术的广泛应用带来了数据隐私风险、数据合规性监管、数据监管活跃性与智能化等挑战.旨在探讨如何利用区... 大模型(large model,LM)在自然语言处理、图像、语音识别等领域展现出巨大潜力,成为推动科技革命与社会进步的关键力量.但大模型技术的广泛应用带来了数据隐私风险、数据合规性监管、数据监管活跃性与智能化等挑战.旨在探讨如何利用区块链技术设计和构建一个有效的大模型数据监管体系促进其健康发展,以应对海量数据应用于大模型所带来的挑战.分析了国内外大模型发展的趋势和现状,指出了大模型数据监管面临的主要挑战,包括数据隐私问题、数据合规性、监管机构难以有效监督等.针对这些挑战提出一种基于区块链技术的数据监管体系设计方案,通过隐私保护、共识算法、激励机制和智能合约4个互相联动的模块实现对大模型数据从原生元数据到输入大模型训练,直至训练后反馈的全周期数据监管.最后总结了区块链技术在大模型数据监管中的应用前景,并对未来大模型数据监管的发展趋势进行了展望. 展开更多
关键词 模型 区块链 模型数据监管 大数据 隐私保护 数据安全
在线阅读 下载PDF
从单智能体到多智能体:大模型智能体支持下的激励型学习活动设计与实证研究 被引量:16
18
作者 黄昌勤 钟益华 +2 位作者 王希哲 韩中美 魏同权 《华东师范大学学报(教育科学版)》 北大核心 2025年第5期44-56,共13页
大模型与智能代理技术的不断进步,使得大模型智能体成为教育领域中实现教与学提质增效的重要新工具。基于大模型智能体的功能定位差异,单一智能体虽然已能够针对各类教与学任务提供诸如内容生成、智能反馈与评估等支持,但单智能体的交... 大模型与智能代理技术的不断进步,使得大模型智能体成为教育领域中实现教与学提质增效的重要新工具。基于大模型智能体的功能定位差异,单一智能体虽然已能够针对各类教与学任务提供诸如内容生成、智能反馈与评估等支持,但单智能体的交互特点、功能属性具有较高同质性,在促进深层次认知发展方面存在一定局限。相比之下,多智能体能够通过模拟多种教育主体角色,提升学习互动的多样性和深度,进而实现更为个性化和深度的学习体验。鉴于智能体在学习过程中的应用主要依靠学习者自发性,为了保障学习活动的有效开展,本研究基于ARCS动机模型分别设计基于单智能体与多智能体的激励型学习活动方案,并面向英语阅读场景开展了准实验研究。实验结果发现:基于多智能体的激励型学习活动相较单智能体能够显著提升学生在推理、评价与应用方面的学习成绩,具有更强的学习动机,且有效促进了其深层次认知发展,尤其是抽象与概括能力。研究证明了多智能体在支持学生深度学习中的价值,为未来进一步探讨多智能体在教育中的应用提供了借鉴。 展开更多
关键词 大语言模型 多智能体 ARCS动机模型 激励型学习活动 深度学习
在线阅读 下载PDF
人工智能何以赋能教师专业发展:理论模型与实践路向 被引量:31
19
作者 黄涛 黄文娟 张振梅 《现代远程教育研究》 北大核心 2025年第1期35-44,共10页
人工智能赋能教师专业发展已成为教育变革的重要议题,然而在当前人工智能助推教师专业发展的实践中,还存在认知、行为与环境等方面的现实阻碍,已有的专业发展模型主要是外源性的,缺乏对教师主体性的观照。在促进教师专业发展过程中,人... 人工智能赋能教师专业发展已成为教育变革的重要议题,然而在当前人工智能助推教师专业发展的实践中,还存在认知、行为与环境等方面的现实阻碍,已有的专业发展模型主要是外源性的,缺乏对教师主体性的观照。在促进教师专业发展过程中,人工智能作为赋能因子的关键在于通过智能技术确定教师所处的发展阶段,消除和减少发展阶段间的各种阻碍因素,达成专业发展进入下一阶段的条件,实现教师专业发展的进阶。以此为切入点从教师主体性的视角,在现有教师专业发展阶段模型中融入人工智能因子构建的人工智能增强型教师专业发展模型(AIeTPD),具备发展计划可定制、发展过程可调控、发展成效可评价的特点,可通过教师学习、智能研修、教学创新三条路径,支持诊断式学习预测、个性化在线学习、混合式智能研修、交互式虚拟教研、孪生式混合课堂、智能化教学反馈以及综合化教师评价等应用场景,促进教师专业发展的阶段演化,重塑教师学习者、互学者、促学者角色,为数字时代大规模个性化教师专业发展提供支撑。 展开更多
关键词 人工智能 教师专业发展 AIeTPD模型 实践场景
在线阅读 下载PDF
糖尿病黄斑水肿抗VEGF治疗后视力获益早期预测模型构建与验证 被引量:1
20
作者 颜宇 钟琴 +3 位作者 陈妍鹏 杨蕾 李港逸 李爽乐 《眼科新进展》 北大核心 2025年第4期298-304,共7页
目的基于临床资料、OCTA、血清脑组织水通道蛋白4(AQP4)mRNA、总胆红素(TBIL)构建糖尿病黄斑水肿(DME)抗血管内皮生长因子(VEGF)治疗后视力获益的早期预测模型,并进行验证。方法选取2021年10月至2024年3月自贡市第一人民医院收治的480例... 目的基于临床资料、OCTA、血清脑组织水通道蛋白4(AQP4)mRNA、总胆红素(TBIL)构建糖尿病黄斑水肿(DME)抗血管内皮生长因子(VEGF)治疗后视力获益的早期预测模型,并进行验证。方法选取2021年10月至2024年3月自贡市第一人民医院收治的480例(480眼)DME患者,按照21分为建模集(320例)、验证集(160例)。将建模集根据抗VEGF治疗后视力获益情况分为获益组(80例)、未获益组(240例)。收集两组患者基线资料,分析DME患者抗VEGF治疗后视力获益的影响因素,构建早期预测模型,并对该模型进行内部、外部验证。结果组间比较结果显示,未获益组患者糖尿病病程长于获益组,吸烟患者占比、最佳矫正视力(BCVA)最小分辨角对数(logMAR)视力、糖化血红蛋白(HbAlc)、AQP4 mRNA均高于获益组,中心凹视网膜深层毛细血管血流密度(DCP-VD)、黄斑中央厚度(CMT)、TBIL均低于获益组(均为P<0.05)。LASSO-Logistic回归分析显示,DME抗VEGF治疗后视力获益的影响因素为CMT、BCVA(logMAR)、HbAlc、AQP4 mRNA、中心凹DCP-VD、TBIL。基于上述影响因素构建的抗VEGF治疗后视力获益的列线图模型的预测风险一致性指数为0.844。受试者工作特征曲线(ROC)显示,该模型在建模集中预测的曲线下面积(AUC)为0.844(95%CI:0.797~0.891),验证集中预测的AUC为0.898(95%CI:0.847~0.949)。决策分析曲线显示,建模集高风险阈值在0~82%,验证集高风险阈值在0~100%时,该模型可带来临床净收益。结论CMT、BCVA(logMAR)、HbAlc、AQP4 mRNA、中心凹DCP-VD、TBIL是DME抗VEGF治疗后视力获益的影响因素,基于此构建的视力获益预测模型准确性、稳定性较高,可作为临床预测治疗后视力获益的有效工具。 展开更多
关键词 糖尿病 黄斑水肿 LASSO-Logistic回归模型 列线图模型 危险因素 影响因素
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部