期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
DeepSeek模型蒸馏的著作权法正当性重勘 被引量:1
1
作者 林秀芹 《知识产权》 北大核心 2025年第4期91-110,共20页
针对AI模型DeepSeek-R1蒸馏引发的著作权纠纷展开法理分析。研究基于蒸馏技术特征与法律要件双重维度,解析知识蒸馏的技术本质——通过模型间参数迁移实现知识迁移的学习方法,其AI创新型训练的本质与技术中立性可以否定著作权侵权的指... 针对AI模型DeepSeek-R1蒸馏引发的著作权纠纷展开法理分析。研究基于蒸馏技术特征与法律要件双重维度,解析知识蒸馏的技术本质——通过模型间参数迁移实现知识迁移的学习方法,其AI创新型训练的本质与技术中立性可以否定著作权侵权的指控。依据《著作权法》及相关原理,论证模型参数作为功能性技术方案不属于著作权保护范畴。通过中、美、欧、日等立法和司法实践中关于机器学习数据合理使用的“文本与数据挖掘例外条款”,揭示当前法律在技术中立原则与权利人利益保护间的制度张力。根据“三步检验法”和“转换性使用”等分析框架研究表明,DeepSeek-R1的蒸馏不构成侵犯著作权,此外,AI模型的蒸馏行为定性应当促进“技术创新—权利保护—公共领域”的动态平衡,为此,应当肯定蒸馏行为的正当性。 展开更多
关键词 模型蒸馏 著作权侵权 合理使用
在线阅读 下载PDF
小样本问题下培训弱教师网络的模型蒸馏模型
2
作者 蔡淳豪 李建良 《计算机应用》 CSCD 北大核心 2022年第9期2652-2658,共7页
针对深度神经网络在图像识别中存在的训练数据不足,以及多模型蒸馏中存在的细节特征丢失和蒸馏计算量大的问题,提出一种小样本问题下培训弱教师网络的模型蒸馏模型。首先通过集成学习算法中的引导聚集(Bagging)算法培训弱教师网络集,在... 针对深度神经网络在图像识别中存在的训练数据不足,以及多模型蒸馏中存在的细节特征丢失和蒸馏计算量大的问题,提出一种小样本问题下培训弱教师网络的模型蒸馏模型。首先通过集成学习算法中的引导聚集(Bagging)算法培训弱教师网络集,在保留图像数据集细节特征的同时进行并行计算以提升网络生成效率;然后融合知识合并算法,并基于弱教师网络特征图形成单个高质量、高复杂度的教师网络,从而获得细节重点更突出的图像特征图;最后在目前先进的模型蒸馏基础上提出了针对组合特征图改进元网络的集成蒸馏模型,该算法在减少了元网络训练计算量的同时实现了小样本数据集对目标网络的训练。实验结果表明,所提模型在准确率上相较于单纯以优质网络为教师网络的蒸馏方案有6.39%的相对改进;比较自适应增强(AdaBoost)算法训练教师网络再加以蒸馏得到的模型和集成蒸馏模型的模型准确率,二者相差在给定误差范围内,而集成蒸馏模型比AdaBoost算法的网络生成速率提升了4.76倍。可见所提模型能有效提高目标模型在小样本问题下的准确率和训练效率。 展开更多
关键词 小样本 模型蒸馏 集成学习 元学习 特征合并
在线阅读 下载PDF
视觉深度学习模型压缩加速综述 被引量:2
3
作者 丁贵广 陈辉 +3 位作者 王澳 杨帆 熊翊哲 梁伊雯 《智能系统学报》 CSCD 北大核心 2024年第5期1072-1081,共10页
近年来,深度学习模型规模越来越大,在嵌入式设备等资源受限环境中,大规模视觉深度学习模型难以实现高效推理部署。模型压缩加速可以有效解决该挑战。尽管已经出现相关工作的综述,但相关工作集中在卷积神经网络的压缩加速,缺乏对视觉Tran... 近年来,深度学习模型规模越来越大,在嵌入式设备等资源受限环境中,大规模视觉深度学习模型难以实现高效推理部署。模型压缩加速可以有效解决该挑战。尽管已经出现相关工作的综述,但相关工作集中在卷积神经网络的压缩加速,缺乏对视觉Transformer模型压缩加速方法的整理和对比分析。因此,本文以视觉深度学习模型压缩技术为核心,对卷积神经网络和视觉Transformer模型2个最重要的视觉深度模型进行了相关技术手段的整理,并对技术热点和挑战进行了总结和分析。本文旨在为研究者提供一个全面了解模型压缩和加速领域的视角,促进深度学习模型压缩加速技术的发展。 展开更多
关键词 视觉深度学习 模型压缩 轻量化结构 模型剪枝 模型量化 模型蒸馏 TRANSFORMER 序列剪枝
在线阅读 下载PDF
θ法应用于原油蒸馏过程模型计算 被引量:1
4
作者 段琴 王雄 徐博文 《系统仿真学报》 CAS CSCD 2001年第z1期117-118,139,共3页
摘 要:选择了θ圆整归一方法应用于原油蒸馏过程稳态模型的计算。实验证明这种方法的应用提高了模型计算中迭代速度,可以达到加速收敛的效果,这种归一圆整的方法完全可以适应原油蒸馏常压塔具有多股进料、多股汽液侧线采出的特点。并... 摘 要:选择了θ圆整归一方法应用于原油蒸馏过程稳态模型的计算。实验证明这种方法的应用提高了模型计算中迭代速度,可以达到加速收敛的效果,这种归一圆整的方法完全可以适应原油蒸馏常压塔具有多股进料、多股汽液侧线采出的特点。并可望应用于原油蒸馏过程动态模型的计算。本文给出了应用于不同平台的仿真结果。 展开更多
关键词 θ法、稳态模型、原油蒸馏
在线阅读 下载PDF
基于网络蒸馏模型的供电接触网支撑装置零部件快速定位方法 被引量:1
5
作者 喻文彬 《城市轨道交通研究》 北大核心 2023年第5期109-112,118,共5页
为确保供电接触网支撑装置具备良好的工作状态,避免支撑装置失效可能造成的严重弓网故障,进而影响列车运行安全,提出一种新型的、适用于小型化嵌入式设备进行部署应用的、基于网络蒸馏技术的深度学习接触网支撑装置快速定位识别模型。... 为确保供电接触网支撑装置具备良好的工作状态,避免支撑装置失效可能造成的严重弓网故障,进而影响列车运行安全,提出一种新型的、适用于小型化嵌入式设备进行部署应用的、基于网络蒸馏技术的深度学习接触网支撑装置快速定位识别模型。网络蒸馏模型是基于双深度学习网络进行指导性学习的,其利用高精度深度学习模型YOLOv5x、YOLOv5l、YOLOv5m作为蒸馏算法中的教师模型,然后利用网络蒸馏技术对复杂模型的特征提取能力进行迁移,以教师模型的类别概率作为软目标并将其用于训练学生模型,从而将知识从复杂模型(教师模型)转移到更高效的小型化模型(学生模型)。研究结果表明,利用网络蒸馏技术可以获得精度高、速度快、模型小、易于部署的接触网支撑装置定位模型。 展开更多
关键词 轨道交通 供电接触网 网络蒸馏模型 零部件定位
在线阅读 下载PDF
一种轻量化的多目标实时检测模型 被引量:5
6
作者 邱博 刘翔 +1 位作者 石蕴玉 尚岩峰 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2020年第9期1778-1785,共8页
为实现公安监控系统内容分析的精准智能及提高服务实战能力,提出一种轻量化的多目标实时检测算法。首先,基于CenterNet检测网络增加了CBNet的多融合阶梯级联结构,有效地解决了主干网络在日常监控中特征提取能力不足的问题;其次,通过模... 为实现公安监控系统内容分析的精准智能及提高服务实战能力,提出一种轻量化的多目标实时检测算法。首先,基于CenterNet检测网络增加了CBNet的多融合阶梯级联结构,有效地解决了主干网络在日常监控中特征提取能力不足的问题;其次,通过模型剪枝压缩网络减少参数量,加快了监控视频分析速度。本文利用部分COCO数据集和自行采集的现场数据进行训练与测试,并与其他主流检测算法(YOLO、Faster-RCNN、SSD等)进行消融实验。实验结果表明:所提模型在公共安全监控中能有效地做到速度与精度的均衡,并具有较强的普适性。 展开更多
关键词 目标检测 深度学习 模型压缩 模型蒸馏 级联融合
在线阅读 下载PDF
黄土高原丘陵沟壑区不同水体间转化特征--以韭园沟流域为例 被引量:8
7
作者 王贺 李占斌 +2 位作者 马波 肖俊波 张乐涛 《中国水土保持科学》 CSCD 北大核心 2016年第3期19-25,共7页
为研究黄土高原丘陵沟壑区降水、地表水和地下水间的转化特征,以绥德县韭园沟流域作为研究对象,通过测定雨水、沟道水和井水的氢氧同位素组成,分析各水体的δD-δ18O特征、氢氧同位素的时间变化和沿程变化,明确各不同水体间的补给关系,... 为研究黄土高原丘陵沟壑区降水、地表水和地下水间的转化特征,以绥德县韭园沟流域作为研究对象,通过测定雨水、沟道水和井水的氢氧同位素组成,分析各水体的δD-δ18O特征、氢氧同位素的时间变化和沿程变化,明确各不同水体间的补给关系,估算流域上游沟道水补给井水的过程中因蒸发损失的水量。结果表明:韭园沟流域沟道水和井水的δD和δ18O之间具有良好的线性关系;井水氢氧同位素相对于沟道水较富集且稳定,降水、气温、风速等气象因子对沟道水氢氧同位素影响强烈,对井水影响较弱;流域沟道水与井水均来源于大气降水,能够有效补给地下水的大气降水氢氧同位素加权平均值为:δ18O=-11‰,δD=-79.80‰;沟道水向井水的转化以单向排泄补给为主,两者转化过程中由于蒸发作用引起的水量损失占补给源水量的7%。 展开更多
关键词 氢氧同位素 地表水 地下水 瑞利蒸馏模型 黄土高原 丘陵沟壑区 韭园沟
在线阅读 下载PDF
微乳化乙醇柴油燃料单液滴的蒸发特性研究 被引量:4
8
作者 胡鹏 孙平 +2 位作者 梅德清 邬齐敏 张敏 《内燃机工程》 EI CAS CSCD 北大核心 2013年第3期9-14,共6页
微乳化乙醇柴油是一种多组分燃料,与柴油的蒸发特性存在不同。对于直径范围为20~30μm的微乳化乙醇柴油液滴,在对流比较强的情况下可以采用蒸馏曲线模型建立其单液滴蒸发模型。通过计算获得环境温度、环境压力及液滴溶醇量对单液滴蒸... 微乳化乙醇柴油是一种多组分燃料,与柴油的蒸发特性存在不同。对于直径范围为20~30μm的微乳化乙醇柴油液滴,在对流比较强的情况下可以采用蒸馏曲线模型建立其单液滴蒸发模型。通过计算获得环境温度、环境压力及液滴溶醇量对单液滴蒸发特性的影响规律。计算结果表明:随着环境温度升高,液滴升温速率加快,液滴的平衡温度上升,液滴寿命缩短;在温度相对较低的环境中,微乳化油液滴寿命随环境压力的增大而延长;在环境温度500K、环境压力1.0MPa情况下,随着液滴溶醇量增加,液滴寿命缩短,但液滴瞬态加热时间和平衡温度基本没有变化。 展开更多
关键词 内燃机 液滴 蒸发 微乳化乙醇柴油 多组分 蒸馏曲线模型
在线阅读 下载PDF
GAN图像对抗样本生成方法 被引量:8
9
作者 王曙燕 金航 孙家泽 《计算机科学与探索》 CSCD 北大核心 2021年第4期702-711,共10页
为了提高生成对抗网络模型对抗样本的多样性和攻击成功率,提出了一种GAN图像对抗样本生成方法。首先,利用原始样本集整体训练一个深度卷积对抗生成网络G1,模拟原始样本集分布;其次,在黑盒攻击场景下,利用模型蒸馏方法对目标模型进行黑... 为了提高生成对抗网络模型对抗样本的多样性和攻击成功率,提出了一种GAN图像对抗样本生成方法。首先,利用原始样本集整体训练一个深度卷积对抗生成网络G1,模拟原始样本集分布;其次,在黑盒攻击场景下,利用模型蒸馏方法对目标模型进行黑盒复制,获取目标模型的本地复制;然后以G1的输出作为输入,以蒸馏模型作为目标模型,训练生成对抗网络G2,在有目标攻击情况下还需输入目标类别,G2用以生成输入数据针对目标类别的扰动;最后将样本与扰动相加并以像素灰度值区间进行规范化,得到对抗样本。实验结果表明,在相同输入条件下该方法产生图像对抗样本平均SSIM指标、MI指标和Cosin相似度分别降低50.7%、10.96%和28.7%,平均均方误差值(MSE)和图像指纹的海明距离分别提升7.6%和1974.80,同时MNIST数据集和CIFAR10数据集下模型平均攻击成功率在95%以上。 展开更多
关键词 神经网络 对抗样本 生成对抗网络(GAN) 模型蒸馏 图像多样性
在线阅读 下载PDF
基于全局指针限定窗口的中文医学实体识别
10
作者 仇家康 张卫山 +2 位作者 陈涛 张宝宇 朱宜昌 《计算机工程与设计》 2025年第9期2586-2591,共6页
针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减... 针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减少长冗余负样本对模型训练的干扰。为降低模型对样本顺序的敏感性,采用最优自蒸馏策略,使模型学习到更高质量的知识和特征表示。实验结果表明,该模型在4个公开数据集上的性能均显著高于基线模型。 展开更多
关键词 实体识别 中文医学 模型蒸馏 文本挖掘 全局指针 神经网络 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部