期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
JADE-DB:基于靶向变异的大语言模型安全通用基准测试集
被引量:
2
1
作者
张谧
潘旭东
杨珉
《计算机研究与发展》
EI
CSCD
北大核心
2024年第5期1113-1127,共15页
提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十...
提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十余款国内外知名大语言模型的安全防护机制.根据语言复杂性差异,JADE-DB包含基础、进阶、高危3个安全测试等级,共计上千条覆盖违法犯罪、侵犯权益、歧视偏见和核心价值观4大类违规主题、30多种违规主题的通用测试问题,其中针对国内开源(中文,8款)、国内商用(中文,6款)和国外商用大语言模型(英文,4款)这3组大语言模型分别构建的3款通用高危测试集,可造成每组模型在高危测试集上的平均违规率均超过70%,测试问题均可同时触发多款模型违规生成.这表明,语言的复杂性导致现有大语言模型难以学习到人类无穷多种表达方式,因此无法识别其中不变的违规本质.
展开更多
关键词
生成式人工智能
安全
大语言
模型
大语言模型安全
评测
人工智能
安全
自然
语言
处理
在线阅读
下载PDF
职称材料
建筑施工安全领域大语言模型构建思路与方法研究
2
作者
赵磊
武彦清
+1 位作者
周大伟
潘鹏
《土木工程学报》
北大核心
2025年第10期144-152,共9页
建筑施工安全是建筑业高质量发展的重要保障,直接关系到人民群众的生命和财产安全,是实现我国国民经济可持续发展、促进社会和谐稳定的基础。大语言模型技术的迅猛发展,不断推动新质生产力的形成和提升,其强大的泛化性、通用性、推理能...
建筑施工安全是建筑业高质量发展的重要保障,直接关系到人民群众的生命和财产安全,是实现我国国民经济可持续发展、促进社会和谐稳定的基础。大语言模型技术的迅猛发展,不断推动新质生产力的形成和提升,其强大的泛化性、通用性、推理能力和涌现特性为提升施工安全管理提供了前所未有的机遇。针对建筑施工安全行业的数字化转型需求,文章深入分析了大语言模型技术在该领域应用时所面临的独特挑战,并提出了建设性的解决方案。同时,文章还探讨了建筑施工安全大模型的具体应用场景,以期为行业深化数字化转型和智能化升级提供思路和技术参考。
展开更多
关键词
人工智能
施工
安全
建筑施工
安全
大语言
模型
安全
隐患智能预警
在线阅读
下载PDF
职称材料
基于情感和认知协同的道德判断方法
被引量:
1
3
作者
吴迪
赵妍妍
秦兵
《计算机研究与发展》
EI
CSCD
北大核心
2024年第5期1193-1205,共13页
随着大语言模型的迅速发展,大语言模型的安全性逐渐引起了研究者和公众的密切关注.为了防止大语言模型在与人类协作中对人类产生伤害,如何确保大语言模型在日常场景中的判断能与人类道德观念相符成为了一个重要问题.其中一个关键的挑战...
随着大语言模型的迅速发展,大语言模型的安全性逐渐引起了研究者和公众的密切关注.为了防止大语言模型在与人类协作中对人类产生伤害,如何确保大语言模型在日常场景中的判断能与人类道德观念相符成为了一个重要问题.其中一个关键的挑战是,如何确保大语言模型在道德判断方面,能够像人类那样,针对不同的情境,灵活地调整或重新考虑预定的规则,从而使其判断与人类的道德观念保持一致.受心理学和认知科学中关于人类道德判断的情感和认知影响因素研究的启发,结合大语言模型在认知推理和情感分析能力上的优势,设计了一种模仿人类道德判断过程中情感判断和认知判断能力交互的方法,从而提升了大语言模型的道德判断表现.实验结果证明了所提方法在该任务上的有效性.总的来说,不仅为大语言模型的道德判断提供了一种创新的方法,也强调了心理学与认知科学理论在此领域的重要性,为未来的进一步研究奠定基础.
展开更多
关键词
道德判断
大语言模型安全
认知判断能力
情感判断能力
提示学习
在线阅读
下载PDF
职称材料
题名
JADE-DB:基于靶向变异的大语言模型安全通用基准测试集
被引量:
2
1
作者
张谧
潘旭东
杨珉
机构
复旦大学计算机科学技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第5期1113-1127,共15页
基金
国家重点研发计划(2021YFB3101200)
国家自然科学基金项目(61972099,U1736208,U1836210,U1836213,62172104,62172105,61902374,62102093,62102091)。
文摘
提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十余款国内外知名大语言模型的安全防护机制.根据语言复杂性差异,JADE-DB包含基础、进阶、高危3个安全测试等级,共计上千条覆盖违法犯罪、侵犯权益、歧视偏见和核心价值观4大类违规主题、30多种违规主题的通用测试问题,其中针对国内开源(中文,8款)、国内商用(中文,6款)和国外商用大语言模型(英文,4款)这3组大语言模型分别构建的3款通用高危测试集,可造成每组模型在高危测试集上的平均违规率均超过70%,测试问题均可同时触发多款模型违规生成.这表明,语言的复杂性导致现有大语言模型难以学习到人类无穷多种表达方式,因此无法识别其中不变的违规本质.
关键词
生成式人工智能
安全
大语言
模型
大语言模型安全
评测
人工智能
安全
自然
语言
处理
Keywords
generative AI safety
large language models
safety evaluation for large language models
AI safety
natural language processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
建筑施工安全领域大语言模型构建思路与方法研究
2
作者
赵磊
武彦清
周大伟
潘鹏
机构
清华大学
北京构力科技有限公司
中建三局集团有限公司
住房城乡建设部数字建造与孪生重点实验室
出处
《土木工程学报》
北大核心
2025年第10期144-152,共9页
文摘
建筑施工安全是建筑业高质量发展的重要保障,直接关系到人民群众的生命和财产安全,是实现我国国民经济可持续发展、促进社会和谐稳定的基础。大语言模型技术的迅猛发展,不断推动新质生产力的形成和提升,其强大的泛化性、通用性、推理能力和涌现特性为提升施工安全管理提供了前所未有的机遇。针对建筑施工安全行业的数字化转型需求,文章深入分析了大语言模型技术在该领域应用时所面临的独特挑战,并提出了建设性的解决方案。同时,文章还探讨了建筑施工安全大模型的具体应用场景,以期为行业深化数字化转型和智能化升级提供思路和技术参考。
关键词
人工智能
施工
安全
建筑施工
安全
大语言
模型
安全
隐患智能预警
Keywords
artificial intelligence
construction safety
building construction safety large language model
safety hazard intelligent early warning
分类号
X947 [环境科学与工程—安全科学]
在线阅读
下载PDF
职称材料
题名
基于情感和认知协同的道德判断方法
被引量:
1
3
作者
吴迪
赵妍妍
秦兵
机构
社会计算与信息检索研究中心(哈尔滨工业大学)
认知智能与内容安全教育部重点实验室(哈尔滨工业大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第5期1193-1205,共13页
文摘
随着大语言模型的迅速发展,大语言模型的安全性逐渐引起了研究者和公众的密切关注.为了防止大语言模型在与人类协作中对人类产生伤害,如何确保大语言模型在日常场景中的判断能与人类道德观念相符成为了一个重要问题.其中一个关键的挑战是,如何确保大语言模型在道德判断方面,能够像人类那样,针对不同的情境,灵活地调整或重新考虑预定的规则,从而使其判断与人类的道德观念保持一致.受心理学和认知科学中关于人类道德判断的情感和认知影响因素研究的启发,结合大语言模型在认知推理和情感分析能力上的优势,设计了一种模仿人类道德判断过程中情感判断和认知判断能力交互的方法,从而提升了大语言模型的道德判断表现.实验结果证明了所提方法在该任务上的有效性.总的来说,不仅为大语言模型的道德判断提供了一种创新的方法,也强调了心理学与认知科学理论在此领域的重要性,为未来的进一步研究奠定基础.
关键词
道德判断
大语言模型安全
认知判断能力
情感判断能力
提示学习
Keywords
moral judgement
large language model safety
cognitive judgment capability
emotional judgment capability
prompt learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
JADE-DB:基于靶向变异的大语言模型安全通用基准测试集
张谧
潘旭东
杨珉
《计算机研究与发展》
EI
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
2
建筑施工安全领域大语言模型构建思路与方法研究
赵磊
武彦清
周大伟
潘鹏
《土木工程学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
3
基于情感和认知协同的道德判断方法
吴迪
赵妍妍
秦兵
《计算机研究与发展》
EI
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部