期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
JADE-DB:基于靶向变异的大语言模型安全通用基准测试集 被引量:2
1
作者 张谧 潘旭东 杨珉 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1113-1127,共15页
提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十... 提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十余款国内外知名大语言模型的安全防护机制.根据语言复杂性差异,JADE-DB包含基础、进阶、高危3个安全测试等级,共计上千条覆盖违法犯罪、侵犯权益、歧视偏见和核心价值观4大类违规主题、30多种违规主题的通用测试问题,其中针对国内开源(中文,8款)、国内商用(中文,6款)和国外商用大语言模型(英文,4款)这3组大语言模型分别构建的3款通用高危测试集,可造成每组模型在高危测试集上的平均违规率均超过70%,测试问题均可同时触发多款模型违规生成.这表明,语言的复杂性导致现有大语言模型难以学习到人类无穷多种表达方式,因此无法识别其中不变的违规本质. 展开更多
关键词 生成式人工智能安全 大语言模型 大语言模型安全评测 人工智能安全 自然语言处理
在线阅读 下载PDF
建筑施工安全领域大语言模型构建思路与方法研究
2
作者 赵磊 武彦清 +1 位作者 周大伟 潘鹏 《土木工程学报》 北大核心 2025年第10期144-152,共9页
建筑施工安全是建筑业高质量发展的重要保障,直接关系到人民群众的生命和财产安全,是实现我国国民经济可持续发展、促进社会和谐稳定的基础。大语言模型技术的迅猛发展,不断推动新质生产力的形成和提升,其强大的泛化性、通用性、推理能... 建筑施工安全是建筑业高质量发展的重要保障,直接关系到人民群众的生命和财产安全,是实现我国国民经济可持续发展、促进社会和谐稳定的基础。大语言模型技术的迅猛发展,不断推动新质生产力的形成和提升,其强大的泛化性、通用性、推理能力和涌现特性为提升施工安全管理提供了前所未有的机遇。针对建筑施工安全行业的数字化转型需求,文章深入分析了大语言模型技术在该领域应用时所面临的独特挑战,并提出了建设性的解决方案。同时,文章还探讨了建筑施工安全大模型的具体应用场景,以期为行业深化数字化转型和智能化升级提供思路和技术参考。 展开更多
关键词 人工智能 施工安全 建筑施工安全大语言模型 安全隐患智能预警
在线阅读 下载PDF
基于情感和认知协同的道德判断方法 被引量:1
3
作者 吴迪 赵妍妍 秦兵 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1193-1205,共13页
随着大语言模型的迅速发展,大语言模型的安全性逐渐引起了研究者和公众的密切关注.为了防止大语言模型在与人类协作中对人类产生伤害,如何确保大语言模型在日常场景中的判断能与人类道德观念相符成为了一个重要问题.其中一个关键的挑战... 随着大语言模型的迅速发展,大语言模型的安全性逐渐引起了研究者和公众的密切关注.为了防止大语言模型在与人类协作中对人类产生伤害,如何确保大语言模型在日常场景中的判断能与人类道德观念相符成为了一个重要问题.其中一个关键的挑战是,如何确保大语言模型在道德判断方面,能够像人类那样,针对不同的情境,灵活地调整或重新考虑预定的规则,从而使其判断与人类的道德观念保持一致.受心理学和认知科学中关于人类道德判断的情感和认知影响因素研究的启发,结合大语言模型在认知推理和情感分析能力上的优势,设计了一种模仿人类道德判断过程中情感判断和认知判断能力交互的方法,从而提升了大语言模型的道德判断表现.实验结果证明了所提方法在该任务上的有效性.总的来说,不仅为大语言模型的道德判断提供了一种创新的方法,也强调了心理学与认知科学理论在此领域的重要性,为未来的进一步研究奠定基础. 展开更多
关键词 道德判断 大语言模型安全 认知判断能力 情感判断能力 提示学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部