期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
大语言模型的技术应用前景与风险挑战 被引量:25
1
作者 徐月梅 胡玲 +2 位作者 赵佳艺 杜宛泽 王文清 《计算机应用》 CSCD 北大核心 2024年第6期1655-1662,共8页
针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative P... 针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。 展开更多
关键词 大语言模型 风险挑战 技术监管 应用前景 通用人工智能
在线阅读 下载PDF
大语言模型的偏见挑战:识别、评估与去除 被引量:1
2
作者 徐月梅 叶宇齐 何雪怡 《计算机应用》 北大核心 2025年第3期697-708,共12页
针对大语言模型(LLM)输出内容存在偏见而导致LLM不安全和不可控的问题,从偏见识别、偏见评估和偏见去除3个角度出发深入梳理和分析现有LLM偏见的研究现状、技术与局限。首先,概述LLM的三大关键技术,从中分析LLM不可避免存在内隐偏见(Int... 针对大语言模型(LLM)输出内容存在偏见而导致LLM不安全和不可控的问题,从偏见识别、偏见评估和偏见去除3个角度出发深入梳理和分析现有LLM偏见的研究现状、技术与局限。首先,概述LLM的三大关键技术,从中分析LLM不可避免存在内隐偏见(Intrinsic Bias)的根本原因;其次,总结现有LLM存在的语言偏见、人口偏见和评估偏见三类偏见类型,并分析这些偏见的特点和原因;再次,系统性回顾现有LLM偏见的评估基准,并探讨这些通用型评估基准、特定语言评估基准以及特定任务评估基准的优点及局限;最后,从模型去偏和数据去偏2个角度出发深入分析现有LLM去偏技术,并指出它们的改进方向,同时,分析指出LLM偏见研究的3个方向:偏见的多文化属性评估、轻量级的偏见去除技术以及偏见可解释性的增强。 展开更多
关键词 大语言模型 偏见溯源 偏见识别 偏见评估 偏见去除
在线阅读 下载PDF
一种基于情感特征表示的跨语言文本情感分析模型 被引量:5
3
作者 徐月梅 施灵雨 蔡连侨 《中文信息学报》 CSCD 北大核心 2022年第2期129-141,共13页
基于深度学习的跨语言情感分析模型需要借助预训练的双语词嵌入(Bilingual Word Embedding, BWE)词典获得源语言和目标语言的文本向量表示。为了解决BWE词典较难获得的问题,该文提出一种基于词向量情感特征表示的跨语言文本情感分析方法... 基于深度学习的跨语言情感分析模型需要借助预训练的双语词嵌入(Bilingual Word Embedding, BWE)词典获得源语言和目标语言的文本向量表示。为了解决BWE词典较难获得的问题,该文提出一种基于词向量情感特征表示的跨语言文本情感分析方法,引入源语言的情感监督信息以获得源语言情感感知的词向量表示,使得词向量的表示兼顾语义信息和情感特征信息,用于跨语言文本的情感预测。实验以英语为源语言,分别以汉语、法语、德语、日语、韩语和泰语6种语言为目标语言进行跨语言情感分析。实验结果表明,该文所提模型与机器翻译方法、不采用情感特征表示的跨语言情感分析方法比较,能够分别提高约9.3%和8.7%预测准确率。该模型在德语上的跨语言情感分析效果最好,英语与德语同属日耳曼语族,在语法和语义上更为接近,符合实验预期。实验部分对影响跨语言情感分析模型的相关因素进行了分析。 展开更多
关键词 跨语言情感分析 情感感知 生成对抗网络
在线阅读 下载PDF
大语言模型与多语言智能的研究进展与启示 被引量:19
4
作者 徐月梅 胡玲 +2 位作者 赵佳艺 杜宛泽 王文清 《计算机应用》 CSCD 北大核心 2023年第S02期1-8,共8页
针对大语言模型(LLM)在高资源语言上表现优异而在低资源语言上表现欠佳的现状,深入分析LLM在多语言场景下的研究现状、技术与局限。首先,从2018年至今以Multi-BERT(multi-lingual Bidirectional Encoder Representations from Transform... 针对大语言模型(LLM)在高资源语言上表现优异而在低资源语言上表现欠佳的现状,深入分析LLM在多语言场景下的研究现状、技术与局限。首先,从2018年至今以Multi-BERT(multi-lingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-trained Transformer)等语言模型为代表,综述LLM的发展脉络;然后,具体分析了大语言模型在多语言智能上的探索,总结现有LLM在多语言智能的研究局限及其改进方向;最后,探讨LLM未来的多语言智能应用场景。分析指出现有LLM受限于多语言训练语料不均衡,存在语言文化的伦理偏见、语言模型的风格趋同化、多语言能力评估基准缺乏以及多语言场景下的模型幻象输出等问题,未来可采用同一语系家族语言的联合训练、多语言适配器技术、跨语言迁移学习技术、提示语工程技术、基于人工智能反馈的强化学习技术等策略实现多语言智能的LLM。 展开更多
关键词 大语言模型 多语言智能 跨语言模型 通用人工智能 迁移学习
在线阅读 下载PDF
一种面向医疗健康领域知识图谱的可扩展系统架构的研究 被引量:7
5
作者 盛明 陈玉思 +3 位作者 张勇 韩光洁 黄天昊 刑春晓 《小型微型计算机系统》 CSCD 北大核心 2019年第10期2150-2154,共5页
随着医学的信息化发展和临床信息数据量的大规模增长,知识图谱在医学领域发挥着越来越重要的作用.医学领域是高度专业化的,同时具有丰富而多样的高质量医学概念资源,并且有很多专业的子领域,如心血管疾病领域,糖尿病领域等.由于数据获... 随着医学的信息化发展和临床信息数据量的大规模增长,知识图谱在医学领域发挥着越来越重要的作用.医学领域是高度专业化的,同时具有丰富而多样的高质量医学概念资源,并且有很多专业的子领域,如心血管疾病领域,糖尿病领域等.由于数据获取的困难以及来自疾病领域的先验知识的缺乏,一次性构建涵盖所有疾病领域的医疗健康知识图谱是十分困难的.提出了一个面向疾病领域可扩展的医疗健康知识图谱构建系统架构.它基于先验的医学知识、医院电子病例(EMR)和供医生使用的工具,构建面向特定疾病领域的知识图谱,以解决上述问题.还提出了应用这个系统架构将现有疾病领域知识图谱扩展到新疾病领域知识图谱的详细过程.经证实,使用该系统架构,医生可以方便有效地获得高度专业化的医疗健康知识图谱. 展开更多
关键词 健康知识图谱 可扩展性 概念图谱 实例图谱
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部