期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于生成式语言模型的立场检测探究
1
作者 张袁硕 李澳华 +3 位作者 陈波 尹召宁 王潘怡 赵小兵 《中文信息学报》 北大核心 2025年第3期139-147,共9页
近年来,立场检测任务受到越来越多的关注,但相关标注数据在范围和规模上都有限,不能有效支撑基于神经网络的立场检测。为此,该文探索在零样本/少样本场景下生成式语言模型在立场检测任务上的能力。首先,构建了一个全新的面向立场检测的... 近年来,立场检测任务受到越来越多的关注,但相关标注数据在范围和规模上都有限,不能有效支撑基于神经网络的立场检测。为此,该文探索在零样本/少样本场景下生成式语言模型在立场检测任务上的能力。首先,构建了一个全新的面向立场检测的数据集,包含5个主题,共2500个人工标注样例;然后,在此数据集上进行了一系列探索实验,实验结果表明,生成式语言模型在零样本设定下,采用结构化的提示学习表现良好;增加额外信息能够显著提升模型性能;在少样本设定下,提供相同目标的示例能够明显提升模型性能,而不同目标示例产生了负面作用;使用思维链可以显著提升模型性能;受提示学习的启发,微调预训练语言模型进一步论证提供额外信息对立场检测的增益显著。 展开更多
关键词 生成式语言模型 立场检测 零样本/少样本 提示学习
在线阅读 下载PDF
基于生成式大语言模型的非遗文本嵌套命名实体识别研究
2
作者 张逸勤 邓三鸿 王东波 《现代情报》 北大核心 2025年第10期26-38,共13页
[目的/意义]本研究探索生成式大语言模型在非物质文化遗产文本嵌套命名实体识别中的应用,以提高特定领域复杂文本中多层次实体的识别精度。[方法/过程]研究对比了GPT-4、Claude 3.5 Sonnet、Chat-GLM2-6b等多种生成式大语言模型与BERT+G... [目的/意义]本研究探索生成式大语言模型在非物质文化遗产文本嵌套命名实体识别中的应用,以提高特定领域复杂文本中多层次实体的识别精度。[方法/过程]研究对比了GPT-4、Claude 3.5 Sonnet、Chat-GLM2-6b等多种生成式大语言模型与BERT+GlobalPointer基线模型的性能,并设计了思维链与行为推理模式两种提示工程技术,以优化模型在复杂上下文中的识别能力。[结果/结论]GPT-4模型采用行为推理模式时表现最佳,Qwen2-72B模型达到91.16%的最高F1值,展现出优异的领域适应性。研究验证了生成式大语言模型在非遗文本嵌套实体识别中的应用潜力,然而在处理长文本和复杂嵌套结构时仍存在计算资源需求高、推理速度慢等挑战。未来,研究将通过混合模型或多任务学习框架,融合BERT模型的稳定性与生成式大语言模型的灵活性以提升识别性能。 展开更多
关键词 生成式语言模型 嵌套实体识别 数字人文 非物质文化遗产 文本挖掘
在线阅读 下载PDF
生成式大语言模型能有效实现对话式教学吗 被引量:5
3
作者 颜士刚 胡修磊 李文光 《现代远程教育研究》 北大核心 2025年第2期52-61,72,共11页
生成式大语言模型从形式上实现了人与机器的自然对话,使古老的对话式教学成为现实可能,因此其自问世以来便受到教育界广为推崇。为了更好地了解生成式大语言模型在对话式教学应用中的适用性,有必要从其工作原理出发探索其在教育应用中... 生成式大语言模型从形式上实现了人与机器的自然对话,使古老的对话式教学成为现实可能,因此其自问世以来便受到教育界广为推崇。为了更好地了解生成式大语言模型在对话式教学应用中的适用性,有必要从其工作原理出发探索其在教育应用中的固有困难,以寻求其赋能对话式教学的适切路径。作为一种基于大规模语料库训练而具有自然语言对话能力的人工神经网络应用,生成式大语言模型本质上是一种基于数据处理的“聊天机器人”,本身存在缺乏理解能力、知识立场不坚定、语言仅是生成而非创造、难以满足个别化学习需求等固有困难。因此,无论从知识传授还是情感培养方面看,生成式大语言模型自身均因受到特定价值取向影响、缺乏策略性引导、难以做到因材施教而无法达成对话式教学的理想效果。即便如此,生成式大语言模型仍能为对话式教学提供适宜的应用场景,如为客观性知识类教学问题提供高效信息咨询服务,基于海量大数据为语言教学提供精准模拟和纠错服务,以及针对常规教学活动提供一般性的参考框架、范式或提纲等。 展开更多
关键词 人工智能 生成式语言模型 对话式教学 个别化教学
在线阅读 下载PDF
面向中医药领域专业能力的生成式大语言模型对比研究 被引量:1
4
作者 张童 王一凡 +3 位作者 王若佳 田甜 闫占峰 郭凤英 《中华中医药学刊》 北大核心 2025年第10期19-27,I0002,共10页
目的 评价大语言模型在中医药领域的知识能力与临床能力。方法 采用文献研究和实验研究方法,选择9个不同类别的大语言模型,构建知识能力和临床能力数据集,设计中医专业能力prompt,采用自动评估法与专家打分法对大语言模型进行测评,使用... 目的 评价大语言模型在中医药领域的知识能力与临床能力。方法 采用文献研究和实验研究方法,选择9个不同类别的大语言模型,构建知识能力和临床能力数据集,设计中医专业能力prompt,采用自动评估法与专家打分法对大语言模型进行测评,使用方差分析、多重比较方法对比分析大语言模型的医学专业能力水平。结果 在知识能力评价中,零一万物(78.93)、智谱清言(77.91)、通义千问(77.22)表现最好,不同模型、不同科目、不同类型模型的知识能力得分差异具有显著性(P<0.05)。在临床能力评价中,各模型生成回复的易读性较高(81.00),但正确性较低(74.86),其中文心一言的平均得分最高(85.40),5个维度分数均达到优秀水平(≥80);不同类型模型的临床能力得分差异具有显著性。结论 通用大语言模型在泛化性、易读性、安全性方面具有优势,医学大语言模型在中医专科和中医问诊方面整体表现良好,未来大语言模型在中医药领域的应用具有广泛的发展前景。 展开更多
关键词 生成式语言模型 中医药领域 专业能力 对比
在线阅读 下载PDF
生成式大语言模型的社会认知风险与应对 被引量:4
5
作者 马忠 高怡英 《浙江社会科学》 北大核心 2025年第2期95-105,158,共12页
生成式大语言模型是当前人工智能技术的一种主要新形态,作为一种新的语言形式,不可避免地引发了知识生产的变革、认知结构的嵌入及社会认知的重塑。综观人类科技史,任何新技术的诞生在带来革命性进步的同时,由于技术本身对传统生产方式... 生成式大语言模型是当前人工智能技术的一种主要新形态,作为一种新的语言形式,不可避免地引发了知识生产的变革、认知结构的嵌入及社会认知的重塑。综观人类科技史,任何新技术的诞生在带来革命性进步的同时,由于技术本身对传统生产方式的颠覆性及实践层面的制度滞后性,必然会带来一定的技术风险。同样,生成式大语言模型在新技术深度赋能新发展的同时,不可避免地产生诸如数据平等、数字孤立、数字鸿沟、算法控制等新问题,在社会认知领域则有可能带来认知倾向的技术操控、社会认知的虚假状态、数字帝国主义的加深等风险。这些风险的产生原因在于技术差异、黑箱逻辑和数据选择所导致的算力不平等、算法不透明和数据局限性。为此要从技术、制度和应用等多个层面入手,通过多元共享打破话语垄断,以制度框架防范潜在风险,提升全民素养以弥合数字鸿沟,确保技术、社会和责任之间的平衡,使人工智能更好服务人类发展。 展开更多
关键词 生成式语言模型 社会认知 风险 人工智能
在线阅读 下载PDF
生成式大语言模型用于超声医学进展
6
作者 陈璐 张明博 罗渝昆 《中国医学影像技术》 北大核心 2025年第6期1005-1008,共4页
生成式大语言模型(GLLM)的快速发展在影像医学研究中备受关注,尤其在超声医学应用中展现出潜力。目前GLLM已具有执业医师的理论水平,可通过生成可靠的结构化超声报告和辅助性诊断意见而提高工作效率,对于降低时间成本和提高医患沟通效... 生成式大语言模型(GLLM)的快速发展在影像医学研究中备受关注,尤其在超声医学应用中展现出潜力。目前GLLM已具有执业医师的理论水平,可通过生成可靠的结构化超声报告和辅助性诊断意见而提高工作效率,对于降低时间成本和提高医患沟通效果等具有一定价值。本文就GLLM在超声医学知识问答、生成结构化超声报告、诊断和管理疾病等的研究现状进行综述。 展开更多
关键词 超声检查 生成式语言模型 结构化报告 知识问答
在线阅读 下载PDF
基于生成式LLM的开源情报分析方法
7
作者 成磊峰 罗吉 +2 位作者 王磊 朱敏 陶思彤 《电讯技术》 北大核心 2025年第10期1545-1550,共6页
针对开源情报分析中网页信息提取问答问题,提出一种融合生成式大语言模型(Large Language Model,LM)、XPath与检索增强生成(Retrieval-Augmented Generation,RAG)的方法,涉及动态模板化提示策略与多粒度语义检索。动态模板基于情报类型... 针对开源情报分析中网页信息提取问答问题,提出一种融合生成式大语言模型(Large Language Model,LM)、XPath与检索增强生成(Retrieval-Augmented Generation,RAG)的方法,涉及动态模板化提示策略与多粒度语义检索。动态模板基于情报类型生成领域知识约束提示,提升实体提取精度;多粒度检索构建文档-段落-实体三级体系,结合BERT-Topk算法优化长文本信息定位。通过OpenKG知识库对齐实体构建属性-关系-事件三维网络,增强复杂事件逻辑分析。该方法在ClueWeb22与TAC-KBP2022数据集上的提取率为0.85,回答准确率为0.78,相比传统RAG,性能提升18%~31%。实际应用中,热点事件简报关键事实准确率达92%,综合成本仅为GPT-4的12%。 展开更多
关键词 开源情报分析 网页信息提取 生成式语言模型 检索增强生成
在线阅读 下载PDF
采用低秩编码优化大语言模型的高校基础知识问答研究 被引量:3
8
作者 骆仕杰 金日泽 韩抒真 《计算机科学与探索》 CSCD 北大核心 2024年第8期2156-2168,共13页
在高等教育领域,基础知识问答系统对学生学术成就提升及教育资源公平分配具有重要作用。近年来已有基于预训练语言模型上使用机器阅读理解和文本相似度匹配的问答技术,在处理复杂的自然语言问题时仍然面临因训练数据不足、模型泛化能力... 在高等教育领域,基础知识问答系统对学生学术成就提升及教育资源公平分配具有重要作用。近年来已有基于预训练语言模型上使用机器阅读理解和文本相似度匹配的问答技术,在处理复杂的自然语言问题时仍然面临因训练数据不足、模型泛化能力限制等瓶颈导致的回答质量和准确性不足的情况。本研究旨在解决如何在降低资源消耗的同时,提升基础知识问答系统在高校环境中的性能优势和准确率。为实现该目标,提出了一种高校基础知识领域的低秩编码大语言模型微调方法。该方法通过低秩编码的方法降低大语言模型的内存、显存在训练和预测的消耗量,并且运用大语言模型的生成式方法优化我校基础知识数据问答领域的研究与分析,从而提高日常基础知识问答的质量、准确性和响应速度。通过冻结大型预训练模型权重,将高校基础知识语言信息融入原Transformer架构的预训练层,并且加入了问答优化模块来规范生成式模型的准确性。此方法在显著减少下游任务可训练参数数量的同时,可以较好地保留原模型的生成式语言能力,并且针对高校基础知识领域展现出更优的性能优势和准确率。 展开更多
关键词 生成式语言模型 基础知识问答 语言模型 TRANSFORMER 冻结模型权重
在线阅读 下载PDF
基于意图理解驱动的客服知识推荐大模型构建 被引量:4
9
作者 马晓亮 高洁 +4 位作者 刘英 裴庆祺 赵汝强 杨邦兴 邓从健 《华南理工大学学报(自然科学版)》 北大核心 2025年第3期40-49,共10页
随着人工智能技术在客服领域的深入应用,电信运营商对AI服务知识推荐的准确率提升提出了更高的要求。为提高电信运营商AI客服系统的知识推荐效率和准确度,该文提出了基于意图理解驱动的客服知识推荐大模型。首先,采用同义词及对话序列... 随着人工智能技术在客服领域的深入应用,电信运营商对AI服务知识推荐的准确率提升提出了更高的要求。为提高电信运营商AI客服系统的知识推荐效率和准确度,该文提出了基于意图理解驱动的客服知识推荐大模型。首先,采用同义词及对话序列的关键词提取模型识别用户查询中的关键词,通过语义相似度比较技术匹配标准问库中的问题,生成最相关的标准问,并采用生成式智能体技术框架构建标准问库,使用智能体技术自动生成知识问题;然后将提取的标准问输入ChatGLM2-6B大语言模型中,经过预训练与人类偏好对齐训练,以进一步提高知识推荐的准确率。实验结果显示:引入标准问库后,智能推荐系统在特定行业知识领域的准确率从74.8%显著提升至85.9%,多组对比实验结果进一步验证了建立标准问库的策略在提高准确率方面的有效性;该文大模型优化了运营商AI客服的智能知识推荐,可为电信运营商AI客服系统的知识推荐提供新的思路和技术支持;运营商通过该文大模型能够更有效地理解和响应客户查询,显著提升客户服务体验。 展开更多
关键词 意图理解 AI客服 生成式语言模型 关键词提问 提示示例
在线阅读 下载PDF
基于大模型的肺癌表皮生长因子受体突变患者生存预测模型构建与验证
10
作者 陈子佳 韩宇 +4 位作者 刘欣 阿孜古丽 张德政 谢雁鸣 王志飞 《世界中医药》 北大核心 2025年第8期1379-1390,共12页
目的:探索肺癌表皮生长因子受体(EGFR)突变三代靶向药(奥希替尼)患者的中医证素分布规律,并基于机器学习与生成式大语言模型构建生存预测模型。方法:回顾性收集国家健康大数据中心2020—2023年新发Ⅲ~Ⅳ期非小细胞肺癌患者,按7∶3随机... 目的:探索肺癌表皮生长因子受体(EGFR)突变三代靶向药(奥希替尼)患者的中医证素分布规律,并基于机器学习与生成式大语言模型构建生存预测模型。方法:回顾性收集国家健康大数据中心2020—2023年新发Ⅲ~Ⅳ期非小细胞肺癌患者,按7∶3随机分训练集与测试集。进行人群与中医证素描述性统计分析,运用LASSO-Cox回归筛选变量,建立Cox比例风险模型并绘制列线图。采用受试者工作特征曲线(ROC)评估模型曲线下面积(AUC),一致性指数(C-index)衡量预测准确性。进一步基于Llama架构的生成式大语言模型构建预测系统,对比传统机器学习性能。结果:中医证素分布以气虚(50.44%)、血瘀(25.01%)、痰(22.53%)为主。LASSO-Cox回归筛选出年龄、纤维蛋白原、CYFRA21-1、合并脑梗死、家族史及既往一代TKI治疗6项独立预后因素。多因素Cox模型显示训练集AUC=0.80(95%CI为0.76~0.84)和测试集AUC=0.78(95%CI为0.73~0.83)的C-index分别为0.77和0.75。生成式模型在40个epoch、学习率5.00×10^(-5)时表现最优,准确率86.6%、召回率95.7%、F1-score 92.8%,显著优于传统方法。结论:本研究构建的肺癌EGFR突变口服三代靶向药患者生存预测模型可以有效预测患者的生存预后风险,并为预测方法提供新方法新思路。 展开更多
关键词 肺癌 EGFR突变 中医证素 生存预测 机器学习 生成式语言模型 LASSO-Cox回归
在线阅读 下载PDF
人工智能文学翻译的“主体性”与“创造性” 被引量:7
11
作者 袁筱一 《上海交通大学学报(哲学社会科学版)》 北大核心 2025年第1期1-10,共10页
随着包括大语言模型在内的人工智能技术的飞速发展,其在文学翻译领域的应用引发了广泛讨论。基于深度学习的生成式模型在文学翻译中究竟有“创造性”吗?它是否具有“主体性”?人工智能在处理非信息文本,尤其是文学作品时所面临的挑战是... 随着包括大语言模型在内的人工智能技术的飞速发展,其在文学翻译领域的应用引发了广泛讨论。基于深度学习的生成式模型在文学翻译中究竟有“创造性”吗?它是否具有“主体性”?人工智能在处理非信息文本,尤其是文学作品时所面临的挑战是什么?人工智能翻译的“硬伤”固然是目前人工智能还无法替代人类翻译主体的主要原因,但是最根本的原因还在于人工智能在文学翻译中难以复制人类译者的“文学性”和“主体性”。而“主体性”的缺失也使得人工智能在文学翻译实践中可能引发一系列伦理问题。因此,我们对人工智能在文学翻译中的应用持审慎态度,因为说到底,维护文学翻译的人文价值和伦理责任就是维护人类的尊严。 展开更多
关键词 人工智能 文学翻译 生成式语言模型 主体性
在线阅读 下载PDF
一种建立在GPT-2模型上的数据增强方法 被引量:3
12
作者 张小川 陈盼盼 +2 位作者 邢欣来 杨昌萌 滕达 《智能系统学报》 CSCD 北大核心 2024年第1期209-216,共8页
针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-train... 针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-trained transformer for data augmentation,PunishGPT-DA)。设计了惩罚项和超参数α,与负对数似然损失函数共同作用微调GPT-2(generative pre-training 2.0),鼓励模型关注那些预测概率较小但仍然合理的输出;使用基于双向编码器表征模型(bidirectional encoder representation from transformers,BERT)的过滤器过滤语义偏差较大的生成样本。本文方法实现了对训练集16倍扩充,与GPT-2相比,在意图识别、问题分类以及情感分析3个任务上的准确率分别提升了1.1%、4.9%和8.7%。实验结果表明,本文提出的方法能够同时有效地控制一致性和多样性需求,提升下游任务模型的训练性能。 展开更多
关键词 自然语言处理 人工智能 数据增强 句子分类 少样本 序列到序列 生成式预训练语言模型 双向编码器表征模型
在线阅读 下载PDF
人工智能的迭代演进及潜在影响
13
作者 毛日昇 《人民论坛》 北大核心 2025年第5期64-67,共4页
随着DeepSeek的火爆出圈,人工智能作为当前全球创新最活跃的领域之一,正在迎来智能化升级浪潮。人工智能的应用不仅不会对就业市场造成显著破坏,反而有助于重塑劳动力市场结构、推动就业增长、缓解收入不平等、创造更公平的就业机会。... 随着DeepSeek的火爆出圈,人工智能作为当前全球创新最活跃的领域之一,正在迎来智能化升级浪潮。人工智能的应用不仅不会对就业市场造成显著破坏,反而有助于重塑劳动力市场结构、推动就业增长、缓解收入不平等、创造更公平的就业机会。人工智能的发展势不可挡,与其合作共生是劳动者适应数智经济时代的必然选择。此外,应在重塑生产生活方式并对全球经济社会发展产生深远影响的同时,确保人工智能安全、可靠、可控。 展开更多
关键词 人工智能 生成式语言模型 发展趋势
在线阅读 下载PDF
基于可控性解释的混合数据增强框架
14
作者 孙泽辰 肖义胜 +2 位作者 李俊涛 张民 周国栋 《软件学报》 北大核心 2025年第4期1604-1619,共16页
先前的预训练语言模型已在众多自然语言理解任务中展现了其卓越的性能.然而,它们常表现出捷径学习的问题,即学习了非鲁棒性特征与标签之间的虚假关联,导致模型在不同于训练分布的测试场景中的泛化能力不佳.近期,生成式预训练大模型在理... 先前的预训练语言模型已在众多自然语言理解任务中展现了其卓越的性能.然而,它们常表现出捷径学习的问题,即学习了非鲁棒性特征与标签之间的虚假关联,导致模型在不同于训练分布的测试场景中的泛化能力不佳.近期,生成式预训练大模型在理解任务中的出色表现引起了广泛的关注,但它们是否受到捷径学习的影响尚未被充分研究.以LLaMA系列模型与FLAN-T5模型为代表,探究生成式预训练大模型在多个自然语言理解任务中的捷径学习现象.研究结果表明,近期流行的生成式大模型仍然存在捷径学习的问题.进而,提出针对生成式预训练大模型的捷径学习问题的缓解策略——基于可控性解释的混合数据增强框架.该框架以数据为中心,基于模型生成的可控性解释数据与部分原始提示性数据构造小规模混合数据集,开展模型微调.在3个具有代表性的自然语言理解任务中的大量实验结果表明,使用该框架所构造的数据集训练模型能够有效缓解模型的捷径学习问题,提升模型在分布外测试场景中的鲁棒性与泛化能力,同时不牺牲甚至提升模型在分布内测试场景中的性能.代码已公开发布在https://github.com/Mint9996/HEDA. 展开更多
关键词 捷径学习 生成式预训练语言模型 自然语言理解
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部