期刊文献+
共找到55,241篇文章
< 1 2 250 >
每页显示 20 50 100
AI时代中国语言知识库构建:理论与方法
1
作者 安波 龙从军 《云南师范大学学报(哲学社会科学版)》 北大核心 2026年第2期80-91,共12页
人工智能快速发展,使语言研究从依赖少量材料与经验判断,转向需要在海量真实语料中进行系统检验与归纳。相比“只把材料收集起来”的传统语料库,文章主张建设面向汉语及我国少数民族语言的“中国语言知识库”。在保存文本、录音、影像... 人工智能快速发展,使语言研究从依赖少量材料与经验判断,转向需要在海量真实语料中进行系统检验与归纳。相比“只把材料收集起来”的传统语料库,文章主张建设面向汉语及我国少数民族语言的“中国语言知识库”。在保存文本、录音、影像等原始材料的同时,对其进行细致、统一标注与整理,把分散的语言现象加工为可检索、可比对、可追溯的知识资源。文章提出以“原始材料-分析标注-知识整理”三步递进的总体框架,强调每一条结论都能回到具体语境与原始证据,避免脱离材料的概括。在方法上,讨论如何实现材料采集的代表性、标注的准确与一致、人工与工具的配合,以及成果的持续更新与开放共享。文章认为,知识库不仅能为语法、语义、音系与类型比较等研究提供坚实的材料基础,也可用于濒危语言与方言的记录保存,并为少数民族语言的智能应用提供更可靠的数据支持,从而在学术研究与社会服务之间形成良性循环。 展开更多
关键词 大规模语言模型 中国语言知识库 语言资源建设 语言数据 低资源语言
在线阅读 下载PDF
中国本土语言人工智能基础能力建设的框架构建及实践路径
2
作者 范俊军 《云南师范大学学报(哲学社会科学版)》 北大核心 2026年第2期69-79,共11页
支持人类语言多样性是大语言模型发展的核心议题之一。当前人工智能仅支持100余种语言,与人类数千种语言相比,覆盖面严重不足。依据二八法则,至少应为约800种语言建立起人工智能的基础能力,方能以关键少数语种体现人类语言多样性的总体... 支持人类语言多样性是大语言模型发展的核心议题之一。当前人工智能仅支持100余种语言,与人类数千种语言相比,覆盖面严重不足。依据二八法则,至少应为约800种语言建立起人工智能的基础能力,方能以关键少数语种体现人类语言多样性的总体面貌,使人工智能成为服务全人类生活的基础设施。在目标语言的遴选上,可依据语言聚居区人口规模、区域行政建制、语言社群的母语AI需求、语族与文种多样性等四项指标构建通用评估框架。就我国语言国情而言,应将汉语方言和少数民族语言纳入人工智能发展战略布局,重点进行文本处理、语音处理、基础翻译与跨语言沟通、知识问答及简易文本生成等五项基础能力建设。在实践层面,应优先实现智能输入法、语音识别与合成、双语翻译、语料驱动问答助手、智能词典与学习平台等五大基本通用任务,遵循“资源先行-工具建设-知识融合-智能交互”的渐进路线。 展开更多
关键词 人工智能 语言模型 语言多样性 汉语方言 少数民族语言
在线阅读 下载PDF
基于大语言模型的语料库查询自动生成方法
3
作者 张成辉 罗景 +1 位作者 涂新辉 陈雨霖 《计算机工程》 北大核心 2026年第2期404-412,共9页
语料库查询语言(CQL)是一种用于在语料库中进行检索和分析的查询语言,自然语言自动生成CQL指将用户以自然语言表达的查询需求自动转换为标准的CQL语句,大大降低了用户使用语料库的门槛。虽然大语言模型(LLM)可以较好地完成自然语言生成... 语料库查询语言(CQL)是一种用于在语料库中进行检索和分析的查询语言,自然语言自动生成CQL指将用户以自然语言表达的查询需求自动转换为标准的CQL语句,大大降低了用户使用语料库的门槛。虽然大语言模型(LLM)可以较好地完成自然语言生成任务,但是在CQL生成任务中效果还不是很理想。为此,提出一种基于LLM上下文学习的语料库查询自动生成方法T2CQL。首先,基于CQL的编写规则总结出一套简洁全面的文本到CQL(Text-to-CQL)语法知识,作为LLM实现Text-to-CQL自动转换的基础,以弥补LLM在此领域知识储备的不足。然后,基于选定的嵌入模型,选取与当前自然语言查询最接近的前k个文本-CQL样本对,以帮助LLM理解语法知识并作为参照。最后,采用生成结果校准策略来减轻LLM在生成CQL时的偏差,通过校准模型偏差提升模型生成CQL语句的性能。实验使用多个LLM在包含1 177条数据的测试集上进行测试。实验结果表明,T2CQL方法显著提升了LLM在完成Text-to-CQL自动转换任务时的性能,最优的执行准确率(EX)达到了85.13%。 展开更多
关键词 语料库查询语言 语言模型 上下文学习 自然语言处理 提示工程
在线阅读 下载PDF
基于大语言模型的钓鱼邮件检测技术研究
4
作者 袁斌 杨克涵 +2 位作者 邹德清 刘勇 张乾坤 《信息安全研究》 北大核心 2026年第2期151-163,共13页
随着钓鱼邮件数量的迅速增加以及对抗技术的不断演进,传统的钓鱼邮件检测方法在效率和准确性方面面临严峻挑战.为此,提出了一种基于大语言模型(large language model,LLM)的钓鱼邮件检测方法,以解决现有系统检测率低、漏报率高及人机交... 随着钓鱼邮件数量的迅速增加以及对抗技术的不断演进,传统的钓鱼邮件检测方法在效率和准确性方面面临严峻挑战.为此,提出了一种基于大语言模型(large language model,LLM)的钓鱼邮件检测方法,以解决现有系统检测率低、漏报率高及人机交互性差等问题.通过全面分析钓鱼邮件的关键特征,包括邮件头部字段、正文内容、URL、二维码、附件及HTML页面,利用特征插入算法构建高质量的训练数据集.基于预训练语言模型LLaMA和低秩自适应微调技术(low-rank adaptation,LoRA),在仅更新0.72%模型参数(约50 MB)条件下实现领域知识迁移,获得钓鱼邮件检测大模型.实验结果显示,与传统方法相比,基于大语言模型的检测方法显著提升了检测的准确性与鲁棒性,整体准确率达到94.5%,有效降低了误报率,增强了钓鱼邮件特征的分类与解释能力,提供了更具实用性和可靠性的钓鱼邮件检测方案. 展开更多
关键词 钓鱼邮件 语言模型 预训练语言模型 低秩自适应 微调
在线阅读 下载PDF
大语言模型预训练系统关键技术综述
5
作者 高彦杰 陈跃国 《软件学报》 北大核心 2026年第1期200-229,共30页
在人工智能时代,如何高效地完成大语言模型的预训练,以满足其在扩展性、性能与稳定性方面的需求,是亟需解决的重要问题.大语言模型系统充分利用加速器和高速网卡进行并行张量计算和通信,极大地提高了模型训练的性能,这一进展伴随着一系... 在人工智能时代,如何高效地完成大语言模型的预训练,以满足其在扩展性、性能与稳定性方面的需求,是亟需解决的重要问题.大语言模型系统充分利用加速器和高速网卡进行并行张量计算和通信,极大地提高了模型训练的性能,这一进展伴随着一系列尚待解决的系统设计问题.首先,在分析大语言模型预训练过程的基础上,介绍了其训练流程与负载特点.其次,从预训练系统的扩展性、性能和可靠性角度出发,分别介绍了各类系统技术的分类、原理、研究现状及热点问题.最后,从总体层面深入分析了大型语言预训练系统面临的挑战,并展望了其未来的发展前景. 展开更多
关键词 人工智能 语言模型 语言模型预训练系统
在线阅读 下载PDF
人工智能时代外国语言学及应用语言学的建设与发展
6
作者 文旭 《山东外语教学》 北大核心 2026年第1期22-31,共10页
人工智能的迅猛发展正在深刻改变语言研究与外语教育的生态环境。外国语言学及应用语言学作为一门兼具科学性与人文性的学科,在人工智能背景下面临前所未有的机遇与挑战。本文主要从价值定位、战略方法、发展路径与未来愿景四个方面系... 人工智能的迅猛发展正在深刻改变语言研究与外语教育的生态环境。外国语言学及应用语言学作为一门兼具科学性与人文性的学科,在人工智能背景下面临前所未有的机遇与挑战。本文主要从价值定位、战略方法、发展路径与未来愿景四个方面系统阐释了该学科的建设思路与发展路径。最终认为,人工智能不仅是外国语言学及应用语言学发展的外部契机,更是推动学科自我革新的内在动力。唯有在价值、战略、创新与愿景的统一中,本学科才能实现可持续发展,展现中国特色与国际意义的双重价值。 展开更多
关键词 人工智能 外国语言 应用语言 价值定位 学科发展
在线阅读 下载PDF
大语言模型毒性治理研究综述
7
作者 李实 张朔 《计算机工程与应用》 北大核心 2026年第5期73-87,共15页
大语言模型在自然语言处理和生成式AI领域的应用日益广泛,其在提升生产效率的同时也带来了显著的伦理问题,尤其是毒性内容生成问题。毒性内容是指具有攻击性、歧视性或侮辱性的语言输出,这可能对社会秩序、文化多样性和道德标准构成负... 大语言模型在自然语言处理和生成式AI领域的应用日益广泛,其在提升生产效率的同时也带来了显著的伦理问题,尤其是毒性内容生成问题。毒性内容是指具有攻击性、歧视性或侮辱性的语言输出,这可能对社会秩序、文化多样性和道德标准构成负面影响。随着深度学习技术的不断创新和发展,大语言模型毒性治理问题受到越来越多的关注,现阶段缺少综述性文章对现有的毒性治理技术进行分析和总结。从概念出发,详细阐述了毒性内容的内涵、数据集和毒性分类;围绕毒性治理的两个关键步骤:毒性检测和毒性缓解进行了归纳和总结,然后在此基础上分析了当前毒性治理体系面临的主要挑战,并探讨了可能的改进方向。 展开更多
关键词 自然语言处理 语言模型(LLM) 模型优化 毒性治理
在线阅读 下载PDF
从人工语言到用户提示词:论情报检索语言的形态演变
8
作者 胡玉宁 《情报杂志》 北大核心 2026年第3期167-174,F0003,共9页
[目的]用户提示词是与生成式信息检索伴生的一种自然语言形态,其语言学本质是用户的意图表达,应将其纳入情报检索语言的发展谱系,以进一步拓展情报语言学的理论外延,为公众提示素养培育提供借鉴。[方法]本文采用结构功能分析法考察情报... [目的]用户提示词是与生成式信息检索伴生的一种自然语言形态,其语言学本质是用户的意图表达,应将其纳入情报检索语言的发展谱系,以进一步拓展情报语言学的理论外延,为公众提示素养培育提供借鉴。[方法]本文采用结构功能分析法考察情报检索语言从人工语言到用户提示词的形态演变。[结果/结论]编制主体呈现从专家系统到大众参与的泛化,编制对象呈现从结构化的概念标识到个性化的符号组合的扩容,结构功能实现从名词主导的术语集到动词驱动的指令集的转换。知识组织的技术思想贯穿整个情报检索语言的发展历程,向“用户端下沉”是其发展的内生动力,生成式信息检索范式正驱动情报检索语言从知识组织到意图表达的功能演进,蕴含着从语言工具属性到社会属性的价值跃迁。 展开更多
关键词 情报语言 生成式人工智能 生成式信息检索 人工语言 用户提示词 知识组织 意图表达
在线阅读 下载PDF
跨语言依存句法分析方法研究综述
9
作者 秦董洪 李路路 +3 位作者 白凤波 王敬凯 孔令儒 徐晨 《计算机工程与应用》 北大核心 2026年第4期1-28,共28页
跨语言依存句法分析是自然语言处理领域的一项关键任务,其核心目标是借助高资源语言(源语言)的依存句法资源来分析低资源语言(目标语言)的句子结构。综述了跨语言依存句法分析的研究方法,并根据改进途径的不同对方法进行了分类,深入分... 跨语言依存句法分析是自然语言处理领域的一项关键任务,其核心目标是借助高资源语言(源语言)的依存句法资源来分析低资源语言(目标语言)的句子结构。综述了跨语言依存句法分析的研究方法,并根据改进途径的不同对方法进行了分类,深入分析了各类方法的主要思路及其不足。介绍了跨语言依存句法分析的数据集、研究方法和在下游中的应用。从模型框架、数据处理、学习方法和大语言模型驱动四个角度对现有研究方法进行了系统总结。对比分析了不同方法在特定条件下的表现,并基于此提出未来值得关注的研究方向,包括语言类型学特征研究、集成系统的构建与应用、多语言文本表示的优化以及多种语言资源整合利用等。 展开更多
关键词 语言依存句法分析 自然语言处理 迁移学习
在线阅读 下载PDF
抗战大后方语言调查的成就与启示
10
作者 王倩倩 曹志耘 《云南民族大学学报(哲学社会科学版)》 北大核心 2026年第2期142-150,共9页
抗日战争时期,国立西南联合大学、中央研究院历史语言研究所等单位的一批杰出的语言学家,在抗战大后方对当地的汉语方言和少数民族语言展开了大规模的调查工作,取得了丰硕的成果,产生了深远的影响。从汉语方言调查、少数民族语言调查、... 抗日战争时期,国立西南联合大学、中央研究院历史语言研究所等单位的一批杰出的语言学家,在抗战大后方对当地的汉语方言和少数民族语言展开了大规模的调查工作,取得了丰硕的成果,产生了深远的影响。从汉语方言调查、少数民族语言调查、语言文化调查三个方面对该时期的调查工作进行梳理,尽可能全面归纳介绍调查点、调查人、发音人、调查时间、调查内容、调查成果等情况,经分析可以得到几点启示:1.深入民间田野,发掘了我国西南地区的语言宝藏,形成了重视田野调查、尊重语言事实的学术传统;2.方言民语共治,跨越了汉语方言与少数民族语言之间的界限,融合了方言学和民族语言学两个学科的研究;3.关注社会文化,在开展语言方言本体调查的同时,积极对各种语言文化现象进行调查和整理,为后世留下了鲜活生动的口传文化资料。 展开更多
关键词 抗战大后方 语言调查 汉语方言 少数民族语言 语言文化
在线阅读 下载PDF
大语言模型幻觉检测方法综述 被引量:2
11
作者 李自拓 孙建彬 +5 位作者 陈广州 方馨悦 崔瑞靖 田植良 黄震 杨克巍 《计算机研究与发展》 北大核心 2026年第1期123-146,共24页
近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucinati... 近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucination)问题引起了学术界和工业界的广泛关注。如何有效检测大语言模型幻觉,成为确保其在文本生成等下游任务可靠、安全、可信应用的关键挑战。该研究着重对大语言模型幻觉检测方法进行综述:首先,介绍了大语言模型概念,进一步明确了幻觉的定义与分类,系统梳理了大语言模型从构建到部署应用全生命周期各环节的特点,并深入分析了幻觉的产生机制与诱因;其次,立足于实际应用需求,考虑到在不同任务场景下模型透明度的差异等因素,将幻觉检测方法划分为针对白盒模型和黑盒模型2类,并进行了重点梳理和深入对比;而后,分析总结了现阶段主流的幻觉检测基准,为后续开展幻觉检测奠定基础;最后,指出了大语言模型幻觉检测的各种潜在研究方法和新的挑战。 展开更多
关键词 幻觉检测 语言模型 事实一致性 文本生成 自然语言处理
在线阅读 下载PDF
基于协同专家系统的建筑施工大语言模型问答系统 被引量:1
12
作者 杨彬 肖鸿儒 +4 位作者 高尚 雷克 陈文硕 张其林 汪丛军 《同济大学学报(自然科学版)》 北大核心 2026年第1期13-21,30,共10页
为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成... 为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成的准确性与推理效率,并有效降低了计算开销。此外,设计了一种领域知识库注入的微调策略,在训练阶段引导模型深度学习施工领域专业语义,从而增强其对工程文本的理解能力,确保生成结果更加符合实际工程需求。实验结果表明,在仅激活约1/3模型参数的情况下,所提出系统仍可达到81.1%的生成语义相似度,兼顾了效率与性能,为建筑施工管理提供了一种高效、可靠且具备工程针对性的智能决策支持工具。 展开更多
关键词 建筑施工 智能建造 问答系统 语言模型 本地知识库
在线阅读 下载PDF
谈教师语言艺术 被引量:8
13
作者 张锐 朱家钰 《课程·教材·教法》 CSSCI 北大核心 1991年第3期43-46,共4页
教师语言是一种职业语言,是教师的行业用语。尽管它与其他行业用语有许多共性,但其特异性是显而易见的。比如,它是一种带有书面语言色彩的口头语言;带有会话语言色彩的独自语言;带有态势语言色彩的有声语言;还是一种带有感情色彩的庄重... 教师语言是一种职业语言,是教师的行业用语。尽管它与其他行业用语有许多共性,但其特异性是显而易见的。比如,它是一种带有书面语言色彩的口头语言;带有会话语言色彩的独自语言;带有态势语言色彩的有声语言;还是一种带有感情色彩的庄重语言,等等。 从教育专业用语来看,教师语言是一种以教育、教学为目标的语言表达方式。因此,它一方面具有明显的教育性,一方面又具有某种规范性,即教师语言应该是规范性的语言。它既是教法、教态与教学语言的统一。 展开更多
关键词 教师语言 教学语言 语言心理 普通话 师范院校 口头语言 语言的特征 语言表达方式 会话语言 态势语言
在线阅读 下载PDF
基于视觉语言特征匹配的野生动物未知类别检测方法
14
作者 杨紫合 田野 +3 位作者 王建涛 裴志永 孙晶 张军国 《林业科学》 北大核心 2026年第4期194-205,共12页
【目的】针对开放环境下野生动物红外相机监测图像中未知类别检测识别率低的问题,提出一种不依赖显式环境描述或生境元数据仅依赖已知物种标签的未知类别检测方法,以适应真实监测数据中信息受限的普遍场景。【方法】提出基于视觉语言特... 【目的】针对开放环境下野生动物红外相机监测图像中未知类别检测识别率低的问题,提出一种不依赖显式环境描述或生境元数据仅依赖已知物种标签的未知类别检测方法,以适应真实监测数据中信息受限的普遍场景。【方法】提出基于视觉语言特征匹配的野生动物未知类别检测方法(EUA),通过耦合大语言模型(LLM)的生态推理能力与视觉语言模型的跨模态对齐特性,构建开放环境下的智能监测框架。首先,设计生态感知提示词,引导LLM仅基于已知物种集合推断区域生态背景,并生成具有生态合理性的潜在物种列表;其次,将潜在物种文本与已知类别共同构建扩展的视觉语言语义空间;最后,提出未知类别评分机制(ODS),通过计算图像在已知类别与潜在物种间的匹配分布偏离度,实现对未知类别的鲁棒检测。【结果】在Dataset3(D3)和North American Camera Trap Images(NACTI)2个公开数据集上的试验表明,EUA显著优于现有方法。在最具挑战性的5类未知类别场景下,EUA的平均假正例率(FPR95)为57.86%,比次优方法降低16.19%,受试者工作特征曲线下面积(AUC)达到84.31%,提升4.64个百分点。消融试验证实,基于生态推理的潜在物种生成和ODS评分机制是性能提升的核心。可视化分析进一步表明,EUA能有效分离已知与未知样本的分布,验证了其设计的有效性。【结论】本研究实现了从“被动分类”到“主动预见”的范式转变,为解决缺乏地理信息的真实监测场景下的未知类别检测问题提供了有效方案。EUA方法不仅在性能上取得突破,更探索出将生态学知识嵌入AI推理过程的可行路径,为构建具备生态感知能力的下一代野生动物智能监测系统提供了新思路。 展开更多
关键词 野生动物监测 未知类别检测 语言模型 视觉语言模型 生态推理
在线阅读 下载PDF
基于大语言模型和深度网络的认知评估量表自动诊断
15
作者 陈涵 徐泽锋 +4 位作者 蒋究 樊凡 章军建 何楚 王文伟 《计算机科学》 北大核心 2026年第3期41-51,共11页
认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究... 认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究有较大意义。针对这一问题,聚焦于一个常用认知评估量表——蒙特利尔认知评估量表(Montreal Cognitive Assessment,MoCA),提出由大语言模型和基于深度网络的图像分类模型组成的自动诊断MoCA的框架,并在此框架下选用模型。为增强基础模型对量表题目的处理能力,提出了融合线性注意力的CSWin-FLA Transformer(Cross-Shaped Window With Focused Linear Attention Transfromer)和基于少样本的自动生成提示方法AGPoFS(Automatic Generation of Prompts Based on Fewer Samples),并设计了一个MoCA诊断流程。鉴于不存在公开的MoCA数据集,收集整理了武汉大学中南医院提供的量表数据组成数据集,从各个方法到整体系统分别进行实验,结果表明,该系统在提出的数据集上取得了最好的应用性能,证明了相关改进和整体系统的有效性。 展开更多
关键词 认知评估量表 深度网络 图像分类 注意力 TRANSFORMER 语言模型 自然语言处理
在线阅读 下载PDF
基于大语言模型的科学问题自动生成研究
16
作者 周凝 闵超 +3 位作者 范涛 刘雨萱 张雯 袁勤俭 《现代情报》 北大核心 2026年第3期3-17,共15页
[目的/意义]科学问题是科学研究的起点,决定了科学研究的深度、广度及其影响。探索一种从海量的科技文献中自动生成科学问题的方法对提高科研选题效率具有重要意义。[方法/过程]本文提出了一种利用大语言模型从科技文献中自动生成科学... [目的/意义]科学问题是科学研究的起点,决定了科学研究的深度、广度及其影响。探索一种从海量的科技文献中自动生成科学问题的方法对提高科研选题效率具有重要意义。[方法/过程]本文提出了一种利用大语言模型从科技文献中自动生成科学问题的方法(AGMSQ)。首先,将科学问题划分为描述性、解释性、方法性、评价性和规范性五类;其次,根据科学问题的类型和结构,设计输入要素组合,由“未来工作句子”(FWS)中提取的关键要素三元组和领域扩展搜索主题构成;最后,利用参数微调的大语言模型ChatGPT-4、ChatGPT-3.5、Claude3 Sonnet和Gemini Pro根据输入要素组合生成科学问题。[结果/结论]利用自然语言处理领域的FWS数据集进行方法性问题的生成,根据专家评估的结果,模型生成的科学问题在清晰度、原创性、可行性、价值上均有良好的表现,其中Claude3 Sonnet生成效果最好。研究证明了大语言模型在科学问题生成方面的能力,为科学问题自动生成的研究提供了新思路。 展开更多
关键词 科学问题 自动生成 语言模型 AI for Science 自然语言处理
在线阅读 下载PDF
语言学界近况分析与我们的科研设想 被引量:5
17
作者 王克非 《外语研究》 北大核心 1996年第3期63-65,共3页
语言学界近况分析与我们的科研设想王克非一、国际语言学界研究近况自八十年代以来,十五年中我国语言学研究的进展是迅速而扎实的,一个显著的表现,就是与国际语言学界逐渐在学术上对接。为了使九五期间我国语言学研究继续拓宽拓深,... 语言学界近况分析与我们的科研设想王克非一、国际语言学界研究近况自八十年代以来,十五年中我国语言学研究的进展是迅速而扎实的,一个显著的表现,就是与国际语言学界逐渐在学术上对接。为了使九五期间我国语言学研究继续拓宽拓深,并进一步与国际学界对接,有必要大致... 展开更多
关键词 心理语言 应用语言 国际语言 语言学研究 计算机语言 社会语言 描写语言 话语语言 语言哲学 语言病理学
在线阅读 下载PDF
基于大语言模型的空间数据库自然语言查询转换方法
18
作者 刘孟怡 许建秋 童咏昕 《软件学报》 北大核心 2026年第3期1121-1142,共22页
Text2SQL技术通过减少非专业用户与关系数据库交互的技术障碍,已发展为数据分析和数据库管理的重要工具.以GPT为代表的大语言模型(large language model,LLM)的引入,进一步提升了Text2SQL系统的性能.然而,由于空间数据涉及复杂的几何关... Text2SQL技术通过减少非专业用户与关系数据库交互的技术障碍,已发展为数据分析和数据库管理的重要工具.以GPT为代表的大语言模型(large language model,LLM)的引入,进一步提升了Text2SQL系统的性能.然而,由于空间数据涉及复杂的几何关系、多样化的查询类型和对高精度语义理解的需求,现有的Text2SQL技术难以直接适用于空间数据库领域.为了解决上述问题,降低普通用户与空间数据库的交互门槛,提出了面向空间数据库的自然语言查询(natural language query,NLQ)转换方法.该方法有两个核心阶段:(1)自然语言理解;(2)可执行语言生成.在阶段(1)中使用实体信息提取算法提取关键查询实体,并基于大语言模型构建空间数据查询语料库进而确定查询类型.在阶段(2)中根据查询类型选择结构化语言模型(structured language model,SLM),然后将实体映射到结构化语言模型中,得到最终的空间数据库可执行语言.在多组真实数据集上的实验结果表明,该方法可以实现从用户的自然语言查询到空间数据库可执行语言的高效转换. 展开更多
关键词 空间数据库 自然语言接口 数据库自然语言接口 语义解析 查询处理
在线阅读 下载PDF
“语言是生产力”视角下的语言产业元行业研究 被引量:7
19
作者 李艳 董潇逸 《云南师范大学学报(哲学社会科学版)》 北大核心 2025年第1期40-52,共13页
面对技术变革与消费需求变化,语言产业如何更好地发挥生产力功能是亟待深入思考的问题。对比各语言行业的产值规模、分析各语言行业在整个语言产业中的占比及其对其他语言行业的辐射带动功能,可以较为清晰地勾勒出9个语言行业间的关系... 面对技术变革与消费需求变化,语言产业如何更好地发挥生产力功能是亟待深入思考的问题。对比各语言行业的产值规模、分析各语言行业在整个语言产业中的占比及其对其他语言行业的辐射带动功能,可以较为清晰地勾勒出9个语言行业间的关系脉络。语言技术行业既是语言产业更好地发挥生产力功能的重要引擎,也是国家科技生产力中至关重要的组成部分。基于语言技术行业的特性与功能,可以将其称为语言产业中的“元行业”。文章旨在围绕语言产业助力新质生产力发展,对作为“元行业”的语言技术行业的产品构成、产值规模、行业功能等进行研究。在此基础上,就如何有效发挥语言技术行业在语言产业以及整个国民经济中的引擎功能进行深入探讨。 展开更多
关键词 语言产业 语言技术行业 语言是生产力 元行业 语言智能
在线阅读 下载PDF
乡村旅游景区语言景观研究——以陕西省袁家村为例
20
作者 张琳 李雪 《西北农林科技大学学报(社会科学版)》 北大核心 2026年第1期69-76,共8页
旅游景区的语言景观因承载着丰富地方特色和文化信息并服务于旅游活动而成为旅游景区构建的核心要素。对乡村旅游景区的语言景观进行科学规划和优化提升具有重要的现实意义。本文以语言景观理论为指导,在理清当前国内外旅游语言景观相... 旅游景区的语言景观因承载着丰富地方特色和文化信息并服务于旅游活动而成为旅游景区构建的核心要素。对乡村旅游景区的语言景观进行科学规划和优化提升具有重要的现实意义。本文以语言景观理论为指导,在理清当前国内外旅游语言景观相关研究基础上,从语言标牌上语码选择和使用、体裁类型、交际功能以及象征意义等方面深入分析袁家村语言景观实践。研究发现:袁家村语言景观的设计和规划相对完善,语言标牌上大部分语码的选择、排列符合国家标准的书写模式;语言标牌的体裁多样,较好地发挥了约束、指示、认知、服务和宣传的交际功能;语言标牌载体的多样性、内容和文字的艺术性体现了袁家村的乡村本真性气质、异域情调,是其注重精神文明建设具象化的表现。 展开更多
关键词 乡村旅游 语言景观 语言标牌 交际功能 袁家村
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部