期刊文献+
共找到310篇文章
< 1 2 16 >
每页显示 20 50 100
Evaluating research quality with Large Language Models:An analysis of ChatGPT’s effectiveness with different settings and inputs
1
作者 Mike Thelwall 《Journal of Data and Information Science》 2025年第1期7-25,共19页
Purpose:Evaluating the quality of academic journal articles is a time consuming but critical task for national research evaluation exercises,appointments and promotion.It is therefore important to investigate whether ... Purpose:Evaluating the quality of academic journal articles is a time consuming but critical task for national research evaluation exercises,appointments and promotion.It is therefore important to investigate whether Large Language Models(LLMs)can play a role in this process.Design/methodology/approach:This article assesses which ChatGPT inputs(full text without tables,figures,and references;title and abstract;title only)produce better quality score estimates,and the extent to which scores are affected by ChatGPT models and system prompts.Findings:The optimal input is the article title and abstract,with average ChatGPT scores based on these(30 iterations on a dataset of 51 papers)correlating at 0.67 with human scores,the highest ever reported.ChatGPT 4o is slightly better than 3.5-turbo(0.66),and 4o-mini(0.66).Research limitations:The data is a convenience sample of the work of a single author,it only includes one field,and the scores are self-evaluations.Practical implications:The results suggest that article full texts might confuse LLM research quality evaluations,even though complex system instructions for the task are more effective than simple ones.Thus,whilst abstracts contain insufficient information for a thorough assessment of rigour,they may contain strong pointers about originality and significance.Finally,linear regression can be used to convert the model scores into the human scale scores,which is 31%more accurate than guessing.Originality/value:This is the first systematic comparison of the impact of different prompts,parameters and inputs for ChatGPT research quality evaluations. 展开更多
关键词 ChatGPT large language models LLMs SCIENTOMETRICS Research Assessment
在线阅读 下载PDF
Construction and preliminary application of large language model for reservoir performance analysis
2
作者 PAN Huanquan LIU Jianqiao +13 位作者 GONG Bin ZHU Yiheng BAI Junhui HUANG Hu FANG Zhengbao JING Hongbin LIU Chen KUANG Tie LAN Yubo WANG Tianzhi XIE Tian CHENG Mingzhe QIN Bin SHEN Yujiang 《Petroleum Exploration and Development》 SCIE 2024年第5期1357-1366,共10页
A large language model(LLM)is constructed to address the sophisticated demands of data retrieval and analysis,detailed well profiling,computation of key technical indicators,and the solutions to complex problems in re... A large language model(LLM)is constructed to address the sophisticated demands of data retrieval and analysis,detailed well profiling,computation of key technical indicators,and the solutions to complex problems in reservoir performance analysis(RPA).The LLM is constructed for RPA scenarios with incremental pre-training,fine-tuning,and functional subsystems coupling.Functional subsystem and efficient coupling methods are proposed based on named entity recognition(NER),tool invocation,and Text-to-SQL construction,all aimed at resolving pivotal challenges in developing the specific application of LLMs for RDA.This study conducted a detailed accuracy test on feature extraction models,tool classification models,data retrieval models and analysis recommendation models.The results indicate that these models have demonstrated good performance in various key aspects of reservoir dynamic analysis.The research takes some injection and production well groups in the PK3 Block of the Daqing Oilfield as an example for testing.Testing results show that our model has significant potential and practical value in assisting reservoir engineers with RDA.The research results provide a powerful support to the application of LLM in reservoir performance analysis. 展开更多
关键词 reservoir performance analysis artificial intelligence large model application-specific large language model in-cremental pre-training fine-tuning subsystems coupling entity recognition tool invocation
在线阅读 下载PDF
A large language model-powered literature review for high-angle annular dark field imaging
3
作者 Wenhao Yuan Cheng Peng Qian He 《Chinese Physics B》 SCIE EI CAS CSCD 2024年第9期76-81,共6页
High-angle annular dark field(HAADF)imaging in scanning transmission electron microscopy(STEM)has become an indispensable tool in materials science due to its ability to offer sub-°A resolution and provide chemic... High-angle annular dark field(HAADF)imaging in scanning transmission electron microscopy(STEM)has become an indispensable tool in materials science due to its ability to offer sub-°A resolution and provide chemical information through Z-contrast.This study leverages large language models(LLMs)to conduct a comprehensive bibliometric analysis of a large amount of HAADF-related literature(more than 41000 papers).By using LLMs,specifically ChatGPT,we were able to extract detailed information on applications,sample preparation methods,instruments used,and study conclusions.The findings highlight the capability of LLMs to provide a new perspective into HAADF imaging,underscoring its increasingly important role in materials science.Moreover,the rich information extracted from these publications can be harnessed to develop AI models that enhance the automation and intelligence of electron microscopes. 展开更多
关键词 large language models high-angle annular dark field imaging deep learning
在线阅读 下载PDF
Research status and application of artificial intelligence large models in the oil and gas industry
4
作者 LIU He REN Yili +6 位作者 LI Xin DENG Yue WANG Yongtao CAO Qianwen DU Jinyang LIN Zhiwei WANG Wenjie 《Petroleum Exploration and Development》 SCIE 2024年第4期1049-1065,共17页
This article elucidates the concept of large model technology,summarizes the research status of large model technology both domestically and internationally,provides an overview of the application status of large mode... This article elucidates the concept of large model technology,summarizes the research status of large model technology both domestically and internationally,provides an overview of the application status of large models in vertical industries,outlines the challenges and issues confronted in applying large models in the oil and gas sector,and offers prospects for the application of large models in the oil and gas industry.The existing large models can be briefly divided into three categories:large language models,visual large models,and multimodal large models.The application of large models in the oil and gas industry is still in its infancy.Based on open-source large language models,some oil and gas enterprises have released large language model products using methods like fine-tuning and retrieval augmented generation.Scholars have attempted to develop scenario-specific models for oil and gas operations by using visual/multimodal foundation models.A few researchers have constructed pre-trained foundation models for seismic data processing and interpretation,as well as core analysis.The application of large models in the oil and gas industry faces challenges such as current data quantity and quality being difficult to support the training of large models,high research and development costs,and poor algorithm autonomy and control.The application of large models should be guided by the needs of oil and gas business,taking the application of large models as an opportunity to improve data lifecycle management,enhance data governance capabilities,promote the construction of computing power,strengthen the construction of“artificial intelligence+energy”composite teams,and boost the autonomy and control of large model technology. 展开更多
关键词 foundation model large language mode visual large model multimodal large model large model of oil and gas industry pre-training fine-tuning
在线阅读 下载PDF
On large language models safety,security,and privacy:A survey
5
作者 Ran Zhang Hong-Wei Li +2 位作者 Xin-Yuan Qian Wen-Bo Jiang Han-Xiao Chen 《Journal of Electronic Science and Technology》 2025年第1期1-21,共21页
The integration of artificial intelligence(AI)technology,particularly large language models(LLMs),has become essential across various sectors due to their advanced language comprehension and generation capabilities.De... The integration of artificial intelligence(AI)technology,particularly large language models(LLMs),has become essential across various sectors due to their advanced language comprehension and generation capabilities.Despite their transformative impact in fields such as machine translation and intelligent dialogue systems,LLMs face significant challenges.These challenges include safety,security,and privacy concerns that undermine their trustworthiness and effectiveness,such as hallucinations,backdoor attacks,and privacy leakage.Previous works often conflated safety issues with security concerns.In contrast,our study provides clearer and more reasonable definitions for safety,security,and privacy within the context of LLMs.Building on these definitions,we provide a comprehensive overview of the vulnerabilities and defense mechanisms related to safety,security,and privacy in LLMs.Additionally,we explore the unique research challenges posed by LLMs and suggest potential avenues for future research,aiming to enhance the robustness and reliability of LLMs in the face of emerging threats. 展开更多
关键词 large language models Privacy issues Safety issues Security issues
在线阅读 下载PDF
面向大语言模型应用的数据服务平台研究 被引量:1
6
作者 鞠炜刚 汪鹏 王佳 《无线互联科技》 2025年第2期45-51,83,共8页
大语言模型应用效果依赖于高质量数据,从原始语料构建训练数据集和检索增强知识的过程中,端到端的数据管理和处理变得至关重要。当前数据服务面临着因数据处理质量差而影响大语言模型应用效果、数据准备效率低、实现的高复杂性和高成本... 大语言模型应用效果依赖于高质量数据,从原始语料构建训练数据集和检索增强知识的过程中,端到端的数据管理和处理变得至关重要。当前数据服务面临着因数据处理质量差而影响大语言模型应用效果、数据准备效率低、实现的高复杂性和高成本等问题。为解决这些问题,文章提出一种面向大语言模型的数据协同服务方案,对原始语料、数据集和知识处理进行有效协同,基于算子可视化编排的自动化处理技术和跨平台统一计算调度框架,设计实现了一种端到端数据服务平台,能有效满足各类大语言模型应用对于数据的不同需求。该平台提升了数据质量、处理效率和灵活性,降低了成本,显著增强了大模型应用效果,具有较强的通用性和广阔的应用前景。 展开更多
关键词 大语言模型 协同服务 算子可视化编排 计算调度 数据服务平台
在线阅读 下载PDF
大语言模型发展研究及其在防洪“四预”平台智能交互的应用探讨
7
作者 郭磊 冯钧 +1 位作者 直伟 周思源 《中国水利》 2025年第5期29-36,共8页
大语言模型(LLMs)是近年来人工智能领域的重大突破,依托Transformer架构与自注意力机制,在超大规模参数下涌现出接近人类的自然语言理解能力,为人类认知、思考、判断和决策提供辅助。当前大语言模型在垂直细分领域的应用已成为热点,特... 大语言模型(LLMs)是近年来人工智能领域的重大突破,依托Transformer架构与自注意力机制,在超大规模参数下涌现出接近人类的自然语言理解能力,为人类认知、思考、判断和决策提供辅助。当前大语言模型在垂直细分领域的应用已成为热点,特别是基于MOE融合架构的DeepSeek开源发布,为行业大模型应用提供了更为便捷的技术路径,进一步推动了相关研究热潮。“四预”是基于数字孪生水利建设的新型水利智能业务应用,具有专业性强、业务链条长、系统架构复杂等特点,功能完备,但在易用性方面仍有优化空间。基于大语言模型的理解和推理能力分析,首次提出了大模型智能交互L0至L3级分类体系,以意图识别和智能调用为切入点,研究其支撑“四预”平台的交互应用场景和实现技术路径,提出了通过优化“预设内容”和叠加具体问题增强大模型输出确定性的方法,并在通用大模型上进行测试,探索大模型智能调用“四预”平台专业模型的路径,为提升防洪“四预”的交互友好性提供了可行方案,同时也为大语言模型在水利智能业务中的深度应用提供参考。 展开更多
关键词 大语言模型 ChatGPT DeepSeek 防洪“四预” 意图识别 模型驱动 垂直领域大模型 专业小模型
在线阅读 下载PDF
企业科技领军人才的多重构型及成才路径:基于大语言模型(LLMs)的质性分析
8
作者 赵晨 林晨 +2 位作者 王宏飞 杜鹏 李建新 《中国软科学》 北大核心 2025年第2期130-139,共10页
基于生涯资本理论,采用大语言模型及K-prototypes聚类分析118名企业科技领军人才。析出实践开拓型、组织发展型、价值引领型、科创新锐型4类人才构型,揭示其“外部环境熏陶、内隐特质激活、外部能力涌现”的内外交错式成长逻辑,廓清各... 基于生涯资本理论,采用大语言模型及K-prototypes聚类分析118名企业科技领军人才。析出实践开拓型、组织发展型、价值引领型、科创新锐型4类人才构型,揭示其“外部环境熏陶、内隐特质激活、外部能力涌现”的内外交错式成长逻辑,廓清各构型差异及多元化发展路径,明确家国情怀的目标导向与科研品质的能力支撑是各构型成才的共性因素。 展开更多
关键词 科技领军人 人才画像 大语言模型 成长路径
在线阅读 下载PDF
大语言模型工具能促进高校学生的高阶思维能力发展吗?——基于12所双一流大学学生问卷调查的实证分析
9
作者 李曼丽 乔伟峰 李睿淼 《现代教育技术》 2025年第1期34-43,共10页
在数智时代,重视培养高校学生的高阶思维能力已逐渐成为共识,但高校学生使用大语言模型工具能否促进高阶思维能力的发展尚存争议。澄清这一争议,不仅有助于在理论上分析人工智能背景下学生高阶思维发展的机理,也可以为学校和教师在教育... 在数智时代,重视培养高校学生的高阶思维能力已逐渐成为共识,但高校学生使用大语言模型工具能否促进高阶思维能力的发展尚存争议。澄清这一争议,不仅有助于在理论上分析人工智能背景下学生高阶思维发展的机理,也可以为学校和教师在教育实践中采取何种措施提供可靠依据。基于此,文章利用我国12所双一流大学学生的问卷调查数据,对当前高校学生的大语言模型工具使用情况及其对高阶思维能力的影响进行实证分析,结果显示:超过半数的高校学生使用过大语言模型工具,但深度创意应用仍有待加强;增加大语言模型工具的基础执行应用与深度创意应用频次,均对高阶思维能力发展具有显著的正向影响;交互质量在大语言模型工具使用频次对高阶思维能力的影响过程中发挥中介作用。在此基础上,文章建议高校正视人工智能技术在高等教育教学过程中的作用,积极推动人工智能赋能教育应用;结合课内外真实情境,促进大语言模型工具的深度创意应用;加强师生人工智能素养培养,提升人机交互质量。 展开更多
关键词 大语言模型 高阶思维能力 高校学生 双一流大学
在线阅读 下载PDF
DeepSeek在档案管理领域中的应用与展望
10
作者 杨建梁 郑梦霏 杨格秀 《机电兵船档案》 2025年第1期2-3,25,共3页
数字化转型背景下,档案管理面临着海量非结构化数据处理、业务流程复杂度提升、服务需求多元化等核心挑战。本研究聚焦DeepSeek大模型的技术特性与档案业务需求的耦合机制,系统探讨人工智能技术对档案全生命周期管理的赋能路径。研究重... 数字化转型背景下,档案管理面临着海量非结构化数据处理、业务流程复杂度提升、服务需求多元化等核心挑战。本研究聚焦DeepSeek大模型的技术特性与档案业务需求的耦合机制,系统探讨人工智能技术对档案全生命周期管理的赋能路径。研究重点展望了DeepSeek在档案管理核心业务上的应用前景,包括:构建智能化四性检测体系强化前端控制,通过动态语义组织优化资源治理,开发预测性保存技术支持长期可信,设计多模态服务体系促进价值释放。此外,档案核心业务需保留人工终审权,常规操作实现智能替代,为档案管理智能化转型提供可行性路径。该研究对于破解档案领域“智能化转型焦虑”、实现技术应用与专业特性的平衡发展具有现实指导意义。 展开更多
关键词 大语言模型 DeepSeek 档案管理 档案信息化
在线阅读 下载PDF
基于大语言模型的中文阅读测试题自动生成研究
11
作者 王鸿滨 吕海辉 《国际汉语教学研究》 2025年第1期41-54,共14页
阅读测试是各类中文课程测试的重要组成部分。本文探究如何利用大语言模型自动生成中文阅读课程的随堂测试题,以帮助教师节省命题的时间成本,并从语言流畅度、言语准确性、问题复杂度、答案存在性、题目作者、判断确信度六个方面,对自... 阅读测试是各类中文课程测试的重要组成部分。本文探究如何利用大语言模型自动生成中文阅读课程的随堂测试题,以帮助教师节省命题的时间成本,并从语言流畅度、言语准确性、问题复杂度、答案存在性、题目作者、判断确信度六个方面,对自动生成的题目进行了人工评估。评估结果表明,利用大语言模型自动生成的题目与HSK真题在语言流畅度、言语准确性、问题复杂度、答案存在性、判断确信度五个方面均没有显著差异,说明基于大语言模型自动生成题目在国际中文教育领域阅读测试中的应用有着切实的可行性。 展开更多
关键词 阅读测试 题目自动生成 HSK 大语言模型
在线阅读 下载PDF
基于大语言模型的C程序单元测试方法
12
作者 李博诺 王博 +4 位作者 陈明达 林友芳 江云松 陈睿 李鹏宇 《空间控制技术与应用》 北大核心 2025年第1期115-122,共8页
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近... 单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行. 展开更多
关键词 软件测试 单元测试 测试自动生成 代码自动生成 大语言模型 测试预言
在线阅读 下载PDF
大语言模型在中医药领域的应用、挑战与前景
13
作者 陈子佳 彭文茜 +2 位作者 张德政 刘欣 王志飞 《协和医学杂志》 北大核心 2025年第1期83-89,共7页
随着人工智能与医学交叉领域的快速发展,大语言模型(large language model,LLM)在诊疗、医药、康养等领域被广泛应用。LLM在中医药领域独具优势,不仅与中医“四诊合参”理念高度契合,还有效结合了中医药自然语言处理与“自监督”学习技... 随着人工智能与医学交叉领域的快速发展,大语言模型(large language model,LLM)在诊疗、医药、康养等领域被广泛应用。LLM在中医药领域独具优势,不仅与中医“四诊合参”理念高度契合,还有效结合了中医药自然语言处理与“自监督”学习技术,同时适应中药复方特色,为中医诊疗提供了有力支持。目前已开发“岐黄问道大模型”、数字中医大模型“GLM-130B”等多种LLM,然而,LLM在中医药领域的应用也面临一系列挑战,包括价值不符与医学滥用风险、对模型可解释性的需求日益增加、技术层面有待进一步提升,以及国内政策准入等方面的限制。本文就LLM发展史、在中医药领域的独特优势及应用、存在问题与挑战、未来发展趋势等进行综述,以期为LLM在中医学领域的进一步推广提供参考。 展开更多
关键词 大语言模型 中医药 学科交叉 应用 挑战 前景
在线阅读 下载PDF
基于大语言模型的矿山事故知识图谱构建
14
作者 张朋杨 生龙 +2 位作者 王巍 魏忠诚 赵继军 《工矿自动化》 北大核心 2025年第2期76-83,105,共9页
现有矿山领域知识图谱构建方法在预训练阶段需要大量人工标注的高质量监督数据,人力成本高且效率低。大语言模型(LLM)可在少量人工标注的高质量数据下显著提高信息抽取的质量且效率较高,然而LLM结合Prompt的方法会产生灾难性遗忘问题。... 现有矿山领域知识图谱构建方法在预训练阶段需要大量人工标注的高质量监督数据,人力成本高且效率低。大语言模型(LLM)可在少量人工标注的高质量数据下显著提高信息抽取的质量且效率较高,然而LLM结合Prompt的方法会产生灾难性遗忘问题。针对上述问题,将图结构信息嵌入到Prompt模板中,提出了图结构Prompt,通过在LLM上嵌入图结构Prompt,实现基于LLM的矿山事故知识图谱高质量构建。首先,收集煤矿安全生产网公开的矿山事故报告并进行格式修正、冗余信息剔除等预处理。其次,利用LLM挖掘矿山事故报告文本中蕴含的知识,对矿山事故报告文本中的实体及实体间关系进行K−means聚类,完成矿山事故本体构建。然后,依据构建的本体进行少量数据标注,标注数据用于LLM的学习与微调。最后,采用嵌入图结构Prompt的LLM进行信息抽取,实例化实体关系三元组,从而构建矿山事故知识图谱。实验结果表明:在实体抽取和关系抽取任务中,LLM的表现优于通用信息抽取(UIE)模型,且嵌入图结构Prompt的LLM在精确率、召回率、F1值方面均高于未嵌入图结构Prompt的LLM。 展开更多
关键词 矿山事故 知识图谱 大语言模型 图结构Prompt 本体构建 信息抽取
在线阅读 下载PDF
大语言模型支持的元综合研究:基于智能体的方法 被引量:1
15
作者 仇星月 陈向东 +2 位作者 陈鹏 褚乐阳 崔萌 《现代教育技术》 2025年第1期63-72,共10页
大语言模型凭借强大的分析与推理能力正在变革教育研究范式,特别是其在智能体技术方面取得的显著进步,为系统性解决科研领域的复杂问题提供了有力支持。基于此,文章聚焦元综合这一典型的研究任务场景,探讨如何基于智能体的方法提供更加... 大语言模型凭借强大的分析与推理能力正在变革教育研究范式,特别是其在智能体技术方面取得的显著进步,为系统性解决科研领域的复杂问题提供了有力支持。基于此,文章聚焦元综合这一典型的研究任务场景,探讨如何基于智能体的方法提供更加系统化的支持:首先,文章提出了多步骤规划、协同模式构建、提示赋能、工具集成的元综合智能体应用原则,设计了由6个智能体协同的应用模式,并基于该模式开发了元综合智能体工具。然后,文章通过案例研究将智能体工具应用于典型的元综合任务,发现与人类团队相比,智能体更能遵照元综合研究流程执行任务,生成结果更全面;人类团队在应用过程中对智能体的准确性和使用体验给予了积极评价。最后,文章基于研究发现提出了智能体在教育研究中的应用策略,以期为深入解决教育研究实践问题提供新的人机协同思路。 展开更多
关键词 大语言模型 智能体 元综合 教育研究
在线阅读 下载PDF
面向区块链漏洞知识库的大模型增强知识图谱问答模型
16
作者 解飞 宋建华 +2 位作者 姜丽 张龑 何帅 《现代电子技术》 北大核心 2025年第2期137-142,共6页
大语言模型(LLM)在专业领域特别是区块链漏洞领域应用时存在局限性,如专业术语噪声干扰和细粒度信息过重导致理解不足。为此,构建一种面向区块链漏洞知识库的增强型知识图谱问答模型(LMBK_KG)。通过整合大模型和知识图谱来增强知识表示... 大语言模型(LLM)在专业领域特别是区块链漏洞领域应用时存在局限性,如专业术语噪声干扰和细粒度信息过重导致理解不足。为此,构建一种面向区块链漏洞知识库的增强型知识图谱问答模型(LMBK_KG)。通过整合大模型和知识图谱来增强知识表示和理解能力,同时利用多粒度语义信息进行专业问题的过滤和精准匹配。研究方法包括使用集成的多粒度语义信息和知识图谱来过滤专业术语噪声,以及采用大模型生成的回答与专业知识图谱进行结构化匹配和验证,以提高模型的鲁棒性和安全性。实验结果表明,所提出的模型在区块链漏洞领域问答的准确率比单独使用大模型提高26%。 展开更多
关键词 大语言模型 知识图谱 问答模型 多粒度语义信息 区块链 漏洞信息 文本表征
在线阅读 下载PDF
国际学界关于ChatGPT语言能力的争论与思考
17
作者 时仲 田英慧 司富珍 《语言战略研究》 北大核心 2025年第1期75-86,共12页
随着ChatGPT为代表的大语言模型在应用方面取得极大成功,语言官能是否为人类独有的问题引起热议,国际学界形成两个对立的阵营。一方认为,大语言模型语言理解和产出方面达到了媲美人类的水准,对乔姆斯基的语言学理论提出了挑战,甚至足以... 随着ChatGPT为代表的大语言模型在应用方面取得极大成功,语言官能是否为人类独有的问题引起热议,国际学界形成两个对立的阵营。一方认为,大语言模型语言理解和产出方面达到了媲美人类的水准,对乔姆斯基的语言学理论提出了挑战,甚至足以取代生成语法的语言学理论地位。另一方则认为,人类语言习得“刺激贫乏”但生成能力惊人,而大语言模型“学习”语言依靠输入海量数据,因此,它无法对人类语言的本质问题给出合理性解释,在语言的核心属性方面与人类语言官能存在本质区别。不少实证测试也对夸大大语言模型在语言学理论中的地位的观点进行了批判。本文认为,对这一问题的讨论,首先应思考如下问题:(1)区分科学理论建构与工程应用;(2)对“可能的语言”与“不可能的语言”的区分做出原则性的预测与解释;(3)探讨自然语言习得“刺激贫乏”与大语言模型依靠“豪华型”海量数据之对立背后的深层原因;(4)对句法在人类语言和大语言模型中的地位进行更多维度和更系统的对比评测。 展开更多
关键词 ChatGPT 大语言模型 刺激贫乏 可能的语言 不可能的语言
在线阅读 下载PDF
基于大小模型协同的情报学理论实体抽取研究
18
作者 姚汝婧 王芳 《现代情报》 北大核心 2025年第4期3-11,73,共10页
[目的/意义]理论是情报学学科构建与发展中至关重要的组成部分,对理论的梳理与分析不仅有助于理解情报学学科的起源与发展脉络,也能够预测新兴技术的发展,高效和准确地识别理论实体对于促进理论研究的深化具有极为重要的作用。[方法/过... [目的/意义]理论是情报学学科构建与发展中至关重要的组成部分,对理论的梳理与分析不仅有助于理解情报学学科的起源与发展脉络,也能够预测新兴技术的发展,高效和准确地识别理论实体对于促进理论研究的深化具有极为重要的作用。[方法/过程]本文提出了一种大小模型协同的情报学理论实体抽取算法,包括词嵌入向量增强、样本难度评估和理论识别模型3个模块。首先利用大型语言模型对理论实体进行预识别,预识别的实体与句子中的原始词嵌入向量构成增强词嵌入向量,通过增强的词嵌入向量优化领域小模型的训练过程。此外,本文利用大模型对样本的难度进行评估,并据此调整训练策略,以提高模型性能。该算法充分结合大型语言模型强大的语义理解能力以及领域小模型的专业性。[结果/结论]在情报学理论实体抽取数据集上展开实验,结果表明本文提出的算法有效提升了理论实体抽取的性能,在精确率、召回率、F1指标上均实现了最优结果。 展开更多
关键词 大型语言模型 情报学理论 实体识别 样本学习难度 模型协同
在线阅读 下载PDF
大语言模型在摘要结构功能识别上的应用研究
19
作者 翁梦娟 王晓光 +2 位作者 桂恒 刘文斌 石佛波 《现代情报》 北大核心 2025年第4期36-48,共13页
[目的/意义]测试GPT等生成式大模型在摘要结构功能识别这一判别式任务上的可行性及应用潜力,为基于生成式大语言模型构建高质量结构化数据提供参考。[方法/过程]采用单轮、零样本提示的方式基于GPT 4.0、Qwen 1.5和ERNIE 4.0实现结构功... [目的/意义]测试GPT等生成式大模型在摘要结构功能识别这一判别式任务上的可行性及应用潜力,为基于生成式大语言模型构建高质量结构化数据提供参考。[方法/过程]采用单轮、零样本提示的方式基于GPT 4.0、Qwen 1.5和ERNIE 4.0实现结构功能分类任务,根据领域、语种、时间划分构建不同的测试子集,以P、R、F1和准确率为评估指标,以单因素方差分析结果衡量不同测试子集间的性能差异程度。[结果/结论]大语言模型的输出不完全与提示中的约束一致,说明使用生成式模型解决判别式任务时,输出结果存在不可控风险,但符合提示的输出比例较高说明使用生成式模型解决判别式任务基本可用。不同大语言模型的性能表现不同,GPT 4.0和ERNIE 4.0在不同结构功能类别样本的所有指标、不同领域样本的R和准确率、不同语种样本的P和F1均表现出0.01水平显著性,其他则无显著差异。未来基于生成式大语言模型解决判别式任务时应着重关注输出结果的可控性、领域自适应等问题。 展开更多
关键词 结构功能识别 生成式大模型 大语言模型 结构化摘要 语步识别
在线阅读 下载PDF
图模驱动的在线医疗健康智慧问答服务研究
20
作者 张君冬 刘江峰 +2 位作者 邓景鹏 刘艳华 黄奇 《现代情报》 北大核心 2025年第1期164-176,共13页
[目的/意义]学者们重视追求医疗智慧问答相关技术本身的前沿性,对基础理论的探讨研究较少,两者未能融合发展。[方法/过程]在辨析相关概念的基础上,首先阐述在线医疗健康领域智慧问答服务的内涵及特征,之后剖析知识图谱与大语言模型的联... [目的/意义]学者们重视追求医疗智慧问答相关技术本身的前沿性,对基础理论的探讨研究较少,两者未能融合发展。[方法/过程]在辨析相关概念的基础上,首先阐述在线医疗健康领域智慧问答服务的内涵及特征,之后剖析知识图谱与大语言模型的联系及两者的互补融合思路,最后提出图模驱动的在线医疗健康智慧问答服务。[结果/结论]文章将医疗智慧问答服务理论特征贯穿智慧问答服务的全过程,创新性地提出其智慧问答服务应包含大语言模型驱动的医疗知识图谱构建、知识图谱增强的医疗大模型训练、图模驱动的智慧问答服务流程三部分。本研究实现了理论与技术的有机结合,研究成果可用于后续医疗智慧问答的实践性工作。 展开更多
关键词 知识图谱 大语言模型 在线医疗健康 智慧问答服务
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部