生成式人工智能(AIGC)的快速崛起,掀起“人工智能+”赋能各行各业的浪潮,对会计领域的研究提供了新思路。由于财会行业要求高精确性与可解释性,而大语言模型存在着模型幻觉与决策黑箱,使得大模型应用于财会领域仍存在较大阻碍,构建财会...生成式人工智能(AIGC)的快速崛起,掀起“人工智能+”赋能各行各业的浪潮,对会计领域的研究提供了新思路。由于财会行业要求高精确性与可解释性,而大语言模型存在着模型幻觉与决策黑箱,使得大模型应用于财会领域仍存在较大阻碍,构建财会知识图谱成为弥补大语言模型不足的有力工具。基于此,文章调用GPT-4o mini API,利用提示词工程(Prompt)与智能体(Agent)思路方法进行自动化知识抽取,构建中国会计准则知识图谱,从模式层提取财会实体与实体间复杂的勾稽关系,为大模型优化微调提供数据层支持。图谱构建结果表明,GPT-4o mini能够成功从大量财务数据中提取丰富的知识五元组,并基于此构建财会知识图谱。最终,通过Neo4j技术实现知识图谱的可视化和查询功能。本研究证明大语言模型构建财会知识图谱具备可行性,能够显著提高知识图谱构建效率,为知识图谱的优化构建提供新思路,也为未来知识图谱融入大模型、优化模型性能提供基底数据支撑。展开更多
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近...单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行.展开更多
随着人工智能与医学交叉领域的快速发展,大语言模型(large language model,LLM)在诊疗、医药、康养等领域被广泛应用。LLM在中医药领域独具优势,不仅与中医“四诊合参”理念高度契合,还有效结合了中医药自然语言处理与“自监督”学习技...随着人工智能与医学交叉领域的快速发展,大语言模型(large language model,LLM)在诊疗、医药、康养等领域被广泛应用。LLM在中医药领域独具优势,不仅与中医“四诊合参”理念高度契合,还有效结合了中医药自然语言处理与“自监督”学习技术,同时适应中药复方特色,为中医诊疗提供了有力支持。目前已开发“岐黄问道大模型”、数字中医大模型“GLM-130B”等多种LLM,然而,LLM在中医药领域的应用也面临一系列挑战,包括价值不符与医学滥用风险、对模型可解释性的需求日益增加、技术层面有待进一步提升,以及国内政策准入等方面的限制。本文就LLM发展史、在中医药领域的独特优势及应用、存在问题与挑战、未来发展趋势等进行综述,以期为LLM在中医学领域的进一步推广提供参考。展开更多
随着深度学习技术的不断发展,大型语言模型(Large Language Models,LLM)在自然语言处理(Natural Language Processing,NLP)领域取得了显著成就。通用人工智能概念以及ChatGPT的爆火使得LLM进入了各行各业的视线,这些模型通常基于Transfo...随着深度学习技术的不断发展,大型语言模型(Large Language Models,LLM)在自然语言处理(Natural Language Processing,NLP)领域取得了显著成就。通用人工智能概念以及ChatGPT的爆火使得LLM进入了各行各业的视线,这些模型通常基于Transformer架构,能够处理和生成大量文本数据,表现出了强大的语言理解和生成能力。旨在以GPT系列、BERT系列和LLaMA系列为主线,概述LLM的发展现状和主要成果,介绍其主要的技术原理,分析其面临的诸多挑战和争议以及发展方向。展开更多
实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环...实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环经济政策进行了实体关系抽取研究。基于所提出的PLLM-RE框架,首先使用RoBERTa模型进行循环经济政策文本的实体识别,然后选取基于Transformer的双向编码器表示(bidirectional encoder representation from Transformers, BERT)模型进行循环经济政策实体关系抽取研究,以构建该政策领域的知识图谱。研究结果表明,PLLM-RE框架在循环经济政策实体关系抽取任务上的性能优于对比模型BiLSTM-ATT、PCNN、BERT以及ALBERT,验证了所提框架在循环经济政策实体关系抽取任务上的适配性和优越性,为后续循环经济领域资源的信息挖掘和政策分析提供了新思路。展开更多
文摘生成式人工智能(AIGC)的快速崛起,掀起“人工智能+”赋能各行各业的浪潮,对会计领域的研究提供了新思路。由于财会行业要求高精确性与可解释性,而大语言模型存在着模型幻觉与决策黑箱,使得大模型应用于财会领域仍存在较大阻碍,构建财会知识图谱成为弥补大语言模型不足的有力工具。基于此,文章调用GPT-4o mini API,利用提示词工程(Prompt)与智能体(Agent)思路方法进行自动化知识抽取,构建中国会计准则知识图谱,从模式层提取财会实体与实体间复杂的勾稽关系,为大模型优化微调提供数据层支持。图谱构建结果表明,GPT-4o mini能够成功从大量财务数据中提取丰富的知识五元组,并基于此构建财会知识图谱。最终,通过Neo4j技术实现知识图谱的可视化和查询功能。本研究证明大语言模型构建财会知识图谱具备可行性,能够显著提高知识图谱构建效率,为知识图谱的优化构建提供新思路,也为未来知识图谱融入大模型、优化模型性能提供基底数据支撑。
文摘单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行.
文摘随着人工智能与医学交叉领域的快速发展,大语言模型(large language model,LLM)在诊疗、医药、康养等领域被广泛应用。LLM在中医药领域独具优势,不仅与中医“四诊合参”理念高度契合,还有效结合了中医药自然语言处理与“自监督”学习技术,同时适应中药复方特色,为中医诊疗提供了有力支持。目前已开发“岐黄问道大模型”、数字中医大模型“GLM-130B”等多种LLM,然而,LLM在中医药领域的应用也面临一系列挑战,包括价值不符与医学滥用风险、对模型可解释性的需求日益增加、技术层面有待进一步提升,以及国内政策准入等方面的限制。本文就LLM发展史、在中医药领域的独特优势及应用、存在问题与挑战、未来发展趋势等进行综述,以期为LLM在中医学领域的进一步推广提供参考。
文摘随着深度学习技术的不断发展,大型语言模型(Large Language Models,LLM)在自然语言处理(Natural Language Processing,NLP)领域取得了显著成就。通用人工智能概念以及ChatGPT的爆火使得LLM进入了各行各业的视线,这些模型通常基于Transformer架构,能够处理和生成大量文本数据,表现出了强大的语言理解和生成能力。旨在以GPT系列、BERT系列和LLaMA系列为主线,概述LLM的发展现状和主要成果,介绍其主要的技术原理,分析其面临的诸多挑战和争议以及发展方向。
文摘实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环经济政策进行了实体关系抽取研究。基于所提出的PLLM-RE框架,首先使用RoBERTa模型进行循环经济政策文本的实体识别,然后选取基于Transformer的双向编码器表示(bidirectional encoder representation from Transformers, BERT)模型进行循环经济政策实体关系抽取研究,以构建该政策领域的知识图谱。研究结果表明,PLLM-RE框架在循环经济政策实体关系抽取任务上的性能优于对比模型BiLSTM-ATT、PCNN、BERT以及ALBERT,验证了所提框架在循环经济政策实体关系抽取任务上的适配性和优越性,为后续循环经济领域资源的信息挖掘和政策分析提供了新思路。