期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于大语言模型的Python编程设计智能助教系统选型评测

System Selection and Performance Evaluation of LLM-Based Python Programming Teaching Assistants

在线阅读下载PDF

导出

摘要本研究针对大语言模型在Python编程教育中的应用,构建了多维度评测体系,系统对比了通义千问、星火、文心一言等主流模型在教学场景中的表现。通过设计事实性问题、推理性问题、代码生成及多轮对话等测试任务,从回答准确性、完整性、语言流畅性、上下文理解能力及代码示例质量五个维度进行评估。实验结果表明,qwen-plus在综合评分中表现最优,其回答覆盖边界条件和多轮逻辑关联性,且代码示例符合PEP8规范;Ernie Bot 8k与sparkV3.5在准确性上优异但存在冗余注释问题,而GPT-4因代码冗余和异常处理片面性得分较低。研究揭示了模型在Python语言细节覆盖和上下文建模方面的共性缺陷,并提出通过知识库更新、强化学习优化及多模态评测体系改进的路径,为智能助教系统的选型与教学场景适配提供了实证依据。 This study investigates the application of large language models (LLMs) in Python programming education by constructing a multi-dimensional evaluation framework to systematically compare the performance of mainstream models, such as Qwen-Plus, Ernie Bot 8k, and SparkV3.5, in educational scenarios. Through testing tasks including factual questions, reasoning problems, code generation, and multi-turn dialogue, models were assessed across five dimensions: accuracy, completeness, linguistic fluency, contextual understanding, and code example quality. Experimental results show that Qwen-Plus achieved the highest overall score, demonstrating superior coverage of edge cases and logical coherence in multi-turn interactions, with code examples adhering to PEP8 standards. Ernie Bot 8k and SparkV3.5 exhibited high accuracy but suffered from redundant annotations, while GPT-4 scored lower due to code redundancy and incomplete exception handling. The study identifies common limitations in models’ coverage of Python language details and contextual modeling, suggesting improvements through knowledge base updates, reinforcement learning optimization, and multi-modal evaluation frameworks. These findings provide empirical evidence for model selection and educational scenario adaptation in intelligent teaching assistant systems.

作者徐鼎洪景尔妮董许宏罗雅琴

机构地区上海工程技术大学数理与统计学院

出处《计算机科学与应用》 2025年第6期190-197,共8页 Computer Science and Application

关键词大语言模型 Python教育评测体系

分类号 G434 [文化科学—教育技术学]

引文网络
相关文献

参考文献4

1黄冰.大语言模型在古生物学中的应用初探——以基于RAG的知识问答系统为例[J].古生物学报,2025,64(1):100-112. 被引量：4
2董艳民,林佳佳,张征,程程,吴金泽,王士进,黄振亚,刘淇,陈恩红.个性化学情感知的智慧助教算法设计与实践[J].计算机应用,2025,45(3):765-772. 被引量：2
3谢颖怡,张逸诗,曾艾玲.基于人工智能大语言模型的微信聊天助教在高职英语教学中的应用探索[J].中国医学教育技术,2025,39(1):48-53. 被引量：2
4黎盈盈,詹昌昊.多模态大语言模型驱动的争论式智能对话学习系统设计与开发[J].数字技术与应用,2025,43(1):25-27. 被引量：4

二级参考文献28

1闫志明,唐夏夏,秦旋,张飞,段元美.教育人工智能(EAI)的内涵、关键技术与应用趋势——美国《为人工智能的未来做好准备》和《国家人工智能研发战略规划》报告解析[J].远程教育杂志,2017,35(1):26-35. 被引量：412
2姜志坚,赵兴民,卢德生.人工智能背景下职业教育发展的策略[J].中国职业技术教育,2017,33(30):54-59. 被引量：53
3梁迎丽,刘陈.人工智能教育应用的现状分析、典型特征与发展趋势[J].中国电化教育,2018(3):24-30. 被引量：359
4任友群,万昆,冯仰存.促进人工智能教育的可持续发展——联合国《教育中的人工智能：可持续发展的挑战和机遇》解读与启示[J].现代远程教育研究,2019,31(5):3-10. 被引量：99
5黄涛,龚眉洁,杨华利,王涵,张晨晨.人机协同支持的小学语文写作教学研究[J].电化教育研究,2020,41(2):108-114. 被引量：37
6王永固,许家奇,丁继红.教育4.0全球框架:未来学校教育与模式转变--世界经济论坛《未来学校:为第四次工业革命定义新的教育模式》之报告解读[J].远程教育杂志,2020,38(3):3-14. 被引量：147
7庄榕霞,杨俊锋,黄荣怀.5G时代教育面临的新机遇新挑战[J].中国电化教育,2020(12):1-8. 被引量：64
8王宇,王澈,于丹.生成式和检索式对话机器人的算法设计与实现综述[J].软件工程,2021,24(2):9-13. 被引量：4
9张苏媛,张水.人工智能(AI)支持下的小学语文分级阅读教学策略探究[J].教育理论与实践,2021,41(5):52-55. 被引量：22
10文秋芳,张虹.《高等职业教育专科英语课程标准(2021年版)》核心素养的确立依据及其内涵解读[J].外语界,2021(5):2-9. 被引量：99

共引文献8

1王士进.大模型技术前沿追踪及其教育应用探索[J].中国基础教育,2025(3):6-10. 被引量：2
2王茜,梁振,孙宇胜,朱丁立,朱玉龙.PUML绘图助手优化中的多模态学习方法探讨[J].电脑知识与技术,2025,21(14):35-37.
3马钰,任世明.基于大语言模型和RAG的舆情知识交互及推荐研究[J].人文与社会科学学刊,2025,1(5):311-314.
4李永亮.基于LLM-RAG的商务政策智能问答系统研究[J].无线互联科技,2025,22(12):26-32.
5郭菲,段俊文,曾敏,覃立波,李敏.教育数字化转型视域下大语言模型驱动的个性化助教平台应用与研究[J].工业和信息化教育,2025(7):89-94.
6易龙,王洁,杨晓彤,张赛赛.基于检索增强生成(RAG)的智能出版业态重塑[J].中国传媒科技,2025(7):19-24.
7李怀贺.基于大模型与多模态解析的智能评标系统的设计与应用[J].中阿科技论坛(中英文),2025(9):118-122.
8阚奕婷.人工智能时代烹饪人才培养模式创新研究[J].中外食品工业,2025(17):127-129.

1黄泳森,阙驰恒.基于人工智能的道路施工过程质量管理技术[J].城市建设理论研究(电子版),2025(15):217-219.
2唐玥宸.数智传播语境下海南自贸港国际传播效能研究动态及价值[J].新闻传播,2025(9):17-19.
3赵紫炎,田霖,黄显康,付思铭,王晨龙.某核电厂安全厂用水系统轴封水堵塞缺陷分析和处理[J].中国设备工程,2025(S1):97-99. 被引量：1
4高洁,蔡晓丽.基于数据挖掘的电网数据分析方法[J].中文科技期刊数据库(文摘版)经济管理,2018(3):00052-00053.
5周颖,孟诗乔,徐灏然,冷皓.土木工程专业知识驱动大语言模型构建与评测体系[J].同济大学学报(自然科学版),2025,53(6):831-840.
6刘雅,张智.基于改进YOLOv8s的遥感图像目标检测[J].计算机工程与设计,2025,46(5):1459-1466.
7王静.小学英语绘本教学中运用提问策略提升思维品质的实践探索[J].小学教学设计,2025(3):92-94.
8刘胜男.浅谈药品生产企业实施新版GMP过程中存在的缺陷[J].中国科技期刊数据库医药,2017(1):00005-00005.
9周涛.风机齿轮箱输出轴轴承跑外圈原因分析及治理[J].中国科技期刊数据库工业A,2019(10):00147-00148.
10黄黎茹.语言细节:领悟文本智慧的密码[J].中学语文教学参考,2025(3):24-26.

计算机科学与应用

2025年第6期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部