题名 基于综合指标的深度学习框架评测方法
1
作者
白玲玲
赵珊
机构
中国移动通信有限公司研究院
出处
《计算机应用》
北大核心
2025年第S1期10-18,共9页
文摘
在人工智能技术体系中,深度学习框架具有关键地位,它们承担了算法封装、数据管理和计算资源利用的核心任务。然而,由于深度学习领域的应用场景、数据集、模型、工具集、库、系统和平台的多样性以及硬件和软件的复杂性,选择和评估一个合适的深度学习框架变得非常困难。针对这一挑战,提出一种基于综合指标的深度学习框架评测方法。该方法涵盖生态建设、易用性、性能和可靠性等多个维度,优化和扩展现有的评测指标,从而提升评测方法的全面性与客观性。此外,引入量化评测标准来优化实验设计和结果分析流程,从而增强评测结果的科学性与可比性。实际案例的结果表明,所提方法在不同的应用场景下展现了良好的适用性,为框架选择提供了量化依据。
关键词
深度学习框架
评测 方法
多样性
复杂性
综合指标
Keywords
deep learning framework
evaluation method
diversity
complexity
comprehensive metric
分类号
TP302
[自动化与计算机技术—计算机系统结构]
题名 土木工程专业知识驱动大语言模型构建与评测体系
2
作者
周颖
孟诗乔
徐灏然
冷皓
机构
同济大学土木工程防灾减灾全国重点实验室
出处
《同济大学学报(自然科学版)》
北大核心
2025年第6期831-840,共10页
基金
国家重点研发计划(2023YFC3805000)
国家杰出青年科学基金(52025083)
+1 种基金
科学探索奖(XP202342)
上海市经信委项目(202201033)。
文摘
为解决通用大语言模型在土木工程领域应用中缺乏专业知识而导致的局限性问题,提出了一种专为土木工程领域设计的知识大模型―CivilGPT。通过多步骤的技术路线构建了CivilGPT模型,包括数据预处理、建立专业知识图谱、生成和优化自动化数据集、分阶段预训练和微调,以及与工程任务的对齐,确保模型能够在土木工程领域实现准确的知识表达和推理能力。此外,建立了基于土木工程资格考试的标准化评测框架Civil-Bench,涵盖13类注册工程师考试题目,包含14823道客观题和269道主观题。通过测试15个国内外语言模型,结果显示CivilGPT在土木工程知识理解、推理能力和复杂问题解决方面具有显著优势。该研究为土木工程领域智能化发展奠定了技术基础,为其他专业领域模型开发提供了重要参考。
关键词
土木工程
大语言模型
CivilGPT
领域知识图谱
civil-bench评测框架
Keywords
civil engineering
large language model
CivilGPT
domain-specific knowledge graph
civil-bench evaluation framework
分类号
TV17
[水利工程]
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 学习行为投入评测框架构建与实证研究
被引量:30
3
作者
张琪
武法提
机构
江苏师范大学智慧教育学院
北京师范大学教育技术学院
出处
《中国电化教育》
CSSCI
北大核心
2018年第9期102-108,共7页
基金
2014年全国教育科学"十二五"规划教育部重点课题"基于教育大数据的学习分析工具设计与应用研究"(课题编号:DCA140230)研究成果
文摘
作为学习者实际表现的主要驱动力量,学习行为投入还未能形成有效的评测体系。该文在对学习行为投入本质探寻的基础上,利用学习者对信息交换活动的适应性调节过程分析学习行为投入的状态,建立周期反馈循环模型,确定了包含持续性(Persistence)、反思性(Reflection)、主动性(Initiative)与专注性(Concentration)的"PRIC"评测维度以表征学习行为投入的水平。据此构建了基于教育云平台的学习行为投入评测框架。框架指标的探索性因子分析表明,4个因子积累方差解释率为64.90%,因子载荷在0.625至0.930之间;验证性因子分析表明,各拟合指数良好,标准化路径系数在0.60至0.94之间,建构信度为0.949;主成分回归分析表明,4个因子对学习结果具有36%的解释力。为更准确的构建评价体系,利用层次分析法建立指标权重,"PRIC"各维度的权重分别为0.3263、0.2121、0.2516与0.2100。
关键词
学习行为投入
“互联网+”教学
教育云平台
评测 框架
实证研究
Keywords
Learning Behavioral Engagement
"Internet+"Teaching
Educational Cloud Platform
Evaluation Framework
EmpiricalResearch
分类号
G434
[文化科学—教育技术学]
题名 ServerScope集成性能评测系统框架
被引量:1
4
作者
李小华
焦丽梅
王启荣
机构
中国科学院计算技术研究所国家智能计算机研究开发中心
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第16期51-53,56,共4页
基金
国家"863"计划基金资助项目(2002AA104410)
中科院计算所创新基金资助项目(20026030)
文摘
介绍了ServerScope集成性能评测系统框架结构的设计与实现。实践证明,利用框架技术显著降低了性能评测软件的开发成本和周期,其可维护性、可扩展性、易用性能较好地满足不同用户的评测需要。
关键词
性能评测
框架
可扩展性
可重用性
SERVERSCOPE
Keywords
Performance evaluation
Framework
Extensibility
Reusability: ServerScope
分类号
TP311.56
[自动化与计算机技术—计算机软件与理论]
题名 学习行为投入:定义、分析框架与理论模型
被引量:76
5
作者
武法提
张琪
机构
北京师范大学教育技术学院
江苏师范大学智慧教育学院
出处
《中国电化教育》
CSSCI
北大核心
2018年第1期35-41,共7页
基金
2014年全国教育科学"十二五"规划教育部重点课题"基于教育大数据的学习分析工具设计与应用研究"(课题编号:DCA140230)研究成果
文摘
"关注学习测量"已成为教育技术发展的重要趋势,学习行为投入的研究正日益受到重视。该文旨在围绕学习行为投入理论模型、发生机制和本质特征展开探索。通过对传统教育场景以及学习分析视角的相关文献梳理,比较不同研究视角的侧重点以及局限性,构建了"互联网+"混合学习环境中的学习行为投入理论模型。该理论模型包含学习行为序列与信息交换活动之间的引发与重组,信息交换活动与学习行为投入之间的驱动与阻碍两个双向交互阶段,以及一个指向学习绩效的单向过程。基于此,对学习行为投入的本质进行了界定。学习行为投入是学习者借助无缝学习空间,在工具、学习方式与学习任务的调控下,与学习资源、共同体进行信息交换活动的行为表达结果,其本质是基于线上线下双重教育供给的适应性调节学习行为。该理论框架的建立为后续评测与分析工具的设计奠定了基础。
关键词
学习行为投入
混合学习环境
定义
评测 框架
理论模型
Keywords
Learning Behavioral Engagement
Blended Learning Environment
Definition
Evaluation Framework
Theoretical Model
分类号
G434
[文化科学—教育技术学]
题名 PISA2018全球胜任力评测
被引量:15
6
作者
李杨
曾小平
机构
首都师范大学初等教育学院
出处
《外国中小学教育》
CSSCI
北大核心
2018年第5期25-32,共8页
基金
北京市社会科学基金项目
北京市教委社科计划重点项目"数学核心素养的内涵构建与培育研究"(项目编号:SZ20171002814)的研究成果
文摘
全球胜任力是全球年轻人面对瞬息万变的世界,谋求可持续发展的必备能力。PISA2018将首次对"全球胜任力"进行评测。评测框架对全球胜任力采取了四维度、四基石的多维、立体的定义,并根据所测对象性质不同,采用了认知测试和学生问卷两种评测方式。对PISA全球胜任力评测进行多角度审视,不仅可以丰富我国的测试理论和实践,还可以对在我国中小学全面开展"全球胜任力"教育提供重要的参考信息。
关键词
PISA2018
全球胜任力
评测 框架
Keywords
PISA 2018
global competence
framework
assessment framework
分类号
G511
[文化科学—教育技术学]
题名 基于任务需求的维和部队跨文化能力测评模型构建
被引量:6
7
作者
庞超伟
张探
机构
国防科技大学文理学院
出处
《外国语文》
北大核心
2021年第4期19-26,共8页
基金
国家社会科学基金重大项目“国防与军队改革视野下的国际语言能力建设研究”(16ZDA210)的阶段性研究成果。
文摘
本研究针对维和任务中大量的跨文化交际需求,旨在构建一个维和部队跨文化能力测评体系。在综合分析军事背景下跨文化能力研究现状的基础上,评述现有跨文化能力模型,结合维和任务性质和具体特点,构建适用于维和部队跨文化能力评测的理论模型。该理论模型含有知识、态度、技巧、意识四个模块,下辖11个具体评价要素,为下一步测量该群体跨文化能力现状,提出针对性的对策建议提供相应的理论支撑。
关键词
维和部队
跨文化能力
评测
理论框架
军事背景
Keywords
peacekeeping forces
cross-cultural competence
assessment
theoretical framework
military background
分类号
H030
[语言文字—语言学]
题名 基于大数据分析技术的大学生创新能力测评研究
被引量:2
8
作者
吴杰
张昊
机构
南京工业大学
出处
《现代电子技术》
2021年第11期125-129,共5页
基金
江苏省自然科学基金项目(BK20180703)
南京工业大学党建与思想政治教育研究课题(SZ20190209)。
文摘
针对当前的大学生创新能力测评系统存在误差大、精度低等不足,为了提高大学生创新能力测评精度,提出基于大数据分析的大学生创新能力测评系统。首先分析了当前大学生创新能力测评研究进展,找到引起大学生创新能力测评不足的因素;然后构建大学生创新能力测评系统的总体框架,并引入大数据分析技术描述大学生创新能力的变化特点,建立大学生创新能力评测模型;最后进行大学生创新能力评测仿真实验。结果表明,所提系统可以高精度拟合大学生创新能力变化特点,获得较高精度的大学生创新能力评测结果,具有十分重要的实际应用价值。
关键词
评测 系统
大学生创新
创新能力
大数据分析
系统框架 构建
仿真实验
Keywords
evaluation system
university student innovation
innovation ability
big data analysis
system framework construction
simulation experiment
分类号
TN99-34
[电子电信—信号与信息处理]
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于Gensim的摘要自动生成算法研究与实现
被引量:15
9
作者
肖元君
吴国文
机构
东华大学计算机科学与技术学院
出处
《计算机应用与软件》
北大核心
2019年第12期131-136,共6页
基金
国家自然科学基金项目(61472075)
文摘
为了让计算机能够对中文文章提取摘要,提出一种中文摘要自动生成算法。该算法基于Gensim自然语言处理框架实现,并在原有的基础上做出了改进,算法主要分为两个阶段。关键句生成阶段,对中文语料进行预处理,并放入Gensim框架中的Word2vec模型进行训练,修改TextRank算法使其能够接受词向量的输入生成无向图从而找到关键句;摘要生成框架构建阶段,根据文章结构与Gensim框架中的LDA主题模型所提取的关键词,赋予句子不同的权值,将分数高的几个句子组合生成文章摘要。Rouge摘要评测结果表明,该算法生成的摘要能够包含文章关键信息,相比于其他自动文摘算法,句意通顺程度得到了提升。
关键词
Gensim框架
Word2vec模型
TextRank算法
摘要生成框架
LDA主题模型
Rouge摘要评测
Keywords
Gensim framework
Word2vec model
TextRank algorithm
Abstract generation framework
LDA theme model
Rouge summary evaluation
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
题名 Web服务资源消耗脆弱性检测技术研究
被引量:1
10
作者
史立敏
王晓茜
张宏斌
刘心宇
汪旭童
机构
中国科学院信息工程研究所
中国科学院大学网络空间安全学院
中国电子信息产业集团有限公司第六研究所
出处
《信息安全研究》
2021年第6期527-534,共8页
基金
国家自然科学基金项目(61902396)。
文摘
当前,针对Web应用层的分布式拒绝服务攻击(distributed denial of service,DDoS)形式愈加严峻,但是对此类DDoS的缓解手段研究较少且技术不够成熟,并且主要聚集于攻击过程中的检测和流量清洗,而缺乏针对Web服务器资源消耗脆弱性的主动检测手段.为此,提出了面向Web服务资源消耗脆弱性的检测模型和评测框架,能够检测Web服务资源消耗脆弱点,并且评测Web服务资源消耗脆弱程度,旨在Web服务受到攻击前预先分析和了解Web服务的资源消耗脆弱性安全问题,为网站安全性能优化和需要采取的防御手段提供支撑.通过对某网站的实际测评验证了本模型和框架的有效性,能够通过对实际应用的网站进行Web服务资源消耗脆弱性检测和评测,发现其Web服务资源消耗脆弱点.
关键词
DDOS
WEB服务资源
定向分析
脆弱性测试
评测 框架
Keywords
distributed denial of service(DDoS)
Web service resource
directed analysis
vulnerability testing
evaluation framework
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]