期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
数据分类分级技术研究综述
1
作者 刘乐源 陈格格 +2 位作者 吴炜 王永 周帆 《计算机科学》 北大核心 2025年第9期195-211,共17页
近年来,各类信息系统和物联网不断发展,与人类日常生活的融合日趋紧密,由此产生的海量数据已经成为当今社会经济中的一种新型生产要素,甚至是国家战略资源。对数据要素进行有效的管理,越来越得到国家、企业和科研机构的重视。准确合理... 近年来,各类信息系统和物联网不断发展,与人类日常生活的融合日趋紧密,由此产生的海量数据已经成为当今社会经济中的一种新型生产要素,甚至是国家战略资源。对数据要素进行有效的管理,越来越得到国家、企业和科研机构的重视。准确合理的数据分类分级作为数据治理任务中最基础的一步,将对后续数据的确权、共享、安全保护等产生重大影响。首先,对数据分类分级任务进行定义,并介绍了传统分类分级的方法;其次,对新近基于人工智能尤其是大语言模型的数据分类分级技术进行了概括和对比;随后,鉴于数据分类分级与行业的相关性,对重点行业和领域中的数据分类分级应用情况进行了介绍;最后,对数据分类分级技术的发展进行了前瞻,讨论了未来面临的新挑战和可能的发展方向。 展开更多
关键词 数据分级分类 数据要素治理 机器学习 深度学习 大语言模型
在线阅读 下载PDF
基于图解析的端到端片段藏文语义角色标注方法
2
作者 班玛宝 罗鹏 +3 位作者 头旦才让 尼玛扎西 才让加 于永斌 《北京大学学报(自然科学版)》 北大核心 2025年第3期440-450,共11页
语义角色标注作为通往语义理解的重要途径,在机器翻译、信息抽取和问答系统中具有广泛的应用价值.本文通过借鉴英文和汉文中较为成熟的语义角色标注方法,在已有藏文语义标注体系和方法的基础上,提出一种基于图解析的端到端片段(span)藏... 语义角色标注作为通往语义理解的重要途径,在机器翻译、信息抽取和问答系统中具有广泛的应用价值.本文通过借鉴英文和汉文中较为成熟的语义角色标注方法,在已有藏文语义标注体系和方法的基础上,提出一种基于图解析的端到端片段(span)藏文语义角色标注方法.该方法将基于片段的藏文语义角色标注转换成基于词的图解析任务,可分为语义角色标注到图的转换和图至语义角色标注的恢复两个阶段.第一阶段采用藏文预训练语言模型(TiUniLM)进行动态词嵌入,并通过引入谓词标识器P,自动指定谓词,然后通过设计"门控"机制长短时记忆网络(GM-LSTM)对时序特征进一步建模.第二阶段使用Viterbi约束解码,对不合法的图进行校正.最后,通过在TSRLD-Span上的实验表明,该方法在测试集上的最佳F1值可达89.69%,相比基线模型,性能具有显著提升,验证了该方法的有效性. 展开更多
关键词 自然语言处理 图解析 片段 藏文语义角色标注 谓词标识器
在线阅读 下载PDF
基于微调Qwen2自动构建领域UML模型
3
作者 李嘉威 邓媛丹 陈波 《计算机科学》 北大核心 2025年第S1期19-22,共4页
提出了一种基于大模型微调技术的领域UML(统一建模语言)自动构建系统,用于将各领域软件系统制作需求的自然语言描述自动转换为符合统一建模语言标准的UML类图。研究过程包括自然文本数据集构建、模型微调、量化部署以及前端交互界面的... 提出了一种基于大模型微调技术的领域UML(统一建模语言)自动构建系统,用于将各领域软件系统制作需求的自然语言描述自动转换为符合统一建模语言标准的UML类图。研究过程包括自然文本数据集构建、模型微调、量化部署以及前端交互界面的开发。通过此系统,非专业用户可以通过简单的自然语言输入,自动生成符合统一建模语言标准的UML类图,大大降低了时间和人力成本。 展开更多
关键词 大模型微调 领域建模 数据集构建 统一建模语言
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部