期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向小样本抽取式问答的多标签语义校准方法
1
作者 刘青 陈艳平 +2 位作者 邹安琪 秦永彬 黄瑞章 《应用科学学报》 CAS CSCD 北大核心 2024年第1期161-173,共13页
小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同... 小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同层级的语义提出了一种面向小样本抽取式问答任务的多标签语义校准方法。采用包含全局语义信息的头标签和基线模型中的特殊字符构成多标签进行语义融合,并利用语义融合门来控制全局信息流的引入,将全局语义信息融合到特殊字符的语义信息中。然后,利用语义筛选门对新融入的全局语义信息和该特殊字符的原有语义信息进行保留与更替,实现对标签偏差语义的校准。在8个小样本抽取式问答数据集中的56组实验结果表明:该方法在评价指标F1值上均明显优于基线模型,证明了所提方法的有效性和先进性。 展开更多
关键词 样本抽取式问答 跨度抽取式问答 多标签语义融合 双门控机制 机器阅读理解
在线阅读 下载PDF
基于影响度的光电测量设备测试性验证试验样本抽取方法 被引量:2
2
作者 何洋 李洪涛 张凯 《现代电子技术》 2014年第3期31-34,37,共5页
为解决目前光电测量设备测试性验证试验中,因样本抽取方法不合理导致试验结论可信度低的问题,通过考虑危害度和故障扩散强度这两个与测试性相关的重要因素,提出了影响度的概念。从功能特征出发,构建功能模块-故障信息模型,利用该模型提... 为解决目前光电测量设备测试性验证试验中,因样本抽取方法不合理导致试验结论可信度低的问题,通过考虑危害度和故障扩散强度这两个与测试性相关的重要因素,提出了影响度的概念。从功能特征出发,构建功能模块-故障信息模型,利用该模型提出了基于影响度的样本抽取方法并给出试验抽取流程。此方法依据影响度相对比率,随机抽取出被测单元的故障样本,可较好地提高样本集代表性,确保试验结论置信度。并以某型光电测量设备中的时统终端单元为例,利用基于影响度的方法进行样本抽取,比较分析抽取结果证明该方法有效可行。 展开更多
关键词 光电测量设备 测试性验证 影响度 功能模块-故障信息模型 样本抽取
在线阅读 下载PDF
面向垂直领域上下文特性的少样本关系抽取方法
3
作者 任浩 李韧 +4 位作者 杨建喜 肖桥 杨小霞 蒋仕新 王笛 《中文信息学报》 北大核心 2025年第1期65-78,共14页
现有的少样本关系抽取解决方案主要基于通用领域语料,尚未充分考虑垂直领域中存在的长文本、关系重叠等问题,面对垂直领域上下文时其关系抽取性能有待提升。针对上述问题,该文以桥梁检测领域和医疗健康领域为背景,提出了一种面向垂直领... 现有的少样本关系抽取解决方案主要基于通用领域语料,尚未充分考虑垂直领域中存在的长文本、关系重叠等问题,面对垂直领域上下文时其关系抽取性能有待提升。针对上述问题,该文以桥梁检测领域和医疗健康领域为背景,提出了一种面向垂直领域上下文特性的少样本关系抽取方法。该方法首先通过预训练语言模型RoBERTa_chinese_base对文本进行编码,再分别在双向长短时记忆网络(BiLSTM)和实体特征提取模块中进一步提取上下文特征和实体级特征,并在特征融合的基础上,通过原型网络进行关系预测。实验结果显示,该文方法在自建的桥梁检测领域数据集Bridge-FewRel上评测结果优于对比的基线模型。在中文医疗健康领域数据集TinyRel-CM的少样本关系抽取任务上,该文方法的大部分结果优于基线模型。同时,该文方法在公有领域数据集FewRel 1.0的5-way-5-shot和10-way-5-shot任务上也取得了有竞争力的结果。 展开更多
关键词 样本关系抽取 垂直领域 RoBERTa 原型网络
在线阅读 下载PDF
基于数据挖掘建立高校系科办学评估体系的合理性评价系统 被引量:5
4
作者 陈丽 陈根才 《浙江大学学报(理学版)》 CAS CSCD 2001年第3期263-268,共6页
本文运用关联规则发现方法对人事信息库进行数据挖掘 ,寻找高校系科办学评估体系中各因素间的关联关系 ,并根据关联关系强弱分析各因素的权重设置的合理性 .本文分析和指出了现有一些算法的优缺点 ,提出了 Tid- optim算法 ,并对发现的... 本文运用关联规则发现方法对人事信息库进行数据挖掘 ,寻找高校系科办学评估体系中各因素间的关联关系 ,并根据关联关系强弱分析各因素的权重设置的合理性 .本文分析和指出了现有一些算法的优缺点 ,提出了 Tid- optim算法 ,并对发现的规则进行分析 ,通过数据抽样建立合理性评价系统 ,有效地解决了权重设置的不合理问题 ,为高校管理决策提供科学依据 . 展开更多
关键词 数据挖掘 关联规则 样本抽取 高校 系科办学评估体系 评价系统 权重设置
在线阅读 下载PDF
二维磁性纳米结构材料的Monte Carlo模拟 被引量:1
5
作者 姜冬华 关治强 +3 位作者 林海 李书平 张志鹏 吴晨旭 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第2期189-192,共4页
运用MonteCarlo模拟方法,通过分析系统自旋序参数与温度的变化关系了解纳米结构材料磁性的特征.计算模拟结果表明,磁性纳米材料具有比同等大小和平均密度的单晶低的居里温度,且在相变过程中往往会出现一些亚稳态.研究结果提供了一种解... 运用MonteCarlo模拟方法,通过分析系统自旋序参数与温度的变化关系了解纳米结构材料磁性的特征.计算模拟结果表明,磁性纳米材料具有比同等大小和平均密度的单晶低的居里温度,且在相变过程中往往会出现一些亚稳态.研究结果提供了一种解析金属纳米结构材料特性的重要方法. 展开更多
关键词 纳米材料 MONTE CARLO模拟 二维磁性纳米结构材料 自旋序参数 居里温度 Metropo1is样本抽取
在线阅读 下载PDF
基于数据抽样的自动k-means聚类算法 被引量:4
6
作者 罗军锋 洪丹丹 《现代电子技术》 2014年第8期19-21,共3页
为了解决传统k-means算法需要输入k值和在超大规模数据集进行聚类的问题,这里在前人研究基础上,首先在计算距离时引入信息熵,在超大规模数据集采用数据抽样,抽取最优样本数个样本进行聚类,在抽样数据聚类的基础上进行有效性指标的验证,... 为了解决传统k-means算法需要输入k值和在超大规模数据集进行聚类的问题,这里在前人研究基础上,首先在计算距离时引入信息熵,在超大规模数据集采用数据抽样,抽取最优样本数个样本进行聚类,在抽样数据聚类的基础上进行有效性指标的验证,并且获得算法所需要的k值,然后利用引入信息熵的距离公式再在超大数据集上进行聚类。实验表明,该算法解决了传统k-means算法输入k值的缺陷,通过数据抽样在不影响数据聚类质量的前题下自动获取超大数据集聚类的k值。 展开更多
关键词 K-MEANS算法 信息熵 最优样本抽取 有效性指标
在线阅读 下载PDF
住户调查中的抽样设计问题及改进建议 被引量:2
7
作者 李锋 《统计与决策》 CSSCI 北大核心 2014年第12期F0002-F0002,F0003,共2页
2010年国家统计局决定对城乡分别进行的住户调查进行改革.2012年12月1日开始实施城乡一体化住户调查,统一阋查指标,统一样本抽取,统一数据生产,统一数据发布,实现了城乡住户调查的统一、规范和一体化.能够提供全体居民统一的收... 2010年国家统计局决定对城乡分别进行的住户调查进行改革.2012年12月1日开始实施城乡一体化住户调查,统一阋查指标,统一样本抽取,统一数据生产,统一数据发布,实现了城乡住户调查的统一、规范和一体化.能够提供全体居民统一的收入、支出和消费数据,能够提供城乡可比、地域可比的城乡居民和分省、分市、分县居民的收入、支出和消费数据. 展开更多
关键词 住户调查 设计问题 城乡一体化 抽样 住房 国家统计局 2010年 样本抽取
在线阅读 下载PDF
大学生个性特征的研究
8
作者 冯治隆 毛志雄 +1 位作者 李瑛 韩旭 《北京林业大学学报》 CAS CSCD 北大核心 1989年第A01期38-47,共10页
一、前言 为祖国建设培养身心健康、全面发展的合格人才,是我国社会主义教育的主要目标。其中,培养和发展学生良好的个性品质,使之形成健康和完善的个性,是实现这一教育目标的重要组成部分,同时也是教书育人、因材施教的必要条件。
关键词 大学生 个性特征 样本抽取 16PF测评 心理结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部