期刊文献+
共找到165篇文章
< 1 2 9 >
每页显示 20 50 100
烟叶智能烘烤信息化考核模型的设计与应用
1
作者 杨楠 李许涛 +8 位作者 夏阳 赵浩宾 徐光辉 王鹏泽 宋翔 宋瑞芳 李敬 张迪 李垚斐 《安徽农学通报》 2025年第10期102-108,共7页
为评价烟叶烘烤过程、烘烤操作和工艺,有效追溯及分析烘烤中出现的问题,以中烟100烟叶为研究对象,设计了烟叶智能烘烤信息化考核模型,并采用自身前后对照设计应用该模型对烘烤人员(烘烤师及烘烤专职人员)进行考核评分,对烤后烟叶质量进... 为评价烟叶烘烤过程、烘烤操作和工艺,有效追溯及分析烘烤中出现的问题,以中烟100烟叶为研究对象,设计了烟叶智能烘烤信息化考核模型,并采用自身前后对照设计应用该模型对烘烤人员(烘烤师及烘烤专职人员)进行考核评分,对烤后烟叶质量进行分析。该模型包括烘烤执行单元、数据获取单元和评价单元,根据推荐的烘烤工艺和评分标准制定预警规则,并统计综合得分。模型实施后,烘烤师综合得分80分以上的人数增加5人,60分以下人数减少9人;烘烤专职人员综合得分80分以上人数增加6人;各区域综合得分平均提高2.03分,增幅2.77%;烤后烟叶外观质量总分提高11.9分,增幅30.59%;烤后烟叶淀粉含量降低7.29个百分点;烤后烟叶香气成分总量增加628.71μg/g,增幅75.88%。综合来看,该模型实现了以数据分析回溯问题,以考核评分促进整改,提高了烟叶烘烤质量,有利于烟区烘烤水平的提升。 展开更多
关键词 烤烟 智能评估 质量评价 数据分析 工艺优化
在线阅读 下载PDF
2020珠峰高程测量BDS-3数据质量分析
2
作者 杨强 党亚民 +2 位作者 蒋光伟 马新莹 孙洋洋 《导航定位学报》 北大核心 2025年第2期20-27,共8页
2020年珠峰高程测量首次以国产北斗卫星导航系统(BDS)接收机为核心装备,获取了北斗三号全球卫星导航系统(BDS-3)高精度观测数据。为了确保成果的可靠性,利用天宝(Trimble)接收机对国产接收机BDS-3观测结果进行检核。针对珠峰地形环境限... 2020年珠峰高程测量首次以国产北斗卫星导航系统(BDS)接收机为核心装备,获取了北斗三号全球卫星导航系统(BDS-3)高精度观测数据。为了确保成果的可靠性,利用天宝(Trimble)接收机对国产接收机BDS-3观测结果进行检核。针对珠峰地形环境限制导致全球卫星导航系统(GNSS)观测网形不佳、峰顶GNSS观测时间短等难题,提出三级控制策略相结合的GNSS观测网数据处理方案,通过构建地区GNSS基准网、局部GNSS控制网和峰顶联测网,在极其有限的珠峰观测时段内最大化地优化提取高质量GNSS观测数据。为了验证BDS-3观测数据的精度,对比全球定位系统(GPS)和BDS-3数据解算结果,并检核GNSS数据处理与分析软件(GPAS)/加米特(GAMIT)2种软件的BDS解算结果,结果表明,BDS-3处理结果精度与GPS成果精度相当,高程方向精度均优于2 cm,坐标差异均优于1 cm,验证了本次珠峰测高BDS-3观测成果的精度和可靠性。 展开更多
关键词 珠穆朗玛峰 数据处理 全球卫星导航系统(GNSS)控制网 高程测量 北斗三号全球卫星导航系统(BDS-3) 质量评估
在线阅读 下载PDF
基于环境质量指数的塔里木河下游生态输水效益评估
3
作者 艾力克木·司拉音 安外尔·艾则孜 +5 位作者 塔吉古丽·喀斯木 史智文 胥俊宇 则外日古丽·克比尔 玉米提·哈力克 艾里西尔·库尔班 《干旱区地理》 北大核心 2025年第1期31-42,共12页
环境质量指数(EQI)是由气候/气象、水资源、土壤、地形地貌和生物多样性等方面的环境要素组成的,能够快速全方位定量评估自然环境总体质量的工具。基于遥感、实地监测、文献等多源数据,用熵值法、主成分分析和层次分析等方法计算EQI,对2... 环境质量指数(EQI)是由气候/气象、水资源、土壤、地形地貌和生物多样性等方面的环境要素组成的,能够快速全方位定量评估自然环境总体质量的工具。基于遥感、实地监测、文献等多源数据,用熵值法、主成分分析和层次分析等方法计算EQI,对2000、2010年和2020年塔里木河下游自然环境质量进行综合评价。结果表明:(1)在生态输水作用下,2000—2020年塔里木河下游自然环境质量有显著改善。其中,EQI相对较高的区域主要分布在近河道两岸和湖盆周边。(2)2000—2010年环境质量改善(改善面积为15620 km^(2))较2010—2020年(改善面积为13831 km^(2))明显。(3)环境质量较差及以下(EQI<0.4)和较好(EQI≥0.8)等级的EQI的增加最为明显,而环境质量差(0.4≤EQI<0.5)和良好(0.6≤EQI<0.8)等级的EQI增加不显著。生态输水量的增加显著减少了EQI偏低和中等区域面积,促进了EQI偏高的区域面积增加,说明总体上生态输水改善了研究区环境质量。 展开更多
关键词 环境质量指数 综合评估 多源数据 塔里木河下游
在线阅读 下载PDF
中美CPI数据质量的比较分析--基于国际货币基金组织的DQAF框架 被引量:17
4
作者 高艳云 《统计研究》 CSSCI 北大核心 2008年第11期51-56,共6页
本文在国际货币基金组织提出的消费者价格指数数据质量评估框架(DQAF)下,着重从四个维度分析了中美两国CPI数据质量方面存在的差异,并在此基础上提出了相关结论和建议。
关键词 数据质量评估框架(dqaF) CPI 中美比较
在线阅读 下载PDF
基于多维度特征与PageRank优化的恶意网址研判方法研究
5
作者 王方圆 练智超 +2 位作者 李千目 顾欢欢 赵谦 《信息网络安全》 北大核心 2025年第4期564-577,共14页
随着互联网技术的快速发展,网络安全威胁日益严峻,恶意网址作为网络攻击的主要载体,通过钓鱼诈骗、恶意软件传播等手段严重威胁用户信息安全与数字资产安全。文章以提升恶意网址识别的准确性为研究目的,以恶意网址为研究对象,研究范围... 随着互联网技术的快速发展,网络安全威胁日益严峻,恶意网址作为网络攻击的主要载体,通过钓鱼诈骗、恶意软件传播等手段严重威胁用户信息安全与数字资产安全。文章以提升恶意网址识别的准确性为研究目的,以恶意网址为研究对象,研究范围涵盖多维度特征分析与PageRank算法优化,运用域名特征分析、备案信息查询、域名收录搜索、流量行为分析、内容质量评估、用户行为数据和时间衰减因子等研究方法与理论。文章结合自然语言处理技术、机器学习和时间衰减机制,提出一个综合的恶意网址研判体系,并验证了其在提高恶意网址识别准确率方面的有效性。实验结果表明,该方法在综合准确率上达到了99.99%,相比传统方法有显著提升。文章的研究成果为网络安全防护提供了有力支持,对于构建更加安全、可信的网络环境具有重要意义。 展开更多
关键词 恶意网址研判 PAGERANK算法 内容质量评估 用户行为数据 时间衰减因子
在线阅读 下载PDF
基于视觉的人体动作质量评价研究综述 被引量:1
6
作者 沈媛媛 张燕明 沈燕飞 《自动化学报》 北大核心 2025年第2期404-426,共23页
基于视觉的人体动作质量评价利用计算机视觉相关技术自动分析个体运动完成情况,并为其提供相应的动作质量评价结果.这已成为运动科学和人工智能交叉领域的一个热点研究问题,在竞技体育、运动员选材、健身锻炼、运动康复等领域具有深远... 基于视觉的人体动作质量评价利用计算机视觉相关技术自动分析个体运动完成情况,并为其提供相应的动作质量评价结果.这已成为运动科学和人工智能交叉领域的一个热点研究问题,在竞技体育、运动员选材、健身锻炼、运动康复等领域具有深远的理论研究意义和很强的实用价值.本文将从数据获取及标注、动作特征表示、动作质量评价3个方面对涉及到的技术进行回顾分析,对相关方法进行分类,并比较分析不同方法在AQA-7、JIGSAWS、EPIC-Skills 2018三个数据集上的性能.最后讨论未来可能的研究方向. 展开更多
关键词 动作质量 评价 计算机视觉 信息获取 特征表示 损失函数
在线阅读 下载PDF
基于大语言模型的航空发动机领域高质量数据集构建
7
作者 邹冠沄 王存俊 +2 位作者 孔寅豪 马小庆 李丕绩 《数据采集与处理》 北大核心 2025年第3期603-615,共13页
随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构... 随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构建方法,该方法无需人工干预即可生成高质量的开放式问答数据。在数据生成阶段,采用上下文学习方法和输入优先生成策略,增强了生成数据的稳定性;在数据过滤阶段,通过原文相似度的忠实度评估和大模型的语义质量评估,建立了数据质量自动评估机制,有效筛选出受幻觉影响的异常数据,确保数据的事实可靠性。实验结果表明,该方法显著提升了生成数据集的质量,经过指令微调后的模型在航空发动机领域的知识问答表现显著提升。本文的研究成果不仅为航空发动机领域的大模型应用提供了坚实基础,也为其他复杂工程领域的数据集自动化构建提供了参考。 展开更多
关键词 大语言模型 垂直领域大模型 问答数据生成 问答数据质量评估
在线阅读 下载PDF
大视场三线阵立体航测系统AMS-3000数据质量评价
8
作者 李天祺 张仙 +5 位作者 金鼎坚 高子弘 韩亚超 许宁 高菡 李恭馨 《自然资源遥感》 北大核心 2025年第3期142-151,共10页
大视场三线阵立体航测系统AMS-3000是我国首台自主研发的机载线阵航测系统,可获取全色和R,G,B多光谱影像,但对于其数据质量目前较少有定量的评价与分析。该文以四川省攀枝花市西部金沙江沿岸区域作为研究区,从灰度特征、纹理特征、能量... 大视场三线阵立体航测系统AMS-3000是我国首台自主研发的机载线阵航测系统,可获取全色和R,G,B多光谱影像,但对于其数据质量目前较少有定量的评价与分析。该文以四川省攀枝花市西部金沙江沿岸区域作为研究区,从灰度特征、纹理特征、能量特征和噪声水平4个方面评价了AMS-3000数据的光谱质量,并与国内外主流航摄系统ADS100进行了对比,以1∶2 000比例尺地形成果数据对AMS-3000的几何精度进行了评价;此外,该文还以矿产资源开发现状调查和地质灾害调查为例,分析了该系统在地质行业的应用效果。研究结果可为大视场三线阵立体航测系统的应用推广及改进提供参考。 展开更多
关键词 航空遥感 大视场三线阵立体航测系统 数据质量评价 地质应用
在线阅读 下载PDF
基于DQAF的数据质量评估机制设计 被引量:5
9
作者 刘鹏 《统计与决策》 CSSCI 北大核心 2021年第11期49-52,共4页
为进一步有效地在组织内推进数据质量评估工作,文章基于劳拉·塞巴斯蒂安-科尔曼提出的数据质量评估框架(DQAF),设计了一种通用工作机制,从数据质量评估的工作内容、工作流程和人员分工3个方面进行系统研究,完善工作内容,建立良性... 为进一步有效地在组织内推进数据质量评估工作,文章基于劳拉·塞巴斯蒂安-科尔曼提出的数据质量评估框架(DQAF),设计了一种通用工作机制,从数据质量评估的工作内容、工作流程和人员分工3个方面进行系统研究,完善工作内容,建立良性循环的工作流程。特别是针对原有的数据质量评估框架未能结合国内常见的企事业单位实际情况这一问题,提出按环节划分的人员分工模式,可覆盖机关、企事业单位等多种不同性质的组织,确保整个数据质量评估工作机制有效实施。 展开更多
关键词 数据质量 评估机制 dqaF
在线阅读 下载PDF
毒理学数据质量评价现状与展望
10
作者 凌敏 卞倩 《中国药理学与毒理学杂志》 CAS 北大核心 2024年第10期787-795,共9页
毒理学数据的质量对于毒性评价和风险预测的科学性至关重要。整合多种证据流和提高毒理学数据的质量对于更有效、更准确地开展健康风险评估必不可少。目前,国际上常用的毒理学数据质量评价体系包括Klimisch评级系统和ToxRTool评价工具... 毒理学数据的质量对于毒性评价和风险预测的科学性至关重要。整合多种证据流和提高毒理学数据的质量对于更有效、更准确地开展健康风险评估必不可少。目前,国际上常用的毒理学数据质量评价体系包括Klimisch评级系统和ToxRTool评价工具及近年来发展起来的SciRAP评价工具和综合风险信息系统工具。我国针对食品安全风险评估中的毒理学数据开发了TRAM可靠性评价工具。上述评价工具具有不同的应用背景和评价标准的适用性,各有优点和不足。 展开更多
关键词 毒理学数据质量 替代方法 数据质量评价体系 风险评估
在线阅读 下载PDF
基于EDA统计图量化的桥梁动态监测数据质量评估
11
作者 殷鹏程 谭曼丽莎 +1 位作者 曹阳梅 单德山 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期9-16,共8页
探索性数据分析统计图在桥梁健康监测动态数据质量评估中已有广泛应用。为了减少人工观察统计图的主观性,通过近似度量方法实现统计图的量化分析,得到多个指标对监测数据进行快速质量评估。在运营环境激励作用下,桥梁结构动力响应具有... 探索性数据分析统计图在桥梁健康监测动态数据质量评估中已有广泛应用。为了减少人工观察统计图的主观性,通过近似度量方法实现统计图的量化分析,得到多个指标对监测数据进行快速质量评估。在运营环境激励作用下,桥梁结构动力响应具有短时线性平稳性,近似服从正态分布。以某大跨斜拉桥振动数据为研究对象,首先,绘制样本数据直方图和Q-Q图,通过观察数据分布特征预先判断数据质量,确定优、良和差3个等级。然后,分别通过KL散度和余弦相似度2种近似度量方法对样本数据直方图和Q-Q图进行量化,得到数据服从正态分布程度的指标;通过箱线图检测样本数据全局异常点,得到正常数据占比;统计分析得到量化值和先验质量等级的对应关系,确定以直方图KL散度和余弦相似度为主、以箱线图正常数据占比为辅的数据质量评估标准。最后,取部分数据为验证集,进一步验证所提方法各个指标的合理性,并给出该方法在实际工程上的应用结果。 展开更多
关键词 桥梁工程 桥梁结构健康监测 数据质量评估 探索性数据分析 KL散度 余弦相似度 箱线图
在线阅读 下载PDF
基于组合赋权法和模糊综合评价的电力设备状态数据质量评估 被引量:23
12
作者 计蓉 侯慧娟 +3 位作者 盛戈皞 张立静 舒博 江秀臣 《高电压技术》 EI CAS CSCD 北大核心 2024年第1期274-281,I0021,共9页
随着电力网络的扩大以及工业信息化的迅速发展,在电力领域中采集和待处理的数据量呈现爆发式增长,数据的丢失、冗余、异常、冲突等问题也日益突出,影响数据的质量。数据质量评估作为保证数据质量的关键一环,发挥着重要作用。针对电力设... 随着电力网络的扩大以及工业信息化的迅速发展,在电力领域中采集和待处理的数据量呈现爆发式增长,数据的丢失、冗余、异常、冲突等问题也日益突出,影响数据的质量。数据质量评估作为保证数据质量的关键一环,发挥着重要作用。针对电力设备的状态数据提出一种数据质量评估方法,选择完整性、准确性、唯一性、一致性、及时性5个评估指标构建数据质量评估体系,设置了定量计算的评估规则;组合运用模糊层次分析法和熵权法来确定各评估维度的权重,以提高数据质量评估的科学性;再运用模糊综合评价法,依据隶属函数来确定数据质量的所属等级。最后运用上述方法,对某地的油色谱数据质量进行评估,该方法计算得到数据质量的评分为77.15,处于“中等”等级。评估结果与实际应用场景相符,表明该文提出的方法适用于电力设备状态数据质量评估。 展开更多
关键词 大数据 电力设备 数据质量评估 模糊层次分析法 熵权法 模糊综合评价
在线阅读 下载PDF
基于域随机化的绝缘子缺损数据自动生成与评价方法 被引量:2
13
作者 刘庆臻 刘亚东 +3 位作者 严英杰 姜骞 王龙 江秀臣 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期1900-1912,共13页
机器代人巡检已逐步在电力巡检场景中得到广泛应用,绝缘子作为维护电力系统安全可靠稳定运行的重要设备,对其缺陷进行准确有效检测具有重要意义。绝缘子缺损识别是绝缘子缺陷检测中的重要任务,针对当前绝缘子缺损数据样本较少且样本不平... 机器代人巡检已逐步在电力巡检场景中得到广泛应用,绝缘子作为维护电力系统安全可靠稳定运行的重要设备,对其缺陷进行准确有效检测具有重要意义。绝缘子缺损识别是绝缘子缺陷检测中的重要任务,针对当前绝缘子缺损数据样本较少且样本不平衡,模型泛化能力差、数据标注不精确的问题,该文提出基于域随机化的缺损样本自动生成框架与样本图像质量评估方法,在虚拟域到真实域的绝缘子缺损检测域适应问题上取得了较好的效果,并基于该方法生成图像标注数据供开源使用。该文提出的域随机化数据生成方法首先基于程序化建模生成结构可调的绝缘子伞盘模型并基于纹理噪声模型建立了包含陶瓷绝缘子常见色彩、纹理信息的程序化纹理模型,进而基于网格噪声模型建立了绝缘子缺损切割模块,随后通过域随机化生成完整的绝缘子结构、纹理模型、缺损结构、背景信息与场景物体。在图像渲染和自动标注环节,首先基于相机对准与能见度自动生成与调整拍摄点及相机参数,进而提出了基于光线投射方法建立数据标注类别判定方法,设置实例对应的图像渲染通道进行图像渲染,完成批量数据生成。该文采用域随机化生成的3000张虚拟数据在不修改YOLO V5网络结构、模型参数的基础上训练模型,在300张真实绝缘子缺损图像上进行测试,正常绝缘子识别准确率达到97.8%,召回率92.1%,缺损绝缘子识别准确率79.0%,召回率75.9%,各检测类别的准确率和召回率均高于基于400张真实图像训练得到的检测模型的推理结果。该文提出的图像样本质量评估方法考虑了与真实域数据的相似度和样本在数据集中的独立性,将所得评价结果代入损失函数权重计算,进一步提升了推理结果,缺损绝缘子识别准确率85.3%,召回率77.8%。 展开更多
关键词 域随机化 域适应 绝缘子缺损检测 图像质量评估 合成数据 3维建模
在线阅读 下载PDF
风云三号微波温度计长序列再定标历史数据集质量评估 被引量:1
14
作者 曹皓东 张鹏 +3 位作者 廖蜜 谷松岩 安大伟 郭杨 《大气科学学报》 CSCD 北大核心 2024年第4期669-680,共12页
以METOP-A、Suomi-NPP历史资料作为参照,系统分析比较了2008—2020年4颗风云三号卫星的微波温度计(Microwave Temperature Sounder, MWTS)再定标历史资料质量。结果表明,4颗卫星的MWTS探测性能稳步上升,再定标数据集有效消除了遥感仪器... 以METOP-A、Suomi-NPP历史资料作为参照,系统分析比较了2008—2020年4颗风云三号卫星的微波温度计(Microwave Temperature Sounder, MWTS)再定标历史资料质量。结果表明,4颗卫星的MWTS探测性能稳步上升,再定标数据集有效消除了遥感仪器在轨期间数据异常跳变、寿命期内遥感仪器辐射响应衰变、不同卫星间的辐射定标差异等因素影响,大幅提升了MWTS历史数据集的准确性和均匀性,使得再定标后的对流层和平流层通道数据与国外同类型仪器数据偏差在±0.1 K范围内。本文还重点分析比较了对流层中高层和平流层低层两个探测通道,结果表明FY-3D MWTS再定标数据和美国NOAA卫星应用研究中心STAR长序列数据集针对中高层大气的表现类似,平均亮温在时间变化和空间分布具有相似的特征,月均全球高空亮温年变化趋势差异最大为0.002 4。因此,2020年之后的FY-3D再定标数据,可以接续STAR长序列数据集,用于中高层大气的温度变化检测与分析。 展开更多
关键词 风云卫星 微波温度计 长序列历史资料 再定标 数据质量评估
在线阅读 下载PDF
结合最小数据集和改进灰色-TOPSIS的全国耕地土壤质量评价及影响因素研究 被引量:2
15
作者 刘加敏 陈敏 +2 位作者 刘洋 周广华 张郁 《天津农业科学》 CAS 2024年第5期79-84,共6页
探究耕地土壤质量的空间分布及影响因素,为指导农户行为及促进农业生态可持续发展提供理论依据,基于中国土壤数据集(HWSD V2.1),利用主成分分析构建耕地土壤质量评价的最小数据集,结合灰色-TOPSIS多目标评价模型,对全国(港澳台除外)耕... 探究耕地土壤质量的空间分布及影响因素,为指导农户行为及促进农业生态可持续发展提供理论依据,基于中国土壤数据集(HWSD V2.1),利用主成分分析构建耕地土壤质量评价的最小数据集,结合灰色-TOPSIS多目标评价模型,对全国(港澳台除外)耕地土壤质量进行评价,运用地理探测器探索外部因子(年平均降水、年平均温度、人口密度和GDP)对耕地土壤质量的影响程度。结果表明:(1)最小数据集能有效减少指标体系之间的相关性,改进灰色-TOPSIS方法一定程度上提高耕地土壤质量评估的准确性;(2)根据耕地土壤质量评价结果,将耕地质量分为5个等级,从全国范围来看,长江中下游区、华南区耕地土壤质量较好,而黄土高原区、青藏高原区、内蒙古高原区耕地土壤质量则较差;(3)从地理探测器结果来看,年平均温度与年平均降水量共同对耕地土壤质量的解释程度大的省份共有20个,远远大于其他两两因子共同对耕地土壤的解释程度,2个因素交互作用效果大于单因子对耕地土壤质量的影响。综上,年平均降水量和年平均温度是影响耕地土壤综合质量的主要因素。 展开更多
关键词 最小数据集 灰色-TOPSIS 土壤质量评价 地理探测器
在线阅读 下载PDF
基于点云数据的预制叠合板尺寸质量智能检测方法 被引量:5
16
作者 马晓晓 张胜 +3 位作者 程国忠 傅丽华 胡申林 李阳 《土木与环境工程学报(中英文)》 CSCD 北大核心 2024年第1期102-109,共8页
为保证预制叠合板在施工现场能顺利安装,在出厂前通常需要对其进行尺寸质量检测,现有预制叠合板的尺寸质量检测方法难以全面准确地测量叠合板的实际三维尺寸。提出一种基于预制叠合板点云数据的多尺寸质量智能检测方法。对采集的点云数... 为保证预制叠合板在施工现场能顺利安装,在出厂前通常需要对其进行尺寸质量检测,现有预制叠合板的尺寸质量检测方法难以全面准确地测量叠合板的实际三维尺寸。提出一种基于预制叠合板点云数据的多尺寸质量智能检测方法。对采集的点云数据进行预处理后,利用机器学习算法完成预制叠合板点云的自动定位与分割;依据不同的检测任务,将目标点云沿不同方向降维,映射为二维灰度图像;利用图像特征检测算法,分别实现叠合板底板的长宽、预留胡子筋的出筋长度与间距及桁架钢筋高度的自动检测;在验证试验中,对3块预制叠合板的点云数据进行尺寸质量检测。结果表明,提出的智能检测方法能全面准确地完成预制叠合板出厂尺寸质量检测,能进一步提高预制叠合板非接触质量检测结果的科学性与精准性。 展开更多
关键词 点云数据 预制叠合板 尺寸质量 智能检测 三维激光扫描
在线阅读 下载PDF
面向多样化数据清洗任务的证据集智能选择方法 被引量:1
17
作者 钱泽凯 丁小欧 +2 位作者 孙哲 王宏志 张岩 《计算机科学》 CSCD 北大核心 2024年第8期124-132,共9页
由于针对单一特定数据质量问题而设计的数据清洗算法并不总能有效地适用于多种清洗需求共存的数据质量提升技术,因此可采用多种清洗方法互相配合的方式来解决各种数据清洗需求。将数据清洗问题转换为证据集的生成和选择问题,基于聚合查... 由于针对单一特定数据质量问题而设计的数据清洗算法并不总能有效地适用于多种清洗需求共存的数据质量提升技术,因此可采用多种清洗方法互相配合的方式来解决各种数据清洗需求。将数据清洗问题转换为证据集的生成和选择问题,基于聚合查询的增量式质量评估方案和基于中间算子证据集的算子结果选择方案,在多种清洗任务下实现了多种清洗方法配合的高效数据清洗。在所提清洗模型中,算子库提供数据清洗结果并将其转换为中间算子;中游的采样器将中间算子集分流和剪枝,给搜索器提供优质的候选证据集;下游的搜索器在质量评估器的指导下进行证据集的选择,搜索完毕后向上游算子库更新数据和必要的参数,使算子库重新迭代生成中间算子。最后,基于3个不同规模的真实数据集进行了大量实验,通过不同数据清洗任务下的性能验证在任意种类的数据清洗需求下算子编排的可行性,并将所提方法和现有的智能数据清洗系统进行性能对比。结果表明,在多种清洗任务中,所提方法在多种数据质量约束、动态和大规模的数据清洗方面具有稳定的准确率和召回率,且同一清洗时间下异常值、规则违反和混合错误的清洗任务性能优于其他智能数据清洗系统15%以上。 展开更多
关键词 数据清洗 数据质量评估 流水线系统设计 算子选择 证据集
在线阅读 下载PDF
基于零知识证明和区块链的联邦学习激励方案 被引量:4
18
作者 吴昊天 李一凡 +1 位作者 崔鸿雁 董琳 《信息网络安全》 CSCD 北大核心 2024年第1期1-13,共13页
在跨孤岛联邦学习中,各参与者对最终训练出的模型贡献各异,如何评估他们的贡献并给予适当激励,成为联邦学习研究中一项关键问题。目前的激励方法主要着眼于奖励有效模型更新的参与者,同时惩罚不诚实者,侧重于激励计算行为。然而,参与者... 在跨孤岛联邦学习中,各参与者对最终训练出的模型贡献各异,如何评估他们的贡献并给予适当激励,成为联邦学习研究中一项关键问题。目前的激励方法主要着眼于奖励有效模型更新的参与者,同时惩罚不诚实者,侧重于激励计算行为。然而,参与者所提供的数据质量同样影响学习效果,但现有方法未充分考虑数据质量,并缺乏鉴定数据真实性的手段。为提升激励的准确性,需对参与者数据质量进行评估。通过融合零知识证明与区块链技术,文章提出一种评估参与者数据质量的协议,构建了全新联邦学习激励方案。该方案可在不泄露明文数据的前提下,评估参与者所用数据集质量,通过区块链系统向合格参与者发放激励,拒绝不合格者。实验证实,在部分用户提供虚假数据的情况下,该方案仍能准确给出激励结果,同时提升联邦学习模型的准确率。 展开更多
关键词 零知识证明 区块链 激励机制 联邦学习 数据质量评估
在线阅读 下载PDF
重庆市植烟土壤质量评价指标体系的构建与应用 被引量:2
19
作者 代先强 周嵘 +1 位作者 周鑫斌 冉茂 《土壤》 CAS CSCD 北大核心 2024年第2期388-397,共10页
为准确评价重庆市烟区土壤质量,以重庆2 513个代表性植烟单元(每个单元面积约6.7 hm^(2))的典型烟田土壤理化指标数据为基础,采用聚类分析法和主成分分析法建立了土壤质量评价最小数据集,构建了植烟土壤质量评价指标体系。结果表明:(1)... 为准确评价重庆市烟区土壤质量,以重庆2 513个代表性植烟单元(每个单元面积约6.7 hm^(2))的典型烟田土壤理化指标数据为基础,采用聚类分析法和主成分分析法建立了土壤质量评价最小数据集,构建了植烟土壤质量评价指标体系。结果表明:(1)基于主成分分析法建立的土壤质量评价体系更适合重庆烟区土壤质量评价,评价指标从原来的16个减为7个,具体为:p H、有机质、有效磷、有效铁、有效锌、有效硫和水稳性大团聚体。(2)烟区土壤酸化较为严重,有35.1%的烟田土壤偏酸;土壤氮素较为适宜,而有效磷和速效钾偏高的烟田占比分别为62.9%和75.8%,其他元素缺乏和过量并存,水稳性大团聚体偏低的烟田占比47.2%。(3)对基于最小数据集构建模型进行的合理性验证发现,基于主成分分析法确定的最小数据集(MDS-PCA)模型的R2比基于聚类分析法确定的最小数据模型的R~2高,前者的MAE、RMSE相比后者更小,说明MDS-PCA能够替代全量数据集对烟田土壤质量进行评价;基于MDS-PCA得到的土壤质量指数平均值为0.61,表明烟区土壤质量总体处于中等偏低水平,45.04%的烟田土壤质量急需提升。(4)土壤质量评价指标隶属度值雷达图表明,pH、有效磷、有效铁、有效硫和水稳性大团聚体的隶属度比较小,为烟区土壤质量限制性因子。 展开更多
关键词 植烟土壤 质量评价 聚类分析 主成分分析 最小数据集
在线阅读 下载PDF
工业多元时序数据质量评估方法
20
作者 宋洪涛 于江生 韩启龙 《计算机应用》 CSCD 北大核心 2024年第6期1743-1750,共8页
现有的数据质量评估(DQA)方法通常只从特定数据质量维度(DQD)的基本概念分析,忽略了能够反映数据质量(DQ)关键信息的细粒度的子维度对评估结果的影响。针对上述问题,提出一种工业多元时序数据质量评估(IMTSDQA)方法。首先,对于待评估的D... 现有的数据质量评估(DQA)方法通常只从特定数据质量维度(DQD)的基本概念分析,忽略了能够反映数据质量(DQ)关键信息的细粒度的子维度对评估结果的影响。针对上述问题,提出一种工业多元时序数据质量评估(IMTSDQA)方法。首先,对于待评估的DQD,如完整性、规范性、一致性、唯一性和准确性等进行细粒度划分,考虑同一DQD内或不同DQD间各子维度的相关性以确定这些子维度的度量;其次,对完整性的属性完整性、记录完整性、数值完整性,规范性的类型规范性、精度规范性,一致性的顺序一致性、逻辑一致性,唯一性的属性唯一性、记录唯一性,准确性的范围准确性、数值准确性等子维度进行权重分配,进而充分挖掘DQD的深层次信息,从而获得反映DQ详情的评估结果。实验结果表明,与现有的基于框架定性分析、依据DQD基本定义构建模型的方法相比,IMTSDQA能更详细、更全面地评估DQ,且不同DQD的评估结果更能客观准确地反映DQ问题。 展开更多
关键词 数据质量 多元时序数据 数据质量维度 数据质量评估 相关性
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部