期刊文献+
共找到190篇文章
< 1 2 10 >
每页显示 20 50 100
基于多激发与层级标签的野生菌图像分类
1
作者 龙朝勋 李俊仪 +3 位作者 李向阳 李海燕 李红松 余鹏飞 《计算机工程与设计》 北大核心 2025年第4期941-949,共9页
为利用生物学多层级类别正确鉴别野生菌种类,提出一种多层级标签的分类网络。引入高效通道注意力(ECA)构建多激发模块,提取并融合多种判别性特征。推广条件概率权重矩阵并以决策融合构建多层级分类器(MHC),实现更广泛的逐层级监督与引... 为利用生物学多层级类别正确鉴别野生菌种类,提出一种多层级标签的分类网络。引入高效通道注意力(ECA)构建多激发模块,提取并融合多种判别性特征。推广条件概率权重矩阵并以决策融合构建多层级分类器(MHC),实现更广泛的逐层级监督与引导。基于准确率动态加权各层级损失项,调整训练侧重点,舍弃KL散度正则项,规避对交叉熵损失的干扰。实验结果表明,提出方法在“种”层级上Top1准确率可达98.17%,识别为可食用的有毒样本的比例(风险指数)达到最低水平,为3.64‰。t-SNE可视化显示,提取的特征的类内聚集性和类间可分离性有所提升。 展开更多
关键词 野生菌 层级标签 细粒度分类 决策融合 动态加权 KL散度 风险指数
在线阅读 下载PDF
基于大模型微调的生成式文献层次分类标引
2
作者 胡忠义 税典程 吴江 《情报学报》 北大核心 2025年第4期425-437,共13页
对文献进行自动的分类标引,有利于实现文献的分类存储、排列和检索。已有研究通常采用判别式模型对文献的浅层类别进行自动识别,而在深层次类别划分和准确性方面能力不足。鉴于此,本研究将文献的层次分类问题转换为文献层次类别标签的... 对文献进行自动的分类标引,有利于实现文献的分类存储、排列和检索。已有研究通常采用判别式模型对文献的浅层类别进行自动识别,而在深层次类别划分和准确性方面能力不足。鉴于此,本研究将文献的层次分类问题转换为文献层次类别标签的生成任务,并构建了基于大模型微调的生成式文献层次分类标引框架。首先,该框架采用自然语言的形式对文献的层次分类号进行标签解释;其次,采用高效微调技术对开源大语言模型进行有监督微调;最后,采用微调后的大模型直接生成文献的多层分类标签,通过标签映射得到文献的中图分类号。在经济、医药卫生和工业技术三类学科数据上进行实验检验,结果表明,有监督微调能够有效提升通用大语言模型在文献层次分类标引任务上的理解与推理能力,也取得了比传统判别式模型更好的分类性能;整合文献的摘要、题名和关键词,可以有效提升微调大语言模型的分类性能;通过对比不同参数规模的Baichuan2和Qwen1.5大模型,发现微调后的Qwen1.5-14B Chat模型表现最佳,其在一级类目上能够达到98%的分类性能,在最具挑战性的五级类目上也达到了80%的准确性;典型样例分析展示了微调后的Qwen1.5-14B-Chat具备一定的纠错能力。 展开更多
关键词 大语言模型 文献分类标引 层次分类 《中国图书馆分类法》
在线阅读 下载PDF
云南省国有林场林业机械化水平评价指标体系及评价方法
3
作者 张静 支玲 曾雪 《林业机械与木工设备》 2025年第2期11-17,共7页
基于云南省特殊的地理条件、林场对林业机械装备的需求以及国有林场的职能,建立适宜云南省国有林场林业机械化水平评价的指标体系和方法,建立引导林场机械化发展,提升林场装备水平,实现林业现代化的保障。通过文献梳理、实地调查和访谈... 基于云南省特殊的地理条件、林场对林业机械装备的需求以及国有林场的职能,建立适宜云南省国有林场林业机械化水平评价的指标体系和方法,建立引导林场机械化发展,提升林场装备水平,实现林业现代化的保障。通过文献梳理、实地调查和访谈,建立了林业机械化能力水平、林业机械化保障水平、林业机械化效益水平3个状态层,8个主题层共32个指标的云南省国有林场林业机械化水平评价指标体系,并通过层次分析法确定各指标的权重,为林场的机械化水平评价奠定基础。 展开更多
关键词 云南省 国有林场 机械化水平 评价指标 层次分析法
在线阅读 下载PDF
基于Donabedian理论的儿童肝移植全周期护理质量指标体系构建 被引量:2
4
作者 唐诗 黄明珠 +3 位作者 陆晔峰 刘文卓 王贝贝 王艳 《中国医学科学院学报》 CAS CSCD 北大核心 2024年第1期55-61,共7页
目的初步构建儿童肝移植全周期护理质量指标体系,以期为护理质量监测及管理提供依据。方法以Donabedian“结构-过程-结果”三维质量评价模型为理论框架,采用文献分析、德尔菲法及层次分析法,构建儿童肝移植全周期护理质量指标体系的内... 目的初步构建儿童肝移植全周期护理质量指标体系,以期为护理质量监测及管理提供依据。方法以Donabedian“结构-过程-结果”三维质量评价模型为理论框架,采用文献分析、德尔菲法及层次分析法,构建儿童肝移植全周期护理质量指标体系的内容及指标权重。结果3轮函询问卷的有效回收率均为100%,专家权威系数分别为0.95、0.96、0.98,肯德尔和谐系数分别为0.165、0.209、0.220(P均<0.001)。最终构建的质量指标体系包括一级指标3项、二级指标15项、三级指标67项。结论初步构建儿童肝移植全周期护理质量指标体系,可为儿童肝移植护理质量评价提供参考依据。 展开更多
关键词 儿童肝移植 全周期 护理质量 指标 德尔菲法 层次分析
在线阅读 下载PDF
锡林郭勒盟大型露天煤矿区地质环境时空演化评价 被引量:3
5
作者 何辉 穆文平 +5 位作者 张晓 宋煜冰 吕远洋 武雄 叶宝莹 白中科 《地学前缘》 EI CAS CSCD 北大核心 2024年第3期443-457,共15页
内蒙古锡林郭勒盟大型露天煤矿区经过20多年的开发,产生了一系列矿山地质环境问题,矿区地质环境在一定程度上遭到破坏,因此,开展大型露天煤矿区地质环境时空演化评价可为矿区生态地质环境修复提供参考。本文对锡林郭勒盟3个大型矿区进... 内蒙古锡林郭勒盟大型露天煤矿区经过20多年的开发,产生了一系列矿山地质环境问题,矿区地质环境在一定程度上遭到破坏,因此,开展大型露天煤矿区地质环境时空演化评价可为矿区生态地质环境修复提供参考。本文对锡林郭勒盟3个大型矿区进行地质环境时空演化评价。首先通过现场调查,明确了研究区主要的矿山地质环境问题,包括植被覆盖度下降、土地压占(排土场和工业场地)、地形地貌景观破坏(露天采坑)和含水层破坏等4类;其次利用遥感影像定量获取了2000—2020年之间的矿山地质环境问题信息,并建立了矿山地质环境评价指标体系;然后应用层次分析法确定了矿山地质环境评价指标的权重,并通过基于GIS的影响指数模型对矿山地质环境影响进行了评价和区划,探讨了矿山地质环境时空演化规律。研究结果表明:(1)3个大型矿区植被覆盖度下降区域的面积、排土场压占土地面积和露天采坑破坏地形地貌景观面积随时间不断增加;(2)大型矿区采矿对地质环境的影响划分为无影响区、轻微影响区、一般影响区、较强影响区和强烈影响区5个等级分区;(3)3个大型矿区地质环境时空演化规律基本相同,不同影响区的空间分布特征和面积随时间变化的规律不同。 展开更多
关键词 露天煤矿区 地质环境 植被覆盖度 层次分析法 影响指数模型 时空演化评价
在线阅读 下载PDF
护理研究生科研伦理素养评价指标体系的构建 被引量:1
6
作者 孔浩鑫 李明霞 +1 位作者 王雪贝 林树豪 《护理学杂志》 CSCD 北大核心 2024年第12期112-115,共4页
目的构建护理研究生科研伦理素养评价指标体系,为客观评价护理研究生的科研伦理素养提供工具。方法以素质冰山模型为理论基础,基于文献回顾和小组讨论拟订护理研究生科研伦理素养评价指标体系初稿,应用德尔菲法和层次分析法确定最终评... 目的构建护理研究生科研伦理素养评价指标体系,为客观评价护理研究生的科研伦理素养提供工具。方法以素质冰山模型为理论基础,基于文献回顾和小组讨论拟订护理研究生科研伦理素养评价指标体系初稿,应用德尔菲法和层次分析法确定最终评价指标体系和权重。结果2轮函询专家积极系数分别为100%和85.0%,专家权威系数为0.900、0.921,肯德尔和谐系数为0.134、0.189(均P<0.05)。最终形成的护理研究生科研伦理素养评价指标体系,包括2个一级指标(外显科研伦理素养、内隐科研伦理素养)、5个二级指标(科研伦理知识、科研伦理技能、科研伦理能力、科研伦理态度、科研伦理价值观)、31个三级指标。结论构建的护理研究生科研伦理素养评价指标体系科学合理,可作为护理研究生科研伦理素养的评价工具。 展开更多
关键词 护理研究生 护理科研 科研伦理 素养 评价指标体系 素质冰山模型 德尔菲法 层次分析法
在线阅读 下载PDF
张家口柴宣盆地浅层地下水水化学特征及水质评价 被引量:3
7
作者 陈迎辉 马苗苗 +2 位作者 刘月东 闫佰忠 陈莹 《科学技术与工程》 北大核心 2024年第7期3010-3019,共10页
地下水作为张家口地区的主要供水水源,近年来受人类活动影响水质有恶化的趋势,影响了当地的用水安全,确定地下水化学特征与水质状况对水资源合理利用具有重要意义。基于2020年水质数据,选取Ca^(2+)、Mg^(2+)、K^(+)、Na^(+)、HCO^(-)_(3... 地下水作为张家口地区的主要供水水源,近年来受人类活动影响水质有恶化的趋势,影响了当地的用水安全,确定地下水化学特征与水质状况对水资源合理利用具有重要意义。基于2020年水质数据,选取Ca^(2+)、Mg^(2+)、K^(+)、Na^(+)、HCO^(-)_(3)、TH、pH、TDS、SO_(4)^(2-)、Cl^(-)、Al^(3+)、NO^(-)_(3)、F^(-)、Cr^(6+)等水质因子,通过数理统计法、Piper三线图、Gibbs图和岩石风化端元图对张家口柴宣盆地地区浅层地下水水化学特征进行分析,并采用模糊综合评价和改进内梅罗指数法对水质进行评价。结果表明:研究区地下水是Ca^(2+)和HCO^(-)_(3)为主的弱碱性淡水,微硬水、硬水和极硬水分别占39.51%、34.57%和25.93%;沿地下水流向,地下水化学类型由HCO_(3)-Ca·Mg、HCO_(3)-Na、SO_(4)·Cl-Na型转变为HCO_(3)-Ca·Mg、HCO_(3)-Na、SO_(4)·Cl-Ca·Mg型,水化学组分的空间分布特征主要受到硅酸盐、碳酸盐的风化溶解和人类活动影响;地下水水质整体满足III类标准,但部分地区水质较差;沿着地下水流向,水质逐渐变差,主要受原生地质环境和工业、农业污染的影响。 展开更多
关键词 水化学特征 水质评价 模糊综合评价 改进内梅罗指数法 主成分分析 系统聚类分析 柴宣盆地
在线阅读 下载PDF
威士忌制备过程中理化指标及挥发性风味物质动态变化规律研究 被引量:3
8
作者 陈文波 张一 +4 位作者 李小燕 杨海莺 牛丽敏 赵凯 李慧 《中国酿造》 CAS 北大核心 2024年第2期88-97,共10页
威士忌是麦芽经糖化、发酵、蒸馏、桶陈等工序制成的蒸馏酒。为明确麦汁发酵及蒸馏过程中理化指标及挥发性风味物质的变化规律,该研究以蒸馏麦芽为原料、以威士忌专用商业酵母为发酵剂制备威士忌。采用高效液相色谱(HPLC)、气相色谱-质... 威士忌是麦芽经糖化、发酵、蒸馏、桶陈等工序制成的蒸馏酒。为明确麦汁发酵及蒸馏过程中理化指标及挥发性风味物质的变化规律,该研究以蒸馏麦芽为原料、以威士忌专用商业酵母为发酵剂制备威士忌。采用高效液相色谱(HPLC)、气相色谱-质谱联用(GC-MS)等技术检测原酒浆发酵及蒸馏过程中理化指标和挥发性风味物质,并基于馏分关键风味物质(气味活度值(OAV)>1)进行主成分分析(PCA)和层次聚类分析(HCA)。结果表明,原酒浆中糖分、酒精度和主要酯类物质在第2天出现拐点;乙酸、丙酸和乳酸含量随着发酵时间增加,在第3天分别达到0.03 g/L、0.13 g/L和0.49 g/L。通过主成分分析(PCA)和层次聚类分析(HCA)可明显区分馏分。该研究结果可为威士忌发酵工艺优化及酒心摘取提供数据支撑。 展开更多
关键词 威士忌 原酒浆 理化指标 馏分 挥发性风味物质 主成分分析 层次聚类分析
在线阅读 下载PDF
基于分区层次图的海量高维数据学习索引构建方法
9
作者 华悦琳 周晓磊 +2 位作者 范强 王芳潇 严浩 《计算机工程与科学》 CSCD 北大核心 2024年第7期1193-1201,共9页
学习索引是破解海量高维数据近似最近邻搜索问题的关键。然而,现有学习索引技术结果仅局限于单个分区中,且依赖于近邻图的构建。随着数据维度和规模的增长,索引难以对分区边界数据进行精确判断,并且构建时间复杂度增大,可扩展性难以保... 学习索引是破解海量高维数据近似最近邻搜索问题的关键。然而,现有学习索引技术结果仅局限于单个分区中,且依赖于近邻图的构建。随着数据维度和规模的增长,索引难以对分区边界数据进行精确判断,并且构建时间复杂度增大,可扩展性难以保障。针对上述问题,提出了基于分区层次图的学习索引方法PBO-HNSW。该方法对分区边界数据进行重新分配,并行构建分布式图索引结构,从而有效应对近似最近邻搜索问题所面临的挑战。实验结果表明,该方法能够在百万级海量高维数据上实现毫秒级的索引构建。当召回率为0.93时,PBO-HNSW方法构建时间仅为基线方法的36.4%。 展开更多
关键词 近似最近邻搜索 学习索引 层次可导航小世界图 分区学习 索引结构
在线阅读 下载PDF
基于多时相Sentinel-2A影像的狼毒分布识别
10
作者 房家玮 胡念钊 +1 位作者 王怀玉 刘咏梅 《草业科学》 CAS CSCD 北大核心 2024年第2期322-331,共10页
狼毒(Stellera chamaejasme)是近年来青藏高原高寒草地的主要入侵毒杂草之一,及时高效的调查与监测可为狼毒综合防控与退化草地恢复提供重要的技术支持。本研究选取花期前与盛花期的Sentinel-2A多光谱影像,将Google Earth Engine平台去... 狼毒(Stellera chamaejasme)是近年来青藏高原高寒草地的主要入侵毒杂草之一,及时高效的调查与监测可为狼毒综合防控与退化草地恢复提供重要的技术支持。本研究选取花期前与盛花期的Sentinel-2A多光谱影像,将Google Earth Engine平台去云、环境要素掩膜、特征优选和随机森林分类相结合,探讨区域尺度的狼毒遥感识别方法。结果表明,通过狼毒敏感指数计算,以及Spearman秩相关性分析与随机森林重要性排序相结合的二次降维,提取了7项狼毒分类特征并构建了4个特征组合方案。与单时相特征组合相比,多时相特征组合有效提高了狼毒识别精度,其中,基于随机森林模型的6个特征组合方案的分类总精度为84.62%,狼毒分类精度均大于80%,识别效果最佳。本研究显示,影像去云及掩膜预处理能够有效减少分类干扰信息,花期前与盛花期提取的多时相特征组合增强了狼毒群落与其他群落的影像光谱差异,在区域尺度狼毒遥感识别中具有较好的应用潜力。 展开更多
关键词 去云 特征优选 分层掩膜 多时相分析 随机森林 敏感指数 狼毒
在线阅读 下载PDF
煤化工企业消防救援能力评估方法研究 被引量:1
11
作者 周洪涛 赵开功 +2 位作者 张晓蕾 孔言言 王睿迪 《中国安全科学学报》 CAS CSCD 北大核心 2024年第S01期205-211,共7页
为科学评估消防救援能力,并提出有效的防控火灾风险建议,基于层次分析-模糊综合模型,构建适用于煤化工企业特征的消防救援能力评价体系,并通过具体案例验证该评价指标体系及模型的科学性、适用性和准确性。研究结果表明:随着我国经济社... 为科学评估消防救援能力,并提出有效的防控火灾风险建议,基于层次分析-模糊综合模型,构建适用于煤化工企业特征的消防救援能力评价体系,并通过具体案例验证该评价指标体系及模型的科学性、适用性和准确性。研究结果表明:随着我国经济社会的蓬勃发展,消防救援任务的范畴逐渐呈现出多元化、复杂化的趋势。在这种日新月异的环境中,消防应急救援是否能够在关键时刻果断、准确、高效地应对,是当前研究亟需解决的关键问题。该评价指标体系和所用的模型方法可为煤化工相关企业的消防救援能力建设提供一个新的视角,为消防救援能力建设提供决策支持。 展开更多
关键词 煤化工 消防救援 能力评估 指标体系 层次分析-模糊综合模型
在线阅读 下载PDF
基于TVP-HFAVAR模型的我国动态金融状况指数构建及应用
12
作者 司颖华 文清 汪卢俊 《统计研究》 CSSCI 北大核心 2024年第12期42-53,共12页
随着金融深化和金融广化的不断发展,金融冲击对实体经济的影响愈发明显,构建能够及时反映金融市场变动并监控宏观经济走势的我国动态金融状况指数(HDFCI),具有重要意义。本文首先使用混频动态因子(MF-DFM)模型构建月度GDP,然后基于分层... 随着金融深化和金融广化的不断发展,金融冲击对实体经济的影响愈发明显,构建能够及时反映金融市场变动并监控宏观经济走势的我国动态金融状况指数(HDFCI),具有重要意义。本文首先使用混频动态因子(MF-DFM)模型构建月度GDP,然后基于分层因子模型从利率、信贷、货币、房价、股价和汇率6类金融子市场共37个金融指标中提取出6个金融公因子,再将月度GDP和金融因子带入时变因子加强型向量自回归(TVP-FAVAR)模型来构建我国动态金融状况指数,并分析其与CPI、GDP的关系。研究发现,本文构建的HDFCI与CPI、GDP有着较强的相关性,符合我国金融市场的现实情况;HDFCI的各权重具有时变性,其中房价、信贷和货币市场权重相对较高,而汇率、利率等权重相对较小;从长周期看,HDFCI比CPI和GDP领先约6个月,能有效预测宏观经济波动。本文拓展了金融状况指数的方法研究,构建了符合我国现实情况和经济走势的金融状况指数,可为相关政策制定提供科学依据。 展开更多
关键词 金融状况指数 混频动态因子模型 分层因子模型 谱分析
在线阅读 下载PDF
有向图上基于层次树索引的最大cycle truss社区搜索
13
作者 宗传玉 张纯鹤 夏秀峰 《计算机应用》 CSCD 北大核心 2024年第1期190-198,共9页
社区搜索旨在从信息网络中找出包含用户查询顶点的高内聚连通子图,cycle truss是一种基于cycle三角形的社区搜索模型,而现有的基于索引的cycle truss社区搜索方法存在索引空间大、搜索效率低、社区内聚性低的缺点。为了解决这一问题,提... 社区搜索旨在从信息网络中找出包含用户查询顶点的高内聚连通子图,cycle truss是一种基于cycle三角形的社区搜索模型,而现有的基于索引的cycle truss社区搜索方法存在索引空间大、搜索效率低、社区内聚性低的缺点。为了解决这一问题,提出一种基于层次树索引的最大cycle truss社区搜索方法。首先,提出了k-cycle truss分解算法,并引入了两个重要的概念:cycle三角连通与k-层次等价。基于k-层次等价设计了层次树索引TreeCIndex与表结构索引SuperTable,在此基础上,并基于这两个新的索引,提出了两个高效的cycle truss社区搜索算法。在4个真实数据集上与已有的基于TrussIndex与EquiTruss的社区搜索算法进行了比较,实验结果表明,TreeCIndex与SuperTable比TrussIndex与EquiTruss节省至少41.5%的空间,索引构建的时间节省8.2%至98.3%,且搜索最大cycle truss社区的效率分别高出了一个和两个数量级。 展开更多
关键词 有向图 社区搜索 cycle truss cycle三角形 层次等价 层次树索引
在线阅读 下载PDF
基于贝叶斯分层模型的甘肃省国道路面损坏状况指数分析
14
作者 陈涛 曾铭 +1 位作者 余遥 胡潇潇 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期790-797,共8页
对甘肃省普通国道路面损坏状况指数(P_(CI))的自然衰减规律建立统计模型.考虑到甘肃省不同地区之间存在完全不同的气候环境的情况,根据降水量、日照时长等环境数据对不同路段进行聚类,基于年交通当量(整个年度内的交通当量)与P_(CI)数据... 对甘肃省普通国道路面损坏状况指数(P_(CI))的自然衰减规律建立统计模型.考虑到甘肃省不同地区之间存在完全不同的气候环境的情况,根据降水量、日照时长等环境数据对不同路段进行聚类,基于年交通当量(整个年度内的交通当量)与P_(CI)数据,利用吉布斯采样进行贝叶斯推断建立贝叶斯分层模型.结果表明,在不同的评价标准下,贝叶斯分层模型在测试集的整体表现优于非分层模型.年交通量对甘肃省不同气候区域国道路段的P_(CI)的影响没有区别;具有较大P_(CI)初始值的路段其P_(CI)值经历一年期衰减后倾向于增大,同时P_(CI)初始值对P_(CI)的衰减起到缓解作用.不同区域P_(CI)初始值的影响程度不相同,河西地区国道路段的P_(CI)初始值对缓解未来一年P_(CI)的衰减作用最大,其次为陇东南地区,最弱为兰州地区及陇东高纬度地区. 展开更多
关键词 路面状况指数 年交通当量 贝叶斯分层模型 吉布斯采样
在线阅读 下载PDF
全球及中国心血管疾病科技影响力评价方法研究
15
作者 郝军 郎欣月 +2 位作者 王杨 曹也丁 李卫 《中国循环杂志》 CSCD 北大核心 2024年第3期279-284,共6页
目的:评估多种综合评价方法在心血管疾病科技影响力评价中的应用。方法:依据全球及中国科技影响力综合评价体系及指标权重,运用层级式多维度指标综合评价、标准化处理法、极值处理法和秩次评价法,对2016~2021年全球医疗机构心血管疾病... 目的:评估多种综合评价方法在心血管疾病科技影响力评价中的应用。方法:依据全球及中国科技影响力综合评价体系及指标权重,运用层级式多维度指标综合评价、标准化处理法、极值处理法和秩次评价法,对2016~2021年全球医疗机构心血管疾病论文影响力、全国医院心血管疾病科技影响力进行排名。结果:四种评价方法的结果一致性较高,其中标准化处理法和极值处理法的结果较为接近,秩次评价法与层级式多维度指标综合评价法的相似度较高,层级式多维度指标综合评价更能够突出高质量科技成果的重要性。结论:层级式多维度指标综合评价是将层级式指标体系、分梯队评价规则和秩次评价法整合在一起的综合评价过程,能够突出注重高质量科技成果,响应科技成果分类多维度评价的导向,具有可操作性和可推广性,为国内医疗机构综合评价实践提供一定参考。 展开更多
关键词 层级式多维度指标综合评价 心血管疾病 科技影响力
在线阅读 下载PDF
云南省国有林场林业机械化水平评价指标体系及评价方法
16
作者 张静 支玲 曾雪 《林业机械与木工设备》 2024年第12期55-61,共7页
基于云南省特殊的地理条件、林场对林业机械装备的需求以及国有林场的职能,建立适宜云南省国有林场林业机械化水平评价的指标体系和方法,建立引导林场机械化发展,提升林场装备水平,实现林业现代化的保障。通过文献梳理、实地调查和访谈... 基于云南省特殊的地理条件、林场对林业机械装备的需求以及国有林场的职能,建立适宜云南省国有林场林业机械化水平评价的指标体系和方法,建立引导林场机械化发展,提升林场装备水平,实现林业现代化的保障。通过文献梳理、实地调查和访谈,建立了林业机械化能力水平、林业机械化保障水平、林业机械化效益水平3个状态层,8个主题层共32个指标的云南省国有林场林业机械化水平评价指标体系,并通过层次分析法确定各指标的权重,为林场的机械化水平评价奠定基础。 展开更多
关键词 云南省 国有林场 机械化水平 评价指标 层次分析法
在线阅读 下载PDF
基于余弦相似度的文本空间索引方法研究 被引量:56
17
作者 张振亚 王进 +1 位作者 程红梅 王煦法 《计算机科学》 CSCD 北大核心 2005年第9期160-163,共4页
基于相似度的数据空间索引在数据挖掘及数据可视化等方面有着重要的应用。本文以新闻的标题为研究对象,提出了以 CrossAVL为基础的文本对象层次式聚类方法以及文本信息空间索引算法 FastMap-MDS,有效地保持了文本对象间的相似信息。实... 基于相似度的数据空间索引在数据挖掘及数据可视化等方面有着重要的应用。本文以新闻的标题为研究对象,提出了以 CrossAVL为基础的文本对象层次式聚类方法以及文本信息空间索引算法 FastMap-MDS,有效地保持了文本对象间的相似信息。实验表明,该方法具有较高的效率和精度。 展开更多
关键词 余弦相似度 数据空间 索引方法 数据挖掘 数据可视化 数据库
在线阅读 下载PDF
HiBase:一种基于分层式索引的高效HBase查询技术与系统 被引量:56
18
作者 葛微 罗圣美 +6 位作者 周文辉 赵頔 唐云 周娟 曲文武 袁春风 黄宜华 《计算机学报》 EI CSCD 北大核心 2016年第1期140-153,共14页
大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主... 大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主键索引,不支持非主键索引,这导致HBase的数据查询效率较低,难以满足数据实时或准实时查询需求.为此,在HBase基础上提供面向非主键的快速查询能力,是目前Hadoop环境下急需研究和解决的一个重要问题.该文研究提出了一种基于分层式HBase非主键索引的查询模型和方法,该模型和方法首先建立基于HBase的持久性索引.然后,为了利用内存提升查询性能,该文进一步提出了一种索引热点数据缓存技术和一种高效的热度累积缓存替换策略,以降低对HBase索引表的磁盘访问开销.热度累积缓存替换策略克服了最近最少使用(LRU)算法的局限性,考虑数据访问的累积热度和时间局部特性,从而更准确地捕获数据访问的特征.为了使索引热点数据缓存内存层具有良好的可扩展性,HiBase设计了基于一致性哈希的分布式内存缓存,支持高效的基于非主键的单点查询和范围查询.最终,该文设计实现了完整的分层式索引和查询系统HiBase.在千万至十亿条记录规模数据集上的测试结果表明,HiBase冷查询响应时间比标准HBase快65倍(大结果集)到3000多倍(小结果集);而引入基于查询热度累积算法的内存索引缓存方法后,热查询性能可在HiBase冷查询基础上再提升5~15倍,使得总体查询性能比标准HBase快300多倍(大结果集)到1.7万倍(小结果集),比开源的Hindex系统快5~20倍. 展开更多
关键词 HBASE 非主键索引 查询处理 分层式索引 缓存替换策略 大数据
在线阅读 下载PDF
一种Hadoop小文件存储和读取的方法 被引量:39
19
作者 张春明 芮建武 何婷婷 《计算机应用与软件》 CSCD 北大核心 2012年第11期95-100,共6页
HDFS(Hadoop Distributed File System)凭借其高容错、可伸缩和廉价存储的优点,在当前面向云计算的应用场景中得到了广泛应用。然而,HDFS设计的初衷是存储超大文件,对于海量小文件,由于NameNode内存开销等问题,其存储和读取性能并不理... HDFS(Hadoop Distributed File System)凭借其高容错、可伸缩和廉价存储的优点,在当前面向云计算的应用场景中得到了广泛应用。然而,HDFS设计的初衷是存储超大文件,对于海量小文件,由于NameNode内存开销等问题,其存储和读取性能并不理想。提出一种基于小文件合并的方法 HIFM(Hierarchy Index File Merging),综合考虑小文件之间的相关性和数据的目录结构,来辅助将小文件合并成大文件,并生成分层索引。采用集中存储和分布式存储相结合的方式管理索引文件,并实现索引文件预加载。此外,HIFM采用数据预取的机制,提高顺序访问小文件的效率。实验结果表明,HIFM方法能够有效提高小文件存储和读取效率,显著降低NameNode和DataNode的内存开销,适合应用在有一定目录结构的海量小文件存储的应用场合。 展开更多
关键词 HDFS 小文件 HIFM 分层索引 索引预加载 数据预取
在线阅读 下载PDF
云环境下一种隐私保护的高效密文排序查询方法 被引量:21
20
作者 程芳权 彭智勇 +2 位作者 宋伟 王书林 崔一辉 《计算机学报》 EI CSCD 北大核心 2012年第11期2215-2227,共13页
数据前端加密是保护云环境下外包数据隐私的一种有效手段,但却给数据查询等操作带来挑战.针对云环境下多数据拥有者数据外包及选择性访问授权特征,为支持大规模加密云数据上高效且隐私保护的用户个性化密文查询,文中提出了一种隐私保护... 数据前端加密是保护云环境下外包数据隐私的一种有效手段,但却给数据查询等操作带来挑战.针对云环境下多数据拥有者数据外包及选择性访问授权特征,为支持大规模加密云数据上高效且隐私保护的用户个性化密文查询,文中提出了一种隐私保护的高效密文排序查询方法RQED.通过设计无证书认证的PKES(支持关键词检索的公钥加密),并构建RQED框架来实现强隐私保护的密文查询.基于该框架,设计了更合理的多属性多关键词密文查询排序函数,并提出了基于层次动态布隆过滤器的RQED索引机制,提高密文查询时空效率.理论分析和实验性能对比证明:RQED在确保查询强隐私保护和高准确性的同时,具有较明显的时空效率优势. 展开更多
关键词 云计算 布隆过滤器 排序查询 层次索引 无证书认证
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部