期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于有限个条件FP_树中挖掘频繁模式
1
作者 林丽 冯少荣 薛永生 《计算机工程与应用》 CSCD 北大核心 2007年第5期175-177,共3页
在数据挖掘中发现关联规则是一个基本问题,而关联规则发现中最昂贵的步骤便是寻找频繁模式。FP_growth(FrequentPatern growth)方法在产生长短频繁项集时不产生候选项集,从而大大提高了挖掘的效率,但是FP_growth在挖掘频繁模式时候产生... 在数据挖掘中发现关联规则是一个基本问题,而关联规则发现中最昂贵的步骤便是寻找频繁模式。FP_growth(FrequentPatern growth)方法在产生长短频繁项集时不产生候选项集,从而大大提高了挖掘的效率,但是FP_growth在挖掘频繁模式时候产生大量的条件FP树从而占用大量空间,对FP_growth进行研究并提出一种改进算法,该算法不仅利用FP_growth算法所有优点而且避免了FP_growth的缺陷。主要通过建立有限棵条件FP树(数目为事务数据库的属性个数)来挖据长短频繁模式,大大节省了FP_growth算法所需要空间,实验证明该文算法是有效的。 展开更多
关键词 关联规则 FP_growth 频繁模式 条件FP
在线阅读 下载PDF
基于增强CT影像组学特征建立条件推理树模型对肾癌亚型的鉴别诊断 被引量:20
2
作者 鲍远照 程琦 +3 位作者 葛亚琼 严立 张龙龙 韦炜 《中国医学影像学杂志》 CSCD 北大核心 2020年第7期520-523,共4页
目的探讨基于增强CT影像组学特征建立的条件推理树模型鉴别常见病理亚型肾细胞癌(RCC)的价值。资料与方法回顾性分析经病理学检查证实且具有完整CT增强图像的120枚RCC病灶,其中肾透明细胞癌(CCRCC)60枚、肾嫌色细胞癌(CRCC)27枚、乳头... 目的探讨基于增强CT影像组学特征建立的条件推理树模型鉴别常见病理亚型肾细胞癌(RCC)的价值。资料与方法回顾性分析经病理学检查证实且具有完整CT增强图像的120枚RCC病灶,其中肾透明细胞癌(CCRCC)60枚、肾嫌色细胞癌(CRCC)27枚、乳头状肾细胞癌(PRCC)33枚。利用ITK-Snap软件在皮髓期病灶最大层面轴位图像勾画感兴趣区。利用A.K.软件提取感兴趣区处的影像组学特征。将病灶随机分为训练组和验证组(约7∶3)。通过Pearson相关分析及随机森林函数进行特征筛选。利用所选特征建立条件推理树模型“ctree”。使用验证组受试者工作特征曲线评价模型的鉴别诊断能力。结果每枚病灶提取396项组学特征,过滤筛选后获得32项特征用于建立条件推理树模型。模型所得CCRCC、CRCC、PRCC组的ROC曲线下面积分别为0.87、0.70、0.89,敏感度分别为79.2%、60.0%、69.2%,特异度分别为91.3%、81.1%、88.2%。结论基于增强CT影像组学特征建立和验证的条件推理树模型在鉴别3种常见的病理亚型RCC时具有较高的临床价值。 展开更多
关键词 肾细胞 体层摄影术 X线计算机 影像组学 条件推理 诊断 鉴别
在线阅读 下载PDF
基于CAN-树的高效关联规则增量挖掘算法 被引量:9
3
作者 邹力鹍 张其善 《计算机工程》 CAS CSCD 北大核心 2008年第3期29-31,共3页
关联规则是数据挖掘领域的一个重要研究方向。针对关联规则的增量挖掘问题,该文提出一种快速算法FIAFAR。算法使用CAN-树存储原始交易数据库,弥补了FP-树的不足,适应于增量挖掘以及最小支持度变化的情况。采用子父节点指针的设计,可以... 关联规则是数据挖掘领域的一个重要研究方向。针对关联规则的增量挖掘问题,该文提出一种快速算法FIAFAR。算法使用CAN-树存储原始交易数据库,弥补了FP-树的不足,适应于增量挖掘以及最小支持度变化的情况。采用子父节点指针的设计,可以快速生成条件模式树,提高算法的效率。实验验证了算法的有效性。 展开更多
关键词 数据挖掘 关联规则 条件模式 指针
在线阅读 下载PDF
机会不平等的测度:回归树模型的应用与比较 被引量:5
4
作者 李金叶 郝雄磊 《统计与信息论坛》 CSSCI 北大核心 2019年第10期3-13,共11页
采用CGSS数据,根据样本出生年份划分为20世纪“50年代”“60年代”“70年代”和“80年代”四个群体,为减少模型选择过程中个人主观因素影响,采用回归树中的条件推断树、条件推断森林算法,得到“事前”法视角下各个群体机会不平等绝对和... 采用CGSS数据,根据样本出生年份划分为20世纪“50年代”“60年代”“70年代”和“80年代”四个群体,为减少模型选择过程中个人主观因素影响,采用回归树中的条件推断树、条件推断森林算法,得到“事前”法视角下各个群体机会不平等绝对和相对程度。研究显示:各个年代机会树终端节点数目分别为23、33、35、23,环境变量与个体收入之间均存在复杂非线性关系;户口类型是影响“50年代”机会不平等最主要环境变量,“60年代”是性别,“70、80年代”是居住地,且户口类型重要性持续下降,而居住地重要性持续上升;比较不同模型的样本表现,条件推断森林在测试集上的均方误差最小,其次是条件推断树,均优于参数法和非参数法;机会不平等的绝对程度由“50年代”的0.129下降到“80年代”的0.049,相对程度由35.3%下降到19.8%。 展开更多
关键词 机会不平等 条件推断 条件推断森林 “事前”法
在线阅读 下载PDF
寒门何以出贵子:农村低收入群体收入跃升的机会不平等 被引量:1
5
作者 平卫英 黄斐 《财经问题研究》 CSSCI 北大核心 2024年第10期93-104,共12页
机会平等是实现低收入群体收入跃升的重要前提。本文基于2015—2021年中国社会状况综合调查数据,将“环境—努力”机会均等分析框架引入农村低收入群体收入跃升的影响因素研究中,采用相异指数衡量农村低收入群体陷入低收入状态的收入机... 机会平等是实现低收入群体收入跃升的重要前提。本文基于2015—2021年中国社会状况综合调查数据,将“环境—努力”机会均等分析框架引入农村低收入群体收入跃升的影响因素研究中,采用相异指数衡量农村低收入群体陷入低收入状态的收入机会不平等程度,运用非参数条件推断树方法测算农村低收入群体陷入低收入状态的机会不平等系数,并进一步讨论了环境因素对农村低收入群体陷入低收入状态的机会不平等的直接影响和间接影响。研究发现:2015—2021年,农村低收入群体陷入低收入状态的机会不平等系数为0.2356—0.2925,说明农村居民收入跃升的机会不平等程度较高;农村低收入群体性别差异对机会不平等的影响最大,其次是地区和年龄。随着时间的变化,户口迁移和父母务农的农村低收入群体,机会差异对农村低收入群体陷入低收入状态的影响逐渐增加;环境因素通过教育渠道和就业渠道间接影响农村低收入群体陷入低收入状态的收入机会不平等的贡献度为43.34%—55.65%,其中,教育渠道的贡献度为34.34%—43.87%,就业渠道的贡献度仅有6.07%—14.26%。本文的研究结论为更好地保障农村低收入群体发展机会平等,助力农村低收入群体收入跃升提供了理论依据。 展开更多
关键词 农村低收入群体 收入跃升 机会不平等 非参数条件推断方法
在线阅读 下载PDF
长三角生态系统服务驱动因素的交互效应及其阈值 被引量:1
6
作者 黄钰婷 曹雅蓉 +1 位作者 吴隽宇 周哲琛 《生态学报》 CAS CSCD 北大核心 2024年第21期9956-9973,共18页
科学管理生态系统以促进多种生态系统服务的可持续供应,对于区域高质量发展具有重要意义。精准制定生态系统管理措施要求深入了解各种生态系统服务的多重驱动因素之间的交互效应及其关键影响阈值,然而当前研究对此理解有限。为此,以202... 科学管理生态系统以促进多种生态系统服务的可持续供应,对于区域高质量发展具有重要意义。精准制定生态系统管理措施要求深入了解各种生态系统服务的多重驱动因素之间的交互效应及其关键影响阈值,然而当前研究对此理解有限。为此,以2020年的长三角地区为例,使用InVEST、CASA和MaxENT等模型评估研究区6种关键生态系统服务供应(气候调节、碳固定、土壤保持、产水量、粮食生产和休闲游憩)。运用约束线法分析单一驱动因素对各个生态系统服务的约束作用与关键阈值;然后,借助条件推理树进一步揭示了多种驱动因素的交互效应及其阈值。研究结果表明:(1)长三角地区的6种关键生态系统服务有显著的空间异质性并且受12个生态-社会经济驱动因素的影响,其中,气候与土地利用的影响最为显著。(2)12个驱动因素对6种关键生态系统服务呈现出4类非线性和2类线性约束作用,共识别出32个关键阈值。(3)特定自然驱动因素会在多因素交互作用下形成的阈值范围内显著影响生态系统服务,例如太阳辐射在特定降雨量(1604.6—1808.5mm)与风速(4.3—4.8m/s)的组合条件下会明显增加产水量。创新整合运用约束线与条件推理树,揭示了驱动因素的非线性作用及关键阈值,为长三角地区生态系统管理措施制定提供了方法参考与决策依据。 展开更多
关键词 生态系统服务 驱动因素 约束线 条件推理 长三角地区
在线阅读 下载PDF
我国中老年人健康的机会不平等——来自机器学习的新证据 被引量:1
7
作者 聂鹏 徐泊阳 +1 位作者 周博 赵方 《人口与经济》 CSSCI 北大核心 2024年第3期43-56,共14页
伴随着我国老龄化进程的不断加快,老年人健康不平等问题变得越发突出。基于2011—2018年中国健康与养老追踪调查数据,使用线性回归、条件推断树和条件森林三种估计方法,对我国45岁及以上中老年居民健康(适应负荷和自评健康)的机会不平... 伴随着我国老龄化进程的不断加快,老年人健康不平等问题变得越发突出。基于2011—2018年中国健康与养老追踪调查数据,使用线性回归、条件推断树和条件森林三种估计方法,对我国45岁及以上中老年居民健康(适应负荷和自评健康)的机会不平等进行测度,并对各变量在健康机会不平等的相对贡献大小进行度量。结果表明,适应负荷与自评健康的机会不平等相对值分别介于3.21%—7.76%与5.15%—10.44%之间,人口学特征(年龄和性别)和儿时社会经济条件均为造成适应负荷和自评健康机会不平等的主要因素。与线性回归结果中出生地区/省份是最重要的影响因素不同,两种机器学习的估计结果表明,人口学特征与儿时社会经济条件是造成适应负荷机会不平等的两大诱因。研究证实基于条件森林的健康机会不平等测度效果优于传统的线性回归,这一研究结果对于使用单个客观健康指标、调整可观测的环境变量之后依然是稳健的。健康的机会不平等是隐藏于健康不平等背后的深层原因,而针对我国中老年人健康机会不平等的综合评估对于帮助老年人有效减少健康不平等的公共政策的出台具有重要的现实意义。 展开更多
关键词 健康机会不平等 Shapley值分解 条件推断 条件森林
在线阅读 下载PDF
基于OWSFP-Tree的最大频繁项目集挖掘算法 被引量:5
8
作者 赵志刚 王芳 万军 《计算机工程与设计》 CSCD 北大核心 2013年第5期1687-1690,1807,共5页
为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前... 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 FP-TREE 条件模式
在线阅读 下载PDF
高危型人乳头瘤病毒感染患者宫颈脱落细胞JAM3/PAX1高甲基化诊断宫颈高级别病变 被引量:7
9
作者 李翔 贺斯黎 +4 位作者 赵行平 孙丹 吴思 徐大宝 李颖佳 《中南大学学报(医学版)》 CAS CSCD 北大核心 2023年第12期1820-1829,共10页
目的:传统的宫颈癌筛查手段——高危型人乳头瘤病毒(high-risk human papillomavirus,hrHPV)和宫颈脱落细胞学检测存在局限性。本研究通过检测宫颈脱落细胞中连接黏附分子3(junctional adhesion molecule 3,JAM3)/配对盒基因1(paired bo... 目的:传统的宫颈癌筛查手段——高危型人乳头瘤病毒(high-risk human papillomavirus,hrHPV)和宫颈脱落细胞学检测存在局限性。本研究通过检测宫颈脱落细胞中连接黏附分子3(junctional adhesion molecule 3,JAM3)/配对盒基因1(paired box gene 1,PAX1)高甲基化水平,并将其与液基薄层细胞学(liquid based cytology,LBC)进行比较,评价JAM3/PAX1甲基化对于宫颈高级别病变的诊断能力,以探索新的宫颈高级别病变的诊断模式,实现宫颈高级别病变“精准筛查”的目的。方法:回顾性收集2021年6月至2022年6月在中南大学湘雅三医院妇科阴道镜门诊接受检查的患者共136例,包括宫颈非高级别病变122例,高级别病变14例。研究的变量包括:基本临床信息(年龄、体重指数、是否绝经)、LBC、hrHPV、宫颈组织病理、阴道微生态结果、阴道镜结果(宫颈转化区类型)、JAM3(ΔCtJ)和PAX1(ΔCtP)基因甲基化的ΔCt值。首先通过logistic回归分析筛选影响宫颈高级别病变的影响因素,并进行相关性分析,然后用差异有统计学意义的变量构建条件推断树模型。结果:Logistic回归分析提示高级别宫颈病变组与非高级别宫颈病变组的PAX1与JAM3基因甲基化ΔCt值以及LBC检测结果差异均有统计学意义(均P<0.05)。相关性分析发现,宫颈病理结果与ΔCtP(r=-0.360,P<0.001)、ΔCtJ(r=-0.448,P<0.001)、LBC(r=-0.305,P<0.001)、菌群多样性(r=-0.183,P=0.037)呈负相关。条件推断树显示:当ΔCtJ>10.13时,全部为宫颈非高级别病变的患者;当ΔCtP>6.22时,非高级别病变的患者有117例,占97.5%,高级别病变者仅3例,占2.5%。ΔCtJ>8.61且LBC为不明确的非鳞状上皮细胞(atypical squamous cell of undetermined significance,ASC-US)或未见上皮内病变细胞时,105例(99.1%)为宫颈非高级别病变的患者,仅1例(0.9%)检出为高级别病变;当LBC结果为高级别病变时,仅9例患者检出高级别病变,3例检出非高级别病变;而当LBC提示低级别病变、ASC-US、未见上皮内病变细胞,且ΔCtP>6.22时,有117例(97.5%)的患者检出非高级别病变。结论:在人乳头瘤病毒感染妇女中,JAM3/PAX1双基因甲基化检测可独立应用于宫颈高级别病变/非高级别病变的分层诊断,且不依赖于宫颈脱落细胞学检测结果;亦可与LBC联合使用以弥补LBC敏感度低的缺点。此外,未来将甲基化试剂盒应用于大规模宫颈癌筛查,有利于发现更多宫颈高级别病变患者,并达到早筛、早治宫颈病变/癌的目的。 展开更多
关键词 宫颈病变 DNA甲基化 连接黏附分子3 配对盒基因1 条件推断
在线阅读 下载PDF
单元测试自动化工具的研究与实现
10
作者 刘升华 王成耀 《计算机工程与设计》 CSCD 北大核心 2007年第23期5588-5590,5612,共4页
软件测试的自动化技术是软件测试技术研究的重点问题,对于提高软件测试的客观性和效率有着非常重要的意义。实现了一个可以自动生成、执行测试用例的工具,该工具针对软件测试过程中的单元测试,以容易发生异常例外的条件语句为中心,对其... 软件测试的自动化技术是软件测试技术研究的重点问题,对于提高软件测试的客观性和效率有着非常重要的意义。实现了一个可以自动生成、执行测试用例的工具,该工具针对软件测试过程中的单元测试,以容易发生异常例外的条件语句为中心,对其进行覆盖检查,实现了单元测试的自动化。 展开更多
关键词 软件测试自动化 测试用例 条件树 条件路径图 测试驱动
在线阅读 下载PDF
基于FP-tree最大频繁模式超集挖掘算法 被引量:3
11
作者 王君 任永功 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期33-36,41,共5页
数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无... 数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无需产生大量的候选集,同时减少数据集扫描次数,降低数据库遍历时间,提高算法效率.实验证明,此算法在降低候选项目集冗余度的同时有效减少了算法运行时间. 展开更多
关键词 数据挖掘 最大频繁项目集 条件频繁模式 超集检测
在线阅读 下载PDF
Optimizing electrophoretic deposition conditions for enhancement in electrical conductivity of carbon fiber/carbon nanotube/epoxy hybrid composites 被引量:1
12
作者 王一奇 BYUN Joon-hyung +1 位作者 KIM Byung-sun SONG Jung-il 《Journal of Central South University》 SCIE EI CAS 2012年第11期3017-3022,共6页
The effectiveness of optimizing electrical conductivity of carbon fiber/carbon nanotube (CNT)/epoxy hybrid composites via Taguchi method was demonstrated. CNTs were induced on carbon fabric by electrophoretic deposi... The effectiveness of optimizing electrical conductivity of carbon fiber/carbon nanotube (CNT)/epoxy hybrid composites via Taguchi method was demonstrated. CNTs were induced on carbon fabric by electrophoretic deposition (EPD) technique. The essential deposition parameters were identified as l) the deposition time, 2) the deposition voltage, 3) the mass fraction of CNTs in suspension, and 4) the distance between the electrodes. An experimental design was then performed to establish the appropriate levels for each factor. An orthogonal array of L9 (34) was designed to conduct the experiments. Electrical conductivity results were collected as the response. The relative influences of design parameters on the response were discussed. Using the model, signal to noise (S/N) ratio and response characteristics for the optimized deposition parameter combination were predicted. The results show clearly that the optimum condition of electrophoretic deposition (EPD) process improves the electrical conductivity of carbon/epoxy hybrid composites. 展开更多
关键词 design of experiment electrophoretic deposition carbon nanotube Taguchi method signal to noise (S/N) ratio analysisof variance (ANOVA)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部