CART(Classification And Regression Tree,分类回归树)是一种准确率和效率都较高的数据挖掘算法,它支持离散型和连续型的数据分类,但无法适用于对加密的隐私云数据进行分类.因此提出PPCART(Privacy-preserving CART,隐私保护的分类回归...CART(Classification And Regression Tree,分类回归树)是一种准确率和效率都较高的数据挖掘算法,它支持离散型和连续型的数据分类,但无法适用于对加密的隐私云数据进行分类.因此提出PPCART(Privacy-preserving CART,隐私保护的分类回归树),该算法利用同态加密特性对CART算法做了相应的改善,使之在保持CART原有准确率和相对较好执行效率的情况下能分类加密云数据,避免了在半诚实模型下的分类过程中真实数据的泄露.经过安全分析和实验测试表明,PPCART可显著提高传统CART算法的安全性,且具有接近于它的执行时间.展开更多
以英语文语转换系统的开发为背景,采用基于大语料库的拼接语音合成方法进行英语语音合成。就英语多音节和无限词汇的特点,选用了3种不同长度的拼接单元:单词,音节,phone。引入了决策树CART(classification and regression tree)方法对...以英语文语转换系统的开发为背景,采用基于大语料库的拼接语音合成方法进行英语语音合成。就英语多音节和无限词汇的特点,选用了3种不同长度的拼接单元:单词,音节,phone。引入了决策树CART(classification and regression tree)方法对大语料库中的语音单元进行预选,并设计了相应的单元选择算法。实验表明,利用该方法能得到清晰自然的合成效果,并且提高了单元选择的效率。展开更多
油中溶解气体分析(dissolved gas analysis,DGA)技术可以有效发现充油变压器内部的早期潜伏性故障,是对充油设备进行诊断的常用检测方法。CART(classification and regression trees)分类回归树是一种可处理连续属性的不平衡算法。SAMM...油中溶解气体分析(dissolved gas analysis,DGA)技术可以有效发现充油变压器内部的早期潜伏性故障,是对充油设备进行诊断的常用检测方法。CART(classification and regression trees)分类回归树是一种可处理连续属性的不平衡算法。SAMME作为Ada Boost二分类算法的延伸,可将多个略好于随机猜测的弱分类器组合提升为分类精度更高的强分类器,完成多分类任务。针对单一算法往往不能满足实际工程对分类精度的需求且高精度算法难以获得的问题,采用SAMME算法对CART弱学习器的权重根据误差不断调整,再通过加权投票将其组合提升为强分类器,并采用V折交叉验证确定SAMME-CART模型的最优迭代次数。以此提高故障诊断模型的泛化能力。实验结果表明,运用该模型结合DGA技术对变压器故障进行诊断,相比于单一CART算法,诊断准确率整体提高了18.7%,表明该方法是可行的。展开更多
文摘CART(Classification And Regression Tree,分类回归树)是一种准确率和效率都较高的数据挖掘算法,它支持离散型和连续型的数据分类,但无法适用于对加密的隐私云数据进行分类.因此提出PPCART(Privacy-preserving CART,隐私保护的分类回归树),该算法利用同态加密特性对CART算法做了相应的改善,使之在保持CART原有准确率和相对较好执行效率的情况下能分类加密云数据,避免了在半诚实模型下的分类过程中真实数据的泄露.经过安全分析和实验测试表明,PPCART可显著提高传统CART算法的安全性,且具有接近于它的执行时间.
文摘以英语文语转换系统的开发为背景,采用基于大语料库的拼接语音合成方法进行英语语音合成。就英语多音节和无限词汇的特点,选用了3种不同长度的拼接单元:单词,音节,phone。引入了决策树CART(classification and regression tree)方法对大语料库中的语音单元进行预选,并设计了相应的单元选择算法。实验表明,利用该方法能得到清晰自然的合成效果,并且提高了单元选择的效率。
文摘油中溶解气体分析(dissolved gas analysis,DGA)技术可以有效发现充油变压器内部的早期潜伏性故障,是对充油设备进行诊断的常用检测方法。CART(classification and regression trees)分类回归树是一种可处理连续属性的不平衡算法。SAMME作为Ada Boost二分类算法的延伸,可将多个略好于随机猜测的弱分类器组合提升为分类精度更高的强分类器,完成多分类任务。针对单一算法往往不能满足实际工程对分类精度的需求且高精度算法难以获得的问题,采用SAMME算法对CART弱学习器的权重根据误差不断调整,再通过加权投票将其组合提升为强分类器,并采用V折交叉验证确定SAMME-CART模型的最优迭代次数。以此提高故障诊断模型的泛化能力。实验结果表明,运用该模型结合DGA技术对变压器故障进行诊断,相比于单一CART算法,诊断准确率整体提高了18.7%,表明该方法是可行的。