期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于决策树生成及剪枝的数据集优化及其应用 被引量:14
1
作者 李国和 王峰 +3 位作者 郑阳 吴卫江 洪云峰 周晓明 《计算机工程与设计》 北大核心 2018年第1期205-211,共7页
为提高智能模型的识别精度,增强其泛化能力,需要对用于智能建模的数据集中的对象类别异常进行检测和修正。在进行数据集和决策树形式化描述的基础上,将基尼指数增益率作为确定连续条件属性最优二分原则,采用递归算法生成叶节点中对象为... 为提高智能模型的识别精度,增强其泛化能力,需要对用于智能建模的数据集中的对象类别异常进行检测和修正。在进行数据集和决策树形式化描述的基础上,将基尼指数增益率作为确定连续条件属性最优二分原则,采用递归算法生成叶节点中对象为同一类别的二叉决策树。利用信息熵评价决策树剪除叶节点中对象的类别分布效果,实现数据集类别异常的类别修正。决策树的生成和剪枝本质上是完成基于基尼指数和信息熵的连续条件属性数据空间分割和合并类别修正。实验和实际应用验证了决策树生成和剪枝是数据集类别优化的有效方法。 展开更多
关键词 信息熵 基尼指数 决策树 剪枝 数据优化
在线阅读 下载PDF
基于粗分和词性标注的中文分词方法 被引量:7
2
作者 姜芳 李国和 +4 位作者 岳翔 吴卫江 洪云峰 刘智渊 程远 《计算机工程与应用》 CSCD 北大核心 2015年第6期204-207,265,共5页
中文分词是中文信息处理的重要内容之一。在基于最大匹配和歧义检测的粗分方法获取中文粗分结果集上,根据隐马尔可夫模型标注词性,通过Viterbi算法对每个中文分词的粗分进行词性标注。通过定义最优分词粗分的评估函数对每个粗分的词性... 中文分词是中文信息处理的重要内容之一。在基于最大匹配和歧义检测的粗分方法获取中文粗分结果集上,根据隐马尔可夫模型标注词性,通过Viterbi算法对每个中文分词的粗分进行词性标注。通过定义最优分词粗分的评估函数对每个粗分的词性标注进行粗分评估,获取最优的粗分为最终分词。通过实验对比,证明基于粗分和词性标注的中文分词方法具有良好的分词效果。 展开更多
关键词 分词 词性标注 隐马尔可夫模型 VITERBI算法
在线阅读 下载PDF
面向文本分类的特征词选取方法研究与改进 被引量:7
3
作者 李国和 岳翔 +3 位作者 吴卫江 洪云峰 刘智渊 程远 《中文信息学报》 CSCD 北大核心 2015年第4期120-125,共6页
中文特征词的选取是中文信息预处理内容之一,对文档分类有重要影响。中文分词处理后,采用特征词构建的向量模型表示文档时,导致特征词的稀疏性和高维性,从而影响文档分类的性能和精度。在分析、总结多种经典文本特征选取方法基础上,以... 中文特征词的选取是中文信息预处理内容之一,对文档分类有重要影响。中文分词处理后,采用特征词构建的向量模型表示文档时,导致特征词的稀疏性和高维性,从而影响文档分类的性能和精度。在分析、总结多种经典文本特征选取方法基础上,以文档频为主,实现文档集中的特征词频及其分布为修正的特征词选取方法(DC)。采用宏F值和微F值为评价指标,通过实验对比证明,该方法的特征选取效果好于经典文本特征选取方法。 展开更多
关键词 文本文档 特征词 特征选取 文本分类
在线阅读 下载PDF
基于决策树的消费行为因素建模与实现 被引量:6
4
作者 黎旭 李国和 +3 位作者 吴卫江 洪云峰 刘智渊 程远 《计算机应用与软件》 CSCD 2015年第5期185-188,211,共5页
消费行为因素分析对产品生产和销售具有重要指导作用。为了利用消费者的消费数据进行消费行为建模和分析,首先进行消费数据形式化表示,形成消费客户交易数据集和交易统计信息表达。然后在消费客户交易数据集上定义信息增益率,反映消费... 消费行为因素分析对产品生产和销售具有重要指导作用。为了利用消费者的消费数据进行消费行为建模和分析,首先进行消费数据形式化表示,形成消费客户交易数据集和交易统计信息表达。然后在消费客户交易数据集上定义信息增益率,反映消费因素的分类能力。在C4.5算法基础上,改进二分法为多分法,对连续型属性(因素)进行离散化,并建立决策树。决策树每一分支构成决策规则,反映消费者的消费因素之间的依赖关系。每条规则的统计信息表示决策规则的不确定性。采用Web体系架构,以Oracle为数据库,实现了消费行为建模与分析系统,该系统不仅消费行为模型分析精度高,而且具有高效性和友好性。 展开更多
关键词 决策树 C4.5算法 信息增益率 连续型属性 因素分析
在线阅读 下载PDF
基于语义的文档特征提取研究方法 被引量:10
5
作者 姜芳 李国和 岳翔 《计算机科学》 CSCD 北大核心 2016年第2期254-258,共5页
中文文本特征词选取是文本处理的重要方面,对文本分类有重要影响。现有的文本特征提取方法存在生成特征向量维数高、依赖训练集、忽略低频关键词等不足。利用《同义词词林》计算词语之间的语义距离,通过聚类算法筛选类别的主题相关词,... 中文文本特征词选取是文本处理的重要方面,对文本分类有重要影响。现有的文本特征提取方法存在生成特征向量维数高、依赖训练集、忽略低频关键词等不足。利用《同义词词林》计算词语之间的语义距离,通过聚类算法筛选类别的主题相关词,最后通过信息增益算法从主题相关词中选取特征词。以宏F值和微F值为评价指标,通过有效性实验和对比实验表明,该方法的文本特征选取效果优于其他经典算法。 展开更多
关键词 特征词 语义距离 信息增益 文本分类
在线阅读 下载PDF
基于自动确定特征点数的镜头分割方法 被引量:2
6
作者 李国和 刘佃兴 +1 位作者 臧金晓 吴卫江 《图学学报》 CSCD 北大核心 2013年第3期95-99,共5页
镜头分割对实现基于图像内容的视频检索具有重要作用。为了提高视频镜头分割的效果,采用Harris算子进行像素点的能量评估,并抑制伪特征点。通过图像帧分块和边缘检测,获取最小化特征点集,并使特征点分布相对均匀合理,然后根据特征点计... 镜头分割对实现基于图像内容的视频检索具有重要作用。为了提高视频镜头分割的效果,采用Harris算子进行像素点的能量评估,并抑制伪特征点。通过图像帧分块和边缘检测,获取最小化特征点集,并使特征点分布相对均匀合理,然后根据特征点计算图像帧统计量,进一步形成图像帧的特征向量。在此基础上,结合图像帧渐变检测和闪光检测实现镜头分割方法,取得很好镜头分割效果。 展开更多
关键词 HARRIS算子 特征提取 闪光检测 渐变检测 镜头分割
在线阅读 下载PDF
基于强化正域的属性约简方法 被引量:8
7
作者 史博文 李国和 +2 位作者 吴卫江 洪云峰 周晓明 《计算机应用研究》 CSCD 北大核心 2017年第1期107-109,127,共4页
通过对多种约简方法进行比较,为了得到更好的结果,在传统基于属性依赖度的约简方法基础上,定义更精确的强化正域概念。通过对边界域的精确划分,得出各条件属性对决策属性的强化依赖度,并用自顶向下的启发式搜索算法得到约简结果。采用UC... 通过对多种约简方法进行比较,为了得到更好的结果,在传统基于属性依赖度的约简方法基础上,定义更精确的强化正域概念。通过对边界域的精确划分,得出各条件属性对决策属性的强化依赖度,并用自顶向下的启发式搜索算法得到约简结果。采用UCI标准数据集对基于强化正域约简方法 REPR进行测试,约简数据后构建的决策树规模小,分类精度高。实验结果表明,相比于经典方法,REPR能更有效地对决策表进行属性约简。 展开更多
关键词 粗糙集 属性约简 正区域 属性依赖度
在线阅读 下载PDF
面向Android的RSA算法优化与二维码加密防伪系统设计 被引量:18
8
作者 方文和 李国和 +2 位作者 吴卫江 洪云峰 周晓明 《计算机科学》 CSCD 北大核心 2017年第1期176-182,共7页
面向Android智能手机终端,研究设计了移动二维码加密防伪系统,其加密模块基于RSA算法。为解决RSA算法在移动终端的运行效率问题,结合Monte Carb型概率算法与Miller-Rabin素数测试优化策略得到快速随机强素数算法以提高RSA算法的初始化... 面向Android智能手机终端,研究设计了移动二维码加密防伪系统,其加密模块基于RSA算法。为解决RSA算法在移动终端的运行效率问题,结合Monte Carb型概率算法与Miller-Rabin素数测试优化策略得到快速随机强素数算法以提高RSA算法的初始化及加密效率,并且采用MMRC解密算法来优化RSA解密过程,还引入了M-ary算法来对RSA算法过程中所进行的模幂运算进行优化计算。通过以上3个方面优化的实现,200次对比实验表明,改进的RSA算法在Android加密防伪模块中的执行效率比原有算法有明显提升。 展开更多
关键词 QR码 RSA ANDROID M-ary算法 智能防伪
在线阅读 下载PDF
基于Spark的人工蜂群改进算法 被引量:4
9
作者 翟光明 李国和 +3 位作者 吴卫江 洪云峰 周晓明 汪静 《计算机应用》 CSCD 北大核心 2017年第7期1906-1910,共5页
针对人工蜂群(ABC)算法求解组合优化问题时效率低的问题,提出了基于Spark云计算框架的并行ABC改进算法。首先,将蜂群划分为子蜂群并将蜂群构造为弹性分布式数据集,子蜂群使用广播机制交换优秀个体;然后,采用一系列转换算子,实现蜜蜂寻... 针对人工蜂群(ABC)算法求解组合优化问题时效率低的问题,提出了基于Spark云计算框架的并行ABC改进算法。首先,将蜂群划分为子蜂群并将蜂群构造为弹性分布式数据集,子蜂群使用广播机制交换优秀个体;然后,采用一系列转换算子,实现蜜蜂寻找解过程的并行化;最后,用万有引力质量计算代替轮盘赌概率计算,减少计算量。通过旅行商问题(TSP)求解说明了算法的可行性。实验结果表明:对比标准ABC算法,所提算法加速比最大达到3.24;对比未改进的并行ABC算法,该算法收敛速度提高约10%。所提算法在复杂问题求解方面优势更加明显。 展开更多
关键词 人工蜂群算法 SPARK 并行 万有引力算法 旅行商问题
在线阅读 下载PDF
基于FP_Growth的消费行为关联分析系统设计与实现 被引量:2
10
作者 黄伟 李国和 +3 位作者 吴卫江 洪云峰 刘智渊 程远 《计算机应用与软件》 CSCD 2015年第8期34-37,79,共5页
分析消费行为,挖掘消费因素之间关联关系,可以辅助指导生产和销售企业的管理和决策。针对海量消费数据引起的内存不足问题,对数值型数据进行离散化,以数据库关系表为频繁模式树存储结构,并建立高效索引,实现频繁模式树中节点快速检索,... 分析消费行为,挖掘消费因素之间关联关系,可以辅助指导生产和销售企业的管理和决策。针对海量消费数据引起的内存不足问题,对数值型数据进行离散化,以数据库关系表为频繁模式树存储结构,并建立高效索引,实现频繁模式树中节点快速检索,最终采用Oracle数据库存储过程实现FP_Growth算法。以B/S体系结构,实现了基于关联规则的消费行为关联分析系统,并取得很好应用效果。 展开更多
关键词 消费行为 FP_Growth 关联规则 存储过程
在线阅读 下载PDF
基于平衡准确率和规模的决策树剪枝算法 被引量:4
11
作者 宋万洋 李国和 +2 位作者 吴卫江 洪云峰 周晓明 《科学技术与工程》 北大核心 2016年第16期79-82,共4页
决策树剪枝是决策树分类学习中的重要步骤,可降低决策树复杂程度和提高决策树泛化能力,从而提高决策树识别精度和效率。通过利用系数函数综合决策树的错误率和规模,形成决策树剪枝标准,在系数函数的参数合适选取,采用自底向上遍历过程... 决策树剪枝是决策树分类学习中的重要步骤,可降低决策树复杂程度和提高决策树泛化能力,从而提高决策树识别精度和效率。通过利用系数函数综合决策树的错误率和规模,形成决策树剪枝标准,在系数函数的参数合适选取,采用自底向上遍历过程逐一进行判断剪枝。实验结果表明,综合考虑决策树的分类预测准确率和决策树的规模大小,BASP剪枝算法能够获得更好的剪枝效果。 展开更多
关键词 决策树 剪枝算法 准确率 规模
在线阅读 下载PDF
混合销售预测模型 被引量:1
12
作者 闫博 李国和 林仁杰 《计算机工程与设计》 北大核心 2015年第3期814-818,共5页
为提高产品销售预测的准确性,为企业生产决策提供有力的参考依据,建立BP_Adaboost和计划评审技术PERT混合销售预测模型。将BP神经网络模型与Adaboost算法进行结合,克服单纯使用BP神经网络容易陷入局部极小值的问题;计划评审技术PERT有... 为提高产品销售预测的准确性,为企业生产决策提供有力的参考依据,建立BP_Adaboost和计划评审技术PERT混合销售预测模型。将BP神经网络模型与Adaboost算法进行结合,克服单纯使用BP神经网络容易陷入局部极小值的问题;计划评审技术PERT有效利用销售管理人员的经验,在一定程度上实现对销售数据偶然性的预测;将BP_Adaboost和计划评审技术PERT组成混合模型进行销售预测。实验结果表明,该模型提高了销售预测的准确性和有效性。 展开更多
关键词 BP神经网络 ADABOOST算法 计划评审技术 预测 混合模型
在线阅读 下载PDF
面向彩印标签的手机数码识别及应用
13
作者 何云 李国和 +3 位作者 林仁杰 成一功 吴卫江 洪云峰 《计算机工程与应用》 CSCD 北大核心 2015年第23期164-168,178,共6页
针对Android手机拍摄标签数字码实时识别的需要,以及拍摄图像具有分辨率低、亮度不均匀、背景复杂等特点,由手机拍摄直接获得灰度图像后,通过数字区域投影定位,获取只包含数字的图像;采用二值化进行灰度图像到黑白图像的变换;通过投影... 针对Android手机拍摄标签数字码实时识别的需要,以及拍摄图像具有分辨率低、亮度不均匀、背景复杂等特点,由手机拍摄直接获得灰度图像后,通过数字区域投影定位,获取只包含数字的图像;采用二值化进行灰度图像到黑白图像的变换;通过投影及归一化处理进行数字码图像分割,并对每个数字码图像进行细化获取细化数字码;基于统计学抽取数字码的特征;建立数字码模式特征后,采用最近邻域判别函数进行数字码识别,取得了良好的识别效果。 展开更多
关键词 数字码 标签 手机 图像处理 数字识别
在线阅读 下载PDF
基于iPhone手机的数字码实时识别与应用
14
作者 成一功 李国和 +4 位作者 林仁杰 何云 吴卫江 洪云峰 周晓明 《计算机工程与科学》 CSCD 北大核心 2015年第12期2399-2404,共6页
根据苹果手机拍摄防伪标签数字实时识别的需要,针对防伪数字字号较小的因素和苹果手机因拍摄距离的原因造成的图像缩小、数字模糊、背景复杂等问题进行处理,提高识别精度。首先通过人工选取数字码区域,并进行背景数字分离,定位获取数字... 根据苹果手机拍摄防伪标签数字实时识别的需要,针对防伪数字字号较小的因素和苹果手机因拍摄距离的原因造成的图像缩小、数字模糊、背景复杂等问题进行处理,提高识别精度。首先通过人工选取数字码区域,并进行背景数字分离,定位获取数字图像;其次采用灰度化和二值化得到黑白图像;然后通过投影对数字码图像进行分割,并对每个数字图像进行归一化、锐化和细化;基于统计学抽取数字码的特征,采用最近邻域判别函数进行数字码识别,取得很好的识别效果。 展开更多
关键词 数字码标签 图像处理 数字码识别 IPHONE手机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部