期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
基于尺度空间中多特征融合的医学影像分类 被引量:7
1
作者 李博 曹鹏 +1 位作者 栗伟 赵大哲 《计算机应用》 CSCD 北大核心 2013年第4期1108-1111,1114,共5页
针对现有医学影像分类方法对临床不同类别影像特征描述效果不一致,且尺度变化敏感的问题,提出一种基于尺度空间提取多特征进行融合的分类方法。首先构建高斯差分尺度空间,然后在尺度空间中分别从灰度、纹理、形状、频域四种互补的角度... 针对现有医学影像分类方法对临床不同类别影像特征描述效果不一致,且尺度变化敏感的问题,提出一种基于尺度空间提取多特征进行融合的分类方法。首先构建高斯差分尺度空间,然后在尺度空间中分别从灰度、纹理、形状、频域四种互补的角度描述医学影像,最后基于最大似然估计理论构建决策级特征融合模型,实现医学影像分类。严格依照IRMA医学影像类别编码标准选择实验数据,结果表明所提方法相对已有方法分类的平均F1值得到了5%~20%不同程度的提高,更全面描述医学影像信息,避免了特征降维造成的信息损失,有效提高了分类的准确率,具有临床应用价值。 展开更多
关键词 图像分类 决策级融合 多特征 尺度空间 最大似然估计
在线阅读 下载PDF
云计算环境下的大规模图数据处理技术 被引量:99
2
作者 于戈 谷峪 +1 位作者 鲍玉斌 王志刚 《计算机学报》 EI CSCD 北大核心 2011年第10期1753-1767,共15页
随着社交网络分析、语义Web分析、生物信息网络分析等新兴应用的快速增长,对亿万个顶点级别大规模图的处理能力的需求愈加迫切,这是当前高性能计算领域的研究和开发热点.文中结合云计算的特点,从图数据管理与图数据处理机制两个方面,综... 随着社交网络分析、语义Web分析、生物信息网络分析等新兴应用的快速增长,对亿万个顶点级别大规模图的处理能力的需求愈加迫切,这是当前高性能计算领域的研究和开发热点.文中结合云计算的特点,从图数据管理与图数据处理机制两个方面,综述了云计算环境下进行大规模图数据处理的关键问题,包括图数据的存储方式、图索引结构、图分割策略、图计算模型、消息通信机制、容错管理、可伸缩性、图查询处理等.全面总结了当前的研究现状和进展,详细分析了存在的挑战性问题,并深入探讨了未来的研究方向. 展开更多
关键词 图处理 云计算 数据管理 分布式计算
在线阅读 下载PDF
融合多种特征点信息的最小生成树医学图像配准 被引量:6
3
作者 支力佳 张少敏 +1 位作者 赵大哲 赵宏 《计算机研究与发展》 EI CSCD 北大核心 2011年第3期501-507,共7页
针对医学图像配准鲁棒性强、准确性高和速度快的要求,提出了一种基于融合多种特征点信息的最小生成树医学图像配准算法.该算法首先提取3种特征点,Harris-Laplace,Laplacian of Gaussian和网格点;然后使用遗传算法去除特征点集的冗余,并... 针对医学图像配准鲁棒性强、准确性高和速度快的要求,提出了一种基于融合多种特征点信息的最小生成树医学图像配准算法.该算法首先提取3种特征点,Harris-Laplace,Laplacian of Gaussian和网格点;然后使用遗传算法去除特征点集的冗余,并通过对位映射构建无向完全图顶点集合;进而使用改进的Kruskal算法来构造最小生成树;最后使用得到的最小生成树估计Rényi熵.该算法较好地解决了在噪声数据中使用最小生成树估计Rényi熵面临的特征点不稳定导致鲁棒性低和构造最小生成树遇到的速度瓶颈.实验结果表明:在图像含有噪声、灰度不均匀以及初始误配范围较大的情况下,该算法在达到良好配准精度的同时,具有较强的鲁棒性和较快的速度. 展开更多
关键词 医学图像配准 Harris-Laplace(HL)点 LAPLACIAN of Gaussian(LoG)点 网格点 遗传算法 最小生成树 Rényi熵
在线阅读 下载PDF
基于Rényi熵的互补尺度空间关键点医学图像配准 被引量:2
4
作者 张少敏 支力佳 +2 位作者 赵大哲 赵宏 林树宽 《仪器仪表学报》 EI CAS CSCD 北大核心 2010年第11期2528-2533,共6页
针对医学图像配准对鲁棒性强、准确性高和速度快的要求,本文提出一种基于Rényi熵的互补尺度空间关键点配准算法。该算法首先从图像上提取Harris-Laplace(HL)和Laplacian of Gaussian(LoG)两种互补的尺度空间关键点,然后将关键点对... 针对医学图像配准对鲁棒性强、准确性高和速度快的要求,本文提出一种基于Rényi熵的互补尺度空间关键点配准算法。该算法首先从图像上提取Harris-Laplace(HL)和Laplacian of Gaussian(LoG)两种互补的尺度空间关键点,然后将关键点对应的灰度信息融入到联合Rényi熵中,最后使用最小生成树来估计联合Rényi熵。新算法结合了互补关键点的鲁棒性,和最小生成树估计Rényi熵的高效性。实验结果表明在图像含有噪声、灰度不均匀和初始误配范围较大的情况下,该算法在达到良好配准精度的同时,具有较强的鲁棒性和较快的速度。 展开更多
关键词 医学图像配准 Harris-Laplace(HL)检测子 LAPLACIAN of Gaussian(LoG)检测子 最小生成树 Rényi熵
在线阅读 下载PDF
融合Dead-ends和离线监督Actor-Critic的动态治疗策略生成模型
5
作者 杨莎莎 于亚新 +3 位作者 王跃茹 许晶铭 魏阳杰 李新华 《计算机科学》 CSCD 北大核心 2024年第7期80-88,共9页
强化学习对数学模型依赖性低,利用经验便于架构和优化模型,非常适合用于动态治疗策略学习。但现有研究仍存在以下问题:1)学习策略最优性的同时未考虑风险,导致学到的策略存在一定的风险;2)忽略了分布偏移问题,导致学到的策略与医生策略... 强化学习对数学模型依赖性低,利用经验便于架构和优化模型,非常适合用于动态治疗策略学习。但现有研究仍存在以下问题:1)学习策略最优性的同时未考虑风险,导致学到的策略存在一定的风险;2)忽略了分布偏移问题,导致学到的策略与医生策略完全不同;3)忽略患者的历史观测数据和治疗史,从而不能很好地得到患者状态,进而导致不能学到最优策略。基于此,提出了融合Dead-ends和离线监督Actor-Critic的动态治疗策略生成模型DOSAC-DTR。首先,考虑学到的策略所推荐的治疗行动的风险性,在Actor-Critic框架中融入Dead-ends概念;其次,为缓解分布偏移问题,在Actor-Critic框架中融入医生监督,在最大化预期回报的同时,最小化所学策略与医生策略之间的差距;最后,为了得到包含患者关键历史信息的状态表示,使用基于LSTM的编码器解码器模型对患者的历史观测数据和治疗史进行建模。实验结果表明,DOSAC-DTR相比基线方法有更好的性能,可以得到更低的估计死亡率以及更高的Jaccard系数。 展开更多
关键词 动态治疗策略 Dead-ends Actor-Critic 状态表征
在线阅读 下载PDF
基于依存句法的博文情感倾向分析研究 被引量:35
6
作者 冯时 付永陈 +2 位作者 阳锋 王大玲 张一飞 《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2395-2406,共12页
博客作为一种用户发表其观点和看法的载体已成为Web上一个重要的情感抒发与交流平台,博文搜索为这种交流提供了方便快捷的途径.很多时候,用户进行博文搜索时更关注作者对事件所持的观点或情感,但目前的博文搜索返回结果大多基于主题而... 博客作为一种用户发表其观点和看法的载体已成为Web上一个重要的情感抒发与交流平台,博文搜索为这种交流提供了方便快捷的途径.很多时候,用户进行博文搜索时更关注作者对事件所持的观点或情感,但目前的博文搜索返回结果大多基于主题而非情感倾向.基于此提出一种基于句法依存分析技术的算法SOAD(sentimentorientationanalysisbasedonsyntacticdependency)对博文搜索结果进行情感倾向性分析.基于SOAD算法,构建了一个中文博文搜索原型系统,对博文搜索结果进行再处理.实验证明,一方面,SOAD算法在分析博文情感上具有更大的优势;另一方面,建立的原型系统实现了依据情感倾向返回搜索结果的目标. 展开更多
关键词 依存句法分析 观点挖掘 情感分析 倾向性分析 博文搜索
在线阅读 下载PDF
基于多特征融合的微博主题情感挖掘 被引量:63
7
作者 黄发良 冯时 +1 位作者 王大玲 于戈 《计算机学报》 EI CSCD 北大核心 2017年第4期872-888,共17页
微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主... 微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主题是密切相关的.多数现有的微博情感分析方法都没有将微博主题与微博情感进行协同分析,或者在微博主题情感分析过程中没有考虑将用户关系、用户性格情绪等特征数据,从而导致微博情感分析与主题检测的效果难尽人意.为此,提出了一个基于多特征融合的微博主题情感挖掘模型TSMMF(Topic Sentiment Model based on Multi-feature Fusion),该模型将情感表情符号与微博用户性格情绪特征纳入到图模型LDA中实现微博主题与情感的同步推导.实验结果表明,与当前用于短文本情感主题挖掘的最优模型(JST,SLDA与DPLDA)相比较,TSMMF具有更优的微博主题情感检测性能. 展开更多
关键词 情感分析 主题检测 LDA 微博短文本 社会媒体处理 自然语言处理
在线阅读 下载PDF
基于Map-Reduce的海量数据高效Skyline查询处理 被引量:44
8
作者 丁琳琳 信俊昌 +1 位作者 王国仁 黄山 《计算机学报》 EI CSCD 北大核心 2011年第10期1785-1796,共12页
Skyline查询已成为现今数据库和信息检索领域的研究热点之一,伴随着人类可以采集和利用的数据信息的急剧增长,使得如何处理海量数据的Skyline查询成为急需解决的问题.近年来兴起的Map-Reduce编程框架能够有效地处理基于海量数据的应用,... Skyline查询已成为现今数据库和信息检索领域的研究热点之一,伴随着人类可以采集和利用的数据信息的急剧增长,使得如何处理海量数据的Skyline查询成为急需解决的问题.近年来兴起的Map-Reduce编程框架能够有效地处理基于海量数据的应用,该文既是研究如何运用Map-Reduce编程框架解决海量数据的Skyline查询问题.在Map-Reduce框架下处理Skyline查询的直接方法是扫描整个数据集进而得到查询结果,但是在海量数据Skyline查询问题中,查询结果的数量远小于原始数据集的数据量,对此该文提出了一系列的Skyline查询算法及优化,有效地过滤掉部分不能成为Skyline查询结果的数据对象,大幅度提高了在Map-Reduce框架下处理Skyline查询的效率.大量运行在Hadoop平台上的实验验证了该文所提出的Skyline查询处理算法具有良好的有效性、准确性和可用性. 展开更多
关键词 云计算 SKYLINE查询 MAP-REDUCE 海量数据 HADOOP
在线阅读 下载PDF
基于动态概率路径事件模型的RFID数据填补算法 被引量:25
9
作者 谷峪 于戈 +1 位作者 李晓静 王义 《软件学报》 EI CSCD 北大核心 2010年第3期438-451,共14页
RFID数据采集过程中漏读现象频频发生,降低了RFID(radio frequency identification)应用中查询结果的准确性.目前解决漏读问题的算法主要是以RFID原始读数为粒度,并基于标签自身历史读数进行窗口平滑,这种作法会填补许多与查询无关的冗... RFID数据采集过程中漏读现象频频发生,降低了RFID(radio frequency identification)应用中查询结果的准确性.目前解决漏读问题的算法主要是以RFID原始读数为粒度,并基于标签自身历史读数进行窗口平滑,这种作法会填补许多与查询无关的冗余数据,并且在多逻辑区域参与的复杂应用中,填补准确率较差.为解决上述问题,首次将RFID数据从数据层抽象到逻辑区域层作为处理的粒度,提出3种基于动态概率路径事件模型的数据填补算法,通过挖掘已知的区域事件的顺序相关性来对后续发生的事件进行判断和填补.进一步,增加对时间因素的考虑,对概率路径事件模型进行扩展.大量实验证明,提出的各个算法在不同的情况下有着不同的性能优势,并且在精简性和准确性上要高于现有的策略. 展开更多
关键词 RFID技术 数据填补 概率路径事件模型 区域事件 漏读数据 冗余数据
在线阅读 下载PDF
WSNs中一种新颖的模糊识别定位技术研究 被引量:15
10
作者 朱剑 赵海 +1 位作者 徐久强 李大舟 《电子学报》 EI CAS CSCD 北大核心 2010年第8期1845-1851,共7页
针对WSNs中定位技术存在的不足,提出了一种新颖的基于模糊识别的定位模型.在该模型中,定位空间被一些样本点划分为若干个相同的小区域,每一个样本点唯一地对应一个信号向量,通过计算未知点对应的信号向量与各个样本点对应向量的贴近度... 针对WSNs中定位技术存在的不足,提出了一种新颖的基于模糊识别的定位模型.在该模型中,定位空间被一些样本点划分为若干个相同的小区域,每一个样本点唯一地对应一个信号向量,通过计算未知点对应的信号向量与各个样本点对应向量的贴近度可以最终地确定未知点的坐标.该定位模型采用射频信号进行定位,不但避免了现有模型的误差叠加,提高了定位精度,而且避免了高计算复杂度与多参考点需求.基于NS-2的仿真结果表明该定位模型在具有较高的性能与较强的实用性. 展开更多
关键词 无线传感器网络 定位模型 RANGE-FREE 模糊识别 样本点
在线阅读 下载PDF
多传感器融合的穿戴式心率监测系统 被引量:14
11
作者 徐礼胜 靳雁冰 +2 位作者 王琦文 李锡勇 印重 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2015年第5期97-103,共7页
为提高日常行为下心率监测准确率,用多传感器融合的方法分别融合与生物电生理和生物机械力密切相关的心电、脉搏波信号,实现基于Android平台的高可靠、穿戴式心率监测系统.使用本系统和ST-1212心电工作站进行了18例日常行为下不同动作... 为提高日常行为下心率监测准确率,用多传感器融合的方法分别融合与生物电生理和生物机械力密切相关的心电、脉搏波信号,实现基于Android平台的高可靠、穿戴式心率监测系统.使用本系统和ST-1212心电工作站进行了18例日常行为下不同动作不同强度的同步采集和分析实验.通过分析信号时域特征得到反映信号质量高低的信号质量指数,根据质量指数自适应调节卡尔曼滤波器对两路信号获得的心率做最优估计,最后通过卡尔曼滤波残差调节权重得到融合心率.结果表明,融合心率相比单从心电或者脉搏波信号所得心率准确度提高46%以上。该系统通过多传感器融合的方式能有效降低干扰对心率估计的影响,可相对长时间地进行心率低负荷连续监测. 展开更多
关键词 心率 多传感器融合 ANDROID平台 穿戴式 信号质量指数 卡尔曼滤波器
在线阅读 下载PDF
基于社交关系的微博主题情感挖掘 被引量:20
12
作者 黄发良 于戈 +3 位作者 张继连 李超雄 元昌安 卢景丽 《软件学报》 EI CSCD 北大核心 2017年第3期694-707,共14页
微博情感分析是社交媒体挖掘中的重要任务之一,在个性化推荐、舆情分析等方面具有重要的理论和应用价值.挖掘性能良好且可同步进行文档主题分析与情感分析的主题情感模型,近年来在以微博为代表的社交媒体情感分析中备受关注.然而,绝大... 微博情感分析是社交媒体挖掘中的重要任务之一,在个性化推荐、舆情分析等方面具有重要的理论和应用价值.挖掘性能良好且可同步进行文档主题分析与情感分析的主题情感模型,近年来在以微博为代表的社交媒体情感分析中备受关注.然而,绝大多数现有主题情感模型都只简单地假设不同微博的情感极性是互相独立的,这与微博生态的现实状况不相一致,从而导致这些模型无法对用户的真实情感进行有效建模.基于此,综合考虑了微博用户相互关联的事实,提出了基于LDA和微博用户关系的主题情感模型SRTSM(social relation topic sentiment model).该模型在LDA中加入情感层与微博用户关系参数,利用微博用户关系与微博主题学习微博的情感极性.针对新浪微博真实数据集上的大量实验结果表明:与代表性算法JST,Sentiment-LDA及DPLDA相比较,SRTSM模型能够对用户真实情感与讨论主题进行更加有效的分析建模. 展开更多
关键词 情感分析 微博情感分析 主题情感模型 社交关系 社会媒体处理
在线阅读 下载PDF
一种面向不确定对象的可见k近邻查询算法 被引量:12
13
作者 王艳秋 徐传飞 +2 位作者 于戈 谷峪 陈默 《计算机学报》 EI CSCD 北大核心 2010年第10期1943-1952,共10页
真实世界中,常存在很多障碍物,影响空间对象到查询点的可见性及距离,可见k近邻查询查找距查询点最近的k个可见对象,是时空查询领域的一类重要算法.由于度量设备误差以及通信开销的限制等因素,空间对象位置不确定因素广泛存在.文中拟对... 真实世界中,常存在很多障碍物,影响空间对象到查询点的可见性及距离,可见k近邻查询查找距查询点最近的k个可见对象,是时空查询领域的一类重要算法.由于度量设备误差以及通信开销的限制等因素,空间对象位置不确定因素广泛存在.文中拟对不确定对象执行可见k近邻查询,提出了概率可见k近邻(PVkNN)查询,即查找前k个成为查询点最近邻居概率最大的节点.为了高效地执行这一查询,文中提出了k-界限剪枝方法,基于可见质心的紧缩过滤以及对不可见对象的剪枝策略,从空间角度过滤掉不符合条件的对象.为避免对候选集合中每个对象的概率都进行精确计算,从概率角度提出了根据概率上下限来对候选集合进行进一步的求精方法,采用近似采样技术来获取可见区域的比例,实现了对PVkNN的高效计算.采用真实和模拟数据集设计实验,充分验证了算法的效率和精度. 展开更多
关键词 概率可见k近邻查询 不确定对象 空间剪枝 概率上下限求精
在线阅读 下载PDF
一种面向微博客文本流的噪音判别与内容相似性双重检测的过滤方法 被引量:15
14
作者 王琳 冯时 +3 位作者 徐伟丽 杨卓 王大玲 张一飞 《计算机应用与软件》 CSCD 北大核心 2012年第8期25-29,94,共6页
微博客作为一种新的用户信息传播载体,在网络舆情发起和传播中起着重要作用。由于用户有意(上传广告)、无意(转发)操作所带来的大量噪音微博和相似微博,对网络舆情分析和用户浏览造成极为不利的影响。检测这些噪音微博和相似微博,对微... 微博客作为一种新的用户信息传播载体,在网络舆情发起和传播中起着重要作用。由于用户有意(上传广告)、无意(转发)操作所带来的大量噪音微博和相似微博,对网络舆情分析和用户浏览造成极为不利的影响。检测这些噪音微博和相似微博,对微博数据进行提纯,成为一个亟待解决的问题。基于统计数据分析了噪音微博和相似微博的特点,提出一种面向微博文本流的噪音判别和内容相似性双重检测的过滤方法:通过URL链接、字符率、高频词等特征判别,过滤噪音微博;通过分段过滤和索引过滤的双重内容过滤,检测和剔除相似微博。实验表明该方法能有效地对微博数据进行提纯,高效准确地过滤掉相似微博和噪音微博。 展开更多
关键词 微博客 噪音微博 相似微博 文本流 过滤
在线阅读 下载PDF
一种基于LDA的潜在语义区划分及Web文档聚类算法 被引量:19
15
作者 刘振鹿 王大玲 +2 位作者 冯时 张一飞 方东昊 《中文信息学报》 CSCD 北大核心 2011年第1期60-65,70,共7页
该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关... 该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关工作比较,该文不仅应用LDA模型表示文档,而且进行了深入的语义分布区域划分,并将分析结果应用于Web文档聚类。实验表明,该文提出的基于LDA的文档类别与语义互作用聚类算法获得了更好的聚类结果。 展开更多
关键词 LDA 潜在语义 语义分布 文档聚类
在线阅读 下载PDF
一种障碍空间中的反k最近邻查询方法 被引量:14
16
作者 于晓楠 谷峪 +1 位作者 张天成 于戈 《计算机学报》 EI CSCD 北大核心 2011年第10期1917-1925,共9页
随着基于位置的服务(LBS)和物联网的快速发展,空间查询技术越来越重要,而空间查询中的最近邻查询及其各种变体有着广泛的应用.近几年,已有较多对于查询前k个反最近邻对象(RkNN)的研究,其中大部分针对的都是理想欧氏空间.而在真实的情况... 随着基于位置的服务(LBS)和物联网的快速发展,空间查询技术越来越重要,而空间查询中的最近邻查询及其各种变体有着广泛的应用.近几年,已有较多对于查询前k个反最近邻对象(RkNN)的研究,其中大部分针对的都是理想欧氏空间.而在真实的情况下,反k最近邻查询通常受障碍物影响.文中研究了障碍空间中反k最近邻查询算法,提出了一种基于障碍Voronoi图的高效的剪枝方法.根据Voronoi图和障碍距离的特性,大幅度减少了数据点处理个数.最后,作者使用真实的数据集和多种方式分布的模拟数据,验证了算法的高效性和准确性. 展开更多
关键词 空间查询 反k最近邻(RkNN) 障碍空间 VORONOI图
在线阅读 下载PDF
一种障碍空间中不确定对象的连续最近邻查询方法 被引量:7
17
作者 李传文 谷峪 +1 位作者 李芳芳 于戈 《计算机学报》 EI CSCD 北大核心 2010年第8期1359-1368,共10页
近年来,基于位置的服务获得了越来越广泛的关注,其中最近邻查询是最常用的一种查询方式.测量手段的不准确性以及数据本身的性质导致不确定性在位置数据中普遍存在,这种不确定性会对最近邻查询结果产生影响.空间中障碍物的存在也给空间... 近年来,基于位置的服务获得了越来越广泛的关注,其中最近邻查询是最常用的一种查询方式.测量手段的不准确性以及数据本身的性质导致不确定性在位置数据中普遍存在,这种不确定性会对最近邻查询结果产生影响.空间中障碍物的存在也给空间数据查询带来了挑战.文中研究存在障碍物的空间中不确定对象连续最近邻查询的处理方法,设计了一种剪枝策略大幅降低需要计算的不确定对象数目,并进一步提出了障碍空间中不确定对象最近邻查询安全区域的概念及安全区域生成算法.设计了安全区域的索引存储方法.实验结果表明,文章所提出的方法具有良好的效率和可扩展性. 展开更多
关键词 最近邻 不确定 障碍空间 基于位置的服务
在线阅读 下载PDF
结合X-means聚类的自适应随机子空间组合分类算法 被引量:5
18
作者 曹鹏 李博 +1 位作者 栗伟 赵大哲 《计算机应用》 CSCD 北大核心 2013年第2期550-553,共4页
针对大规模数据的分类准确率低且效率下降的问题,提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法,保持原有数据结构的同时,把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空... 针对大规模数据的分类准确率低且效率下降的问题,提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法,保持原有数据结构的同时,把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空间组合分类器,提升了基分类器的差异性并自动确定基分类器数量,提升了组合分类器的鲁棒性及分类准确性。该算法在人工和UCI数据集上进行了测试,并与传统单分类和组合分类算法进行了比较。实验结果表明,对于大规模数据集,该方法具有更好的分类精度和健壮性,并提升了整体算法的效率。 展开更多
关键词 大规模数据集 X—means聚类 组合分类 随机子空间 支持向量机
在线阅读 下载PDF
基于粒子群优化的不均衡数据学习 被引量:5
19
作者 曹鹏 李博 +1 位作者 栗伟 赵大哲 《计算机应用》 CSCD 北大核心 2013年第3期789-792,共4页
为了提高重采样算法在不均衡数据学习的性能,提出一种基于粒子群优化的不均衡数据学习方法。通过粒子群优化,以不均衡数据分类评价准则作为目标函数,来优化重采样算法中最佳的采样率,同时对特征进行选择,从而达到最佳的数据分布。该算... 为了提高重采样算法在不均衡数据学习的性能,提出一种基于粒子群优化的不均衡数据学习方法。通过粒子群优化,以不均衡数据分类评价准则作为目标函数,来优化重采样算法中最佳的采样率,同时对特征进行选择,从而达到最佳的数据分布。该算法在大量UCI数据集上进行了测试,与其他不均衡学习算法进行比较,结果表明该算法具有更高的分类性能;并验证了同时优化采样率和特征集合,可有效地改进不均衡数据分类效果。 展开更多
关键词 粒子群优化 群体智能 不均衡数据分类 重采样 特征选择
在线阅读 下载PDF
MICA:一个面向微博数据流的观点挖掘原型系统 被引量:6
20
作者 阳锋 冯时 +3 位作者 王琳 李任斐 王大玲 于戈 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期405-409,共5页
微博客是一种新的信息载体和传播途径,比传统的博客、论坛等载体具有更多新的特点,实时性(随时发布、更新)和多模态性(包含文字、图像、视频等)是其中的2个主要特点.设计并实现了一个面向微博数据流的、集即时下载各模态信息和分析观点... 微博客是一种新的信息载体和传播途径,比传统的博客、论坛等载体具有更多新的特点,实时性(随时发布、更新)和多模态性(包含文字、图像、视频等)是其中的2个主要特点.设计并实现了一个面向微博数据流的、集即时下载各模态信息和分析观点倾向于一体的观点挖掘原型系统MICA(microblog item crawling and analyzing),设计并使用WeiBoAPI(微博编程集成应用接口)从腾讯、新浪等网站实时抓取微博数据,针对其中文本内容进行情感倾向性分析,针对其中的图像数据进行特征抽取,并为进一步的多模态观点挖掘打下基础. 展开更多
关键词 微博客 情感分析 观点挖掘
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部