题名 位置大数据的价值提取与协同挖掘方法
被引量:54
1
作者
郭迟
刘经南
方媛
罗梦
崔竞松
机构
武汉大学 卫星定位导航技术研究中心
武汉大学计算机学院
软件 工程 国家 重点 实验室 (武汉大学计算机学院 )
出处
《软件学报》
EI
CSCD
北大核心
2014年第4期713-730,共18页
基金
国家自然科学基金(41104010)
国家高技术研究发展计划(863)(2013AA12A206
+2 种基金
2013AA12A204)
国家自然科学重大研究计划(9112002)
高等学校学科创新引智计划(B07037)
文摘
随着位置服务和车联网应用的不断普及,由地理数据、车辆轨迹和应用记录等所构成的位置大数据已成为当前用来感知人类社群活动规律、分析地理国情和构建智慧城市的重要战略性资源,是大数据科学研究极其重要的一部分.与传统小样统计不同,大规模位置数据存在明显的混杂性、复杂性和稀疏性,需要对其进行价值提取和协同挖掘,才能获得更为准确的移动行为模式和区域局部特征,从而还原和生成满足关联应用分析的整体数据模型.因此,着重从以下3个方面系统综述了针对位置大数据的分析方法,包括:(1)针对数据混杂性,如何先从局部提取出移动对象的二阶行为模式和区域交通动力学特征;(2)针对数据复杂性,如何从时间和空间尺度上分别对位置复杂网络进行降维分析,从而建立有关社群整体移动性的学习和推测方法;(3)针对数据的稀疏性,如何通过协同过滤、概率图分析等方法构建位置大数据全局模型.最后,从软件工程角度提出了位置大数据分析的整体框架.在这一框架下,位置数据将不仅被用来进行交通问题的分析,还能够提升人们对更为广泛的人类社会经济活动和自然环境的认识,从而体现位置大数据的真正价值.
关键词
大数据
轨迹移动模式
位置服务
泛在测绘
数据挖掘
Keywords
big data
trajectories mobility pattern
location based service
ubiquitous mapping
data mining
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于边界判别投影的数据降维
被引量:16
2
作者
何进荣
丁立新
李照奎
胡庆辉
机构
软件 工程 国家 重点 实验室 (武汉大学计算机学院 )
出处
《软件学报》
EI
CSCD
北大核心
2014年第4期826-838,共13页
基金
中央高校基本科研业务费专项资金(2012211020209)
广东省省部产学研结合专项资金(2011B090400477)
+2 种基金
珠海市产学研合作专项资金(2011A050101005
2012D0501990016)
珠海市重点实验室科技攻关项目(2012D0501990026)
文摘
为了提取具有较好判别性能的低维特征,提出了一种新的有监督的线性降维算法——边界判别投影,即,最小化同类样本间的最大距离,最大化异类样本间的最小距离,同时保持数据流形的几何形状.与经典的基于边界定义的算法相比,边界判别投影可以较好地保持数据流形的几何结构和判别结构等全局特性,可避免小样本问题,具有较低的计算复杂度,可应用于超高维的大数据降维.人脸数据集上的实验结果表明,边界判别分析是一种有效的降维算法,可应用于大数据上的特征提取.
关键词
边界判别投影
数据降维
特征提取
边界样本点
人脸识别
Keywords
margin discriminant projection
dimensionality reduction
feature extraction
margin sample
face recognition
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 L_p范数约束的多核半监督支持向量机学习方法
被引量:8
3
作者
胡庆辉
丁立新
何进荣
机构
软件 工程 国家 重点 实验室 (武汉大学计算机学院 )
桂林航天工业学院 信息工程 系
出处
《软件学报》
EI
CSCD
北大核心
2013年第11期2522-2534,共13页
基金
国家自然科学基金(60975050)
广东省省部产学研结合专项(2011B090400477)
+4 种基金
珠海市产学研合作专项资金(2011 A050101005
2012D0501990016)
珠海市重点实验室科技攻关项目(2012D0501990026)
中央高校基本科研业务费专项资金(20122 11020209)
桂林航天工业学院科研基金(Y12Z028)
文摘
在机器学习领域,核方法是解决非线性模式识别问题的一种有效手段.目前,用多核学习方法代替传统的单核学习已经成为一个新的研究热点,它在处理异构、不规则和分布不平坦的样本数据情况下,表现出了更好的灵活性、可解释性以及更优异的泛化性能.结合有监督学习中的多核学习方法,提出了基于Lp范数约束的多核半监督支持向量机(semi-supervised support vector machine,简称S3VM)的优化模型.该模型的待优化参数包括高维空间的决策函数fm和核组合权系数m.同时,该模型继承了单核半监督支持向量机的非凸非平滑特性.采用双层优化过程来优化这两组参数,并采用改进的拟牛顿法和基于成对标签交换的局部搜索算法分别解决模型关于fm的非平滑及非凸问题,以得到模型近似最优解.在多核框架中同时加入基本核和流形核,以充分利用数据的几何性质.实验结果验证了算法的有效性及较好的泛化性能.
关键词
半监督
支持向量机
拟牛顿法
多核学习
半监督支持向量机
Keywords
semi-supervised
support vector machine (SVM)
quasi-Newton method
multiple kemel learning
semi-supervised supportvector machine (S3VM)
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 一种基于RGPS着色的C-net模型及其应用
被引量:2
4
作者
黄贻望
何克清
冯在文
黄颖
谢芳
机构
软件 工程 国家 重点 实验室 (武汉大学计算机学院 )
铜仁学院 数学与计算机 科学系
赣南师范学院 数学与计算机 学院
湖北工业大学 计算机 学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第9期2030-2045,共16页
基金
国家"九七三"重点基础研究发展计划基金项目(2014CB340404)
国家自然科学基金项目(61373037
+6 种基金
61100017
61202031)
国家科技支撑计划基金项目(2012BAH07B01)
中央高校基本科研业务费专项资金项目(2012211020201)
贵州省科学技术厅
铜仁市科学技术局
铜仁学院联合基金项目(黔科合J字LKT[2012]04号)
文摘
可配置业务流程模型描述面向领域的相似流程模型家簇,这种模型能够通过配置操作获取满足特定用户需求的个性化流程模型.提出一个在角色和目标约束下以流程为中心的可配置业务流程模型,首先对因果网模型(C-net)进行扩展,将该模型中的活动元素增加角色和目标两个约束关系,从而利用RGPS需求元模型框架中对角色(R)、目标(G)、流程(P)、服务(S)之间的约束规则和关联关系去约束业务流程活动之间的执行序列,使得模型有效反映了业务流程活动中的实际行为;然后将活动的输入绑定和输出绑定端口设置配置操作标记,通过对端口配置标记的操作形成个性化流程;最后,给出了模型的形式化定义并分析模型在业务流程配置中的应用,使得能够指导业务流程的配置等管理操作.
关键词
可配置业务流程
活动
着色C-net
RGPS
配置
Keywords
configurable business process
activity
colored C-net
RGPS
configuration
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于图像分解的人脸特征表示
被引量:1
5
作者
李照奎
丁立新
何进荣
胡庆辉
机构
软件 工程 国家 重点 实验室 (武汉大学计算机学院 )
沈阳航空航天大学 计算机 学院
出处
《软件学报》
EI
CSCD
北大核心
2014年第9期2102-2118,共17页
基金
国家自然科学基金(60975050
60902053
+4 种基金
61170185)
广东省省部产学研结合专项资金(2011B090400477)
珠海市产学研合作专项资金(2011A050101005
2012D0501990016)
珠海市重点实验室科技攻关项目(2012D0501990026)
文摘
提出一种基于图像分解的人脸特征表示方法(FRID),首先通过多方向操作,把一幅图像分解成一系列方向子图像;然后,通过欧拉映射操作,把每幅方向子图像分解成实部和虚部图像,针对每幅实部和虚部图像,分别划分出多个不重叠的局部图像块,通过统计图像块上不同数值的个数生成相应的实部和虚部直方图,一幅图像的所有实部和虚部直方图被串联成一个超级特征向量;最后,利用线性判别分析方法对超级特征向量进行维数约简,以获得每幅图像的低维表示.实验显示该方法在多个人脸数据库上获得了优于时新算法的识别结果,并且表现得更为稳定.
关键词
图像分解
多方向操作
欧拉映射
人脸识别
Keywords
image decomposition
multiple orientations operator
Euler mapping
face recognition
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种大规模图数据上已知项搜索的优化方法
被引量:1
6
作者
钟鸣
王盛
刘梦赤
机构
软件 工程 国家 重点 实验室 (武汉大学计算机学院 )
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第1期54-63,共10页
基金
国家自然科学基金项目(61202036)
高等学校博士学科点专项科研基金项目(20120141120013)
国家大学生创新创业计划训练项目(201310486060)
文摘
近年来,在社交网络、生物信息、软件工程、知识工程等领域,以图为天然组织结构的数据开始大量涌现,从而使得图数据的查询、搜索、挖掘等问题迅速成为研究热点.然而,由于图的计算复杂度高,现有的图数据关键词搜索方法的可伸缩性差,难以应用于大规模图数据.创新性地从对用户搜索意图的探索出发,探讨了可能存在的不同类型的图搜索及其优化潜力,提出了根据不同类型搜索的特点采用专门的优化策略的思想;并针对其中非常重要和常见的"已知项搜索"提出了一种启发式优化方法,利用图中局部拓扑信息构建索引,并使用MapReduce技术处理大规模图数据,实现在搜索前裁剪匹配顶点,以少量可能存在的top-k答案丢失为代价来显著缩减搜索空间.实验证明该方法能够极大地减少已知项搜索的响应时间.
关键词
图数据
已知项搜索
优化
匹配顶点裁剪
索引
Keywords
graph data
known-item search
optimization
matched vertex pruning
index
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]