-
题名一种基于上下文语义信息的图像块视觉单词生成算法
被引量:41
- 1
-
-
作者
刘硕研
须德
冯松鹤
刘镝
裘正定
-
机构
北京交通大学计算机科学系
北京交通大学信息科学研究所
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2010年第5期1156-1161,共6页
-
基金
国家自然科学基金(No.60803072
No.90820013)
中国博士后科学基金(No.20090460197)
-
文摘
基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像块视觉单词生成算法:首先,本文中使用的上下文语义信息是视觉单词之间的语义共生概率,它是由概率潜在语义分析模型(probabilistic Latent Semantic Analysis)自动分析得到,无需任何人工标注.其次,我们引入Markov随机场理论中类别标记的伪似然度近似的策略,将图像块在特征域的相似性同空间域的上下文语义共生关系有机地结合起来,从而更准确地为图像块定义视觉单词.最后统计视觉单词的出现频率作为图像的场景表示,利用支持向量机分类器完成图像的场景分类任务.实验结果表明,本算法能有效地提高视觉单词的语义准确性,并在此基础上改善场景分类的性能.
-
关键词
场景分类
视觉单词
概率潜在语义分析模型
MARKOV随机场模型
上下文语义信息
-
Keywords
scene categorization
visual words
probabilistic latent semantic analysis (pISA)
markov random fields (MRF)
contextual semantic information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名相似性的二值表示
- 2
-
-
作者
于剑
-
机构
北京交通大学计算机科学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第12期2117-2122,共6页
-
基金
国家自然科学基金项目(60875031
90820013)
国家"九七三"重点基础研究发展计划基金项目(2007CB311002)
-
文摘
在模式识别与机器学习领域,相似性具有重要作用.但是相似性具有不同的解释.讨论了相似性在原型理论、样例理论下的不同解释,指出几乎所有的非负度量都有对应的相似性解释,说明了一定程度上相似性反映了对象的全局性质.作为一般相似性的例子,给出了图像、模糊集合的相似性解释,指出模糊集合是研究论域内对象与概念相似性的有效工具之一,并根据韦特海默对比不变性原则(Wertheimer's contrast invariant principle),导出了相似对比不变性准则.据此建立了有界非负矩阵的二值表示.这些结果可以得到相似矩阵的最优二值分解.由于相似性的广泛性,该模型可望有很多应用.
-
关键词
相似性
样例理论
原型理论
图像
模糊集合
-
Keywords
similarity
exemplar theory
prototype theory
image
fuzzy set
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种利用近邻和信息熵的主动文本标注方法
被引量:4
- 3
-
-
作者
朱岩
景丽萍
于剑
-
机构
北京交通大学计算机科学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第6期1306-1312,共7页
-
基金
中央高校基金科研业务费专项资金项目(2009YJS026)
北京交通大学优秀博士生科技创新基金项目(141097522)
+2 种基金
国家自然科学基金项目(0905028
90820013
60875031)
-
文摘
由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提出一种避开选择已标注样本的K近邻来抽取下一组候选标注样本的方法,使得分布在不同区域的样本有更多的标注机会.在此基础上,为了获得更多的类别信息,在候选标注样本中选择信息熵最大的样本作为最终的标注样本.真实文本数据上的实验表明了提出方法的有效性.
-
关键词
半监督文本分类
主动学习
近邻
信息熵
标注方法
-
Keywords
semi-supervised text classification
active learning
nearest neighbor
informationentropy
labeling strategy
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-