期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于差异性评估对Co-training文本分类算法的改进
被引量:
4
1
作者
唐焕玲
林正奎
鲁明羽
《电子学报》
EI
CAS
CSCD
北大核心
2008年第B12期138-143,共6页
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视...
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视图的目标,转变成寻找两个既满足一定的正确性,又存在较大的差异性的两个基分类器的问题.首先利用特征评估函数建立多个特征视图,每个特征视图包含足够的信息训练生成一个基分类器,然后通过评估基分类器之间的差异性间接评估二者的独立性,选择两个满足一定的正确性和差异性比较大的基分类器协同训练.根据每个视图上采用的分类算法是否相同,提出了两种改进算法TV-SC和TV-DC.实验表明改进的TV-SC和TV-DC算法明显优于基于随机分割特征视图的Co-Rnd算法,而且TV-DC算法的分类效果要优于TV-SC算法.
展开更多
关键词
半监督
文本
分类
CO-TRAINING
特征视图
差异性评估
标注
文本
未标注文本
在线阅读
下载PDF
职称材料
一种结合独立性模型与差异评估的Co-Training改进方案
被引量:
7
2
作者
唐焕玲
林正奎
+1 位作者
鲁明羽
邬俊
《计算机研究与发展》
EI
CSCD
北大核心
2008年第11期1874-1881,共8页
Co-Training算法要求两个特征视图满足一致性和独立性,但是,许多应用中不存在自然划分且满足这种假设的两个视图.为此,提出利用互信息(MI)或者CHI统计量评估特征之间的相互独立性,建立特征相互独立性模型(MID-Model).基于该模型,提出了...
Co-Training算法要求两个特征视图满足一致性和独立性,但是,许多应用中不存在自然划分且满足这种假设的两个视图.为此,提出利用互信息(MI)或者CHI统计量评估特征之间的相互独立性,建立特征相互独立性模型(MID-Model).基于该模型,提出了新的特征子集划分方法PMID-MI与PMID-CHI算法,能有效地将一个特征集合划分成两个独立性较强的子集.并且利用多种差异评估法,进一步验证两个子集的独立性.基分类器之间的差异性能够减少两个基分类器给同一个未标注文本都标注错误的可能性.最后,提出了对Co-Training的改进算法SC-PMID.实验结果表明SC-PMID算法能够明显提高半监督分类精度.
展开更多
关键词
半监督分类
Co—Training
标注
文本
未标注文本
相互独立性模型
差异性评估
在线阅读
下载PDF
职称材料
题名
基于差异性评估对Co-training文本分类算法的改进
被引量:
4
1
作者
唐焕玲
林正奎
鲁明羽
机构
大连海事大学信息科学技术学院
烟台职业学院计算机与信息工程系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2008年第B12期138-143,共6页
基金
国家自然科学基金(No.60773084,J0724003,60603023)
教育部博士点基金(No.20070151009)
文摘
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视图的目标,转变成寻找两个既满足一定的正确性,又存在较大的差异性的两个基分类器的问题.首先利用特征评估函数建立多个特征视图,每个特征视图包含足够的信息训练生成一个基分类器,然后通过评估基分类器之间的差异性间接评估二者的独立性,选择两个满足一定的正确性和差异性比较大的基分类器协同训练.根据每个视图上采用的分类算法是否相同,提出了两种改进算法TV-SC和TV-DC.实验表明改进的TV-SC和TV-DC算法明显优于基于随机分割特征视图的Co-Rnd算法,而且TV-DC算法的分类效果要优于TV-SC算法.
关键词
半监督
文本
分类
CO-TRAINING
特征视图
差异性评估
标注
文本
未标注文本
Keywords
semi-supervised text categorization
Co-training
features views
diversity measures
labeled documents
unlabeled documents
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种结合独立性模型与差异评估的Co-Training改进方案
被引量:
7
2
作者
唐焕玲
林正奎
鲁明羽
邬俊
机构
大连海事大学信息科学技术学院
烟台职业学院计算机与信息工程系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第11期1874-1881,共8页
基金
国家自然科学基金项目(60773084,J0724003,60603023)
高等学校博士学科点专项科研基金项目(20070151009)~~
文摘
Co-Training算法要求两个特征视图满足一致性和独立性,但是,许多应用中不存在自然划分且满足这种假设的两个视图.为此,提出利用互信息(MI)或者CHI统计量评估特征之间的相互独立性,建立特征相互独立性模型(MID-Model).基于该模型,提出了新的特征子集划分方法PMID-MI与PMID-CHI算法,能有效地将一个特征集合划分成两个独立性较强的子集.并且利用多种差异评估法,进一步验证两个子集的独立性.基分类器之间的差异性能够减少两个基分类器给同一个未标注文本都标注错误的可能性.最后,提出了对Co-Training的改进算法SC-PMID.实验结果表明SC-PMID算法能够明显提高半监督分类精度.
关键词
半监督分类
Co—Training
标注
文本
未标注文本
相互独立性模型
差异性评估
Keywords
semi-supervised categorization
co-training
labeled document
unlabeled document
mutual independence model
diversity measure
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于差异性评估对Co-training文本分类算法的改进
唐焕玲
林正奎
鲁明羽
《电子学报》
EI
CAS
CSCD
北大核心
2008
4
在线阅读
下载PDF
职称材料
2
一种结合独立性模型与差异评估的Co-Training改进方案
唐焕玲
林正奎
鲁明羽
邬俊
《计算机研究与发展》
EI
CSCD
北大核心
2008
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部