期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法
被引量:
5
1
作者
如先姑力·阿布都热西提
亚森·艾则孜
郭文强
《计算机应用研究》
CSCD
北大核心
2019年第11期3410-3414,共5页
提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最...
提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最后,在传统SVM中引入一个控制超平面之间距离的参数,构建一种类不平衡SVM,使其能够很好地分类具有非线性不可分和不平衡性的维吾尔语文本。实验结果表明,该方法能够准确分类出不良文本,且具有较短的分类时间。
展开更多
关键词
维吾尔语网页
不良文本过滤
n-gram词干提取
类不平衡svm
在线阅读
下载PDF
职称材料
题名
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法
被引量:
5
1
作者
如先姑力·阿布都热西提
亚森·艾则孜
郭文强
机构
新疆警察学院信息安全工程系
新疆财经大学计算机科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2019年第11期3410-3414,共5页
基金
国家自然科学基金资助项目(61762086)
新疆维吾尔自治区高校科研计划项目(XJEDU2017M046)
国家社会科学基金资助项目(13CFX055)
文摘
提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最后,在传统SVM中引入一个控制超平面之间距离的参数,构建一种类不平衡SVM,使其能够很好地分类具有非线性不可分和不平衡性的维吾尔语文本。实验结果表明,该方法能够准确分类出不良文本,且具有较短的分类时间。
关键词
维吾尔语网页
不良文本过滤
n-gram词干提取
类不平衡svm
Keywords
Uyghur webpage
reactionary text filtering
n-gram stem extraction
class-unbalanced
svm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法
如先姑力·阿布都热西提
亚森·艾则孜
郭文强
《计算机应用研究》
CSCD
北大核心
2019
5
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部