期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法
被引量:
5
1
作者
如先姑力·阿布都热西提
亚森·艾则孜
郭文强
《计算机应用研究》
CSCD
北大核心
2019年第11期3410-3414,共5页
提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最...
提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最后,在传统SVM中引入一个控制超平面之间距离的参数,构建一种类不平衡SVM,使其能够很好地分类具有非线性不可分和不平衡性的维吾尔语文本。实验结果表明,该方法能够准确分类出不良文本,且具有较短的分类时间。
展开更多
关键词
维吾尔语网页
不良文本过滤
n-gram词干提取
类不平衡SVM
在线阅读
下载PDF
职称材料
基于χ~2统计量的不良文本过滤特征选择方法
被引量:
1
2
作者
管江红
《现代电子技术》
北大核心
2019年第21期182-186,共5页
针对现有以χ^2统计量为基础的特征选择方法在不良文本过滤过程中效果欠佳的问题,利用双层分类对特征选择方法进行改良,提出一种不良文本过滤特征选择方法。首先通过改良逆文档频率来区分特征项在所属类别类内与其他类别之间的分布差别...
针对现有以χ^2统计量为基础的特征选择方法在不良文本过滤过程中效果欠佳的问题,利用双层分类对特征选择方法进行改良,提出一种不良文本过滤特征选择方法。首先通过改良逆文档频率来区分特征项在所属类别类内与其他类别之间的分布差别;其次,引入逆类别频率弥补抑制强度;最后,加入逆上层类别频率,清晰划分具有较高相似度的某两类二层类别。所改良的特征选择方法能够弥补现有χ^2统计量在类内/类间特征项分布情况判别能力的缺陷,将其应用于不良文本过滤过程,能够充分贴合不良文本过滤过程的特征选择需求。通过对比评估指标的结果,表明所提方法在不良文本过滤领域具有更好的效果。
展开更多
关键词
特征选择
χ^2统计量
双层分类
不良文本过滤
特征项分布
评估指标
在线阅读
下载PDF
职称材料
基于KNN的不良文本过滤方法
被引量:
7
3
作者
王洪彬
刘晓洁
《计算机工程》
CAS
CSCD
北大核心
2009年第24期69-71,共3页
不良文本过滤是当前的一个研究热点。通过对χ2统计量的具体分析,证明χ2统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在此基础上改进KNN算法,消除了KNN算法中N的不确定性,彻底实现了...
不良文本过滤是当前的一个研究热点。通过对χ2统计量的具体分析,证明χ2统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在此基础上改进KNN算法,消除了KNN算法中N的不确定性,彻底实现了无参性,大幅减少了分类所用的时间。实验证明,该算法符合Web实时在线分类的要求。
展开更多
关键词
KNN算法
不良文本过滤
χ2统计量
在线阅读
下载PDF
职称材料
题名
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法
被引量:
5
1
作者
如先姑力·阿布都热西提
亚森·艾则孜
郭文强
机构
新疆警察学院信息安全工程系
新疆财经大学计算机科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2019年第11期3410-3414,共5页
基金
国家自然科学基金资助项目(61762086)
新疆维吾尔自治区高校科研计划项目(XJEDU2017M046)
国家社会科学基金资助项目(13CFX055)
文摘
提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最后,在传统SVM中引入一个控制超平面之间距离的参数,构建一种类不平衡SVM,使其能够很好地分类具有非线性不可分和不平衡性的维吾尔语文本。实验结果表明,该方法能够准确分类出不良文本,且具有较短的分类时间。
关键词
维吾尔语网页
不良文本过滤
n-gram词干提取
类不平衡SVM
Keywords
Uyghur webpage
reactionary text filtering
n-gram stem extraction
class-unbalanced SVM
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于χ~2统计量的不良文本过滤特征选择方法
被引量:
1
2
作者
管江红
机构
西藏民族大学信息工程学院
出处
《现代电子技术》
北大核心
2019年第21期182-186,共5页
文摘
针对现有以χ^2统计量为基础的特征选择方法在不良文本过滤过程中效果欠佳的问题,利用双层分类对特征选择方法进行改良,提出一种不良文本过滤特征选择方法。首先通过改良逆文档频率来区分特征项在所属类别类内与其他类别之间的分布差别;其次,引入逆类别频率弥补抑制强度;最后,加入逆上层类别频率,清晰划分具有较高相似度的某两类二层类别。所改良的特征选择方法能够弥补现有χ^2统计量在类内/类间特征项分布情况判别能力的缺陷,将其应用于不良文本过滤过程,能够充分贴合不良文本过滤过程的特征选择需求。通过对比评估指标的结果,表明所提方法在不良文本过滤领域具有更好的效果。
关键词
特征选择
χ^2统计量
双层分类
不良文本过滤
特征项分布
评估指标
Keywords
feature selection
χ^2 statistics
double-layer classification
harmful text filtering
feature item distribution
evaluation index
分类号
TN911.1 [电子电信—通信与信息系统]
34
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于KNN的不良文本过滤方法
被引量:
7
3
作者
王洪彬
刘晓洁
机构
四川大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第24期69-71,共3页
基金
国家自然科学基金资助项目(60573130
60502011)
+1 种基金
国家"863"计划基金资助项目(2006AA01Z435)
教育部新世纪优秀人才计划基金资助项目(NCET-04-0870)
文摘
不良文本过滤是当前的一个研究热点。通过对χ2统计量的具体分析,证明χ2统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在此基础上改进KNN算法,消除了KNN算法中N的不确定性,彻底实现了无参性,大幅减少了分类所用的时间。实验证明,该算法符合Web实时在线分类的要求。
关键词
KNN算法
不良文本过滤
χ2统计量
Keywords
K-Nearest Neighbor(KNN) algorithm
reactionary text filtering
statistics χ2
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法
如先姑力·阿布都热西提
亚森·艾则孜
郭文强
《计算机应用研究》
CSCD
北大核心
2019
5
在线阅读
下载PDF
职称材料
2
基于χ~2统计量的不良文本过滤特征选择方法
管江红
《现代电子技术》
北大核心
2019
1
在线阅读
下载PDF
职称材料
3
基于KNN的不良文本过滤方法
王洪彬
刘晓洁
《计算机工程》
CAS
CSCD
北大核心
2009
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部