-
题名面向维吾尔文的敏感信息过滤方法研究
被引量:6
- 1
-
-
作者
薛朋强
鲜英
努尔布力
吾守尔.斯拉木
-
机构
新疆大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第5期236-241,246,共7页
-
基金
国家自然科学基金(No.61163052
No.61303231
No.61433012)
-
文摘
在这个信息量爆炸性增长的时代,网络不良信息充斥在日常生活当中。为了构建洁净的网络环境,实现对网络维吾尔文中敏感信息的检测与过滤,通过分析维吾尔文的特点,将维吾尔文进行词干提取和编码化处理,再结合DFA和决策树提出了针对维吾尔文敏感信息过滤的相应方法。维吾尔文经过词干提取、编码化处理解决了维吾尔文书写顺序和形式多样、存储易出现乱码等问题。再结合决策树的特点,将转码后的维吾尔文信息存储于决策树节点上,将决策树的子节点按照特定编码进行顺序排列。这样维吾尔文文本信息进行敏感信息过滤时可以缩小检测范围,提高算法效率。
-
关键词
敏感信息过滤
确定性自动机
维吾尔文过滤
决策树
-
Keywords
sensitive information filtering
deterministic finite automaton
Uyghur filter
decision tree
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-