期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于决策树的敏感词变形体识别算法研究及应用 被引量:19
1
作者 余敦辉 张笑笑 +1 位作者 付聪 张万山 《计算机应用研究》 CSCD 北大核心 2020年第5期1395-1399,1405,共6页
针对网络中敏感词变形体识别效率不高的问题,提出了基于决策树的敏感词变形体识别算法。首先,通过分析汉字的结构和读音等特征,研究敏感词及变形体;其次,基于敏感词库构建敏感词决策树;最后,通过多因子改进模型,对微博等新媒体的文本敏... 针对网络中敏感词变形体识别效率不高的问题,提出了基于决策树的敏感词变形体识别算法。首先,通过分析汉字的结构和读音等特征,研究敏感词及变形体;其次,基于敏感词库构建敏感词决策树;最后,通过多因子改进模型,对微博等新媒体的文本敏感程度进行计算。实验结果表明,该算法在识别中文敏感词及变形体时,查全率和查准率最高分别可达95%和94%,与基于确定有穷自动机的改进算法相比,查全率和查准率分别提高了19.8%和21.1%;与敏感信息决策树信息过滤算法相比,查全率和查准率分别提高17.9%和18.1%。通过分析,该算法对敏感词变形体的识别和自动过滤是有效的。 展开更多
关键词 敏感识别 敏感词变形体 决策树 敏感程度计算 多因子模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部