期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于短语的贝叶斯中文垃圾邮件过滤方法 被引量:10
1
作者 王青松 魏如玉 《计算机科学》 CSCD 北大核心 2016年第4期256-259,269,共5页
朴素贝叶斯算法在垃圾邮件过滤领域得到了广泛应用,该算法中,特征提取是一个必不可少的环节。过去针对中文的垃圾邮件过滤方法都以词作为文本的特征项单位进行提取,面对大规模的邮件训练样本,这种算法的时间效率会成为邮件过滤技术中的... 朴素贝叶斯算法在垃圾邮件过滤领域得到了广泛应用,该算法中,特征提取是一个必不可少的环节。过去针对中文的垃圾邮件过滤方法都以词作为文本的特征项单位进行提取,面对大规模的邮件训练样本,这种算法的时间效率会成为邮件过滤技术中的一个瓶颈。对此,提出一种基于短语的贝叶斯中文垃圾邮件过滤方法,在特征项提取阶段结合文本分类领域提出的新的短语分析方法,按照基本名词短语、基本动词短语、基本语义分析规则,以短语为单位进行提取。通过分别以词和短语为单位进行垃圾邮件过滤的对比测试实验证实了所提出方法的有效性。 展开更多
关键词 垃圾邮件过滤 贝叶斯 特征项提取 基于短语 中文分词
在线阅读 下载PDF
协作信息平台中协作内容自动匹配方法的设计与实现
2
作者 李培峰 朱巧明 杨蓓虹 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第z1期429-433,共5页
首先介绍了一个企业协作信息平台的基本框架,分析了实现协作信息平台中协作内容自动匹配的重要性和必要性,提出了在向量空间模型(VSM)的基础上,通过规则提取、查询扩展、潜在语义索引和相关反馈相结合的方法实现企业协作信息网平台中信... 首先介绍了一个企业协作信息平台的基本框架,分析了实现协作信息平台中协作内容自动匹配的重要性和必要性,提出了在向量空间模型(VSM)的基础上,通过规则提取、查询扩展、潜在语义索引和相关反馈相结合的方法实现企业协作信息网平台中信息的自动匹配和检索,并给出相关实验结果. 展开更多
关键词 协作信息平台 内容自动匹配 特征项提取 特征权重 潜在语义索引
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部