-
题名基于数据库编程语言的海量邮件数据分类技术
- 1
-
-
作者
段丹
郭绍忠
甄涛
刘晓楠
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第9期70-72,75,共4页
-
文摘
针对海量邮件数据的处理需求和实际业务需要,设计了基于数据库编程语言的海量邮件自动分类系统。该系统由特征学习模块、数据库查询模块和贝叶斯分类模块3部分构成。结合贝叶斯分类算法,利用PL/SQL语言与数据库交互时的高效性特点,在ORACLEPL/SQL存储过程中完成对未知邮件的特征提取和表示,实现对海量邮件数据的有效分类。
-
关键词
海量邮件数据
特征学习
数据库编程语言
存储过程
贝叶斯分类
-
Keywords
massive e-mall data
feature study
database programming language
stored procedure
Bayesian classification
-
分类号
TP311.11
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于邮件分类的敏感社团挖掘技术
被引量:3
- 2
-
-
作者
段丹
郭绍忠
李志博
刘沙
-
机构
信息工程大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2007年第12期3039-3041,3044,共4页
-
文摘
针对海量邮件数据的处理需求和实际业务需要,设计了基于三层过滤模型的邮件挖掘系统。对时间属性、内容信息和地址数据进行逐层分析和筛选过滤,在广度上缩小侦察范围,在深度上加大挖掘力度。系统以邮件正文和主题包含的敏感信息为切入对邮件进行自动分类,进而通过地址信息建立邮件社会关系网络,挖掘原始邮件数据背后隐含的社团结构。最后通过实验验证了其有效性。
-
关键词
海量邮件数据
贝叶斯分类器
邮件社会网络
社团结构
中介度
-
Keywords
massive email data
Bayesian classifier
E-mail Social Network (ESN)
community structure
betweenness centrality
-
分类号
TP311.11
[自动化与计算机技术—计算机软件与理论]
-