-
题名非平衡数据集分类问题研究进展
被引量:16
- 1
-
-
作者
高嘉伟
梁吉业
-
机构
山西大学计算智能与中文信息处理省部共建教育部重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2008年第4期10-13,共4页
-
基金
国家自然科学基金(No70471003)
高等学校博士学科点专项科研基金(No200501080604)
+1 种基金
教育部科学技术研究重点项目(No206017)
山西省重点实验室开放基金(No200603023)的资助
-
文摘
非平衡数据集广泛存在于现实世界中,其分类问题已经成为目前数据挖掘领域中的一个研究热点。文章综述了非平衡数据集分类问题的评价方法及其常用分类算法,分析了目前存在的主要困难,并指出需进一步解决的几个问题。
-
关键词
非平衡数据集
分类
算法
-
Keywords
Imbalanced data sets, Classification, Algorithm
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TK124
[动力工程及工程热物理—工程热物理]
-
-
题名基于词对向量空间模型的新事件检测方法
被引量:4
- 2
-
-
作者
樊旭琴
张永奎
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理省部共建教育部重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第12期123-125,共3页
-
基金
国家自然科学基金No.60475022
山西省自然科学基金No.20041041
山西省回国留学人员基金(No.2002004)~~
-
文摘
新事件检测(NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。传统向量空间模型采用单个词来表示文本特征,考虑到词的位置信息以及其他的表示内容的信息,提出了词对表示文本的方法,并结合HowNet资源对所抽取的词对进行归一化处理,最后对不同类别新闻中不同词性对的权重参数进行优化。通过在已有的突发性新闻语料上进行实验,表明这种改进方法的效果比较明显,性能也有一定的提高。
-
关键词
向量空间模型
词对特征
新事件检测
-
Keywords
vector space model
word pair feature
new event detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-