-
题名WKAG:一种针对不平衡医保数据的欺诈检测方法
被引量:10
- 1
-
-
作者
吴文龙
周喜
王轶
王保全
-
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆民族语音语言信息处理实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第9期247-254,共8页
-
基金
中国科学院STS计划(KFJ-STS-QYZD-102)
中科院创新青年促进会(Y9290802)
自治区天山青年计划(2018Q032)。
-
文摘
医保欺诈检测具有迫切的现实意义,当前工作主要以机器学习方法为主,但面临两个重要问题:(1)数据不平衡问题较为突出,欺诈样本占比极小,影响识别效果;(2)数据特征的选取与构造过于依赖领域业务知识,难以保证特征有效性。针对这些问题,提出了一种针对不平衡医保数据的欺诈检测方法——WKAG。使用WGAN-KDE(Wasserstein Generative Adversarial Network-Kernel Density Estimation)方法改善数据不平衡问题,结合自编码器(Auto-Encoder)提取数据的深层隐藏特征,使用Gradient Boosted Decision Tree(GBDT)检测医保欺诈行为。在多个公开数据集上验证了该方法有效性,并在真实医保业务数据集上进行了实验验证,结果表明了WKAG可作为医保欺诈行为的有效检测方法。
-
关键词
生成对抗网络
不平衡类
自编码特征表示
医保欺诈检测
集成学习
-
Keywords
generative adversarial network
imbalance dataset
auto-encoder feature representation
medical insurance fraud detection
ensemble learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-