-
题名基于CRFs模型的敏感话题识别研究
被引量:4
- 1
-
-
作者
翟东海
聂洪玉
崔静静
杜佳
-
机构
西南交通大学信息科学与技术学院
西藏大学工学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第4期993-996,共4页
-
基金
国家语委"十二五"科研规划资助项目(YB125-49)
国家教育部科学技术研究重点资助项目(212167)
+1 种基金
中央高校基本科研业务费专项资金科技创新资助项目(SWJTU12CX096)
国家级大学生创新创业训练计划资助项目(201210694017)
-
文摘
条件随机场(CRFs)是一种判别式概率无向图学习模型,将其引入敏感话题识别中,提出了基于CRFs模型的敏感话题识别方法。将随机挑选出的一篇待检测文本s和剩余的待检测文本分别作为CRFs模型的观察序列和状态序列来计算文本s和其余待检测文本间的相关性概率值;然后将相关性最高的那篇文本和文本s合并表征一个类别;同时,将相关性最低的那篇文本作为另一个类别,将这两个类别作为CRFs模型新的状态序列,剩余的待检测文本作为新的观察序列进行迭代,据此实现敏感话题的识别。在数据集上进行的实验中,该方法的耗费函数的值为0.01943,宏平均F度量的值为0.8235,都取得了很好的效果。
-
关键词
条件随机场
敏感话题识别
相关性概率值
-
Keywords
conditional random field (CRFs)
sensitive topic detection
correlative probabilities
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-