期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于主动学习的中文问题分类数据集构建
被引量:
2
1
作者
邱锡鹏
缪有栋
黄萱菁
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2012年第5期125-128,共4页
为解决在开放领域问题回答问题中语料规模较小、难以满足问题分类训练需要的问题,用主动学习方法来构建中文问题分类数据集.根据主动学习的方法进行中文问题类别标注,并且通过主动式特征选择方法来提升性能.实验结果表明:在使用主动学...
为解决在开放领域问题回答问题中语料规模较小、难以满足问题分类训练需要的问题,用主动学习方法来构建中文问题分类数据集.根据主动学习的方法进行中文问题类别标注,并且通过主动式特征选择方法来提升性能.实验结果表明:在使用主动学习方法时可以快速收敛到最佳准确率(85%),在使用人工标注特征下特征集明显的减小.基于主动学习的标注方法在需要较小人工标注同时取得很好的分类性能,并且在一定程度上还可以明显提高问题分类的准确率.
展开更多
关键词
主动学习
PASSIVE
Aggressive算法
特征选择
中文问题分类
在线阅读
下载PDF
职称材料
面向问答社区的中文问题分类
被引量:
10
2
作者
董才正
刘柏嵩
《计算机应用》
CSCD
北大核心
2016年第4期1060-1065,共6页
传统的问题分类体系大都基于事实类问题,传统的问题分类方法也比较依赖于疑问词这一分类特征,但问答社区(CQA)中非事实类问题居多,且许多问题并不包含疑问词,为此,提出一种面向问答社区的粗粒度分类体系,并在此基础上提出一种基于疑问...
传统的问题分类体系大都基于事实类问题,传统的问题分类方法也比较依赖于疑问词这一分类特征,但问答社区(CQA)中非事实类问题居多,且许多问题并不包含疑问词,为此,提出一种面向问答社区的粗粒度分类体系,并在此基础上提出一种基于疑问词的层次化结构问题分类方法。该方法首先自动识别问题中的疑问词,若疑问词存在,则用支持向量机(SVM)模型进行分类;而对没有疑问词的问题,则用所构造的基于焦点词的分类器进行分类。通过在从中文问答社区知乎中所爬取的问题数据集上进行实验,与传统的基于SVM模型的分类方法相比,该方法的分类准确率提高了4.7个百分点。实验结果表明,这种根据问题是否含有疑问词而选择不同分类器的方法,减轻了分类方法对疑问词的依赖,能有效提高问答社区中问题分类的准确率。
展开更多
关键词
中文问题分类
问答社区
层次
分类
支持向量机
焦点词
在线阅读
下载PDF
职称材料
题名
基于主动学习的中文问题分类数据集构建
被引量:
2
1
作者
邱锡鹏
缪有栋
黄萱菁
机构
复旦大学计算机科学技术学院
出处
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2012年第5期125-128,共4页
基金
国家自然科学基金资助项目(61003091
61073069)
文摘
为解决在开放领域问题回答问题中语料规模较小、难以满足问题分类训练需要的问题,用主动学习方法来构建中文问题分类数据集.根据主动学习的方法进行中文问题类别标注,并且通过主动式特征选择方法来提升性能.实验结果表明:在使用主动学习方法时可以快速收敛到最佳准确率(85%),在使用人工标注特征下特征集明显的减小.基于主动学习的标注方法在需要较小人工标注同时取得很好的分类性能,并且在一定程度上还可以明显提高问题分类的准确率.
关键词
主动学习
PASSIVE
Aggressive算法
特征选择
中文问题分类
Keywords
active learning
passive aggressive
feature selection
Chinese question classification
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向问答社区的中文问题分类
被引量:
10
2
作者
董才正
刘柏嵩
机构
宁波大学信息科学与工程学院
宁波大学图书馆与信息中心
出处
《计算机应用》
CSCD
北大核心
2016年第4期1060-1065,共6页
基金
浙江省教育厅(文)/科研计划项目(20071008)
浙江省部级实验室开放基金资助项目(B2014)~~
文摘
传统的问题分类体系大都基于事实类问题,传统的问题分类方法也比较依赖于疑问词这一分类特征,但问答社区(CQA)中非事实类问题居多,且许多问题并不包含疑问词,为此,提出一种面向问答社区的粗粒度分类体系,并在此基础上提出一种基于疑问词的层次化结构问题分类方法。该方法首先自动识别问题中的疑问词,若疑问词存在,则用支持向量机(SVM)模型进行分类;而对没有疑问词的问题,则用所构造的基于焦点词的分类器进行分类。通过在从中文问答社区知乎中所爬取的问题数据集上进行实验,与传统的基于SVM模型的分类方法相比,该方法的分类准确率提高了4.7个百分点。实验结果表明,这种根据问题是否含有疑问词而选择不同分类器的方法,减轻了分类方法对疑问词的依赖,能有效提高问答社区中问题分类的准确率。
关键词
中文问题分类
问答社区
层次
分类
支持向量机
焦点词
Keywords
Chinese question classification
Community Question Answering(CQA)
hierarchical classification
Support Vector Machine(SVM)
focus word
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于主动学习的中文问题分类数据集构建
邱锡鹏
缪有栋
黄萱菁
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2012
2
在线阅读
下载PDF
职称材料
2
面向问答社区的中文问题分类
董才正
刘柏嵩
《计算机应用》
CSCD
北大核心
2016
10
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部