期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
综合最大匹配和歧义检测的中文分词粗分方法
被引量:
3
1
作者
李国和
刘光胜
+2 位作者
秦波波
吴卫江
李洪奇
《计算机工程与应用》
CSCD
2012年第14期139-142,167,共5页
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规...
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好的效果。
展开更多
关键词
中文分词
粗分
最大匹配
算法
全切分算法
歧义检测
在线阅读
下载PDF
职称材料
题名
综合最大匹配和歧义检测的中文分词粗分方法
被引量:
3
1
作者
李国和
刘光胜
秦波波
吴卫江
李洪奇
机构
中国石油大学地球物理与信息工程学院
中国石油大学(北京)油气资源与探测国家重点实验室
石大兆信数字身份管理与物联网技术研究院
出处
《计算机工程与应用》
CSCD
2012年第14期139-142,167,共5页
基金
国家自然科学基金(No.60473125)
国家高新技术研究发展计划(No.2009AA062802)
+1 种基金
中国石油(CNPC)石油科技中青年创新基金(No.05E7013)
国家重大专项子课题(No.G5800-08-ZS-WX)
文摘
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好的效果。
关键词
中文分词
粗分
最大匹配
算法
全切分算法
歧义检测
Keywords
Chinese word segmentation
rough segmentation
maximum match algorithm
omni-segmentation algorithm
ambiguity detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
综合最大匹配和歧义检测的中文分词粗分方法
李国和
刘光胜
秦波波
吴卫江
李洪奇
《计算机工程与应用》
CSCD
2012
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部