-
题名演化算法在中文自动分词中的应用
被引量:7
- 1
-
-
作者
何炎祥
冯夏根
周水庚
-
机构
武汉大学计算机学院软件工程国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第5期80-82,共3页
-
文摘
首先对各种现有的中文自动分词算法进行简要比较,并指出其存在的问题,然后针对这些问题,设计了一个基于演化的中文自动分词算法。最后通过对实验结果的分析,比较了本算法与已有算法的优缺点,并指明了算法的改进之处。
-
关键词
语料库
汉字信息处理
演化算法
中文自动分词
-
Keywords
Evolution alorithmCorpus bankChinese language automatic word segmentation
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名信息过滤中的中文自动分词技术研究
被引量:7
- 2
-
-
作者
孙铁利
李晓微
张妍
-
机构
东北师范大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2009年第3期80-82,100,共4页
-
文摘
文本信息过滤技术需要解决的一个重要问题是对文档进行形式化处理,使得文本成为可计算和推理的信息,而中文自动分词是中文信息处理的基础性工作。本文对中文自动分词的主要方法进行了研究分析,构造了分词的形式化模型,说明了自动分词中存在的两个最大困难及其解决方法,最后指出了中文自动分词研究中存在的问题及未来的研究工作。
-
关键词
中文自动分词
歧义
未登录词
形式化模型
-
Keywords
automatic Chinese segmentation
ambiguity
unknown word
formal model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种组合型中文分词方法
被引量:11
- 3
-
-
作者
郑晓刚
韩立新
白书奎
曾晓勤
-
机构
河海大学计算机与信息学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第7期26-28,39,共4页
-
基金
国家自然科学基金项目(60673186
60971088)
江苏省高校"青蓝工程"中青年学术带头人培养对象资助项目
-
文摘
设计一种组合型的分词机制:基于字典的双向最大匹配,基于字标注的中文分词方法和隐马尔科夫的分词方式。通过实验的结果比较,表明该种组合型的分词方法能够较好地解决中文歧义并发现新的登录词。
-
关键词
中文信息处理
中文自动分词
组合型分词
-
Keywords
Chinese information processing Chinese word automatic segmentation Combination-type word segmentation
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名中文分词算法在搜索引擎应用中的研究
被引量:20
- 4
-
-
作者
欧振猛
余顺争
-
机构
中山大学电子系
-
出处
《计算机工程与应用》
CSCD
北大核心
2000年第8期80-82,84,共4页
-
文摘
在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行中文分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词中出现的歧义问题,从而提高精度。
-
关键词
搜索引擎
中文自动分词
算法
汉字信息处理
-
Keywords
Search Engine, Chinese Word Automatic Segmentation, Matching, Markoff process
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名自动分词算法在智能答疑系统中的应用研究
被引量:4
- 5
-
-
作者
郑耿忠
-
机构
韩山师范学院数学与信息技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第9期2224-2226,2235,共4页
-
文摘
汉语自动分词是远程教育智能答疑系统的基础,如何根据远程教育智能答疑系统的特点进行相关分词算法的设计是提高答疑系统智能性,促进智能答疑系统发展的关键所在。针对现有答疑系统智能性不好的问题,在介绍几种常见分词算法的基础上,提出了一种改进型的自动分词算法,对该算法及其在智能答疑系统中的应用进行了分析,有利于提高智能答疑系统答疑的准确性和智能性,具有一定的实用价值。
-
关键词
中文自动分词
智能答疑系统
全切分
交集型歧义
远程教育
-
Keywords
Chinese word segmentation
intelligent answering system
complete syncopate
overlapped ambiguity
remote education
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名中文分词中组合型切分歧义的消解研究
被引量:1
- 6
-
-
作者
尤慧丽
晏立
杨晓东
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第31期125-127,134,共4页
-
文摘
针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提取歧义字段的上下文信息来建立规则库,然后利用C-SVM模型结合规则对组合型歧义字段进行歧义消解。最后以1998年1月《人民日报》语料中出现的组合型歧义字段进行训练和测试,实验显示消歧的平均准确率达89.33%。
-
关键词
中文自动分词
组合型歧义
上下文信息
C-支持向量机
-
Keywords
Chinese word segmentation
combinational ambiguity
contextual information
C-Support Vector Machine(C-SVM)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语境信息的组合型分词歧义消解方法
被引量:10
- 7
-
-
作者
曲维光
吉根林
穗志方
周俊生
-
机构
北京大学计算语言学研究所
南京师范大学计算机系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2006年第17期74-76,共3页
-
基金
国家"973"计划基金资助项目(2004CB318102)
国家自然科学基金资助项目(60503071)
江苏省自然科学基金资助项目(BK2005135)
-
文摘
提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧义进行实验,平均准确率达到95%以上,证明该方法对于消解组合型分词歧义具有良好效果。
-
关键词
中文自动分词
组合型歧义
相对词频
语境计算模型
-
Keywords
Chinese word segmentation
Covering ambiguity
Relative word frequency
Context calculation model
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名中文搜索引擎现状与展望
被引量:25
- 8
-
-
作者
都云程
卢献华
-
机构
北京信息工程学院中文信息研究处理中心
-
出处
《中文信息学报》
CSCD
北大核心
1999年第3期61-64,F003,共5页
-
文摘
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向。
-
关键词
中文搜索引擎
全文检索
中文自动分词
搜索引擎
-
Keywords
Chinese search engineFull-text retrievalAutomatic words segmentationrelevance Ranking
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-