期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
语料库词性标注一致性检查方法研究 被引量:9
1
作者 张虎 郑家恒 刘江 《中文信息学报》 CSCD 北大核心 2004年第5期11-16,共6页
在对大规模语料库进行深加工时 ,保证词性标注的一致性已成为建设高质量语料库的首要问题。本文提出了基于聚类和分类的语料库词性标注一致性检查的新方法 ,该方法避开了以前一贯采用的规则或统计的方法 ,利用聚类和分类的思想 ,对范例... 在对大规模语料库进行深加工时 ,保证词性标注的一致性已成为建设高质量语料库的首要问题。本文提出了基于聚类和分类的语料库词性标注一致性检查的新方法 ,该方法避开了以前一贯采用的规则或统计的方法 ,利用聚类和分类的思想 ,对范例进行聚类并求出阈值 ,对测试数据分类来确定其标注的正误 ,进而得出每篇文章的词性标注一致性情况 。 展开更多
关键词 计算机应用 中文信息处理 词性标注一致性 兼类词 聚类
在线阅读 下载PDF
基于分类的汉语语料库词性标注一致性检查 被引量:3
2
作者 张虎 郑家恒 《计算机工程》 CAS CSCD 北大核心 2008年第8期90-92,共3页
制约语料库加工质量的一个重要方面是多标记词语的词性标注一致性问题。该文通过对大规模语料库兼类词的词性标注结果的分析,提出一种语料库词性标注一致性检查的方法,分析词性标记序列的特征并建立兼类词语境向量模型,运用k最近邻法,... 制约语料库加工质量的一个重要方面是多标记词语的词性标注一致性问题。该文通过对大规模语料库兼类词的词性标注结果的分析,提出一种语料库词性标注一致性检查的方法,分析词性标记序列的特征并建立兼类词语境向量模型,运用k最近邻法,对兼类词语境进行向量分类,判定兼类词词性标注是否一致,得出每篇文章的词性标注的一致性情况,并测试了北京大学的150万语料。 展开更多
关键词 分类 词性标注 兼类词 词性标注一致性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部