-
题名汉字的线性分类实验
被引量:1
- 1
-
-
作者
金奕江
马少平
-
机构
智能技术与系统国家重点实验室清华大学计算机系
-
出处
《中文信息学报》
CSCD
北大核心
2000年第2期55-59,共5页
-
基金
国家自然科学基金
"86 3"高技术项目资助
-
文摘
本文通过实验研究了在汉字识别中应用线性分类器的可能性 ,考察了汉字之间的线性可分性。实验使用了两种主要的线性分类器 :Fisher线性判别和感知器。实验检验每一对汉字的线性可分性。实验结果表明 ,汉字之间的线性分类性是相当好的。尤其是Fisher线性判别 ,不能成功线性分类的汉字仅占百万分之 4.2 5。这显示了在汉字识别中应用线性分类器是有着巨大的潜力的。同时 ,线性分类实验结果还可用来检验所选取特征的好坏 ,有利于客观的评价特征。
-
关键词
汉字识别
线性分类器
模式识别
-
Keywords
Chinese character recognition Linear Classification Fisher Linear Discriminant Perceptron
-
分类号
H123
[语言文字—汉语]
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名知网与同义词词林的信息融合研究
被引量:28
- 2
-
-
作者
梅立军
周强
臧路
陈祖舜
-
机构
智能技术与系统国家重点实验室清华大学计算机系
-
出处
《中文信息学报》
CSCD
北大核心
2005年第1期63-70,共8页
-
基金
国家自然科学基金 (6 0 1330 0 0 8)
国家 937基金 (G19980 30 5 0 7)
国家高技术研究发展 836计划(2 0 0 1AA114 0 4 0 )
-
文摘
本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上对两部词典中同时收录且均只有一个义项的词语进行双向意义联结 ,最后根据分类算法对两部词典中同时收录非单一义项的词语进行双向意义联结。实验表明 ,本文提出的处理策略达到了 93%的信息融合正确率 ,融合后形成的新词典兼有词林的分类学信息和知网的概念描述信息。
-
关键词
计算机应用
中文信息处理
词典信息融合
知网
同义词词林
分类
-
Keywords
computer application
Chinese information processing
information merging
HowNet
TongYiCi CiLin
classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语声调识别中的基音平滑新方法
被引量:26
- 3
-
-
作者
朱小燕
王昱
刘俊
-
机构
智能技术与系统国家重点实验室清华大学计算机系
-
出处
《中文信息学报》
CSCD
北大核心
2001年第2期45-50,共6页
-
基金
国家自然科学基金 !(6 9982 0 0 5 )
国家重点基础研究发展规划项目 !(G1980 30 5 0 70 3)
-
文摘
汉语普通话是一种带声调的语言。声调可以用基音的轮廓信息进行描述。传统基音的平滑方法 :线性平滑、中值平滑和一般的线性插值方法都不能很好地处理连续的基音频率有随机错误点的情况。本文提出了一种通过搜索来得到更精确的基音轮廓的新的基音平滑方法。这种方法具有简单可靠 ,快速高效的特点。实验表明这种方法比传统的方法识别错误率降低约 40 %
-
关键词
基音检测
声调识别
语音识别
基音频率
基音轮廓
中值平滑
随机错误点
-
Keywords
pith detection
smoothing
ione recognition
speech recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名虚拟装配仿真平台的研究与实现
被引量:12
- 4
-
-
作者
陶品
叶榛
王洋
孙增圻
-
机构
智能技术与系统国家重点实验室
-
出处
《系统仿真学报》
EI
CAS
CSCD
2001年第6期704-706,共3页
-
文摘
虚拟装配是虚拟现实领域中一个新的研究方向。本文从虚拟现实技术的角度出发,讨论了在设计一个虚拟装配平台时所要涉及到的一些关键技术和解决办法,包括虚拟装配平台的装配关系表示、装配对象管理、实时碰撞检测等问题。最后本文还展示了用该原型系统完成虚拟装配操作的一个实例并分析了该系统有待进一步完善之处。
-
关键词
虚拟装配仿真平台
机械装配
CAD
计算机仿真
-
Keywords
virtual reality
machine assembly
collision detection
-
分类号
TH16
[机械工程—机械制造及自动化]
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语基本短语的自动识别
被引量:41
- 5
-
-
作者
张昱琪
周强
-
机构
智能技术与系统国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2002年第6期1-8,共8页
-
基金
国家自然科学基金项目 (6 990 30 0 7)
国家 973基金项目 (G19980 30 5 0 7)
国家 86 3计划项目 (2 0 0 1AA114 0 4 0 )
-
文摘
本文应用基于实例的MBL(Memory BasedLearning)学习方法 ,对汉语中较常见的 9种基本短语的边界及类别进行识别 ,并利用短语内部构成结构和词汇信息对预测中出现的边界歧义和短语类型歧义进行了排歧处理。实验中还比较了在特征向量中加入词汇信息与否对实验结果的影响。实验取得了比较令人满意的结果 :对这 9种基本短语的识别正确率达到 95 .2 % ;召回率达到 93.7%。
-
关键词
部分分析
基本短语
实例学习
短语结构
词汇排放
短语识别
自然语言处理
汉语句法分析
-
Keywords
partial parsing
base phrase
memory based learning
phrase structure
lexical based disambiguation
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词性和语义知识的汉语句法规则学习
被引量:8
- 6
-
-
作者
苑春法
陈刚
黄昌宁
-
机构
智能技术与系统国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2001年第3期1-8,共8页
-
基金
自然科学基金!(6 9975 0 0 8)
973基础研究基金!(G19980 30 5 0 7)
-
文摘
本文提出了一种汉语句法规则学习的新方法。本方法的特点是 :在规则的学习和表示上都利用了词性、语义以及上下文相关的信息。它不仅能自动学习上下文无关的二元规则 ,而且还能自动发现词类搭配中的歧义结构 ,并利用语义和上下文相关信息将歧义规则在句法分析之前进行排除。实验结果表明 ,该方法较好地解决了汉语句法规则的自动获取及排歧问题并极大地降低了句法分析的难度 ,显示了很好的应用前景。
-
关键词
句法分析
二元语义规则
二元词性规则
禁止规则
汉语
-
Keywords
parsing
bi gram semantic rules
bi gram part of speech rules
forbidden rules
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-