摘要
针对单义词的词义问题构建了融合触发对(trigger pair)的矢量空间模型用来进行词义相似度的计算,并以此为基础进行了词语的聚类;针对多义词的词义问题应用融合远距离上下文信息的最大熵模型进行了有导词义消歧的研究.为克服以往词义消歧评测中通过人工构造带有词义标记的测试例句而带来的覆盖程度小、主观影响大等问题,将模型的评测直接放到了词语聚类和分词歧义这两个实际的应用中.分词歧义的消解正确率达到了92%,词语聚类的结果满足进一步应用的需要.
出处
《高技术通讯》
CAS
CSCD
北大核心
2005年第1期1-6,共6页
Chinese High Technology Letters
基金
国家自然科学基金,国家高技术研究发展计划(863计划)