题名 基于对数模型的词义自动消歧
被引量:13
1
作者
朱靖波
李珩
张跃
姚天顺
机构
东北大学计算机科学研究所
出处
《软件学报》
EI
CSCD
北大核心
2001年第9期1405-1412,共8页
基金
国家自然科学基金资助项目 (6 9985 0 0 1)
国家重点基础研究发展规划 973资助项目 (G19980 30 5 0 11)
国家教育部博士点基金资助项目 (19990 145 0 3)~~
文摘
提出了一种对数模型 (logarithm model,简称 L M) ,构造了一个词义自动消歧系统 LM-WSD(word sensedisambiguation based on logarithm model) .在词义自动消歧实验中 ,构造了 4种计算模型进行词义消歧 ,根据 4个计算模型的消歧结果 ,分析了高频率词义、指示词、特定领域、固定搭配和固定用法信息对名词和动词词义消歧的影响 .目前 ,该词义自动消歧系统 L M-WSD已经应用于基于词层的英汉机器翻译系统 (汽车配件专业领域 )中 ,有效地提高了翻译性能 .
关键词
词义自动消歧
机器翻译
对数模型
自然语言处理
计算机
Keywords
word sense disambiguation
machine translation
logarithm model
natural language processing
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
题名 文本层次分析与文本浏览
被引量:12
2
作者
林鸿飞
战学刚
姚天顺
机构
东北大学计算机科学研究所
出处
《中文信息学报》
CSCD
北大核心
1999年第4期7-15,共9页
基金
国家自然科学基金
国家教委博士点基金
文摘
本文简要描述了文本的物理结构和逻辑结构以及相应的向量空间模型。研制了具有导航机制的文本浏览系统。提出了文本结构分析中的层次分析方法,它采用有序划分层次的方法。并在此基础上,给出了文本结构中各单元的标记信息,由此形成了文本的可视化表示。利用文本、层次、段落的超文本连接,根据浏览的需要,逐级展现文本细节,帮助用户有目的、有选择地浏览文本。最后给出评价的结果。
关键词
向量空间
文本结构分析
文本浏览
文本层次分析
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于概念扩充的中文文本过滤模型
被引量:7
3
作者
林鸿飞
战学刚
姚天顺
机构
东北大学计算机科学研究所
出处
《计算机科学》
CSCD
北大核心
2000年第2期88-90,82,共4页
基金
国家自然科学基金 编号:69675019
国家教委博士点基金
文摘
1 前言今天,以因特网为主体的信息高速公路仍在不断普及和发展,因特网上蕴涵的海量信息远远超过人们的想象,面对这样的信息汪洋大海,人们往往感到束手无策,无所适从,出现所谓的“信息过载”问题。如何帮助人们有效地选择和利用所感兴趣的信息,同时保证人们在信息选择方面的个人隐私权利?这已成为学术界和企业界所十分关注的焦点。因此。
关键词
中文文本
文本过滤模型
概念扩充
信息过滤
Keywords
Text filtering,Boolean constrains,Vector space model,Concept expansion,Passage match-ing, User profiles,Fuzzy logic
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 机器学习在汉语关联词语识别中的应用
被引量:7
4
作者
高维君
姚天顺
黎邦洋
陈伟光
邹嘉彦
机构
东北大学计算机科学研究所
香港城市大学 语言资讯科学 研究 中心
出处
《中文信息学报》
CSCD
北大核心
2000年第3期1-8,共8页
文摘
关联词语在一些汉语议论文章中占很大的比重 ,因而 ,对于此类汉语文章的分析 ,关联词可以起到非常重要的作用。本文主要讨论如何将机器学习应用于汉语关联词的歧义辨别———原因 ,方法和效果。我们在已经加工完毕的 80篇汉语语料的基础上 ,抽取了用于机器学习的训练集和测试集 ,并使用C4.5进行了测试 ,识别正确率在 80 %以上。在文章的后面 ,我们还从语言学的角度对机器学习的结果进行了解释和分析。
关键词
机器学习
关联词语识别
语料库
汉语
歧义问题
Keywords
Discourse marker Machine learning C4.5 Discourse analysis Corpus
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 英文文献辅助阅读系统
被引量:1
5
作者
程海亮
姚天顺
机构
东北大学计算机科学研究所
出处
《小型微型计算机系统》
EI
CSCD
北大核心
1997年第1期37-41,共5页
文摘
本文详细地阐述了英文辅助阅读系统在设计当中遇到的问题,重点是对动词的远程搭配问题进行了深入的剖析。
关键词
英文文献
辅助阅读
远程搭配
计算机应用
Keywords
English literature, Auxiliary reading, Remote matching, Rule, Noun phrase
分类号
TP399
[自动化与计算机技术—计算机应用技术]