期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
古汉语与现代汉语句子对齐研究 被引量:6
1
作者 刘颖 王楠 《计算机应用与软件》 CSCD 北大核心 2013年第11期127-130,共4页
对西汉时期司马迁所著《史记》原文(古文)与现代文译文(现代文)的平行语料进行句子对齐研究。对数线性模型将句子的长度特征、句子对齐模式特征和共现汉字特征相结合来对《史记》古文和现代文进行句子对齐。通过实验可以看出,同时考虑... 对西汉时期司马迁所著《史记》原文(古文)与现代文译文(现代文)的平行语料进行句子对齐研究。对数线性模型将句子的长度特征、句子对齐模式特征和共现汉字特征相结合来对《史记》古文和现代文进行句子对齐。通过实验可以看出,同时考虑句子长度、句子对齐模式和共现汉字三个特征,句子对齐的准确率和召回率是最高的,准确率为94.4%,召回率为94.3%。 展开更多
关键词 句子对齐 对数线性模型 对齐模式
在线阅读 下载PDF
利用平行网页建立中英文统计翻译模型 被引量:9
2
作者 聂建云 陈江 《中文信息学报》 CSCD 北大核心 2001年第1期1-12,共12页
建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构... 建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构信息。实验表明 ,所训练的翻译模型能达到 80 %的准确率。对于象跨语言信息检索这样的应用 ,这样的准确率已经能大致满足需要。这一工作表明 。 展开更多
关键词 中英问句翻译 句对齐 统计翻译模型 跨语言信息检索 平行文本 HTML结构 准确率
在线阅读 下载PDF
机器译文自动评价中基于IHMM的近义词匹配方法研究 被引量:2
3
作者 李茂西 徐凡 王明文 《中文信息学报》 CSCD 北大核心 2016年第4期117-123,共7页
机器译文的自动评价推动着机器翻译技术的快速发展与应用,在其研究中的一个关键问题是如何自动的识别并匹配机器译文与人工参考译文之间的近义词。该文探索以源语言句子作为桥梁,利用间接隐马尔可夫模型(IHMM)来对齐机器译文与人工参考... 机器译文的自动评价推动着机器翻译技术的快速发展与应用,在其研究中的一个关键问题是如何自动的识别并匹配机器译文与人工参考译文之间的近义词。该文探索以源语言句子作为桥梁,利用间接隐马尔可夫模型(IHMM)来对齐机器译文与人工参考译文,匹配两者之间的近义词,提高自动评价方法与人工评价方法的相关性。在LDC2006T04语料和WMT数据集上的实验结果表明,该方法与人工评价的系统级别相关性和句子级别相关性不仅一致的优于在机器翻译中广泛使用的BLEU、NIST和TER方法,而且优于使用词根信息和同义词典进行近义词匹配的METEOR方法。 展开更多
关键词 机器译文自动评价 近义词匹配 间接隐马尔可夫模型 单语句子词对齐 相关性
在线阅读 下载PDF
面向对象类谓词逻辑知识表达模式及其在选线系统中的应用 被引量:5
4
作者 易思蓉 《中国铁道科学》 EI CAS CSCD 北大核心 2003年第6期31-35,共5页
将谓词逻辑知识表达法与面向对象技术相结合,提出面向对象的类谓词逻辑知识表达模型。该模型用对象和信息表现问题中的事物及其关系;用类和继承来模拟人们的思维方式。模型中通过采用"测验分数"语义,有效地解决了不确定性知... 将谓词逻辑知识表达法与面向对象技术相结合,提出面向对象的类谓词逻辑知识表达模型。该模型用对象和信息表现问题中的事物及其关系;用类和继承来模拟人们的思维方式。模型中通过采用"测验分数"语义,有效地解决了不确定性知识的表达问题;用类代替关系定义域中的实体,可通过缩小搜索空间而提高推理效率。以选线系统中的设计状态知识,说明类谓词逻辑知识表达模式在选线领域知识表达中的应用。 展开更多
关键词 选线 知识表达模式 面向对象建模 智能化设计设计
在线阅读 下载PDF
基于高斯混合模型的生物医学领域双语句子对齐 被引量:4
5
作者 陈相 林鸿飞 杨志豪 《中文信息学报》 CSCD 北大核心 2010年第4期68-73,共6页
双语术语词典在生物医学跨语言检索系统中有着非常重要的地位,而双语句子对齐是构建双语词典的第一步工作。为了构想面向生物医学领域的双语词典,该文将分类思想和迁移学习方法引入汉英句子对齐任务中,将句子对齐任务看成一个多类分类任... 双语术语词典在生物医学跨语言检索系统中有着非常重要的地位,而双语句子对齐是构建双语词典的第一步工作。为了构想面向生物医学领域的双语词典,该文将分类思想和迁移学习方法引入汉英句子对齐任务中,将句子对齐任务看成一个多类分类任务,考虑生物医学领域双语摘要的锚信息,利用高斯混合模型完成分类目标。同时,在模型训练过程中,该文引入了迁移学习的思想,结合无噪音的《新概念英语》双语语料对模型的句子长度特征进行训练,使得模型在测试语料上句子对齐的正确率得到较大提高。 展开更多
关键词 计算机应用 中文信息处理 句子对齐 高斯混合模型 迁移学习 锚信息
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部