检索结果-维普期刊中文期刊服务平台

基于“相同与差异”的机译单元的自动提取研究: 1; 作者陈博兴杜利民《中文信息学报》 CSCD 北大核心 2003年第3期34-40,共7页; 从双语语料库中提取的机译单元能更好地覆盖真实语言文本 ,本文提供了一个通过找出两个双语句对之间非全部为高频功能词的“相同和差异”部分 ,并且利用翻译词典和动态规划算法对齐“相同和差异”部分来获取机译单元的算法。对于获取的... 展开更多; 关键词人工智能机器翻译双语语料库机译单元相同和差异; 在线阅读下载PDF 职称材料

EBMT系统中的多词单元翻译词典获取研究被引量：5: 2; 作者程洁杜利民《中文信息学报》 CSCD 北大核心 2004年第1期55-61,共7页; EBMT系统是一种基于语料库的机器翻译方法 ,其主要思想是通过类比原理进行翻译。如何从语料库中提取出一个实用的翻译词典进行系统的辅助翻译已经越来越多的引起关注。本文探讨了如何结合阈值和关联度提取的方法获取多词单元翻译词典 ,... 展开更多; 关键词人工智能机器翻译 EBMT 翻译词典多词单元; 在线阅读下载PDF 职称材料

基于USB2.0的麦克风阵列语音数据采集系统设计被引量：3: 3; 作者施剑何成林杜利民《计算机工程》 CAS CSCD 北大核心 2006年第24期216-218,共3页; 介绍了一种基于USB2.0接口芯片ISP1581,并采用FPGA芯片EP1C3T144实现麦克风阵列语音数据采集的方法,讨论了如何获得同步、实时、信噪比高的语音数据以及USB2.0传输控制方面的问题。该方法具有接口简单、使用方便、扩展性好等特点。; 关键词麦克风阵列 USB2.0 等时传输模式; 在线阅读下载PDF 职称材料

基于双语语料的单个源语词汇和目标语多词单元的对齐被引量：6: 4; 作者陈博兴杜利民《中文信息学报》 CSCD 北大核心 2003年第1期13-19,共7页; 多词单元包括固定搭配、多词习语和多词术语等。本文提供了一个基于双语口语语料库的自动对齐单个源语词汇和目标语多词单元的算法 ,算法一方面通过计算对应于同一个源语词汇 ,多个目标语词汇之间的互信息和t值的归一化差值的大小来衡... 展开更多; 关键词双语语料源语词汇目标语人工智能机器翻译双语对齐多词单元翻译词典; 在线阅读下载PDF 职称材料

基于双语对齐口语语料的翻译词典的自动生成被引量：2: 5; 作者陈博兴杜利民《计算机学报》 EI CSCD 北大核心 2003年第3期275-280,共6页; 提出了一个基于英汉双语口语对齐语料库的翻译词典的自动生成算法 .首先利用释义词典过滤双语文本 ,得到“过滤词典” ,继而通过统计共现概率 ,计算出所有词对的相互关联值 ,并且生成“汉英 (英汉 )相互关联值表” ,对于每个源语词汇选... 展开更多; 关键词双语对齐口语语料翻译词典自动生成关联值机器翻译英汉翻译语料库; 在线阅读下载PDF 职称材料

优先度排序RBF神经网络在与文本无关说话人确认中的应用: 6; 作者邓浩江王守觉杜利民《电子与信息学报》 EI CSCD 北大核心 2003年第9期1153-1159,共7页; 该文介绍了优先度排序径向基函数(PORBF)神经网络的结构与算法,并提出了将其应用于与文本无关说话人确认时的训练算法、似然度的计算方法以及识别规则。为了增强PORBF网络的泛化能力,该文用压缩矢量构造抑制样本集,提出了顺序选取、最... 展开更多; 关键词优先度排序径向基函数神经网络说话人确认与文本无关训练算法语音处理; 在线阅读下载PDF 职称材料

似然得分归一化及其在与文本无关说话人确认中的应用: 7; 作者邓浩江杜利民万洪杰《电子与信息学报》 EI CSCD 北大核心 2005年第7期1025-1029,共5页; 该文研究了似然得分归一化方法的原理,建立了基于自适应GMM模型的说话人确认系统,并将非特定人的背景模型与特定人的cohort模型相结合,提出了混合归一化的方法。在电话语音条件下,该文比较了不同得分归一化方法对确认系统性能的影响。... 展开更多; 关键词说话人确认高斯混合模型得分归一化与文本无关; 在线阅读下载PDF 职称材料

基于MMSE准则的基频模型: 8; 作者刘浩杰杜利民《电子与信息学报》 EI CSCD 北大核心 2005年第12期1932-1936,共5页; 在声调与语调相互作用理论的基础上，该文利用最小均方误差准则有效地提取了连续语流基频曲线的高音线及低音线，从量化的角度证实了高音线及低音线对连续语流基频曲线的作用及其区别。该文还对声调与语调相互作用的数学模型做了初步探... 展开更多; 关键词语音信号处理基频模型高音线低音线最小均方误差准则; 在线阅读下载PDF 职称材料

题名基于“相同与差异”的机译单元的自动提取研究: 1; 作者陈博兴杜利民; 机构中国科学院声学研究所语音交互技术研究中心; 出处《中文信息学报》 CSCD 北大核心 2003年第3期34-40,共7页; 文摘从双语语料库中提取的机译单元能更好地覆盖真实语言文本 ,本文提供了一个通过找出两个双语句对之间非全部为高频功能词的“相同和差异”部分 ,并且利用翻译词典和动态规划算法对齐“相同和差异”部分来获取机译单元的算法。对于获取的候选机译单元 ,本算法设计了三个过滤器来考察其正确性 :双语词串相似度过滤考察其语义对应性 ,词性相似度过滤考察其语法对应性 ,首尾禁用词过滤考察其搭配正确性。通过抽样检验 ,最后提取的机译单元的正确率为 86% ,召回率约为 61 34 % ,该算法对于获取机译单元提供了一种新的实用的方法。; 关键词人工智能机器翻译双语语料库机译单元相同和差异; Keywords artificial intelligence machine translation bilingual corpora machine translation unit similarity and difference; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名EBMT系统中的多词单元翻译词典获取研究被引量：5: 2; 作者程洁杜利民; 机构中国科学院声学研究所语音交互技术研究中心; 出处《中文信息学报》 CSCD 北大核心 2004年第1期55-61,共7页; 文摘 EBMT系统是一种基于语料库的机器翻译方法 ,其主要思想是通过类比原理进行翻译。如何从语料库中提取出一个实用的翻译词典进行系统的辅助翻译已经越来越多的引起关注。本文探讨了如何结合阈值和关联度提取的方法获取多词单元翻译词典 ,在这两种方法中 ,阈值提取受主观影响太大 ,关联值提取效率太低 ,都不能很好的满足翻译词典提取的要求。本文提出的算法利用阈值提取出备选多词单元 ,其中提出了四点规则弱化主观影响且保证全面覆盖所有多词单元 ,降低了阈值本身所带来的不精确度的影响 ,然后对计算结果进行三层过滤 ,进一步提高了准确率 ;该算法还合并了单词译成多词单元和多词单元互译两部分词典的提取。; 关键词人工智能机器翻译 EBMT 翻译词典多词单元; Keywords artificial intelligence machine translation EBMT translation lexicon multi word unit; 分类号 TP391.2 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于USB2.0的麦克风阵列语音数据采集系统设计被引量：3: 3; 作者施剑何成林杜利民; 机构中国科学院声学研究所DSP中心中国科学院声学研究所语音交互技术研究中心; 出处《计算机工程》 CAS CSCD 北大核心 2006年第24期216-218,共3页; 基金国家"973"计划基金资助重点项目"图像语音自然语言理解和知识挖掘--汉语自然口语对话的理论和实验平台"(G1998030505); 文摘介绍了一种基于USB2.0接口芯片ISP1581,并采用FPGA芯片EP1C3T144实现麦克风阵列语音数据采集的方法,讨论了如何获得同步、实时、信噪比高的语音数据以及USB2.0传输控制方面的问题。该方法具有接口简单、使用方便、扩展性好等特点。; 关键词麦克风阵列 USB2.0 等时传输模式; Keywords Microphone array USB2.0 Isochronous mode; 分类号 TP393.02 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于双语语料的单个源语词汇和目标语多词单元的对齐被引量：6: 4; 作者陈博兴杜利民; 机构中国科学院声学研究所语音交互技术研究中心; 出处《中文信息学报》 CSCD 北大核心 2003年第1期13-19,共7页; 基金国家 973重点基础研究发展资助项目 (G19980 30 5 0 5 ); 文摘多词单元包括固定搭配、多词习语和多词术语等。本文提供了一个基于双语口语语料库的自动对齐单个源语词汇和目标语多词单元的算法 ,算法一方面通过计算对应于同一个源语词汇 ,多个目标语词汇之间的互信息和t值的归一化差值的大小来衡量目标语多个词语之间的关联程度以提取多词单元 ,另一方面通过计算互信息和t值的平均值作为多词单元和单个源语词汇之间互为相互翻译的衡量程度 ,用局部最优、首尾禁用词过滤以及长词优先等策略很好地解决了这个问题。另外 ,对短语翻译词典的分级 ,有效地减少了高级别词典中非正确翻译项的数目 ,使得翻译词典具有更好的实用性。; 关键词双语语料源语词汇目标语人工智能机器翻译双语对齐多词单元翻译词典; Keywords artificial intelligence machine translation bilingual alignment multiword unit translation dictionary even association score normalize association score difference; 分类号 H08 [语言文字—语言学]; 在线阅读下载PDF 职称材料

题名基于双语对齐口语语料的翻译词典的自动生成被引量：2: 5; 作者陈博兴杜利民; 机构中国科学院声学研究所语音交互技术研究中心; 出处《计算机学报》 EI CSCD 北大核心 2003年第3期275-280,共6页; 文摘提出了一个基于英汉双语口语对齐语料库的翻译词典的自动生成算法 .首先利用释义词典过滤双语文本 ,得到“过滤词典” ,继而通过统计共现概率 ,计算出所有词对的相互关联值 ,并且生成“汉英 (英汉 )相互关联值表” ,对于每个源语词汇选取相互关联值最大的若干项目标语作为候选词对 ,分别赋予信任值 1,然后统计每个候选词对的信任值作为翻译词典的分级标准 ,得到 4个不同级别的词典 ,其中“过滤词典 +4级词典”在召回率为 93 5 %的情况下 ,正确率达到 93 389% .; 关键词双语对齐口语语料翻译词典自动生成关联值机器翻译英汉翻译语料库; Keywords Database systems; 分类号 TP391.2 [自动化与计算机技术—计算机应用技术] H315.9 [语言文字—英语]; 在线阅读下载PDF 职称材料

题名优先度排序RBF神经网络在与文本无关说话人确认中的应用: 6; 作者邓浩江王守觉杜利民; 机构中国科学院声学研究所语音交互技术研究中心中国科学院半导体研究所人工神经网络实验室; 出处《电子与信息学报》 EI CSCD 北大核心 2003年第9期1153-1159,共7页; 文摘该文介绍了优先度排序径向基函数(PORBF)神经网络的结构与算法,并提出了将其应用于与文本无关说话人确认时的训练算法、似然度的计算方法以及识别规则。为了增强PORBF网络的泛化能力,该文用压缩矢量构造抑制样本集,提出了顺序选取、最近邻选取和最远距离选取等3种选择抑制样本集中说话人的方法,并对PORBF神经元的输出进行了等比递减加权.在相同条件下的与文本无关说话人确认实验中,传统的矢量量化方法的等差错率可达10.56％,而基于PORBF网络的确认系统使用最近邻选择方法构造抑制样本集,其等差错率可达6.83％;性能提高很多。; 关键词优先度排序径向基函数神经网络说话人确认与文本无关训练算法语音处理; Keywords Priority ordered, Speaker verification, Text-independent, Radial Basis Function networks; 分类号 TN912.3 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名似然得分归一化及其在与文本无关说话人确认中的应用: 7; 作者邓浩江杜利民万洪杰; 机构中国科学院声学研究所语音交互技术研究中心; 出处《电子与信息学报》 EI CSCD 北大核心 2005年第7期1025-1029,共5页; 文摘该文研究了似然得分归一化方法的原理,建立了基于自适应GMM模型的说话人确认系统,并将非特定人的背景模型与特定人的cohort模型相结合,提出了混合归一化的方法。在电话语音条件下,该文比较了不同得分归一化方法对确认系统性能的影响。实验表明,在自适应GMM模型似然比得分的基础上,T-cohort与通用背景模型混合归一化能获得最佳识别效果。当错误拒绝率为5%时,该方法可以获得0.5%的错误接受率,远远低于采用通用背景模型归一化方法的2%。; 关键词说话人确认高斯混合模型得分归一化与文本无关; Keywords Speaker verification, Gaussian mixture model, Score normalization, Text-independent; 分类号 TP391.42 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于MMSE准则的基频模型: 8; 作者刘浩杰杜利民; 机构中国科学院声学研究所语音交互技术研究中心; 出处《电子与信息学报》 EI CSCD 北大核心 2005年第12期1932-1936,共5页; 文摘在声调与语调相互作用理论的基础上，该文利用最小均方误差准则有效地提取了连续语流基频曲线的高音线及低音线，从量化的角度证实了高音线及低音线对连续语流基频曲线的作用及其区别。该文还对声调与语调相互作用的数学模型做了初步探讨，建立了基频曲线的双线调节及调中值模型，为合成系统基频灵活有效地调整提供了新的手段，提高了语音合成系统的自然度。; 关键词语音信号处理基频模型高音线低音线最小均方误差准则; Keywords Speech signal processing, Fundamental frequency model, Top line, Bottom line, MMSE principle; 分类号 TN912.3 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于“相同与差异”的机译单元的自动提取研究	陈博兴杜利民	《中文信息学报》 CSCD 北大核心	2003	0	在线阅读下载PDF 职称材料
2	EBMT系统中的多词单元翻译词典获取研究	程洁杜利民	《中文信息学报》 CSCD 北大核心	2004	5	在线阅读下载PDF 职称材料
3	基于USB2.0的麦克风阵列语音数据采集系统设计	施剑何成林杜利民	《计算机工程》 CAS CSCD 北大核心	2006	3	在线阅读下载PDF 职称材料
4	基于双语语料的单个源语词汇和目标语多词单元的对齐	陈博兴杜利民	《中文信息学报》 CSCD 北大核心	2003	6	在线阅读下载PDF 职称材料
5	基于双语对齐口语语料的翻译词典的自动生成	陈博兴杜利民	《计算机学报》 EI CSCD 北大核心	2003	2	在线阅读下载PDF 职称材料
6	优先度排序RBF神经网络在与文本无关说话人确认中的应用	邓浩江王守觉杜利民	《电子与信息学报》 EI CSCD 北大核心	2003	0	在线阅读下载PDF 职称材料
7	似然得分归一化及其在与文本无关说话人确认中的应用	邓浩江杜利民万洪杰	《电子与信息学报》 EI CSCD 北大核心	2005	0	在线阅读下载PDF 职称材料
8	基于MMSE准则的基频模型	刘浩杰杜利民	《电子与信息学报》 EI CSCD 北大核心	2005	0	在线阅读下载PDF 职称材料