期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
汉语语音文档检索中后验概率的索引方法
1
作者
郑铁然
韩纪庆
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2009年第8期97-102,共6页
基于音节Lattice形式的语音识别结果来实现汉语语音文档检索,不但可以成功规避词表外词问题,而且Lattice这种多候选形式也能有效补偿识别错误对检索性能的影响.在基于音节Lattice的汉语语音文档检索研究中,针对已有索引方法的不足,提出...
基于音节Lattice形式的语音识别结果来实现汉语语音文档检索,不但可以成功规避词表外词问题,而且Lattice这种多候选形式也能有效补偿识别错误对检索性能的影响.在基于音节Lattice的汉语语音文档检索研究中,针对已有索引方法的不足,提出了一种基于后验概率的索引方法,对向量空间模型进行改进,以音节和K步邻接音节对作为索引项,以它们在语音文档中的后验概率值作为索引项权重.检索实验表明,文中的方法更适用于基于音节Lattice的语音文档检索任务,各项改进都达到了预期效果.
展开更多
关键词
汉语语音文档检索
音节Lattice
K步邻接音节对
后验概率
改进的向量空间模型
在线阅读
下载PDF
职称材料
基于子词链的中文新闻广播故事自动分割
被引量:
2
2
作者
杨玉莲
谢磊
《计算机应用研究》
CSCD
北大核心
2009年第2期583-586,594,共5页
提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广播的语音识别抄本上采用中文子词单元(汉字和音节)创建子词链,进行中文新闻广播故事的自动分割,有效地解...
提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广播的语音识别抄本上采用中文子词单元(汉字和音节)创建子词链,进行中文新闻广播故事的自动分割,有效地解决了在传统词链方法中由于语音识别错误(特别是词典未收录词汇)导致的相关联词之间无法匹配的问题。同时,利用各级词汇表示单元之间的互补性,如词的表义确定性和子词对语音识别错误的鲁棒性,对各级词汇进行融合,利用不同级别词汇表示单元的优势进一步提高中文新闻广播故事分割的性能。在TDT2中文标准新闻广播语料库上进行的实验表明,基于一元汉字子词链分割方法的F-mea-sure比传统词链方法提高了6.06%。基于一元和二元汉字子词链边界强度的融合可以使F-mea-sure进一步提高2.55%。基于投票法的融合可以使F-measure比传统词链方法提高9.04%。
展开更多
关键词
子词
词链
主题分割
故事分割
信息检索
语音文件检索
在线阅读
下载PDF
职称材料
一种融合音位属性的语音文档索引方法
3
作者
陆明明
张连海
+1 位作者
屈丹
牛铜
《计算机工程》
CAS
CSCD
2012年第19期159-162,共4页
为提高索引覆盖率并获得更多的候选路径,提出一种在词格上融合音位属性的语音文档索引方法。通过基于音位属性检测的语音识别系统建立词格,利用其信息互补性,与传统的词格进行起止节点合并。针对合并后Lattice规模增大的问题,采用基于...
为提高索引覆盖率并获得更多的候选路径,提出一种在词格上融合音位属性的语音文档索引方法。通过基于音位属性检测的语音识别系统建立词格,利用其信息互补性,与传统的词格进行起止节点合并。针对合并后Lattice规模增大的问题,采用基于位置的分段对齐方法对其结构进行压缩。实验结果表明,该方法在提高索引覆盖率和降低最小错误率方面均优于传统的语音文档索引方法,能够有效提高语音检索性能。
展开更多
关键词
语音文档检索
语音文档索引
自动语音识别
音位属性检测
词格
信息融合
在线阅读
下载PDF
职称材料
基于子词PSPL的汉语语音文档索引
4
作者
陆明明
张连海
屈丹
《应用科学学报》
CAS
CSCD
北大核心
2013年第3期259-265,共7页
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词...
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.
展开更多
关键词
语音文档检索
语音文档索引
子词PSPL
词格
子词后验概率
在线阅读
下载PDF
职称材料
题名
汉语语音文档检索中后验概率的索引方法
1
作者
郑铁然
韩纪庆
机构
哈尔滨工业大学计算机科学与技术学院
出处
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2009年第8期97-102,共6页
基金
国家重点基础研究发展计划资助项目(2007CB311100)
国家高技术研究发展计划资助项目(2006AA01Z197)
文摘
基于音节Lattice形式的语音识别结果来实现汉语语音文档检索,不但可以成功规避词表外词问题,而且Lattice这种多候选形式也能有效补偿识别错误对检索性能的影响.在基于音节Lattice的汉语语音文档检索研究中,针对已有索引方法的不足,提出了一种基于后验概率的索引方法,对向量空间模型进行改进,以音节和K步邻接音节对作为索引项,以它们在语音文档中的后验概率值作为索引项权重.检索实验表明,文中的方法更适用于基于音节Lattice的语音文档检索任务,各项改进都达到了预期效果.
关键词
汉语语音文档检索
音节Lattice
K步邻接音节对
后验概率
改进的向量空间模型
Keywords
Chinese
spoken
document
retrieval
syllable lattice
K step neighbor syllable pairs posterior probability
improved vector space model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于子词链的中文新闻广播故事自动分割
被引量:
2
2
作者
杨玉莲
谢磊
机构
西北工业大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2009年第2期583-586,594,共5页
基金
国家教育部高等学校博士点学科专项基金资助项目(20070699015)
陕西省自然科学基础研究计划资助项目(2007F15)
+1 种基金
西北工业大学基础研究基金资助项目
西北工业大学"翱翔之星"计划资助项目(07XE0150)
文摘
提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广播的语音识别抄本上采用中文子词单元(汉字和音节)创建子词链,进行中文新闻广播故事的自动分割,有效地解决了在传统词链方法中由于语音识别错误(特别是词典未收录词汇)导致的相关联词之间无法匹配的问题。同时,利用各级词汇表示单元之间的互补性,如词的表义确定性和子词对语音识别错误的鲁棒性,对各级词汇进行融合,利用不同级别词汇表示单元的优势进一步提高中文新闻广播故事分割的性能。在TDT2中文标准新闻广播语料库上进行的实验表明,基于一元汉字子词链分割方法的F-mea-sure比传统词链方法提高了6.06%。基于一元和二元汉字子词链边界强度的融合可以使F-mea-sure进一步提高2.55%。基于投票法的融合可以使F-measure比传统词链方法提高9.04%。
关键词
子词
词链
主题分割
故事分割
信息检索
语音文件检索
Keywords
subword
lexical chaining
topic segmentation
story segmentation
information
retrieval
spoken document retrieval(sdr)
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
一种融合音位属性的语音文档索引方法
3
作者
陆明明
张连海
屈丹
牛铜
机构
解放军信息工程大学信息工程学院
出处
《计算机工程》
CAS
CSCD
2012年第19期159-162,共4页
基金
国家自然科学基金资助项目(61175017)
文摘
为提高索引覆盖率并获得更多的候选路径,提出一种在词格上融合音位属性的语音文档索引方法。通过基于音位属性检测的语音识别系统建立词格,利用其信息互补性,与传统的词格进行起止节点合并。针对合并后Lattice规模增大的问题,采用基于位置的分段对齐方法对其结构进行压缩。实验结果表明,该方法在提高索引覆盖率和降低最小错误率方面均优于传统的语音文档索引方法,能够有效提高语音检索性能。
关键词
语音文档检索
语音文档索引
自动语音识别
音位属性检测
词格
信息融合
Keywords
spoken document retrieval(sdr)
spoken
document
indexing
Automatic Speech Recognition(ASR)
phonological feature detection
lattice
information integration
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于子词PSPL的汉语语音文档索引
4
作者
陆明明
张连海
屈丹
机构
解放军信息工程大学信息工程学院
出处
《应用科学学报》
CAS
CSCD
北大核心
2013年第3期259-265,共7页
基金
国家自然科学基金(No.61175017)资助
文摘
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.
关键词
语音文档检索
语音文档索引
子词PSPL
词格
子词后验概率
Keywords
spoken
document
retrieval
,
spoken
document
indexing, subword-based position specific posterior lattices, lattice, subword posterior probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
汉语语音文档检索中后验概率的索引方法
郑铁然
韩纪庆
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2009
0
在线阅读
下载PDF
职称材料
2
基于子词链的中文新闻广播故事自动分割
杨玉莲
谢磊
《计算机应用研究》
CSCD
北大核心
2009
2
在线阅读
下载PDF
职称材料
3
一种融合音位属性的语音文档索引方法
陆明明
张连海
屈丹
牛铜
《计算机工程》
CAS
CSCD
2012
0
在线阅读
下载PDF
职称材料
4
基于子词PSPL的汉语语音文档索引
陆明明
张连海
屈丹
《应用科学学报》
CAS
CSCD
北大核心
2013
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部