-
题名基于递归神经网络的语音识别快速解码算法
被引量:17
- 1
-
-
作者
张舸
张鹏远
潘接林
颜永红
-
机构
中国科学院声学研究所语言声学与内容理解重点实验室
中国科学院大学
中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2017年第4期930-937,共8页
-
基金
国家自然科学基金(U1536117
11590770-4)
+2 种基金
国家重点研发计划重点专项(2016YFB0801200
2016YFB0801203)
新疆维吾尔自治区科技重大专项(2016A03007-1)~~
-
文摘
递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。
-
关键词
语音识别
递归神经网络
解码器
跳帧计算
-
Keywords
Speech recognition
Recurrent Neural Network (RNN)
Decoder
Frame skipping
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进主题分布特征的神经网络语言模型
被引量:10
- 2
-
-
作者
刘畅
张一珂
张鹏远
颜永红
-
机构
中国科学院声学研究所语言声学与内容理解重点实验室
中国科学院大学
中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2018年第1期219-225,共7页
-
基金
国家自然科学基金(11590770-4
U1536117
+4 种基金
11504406
11461141004)
国家重点研发计划重点专项(2016YFB0801203
2016YFB0801200)
新疆维吾尔自治区科技重大专项(2016A03007-1)~~
-
文摘
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后的特征应用于基于长短时记忆(LSTM)单元的递归神经网络语言模型中。实验表明,在PTB数据集上该文提出的方法使语言模型的困惑度相对于基线系统下降11.8%。在SWBD数据集多候选重估实验中,该文提出的特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.0%;在WSJ数据集上的实验中,该特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.8%,并且在eval92测试集上,改进隐含狄利克雷分布(LDA)特征使RNN效果与LSTM相当。
-
关键词
语音识别
语言模型
隐含狄利克雷分布
长短时记忆
-
Keywords
Speech recognition
Language model
Latent Dirichlet Allocation (LDA)
Long Short-Term Memory (LSTM)
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于图数据库的文献检索方法优化与实现
被引量:9
- 3
-
-
作者
林启胜
王磊
周喜
赵凡
马博
-
机构
中国科学院新疆理化技术研究所
新疆民族语音语言信息处理实验室
中国科学院大学计算机与控制学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2017年第10期63-67,共5页
-
基金
中科院西部之光--西部博士项目(XBBS201315)
-
文摘
针对目前文献检索系统对于查询结果仅以文本形式呈现的问题,提出了一个基于图数据库的文献信息检索系统.该采用图数据库Neo4j进行存储,用户通过关键词查询,系统以图节点的可视化形式将信息呈现给用户,可以直观地了解文献的相关信息.实验结果表明,该系统比关系基于数据库的系统更快,执行的时间减少了71%(对于3-节点查询),88%(对于4节点的查询),以及99%的(5-节点查询).
-
关键词
Neo4j
数据库
数据存储
信息检索
CYPHER
-
Keywords
Neo4j
graph database
data store
information retrival
cypher
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名双向长短时记忆模型训练中的空间平滑正则化方法研究
被引量:3
- 4
-
-
作者
李文洁
葛凤培
张鹏远
颜永红
-
机构
中国科学院声学研究所语言声学与内容理解重点实验室
中国科学院大学
中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2019年第3期544-550,共7页
-
基金
国家重点研发计划重点专项(2016YFB0801203
2016YFB0801200)
+4 种基金
国家自然科学基金(11590770-4
U1536117
11504406
11461141004)
新疆维吾尔自治区科技重大专项(2016A03007-1)~~
-
文摘
双向长短时记忆模型(BLSTM)由于其强大的时间序列建模能力,以及良好的训练稳定性,已经成为语音识别领域主流的声学模型结构。但是该模型结构拥有更大计算量以及参数数量,因此在神经网络训练的过程当中很容易过拟合,进而无法获得理想的识别效果。在实际应用中,通常会使用一些技巧来缓解过拟合问题,例如在待优化的目标函数中加入L2正则项就是常用的方法之一。该文提出一种空间平滑的方法,把BLSTM模型激活值的向量重组成一个2维图,通过滤波变换得到它的空间信息,并将平滑该空间信息作为辅助优化目标,与传统的损失函数一起,作为优化神经网络参数的学习准则。实验表明,在电话交谈语音识别任务上,这种方法相比于基线模型取得了相对4%的词错误率(WER)下降。进一步探索了L2范数正则技术和空间平滑方法的互补性,实验结果表明,同时应用这2种算法,能够取得相对8.6%的WER下降。
-
关键词
语音信号处理
空间平滑
双向长短时记忆模型(LSTM)
正则化
过拟合
-
Keywords
Speech signal processing
Spatial smoothing
Long Short-Term Memory (LSTM)
Regularization
Overfitting
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于R-树索引的高维相似重复记录检测改进算法
被引量:3
- 5
-
-
作者
宋国兴
周喜
马博
赵凡
-
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆民族语音语言信息处理实验室
-
出处
《微电子学与计算机》
CSCD
北大核心
2017年第9期97-102,共6页
-
基金
新疆维吾尔自治区重点实验室项目(2016D03019)
新疆维吾尔自治区高技术计划项目(201512103)
中国科学院科技服务网络计划(STS计划)项目(KFJ-EW-STS-129)
-
文摘
经典的相似重复记录检测算法SNM算法随着记录维度的增加,投影过程不仅会导致数据丢失,算法的误差率也会明显增大.针对SNM算法的不足,提出DRR算法,利用R-树构建索引保留记录的高维空间特性,通过聚类减少记录在叶子节点中的比较次数提高效率,同时改进度量记录相似性的距离算法,避免高维数据稀疏性的影响.最后,通过真实数据在不同维度上分别与SNM算法进行对比,验证了算法的有效性.
-
关键词
SNM算法
R-树索引
高维空间特性
改进距离算法
数据稀疏性
-
Keywords
Key words: SNM algorithm
R- tree index
high dimensional space characteristics
improved distance algorithm
data scarcity
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于REST架构的小额支付平台研究
- 6
-
-
作者
邓玉龙
张岩
马玉鹏
-
机构
中国科学院新疆理化技术研究所
新疆民族语音语言信息处理实验室
中国科学院大学
-
出处
《微电子学与计算机》
CSCD
北大核心
2017年第10期86-90,96,共6页
-
基金
中国科学院西部之光人才培养计划项目(XBBS201319)
中国科学院青年创新促进会资助项目
新疆维吾尔自治区引进高层次人才计划资助项目
-
文摘
针对现阶段小额支付平台终端繁杂异构的问题,提出了一种基于REST架构风格的小额支付系统平台,其将小额支付过程以及相关数据抽象为资源,以HTTP作为通信协议,通过RESTful Web服务方式连接移动客户端与Web服务端.设计了小额支付平台的架构,定义了小额支付平台RESTful Web服务的具体方法和规则,并且实现了小额支付原型系统.实验结果表明,相较于传统的基于SOAP协议的大Web服务方式,基于REST架构风格的小额支付平台具有明显的优势.
-
关键词
小额支付
REST架构
WEB服务
SOAP
-
Keywords
micro payment
REST architecture
Web Service
SOAP
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名基于中国剩余定理的区块链用户私钥托管方法研究
- 7
-
-
作者
汪洋
孟小艳
王轶
葛翔
张容祯
-
机构
新疆农业大学计算机与信息工程学院
中国科学院新疆理化技术研究所
新疆民族语音语言信息处理实验室
国网新疆电力公司营销服务中心(资金集约中心、计量中心)
-
出处
《信息技术与信息化》
2023年第10期19-23,共5页
-
基金
新疆网信科创课题“区块链技术促进政务数据共享的应用研究”(12221604)
新疆维吾尔自治区重点研发计划"基于社会公共服务的数据资源开发利用及安全保障关键技术研发"(2022B01005)
+1 种基金
新疆维吾尔自治区“两区”科技发展项目“文旅兴疆数智平台关键技术研究与应用”(2022LQ03003)
新疆维吾尔自治区天山创新团队“可信数据智能分析处理创新团队”(2022D14019)。
-
文摘
针对区块链用户私钥丢失恢复的安全问题,提出一种基于中国剩余定理的门限秘密共享的区块链私钥托管、挂失及恢复的方案。私钥托管阶段,使用门限密码学共享技术将处理后的私钥进行秘密分割得到秘密碎片,再将秘密碎片使用参与托管组成员的公钥非对称加密,调用智能合约写入区块链分布式账本中;挂失阶段,创建临时用户向区块链平台发起私钥挂失请求;恢复阶段,临时用户与托管组成员协作恢复出用户私钥;更新阶段,根据用户活跃度进行托管更新操作。通过安全性和效率方面进行分析,所提出的方案相较于传统方案具有可恢复性、匿名性、无需额外管理秘密碎片等优势,且方案的计算效率较高,可以实现区块链用户私钥的安全托管,解决区块链用户私钥丢失后恢复的难题。
-
关键词
区块链
私钥管理
门限密码学
智能合约
-
分类号
TN918.4
[电子电信—通信与信息系统]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-