-
题名中文语音合成中的文本正则化研究
被引量:13
- 1
-
-
作者
贾玉祥
黄德智
刘武
俞士汶
-
机构
北京大学计算语言学研究所
法国电信北京研发中心
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期45-50,55,共7页
-
基金
国家973课题资助项目(2004CB318102)
-
文摘
中文文本正则化是把非汉字字符串转化为汉字串以确定其读音的过程。该工作的难点:一是正则化对象——非汉字串形式复杂多样,难于归纳;二是非汉字串有歧义,需要消歧处理。文章引入非标准词的概念对非汉字串进行有效归类,提出非标准词的识别、消歧及标准词生成的三层正则化模型。在非标准词的消歧中引入机器学习的方法,避免了复杂规则的书写。实验表明,此方法取得了很好的效果,并具有良好的推广性,开放测试的正确率达到98.64%。
-
关键词
计算机应用
中文信息处理
文本正则化
语音合成
最大熵模型
-
Keywords
computer application
Chinese information processing
text normalization
text-to-speech
maximum entropy model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名WebRTC技术研究及其应用
被引量:9
- 2
-
-
作者
付斌
杨鑫
王松
林鸿
-
机构
中国电信股份有限公司北京研究院
法国电信北京研发中心
-
出处
《电信科学》
北大核心
2013年第9期108-112,共5页
-
文摘
WebRTC技术在浏览器上直接实现语音、视频和文件共享等业务,极大地提高了使用的便利性。由于其开源和开放,使得VoIP应用的开发更为简单和快速。在对WebRTC进行介绍的基础上,分析了其发展趋势以及对运营商通信业务的影响,与IMS进行了对比,然后对WebRTC与IMS结合的3种方式进行了讨论。最后,对目前WebRTC的主要研究方向进行了介绍,展望了未来的发展趋势。
-
关键词
WebRTC
RTCWeb
IMS
VOIP
-
Keywords
Web real-time communication, RTCWeb, IP multimedia subsystem, voice over IP
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名多决策树包分类算法
被引量:4
- 3
-
-
作者
李振强
张圣亮
马严
赵晓宇
-
机构
北京邮电大学计算机科学与技术学院
北京邮电大学信息网络中心
法国电信北京研发中心
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2008年第4期975-978,共4页
-
基金
法国电信北京研发中心资助课题
-
文摘
网络安全、网络测量、服务质量、流路由等都离不开多维包分类算法。设计一种在时间上和空间上都很好的包分类算法非常困难。该文在分析大规模规则集的特征的基础上,根据协议类型域只有有限的几种取值的特点,提出一种多决策树包分类算法。该算法既可用软件实现,也适宜硬件实现,并且在理论上适用于IPv6的包分类。当采用硬件实现时,多棵树可以并行查找,树内查找可以采用流水结构,算法的查找复杂度为O(1)。该算法可用于改进广泛应用的HiCuts和HyperCuts算法,与之相比,多决策树算法在预处理时间、内存占用和查找时间上都有很大提高。
-
关键词
包分类
决策树
服务质量
流路由
-
Keywords
Packet classification
Decision tree
Quality of Service (QoS)
Flow routing
-
分类号
TP393.03
[自动化与计算机技术—计算机应用技术]
-
-
题名基于WebRTC技术的应用及平台技术开发与设计
被引量:20
- 4
-
-
作者
林鸿
王松
杨鑫
付斌
-
机构
法国电信北京研发中心
中国电信股份有限公司北京研究院
-
出处
《电信科学》
北大核心
2013年第9期20-25,36,共7页
-
文摘
WebRTC具有开放标准、简单易扩展、开源免费等特点。除了通过调用WebRTC提供的标准Web API方便快速开发Web应用外,还可以利用WebRTC的核心实现库开发高质量的实时音视频通信移动客户端应用。总结了WebRTC的主要技术特点,对设计和开发基于WebRTC技术的移动客户端应用和Web应用进行技术分析,给出基于WebRTC技术的移动客户端应用、Web应用和服务平台的参考设计和实现。
-
关键词
Web实时通信
移动客户端
WEB应用
JavaScript会话建立协议
STUN
TURN
-
Keywords
WebRTC, mobile client, Web application, JavaScript session establishment protocol, STUN, TURN
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名归一化的邻接变化数方法在中文分词中的应用
被引量:5
- 5
-
-
作者
何赛克
王小捷
董远
张韬政
白雪
-
机构
北京邮电大学信息与通信工程学院
北京邮电大学计算机科学与技术学院
法国电信北京研发中心
-
出处
《中文信息学报》
CSCD
北大核心
2010年第1期15-19,共5页
-
基金
高等学校学科创新引智计划资助项目(B08004)
国家支撑计划资助项目(2007BAHo5B02-04)
-
文摘
该文提出了一种无监督和有监督相结合的中文分词方法:将邻接变化数(Accessor Variety,AV)引入基于条件随机场的中文分词系统中。针对邻接变化数在处理较少的训练数据时存在的缺陷,提出了一种归一化的改进方法,以减轻计算AV值时产生的波动。基于Bakeoff-4的中文分词实验表明,归一化的邻接变化数方法无论对于封闭测试,还是开放测试,都带来了性能的提升。
-
关键词
计算机应用
中文信息处理
无监督分词
条件随机场
归一化的邻接变化数方法
-
Keywords
computer application
Chinese information processing
unsupervised segmentation
CRFs
normalized accessor variety
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名手持移动设备中多通道交互的通用开发框架
被引量:3
- 6
-
-
作者
聂波
王绪刚
王宏安
王纲
-
机构
中国科学院 软件研究所 人机交互技术与智能信息处理实验室
法国电信北京研发中心
-
出处
《计算机应用研究》
CSCD
北大核心
2007年第9期156-158,161,共4页
-
文摘
提出的多通道交互通用开发框架可以快速地开发出支持多通道交互的应用,也可以将已经存在的应用快速更改为多通道交互应用;基于此理论,设计和实现了一种支持手写笔和语音输入的多通道家电开关控制系统。具体地阐明了实际开发中应该重点注意的环节,希望能够对当前手持移动设备的多通道交互化有所借鉴。
-
关键词
手持移动设备
人机交互
多通道交互模式
扩展多通道脚本语言
家电开关控制系统
-
Keywords
handheld mobile device
human computer interaction
multimodal interface
EMMA (extensible multimodal annotation makup language)
home appliances switch control application
-
分类号
TP311.11
[自动化与计算机技术—计算机软件与理论]
-
-
题名IMS客户端技术标准及软件特性分析
被引量:2
- 7
-
-
作者
林鸿
陈自力
王松
-
机构
法国电信北京研发中心
-
出处
《电信科学》
北大核心
2007年第1期28-33,共6页
-
文摘
当前对IMS(IP多媒体子系统)技术的探讨主要集中在网络侧上,而缺少对IMS客户端的研究。本文针对IETF、3GPP、OMA(开放移动联盟)、JCP等国际标准组织中IMS客户端的相关规范进行了研究和分析,给出IMS客户端的定义和IMS客户端软件架构设计参考,指出IMS客户端区别于传统SIP客户端的一些特点以及在IMS客户端软件开发中应当注意的一些关键问题。
-
关键词
IP多媒体子系统
IMS客户端
会话启始协议
-
Keywords
IP multimedia subsystem, IMS client, SIP
-
分类号
TN929.5
[电子电信—通信与信息系统]
-