期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
语言统计方法的实践教学
1
作者 冯敏萱 《语文建设》 北大核心 2012年第10X期17-18,共2页
针对文科生学习语言统计方法课程的特点,在实践教学模式上,主张"任务驱动式"理论教学,探索抽象知识的具象呈现;第二,"分层次模块化"实例教学,充分尊重个性,启发创新;第三,丰富的原创性实践教学资源,提高动手能力,... 针对文科生学习语言统计方法课程的特点,在实践教学模式上,主张"任务驱动式"理论教学,探索抽象知识的具象呈现;第二,"分层次模块化"实例教学,充分尊重个性,启发创新;第三,丰富的原创性实践教学资源,提高动手能力,培养自学意识;第四,引入成语、熟语、游戏等,实现文理工纵深渗透;第五,建设配套网络教学资源,促进教学互动灵活多样。经过两年教学实践验证,网络精品课程的教学形式得到充分肯定,实践教学课件也荣获了校级多媒体教学课件三等奖。 展开更多
关键词 语言统计方法 课程改革 实践教学 多媒体课件
在线阅读 下载PDF
语言统计学视野下的美国涉缅话语探究述略
2
作者 张春晖 《电影评介》 2010年第10期111-112,共2页
把语言统计学用于作为人文学科的话语分析,可以从数理逻辑的层面上验证话语理论的一些结论,增加结论的客观性和科学性。对美国涉缅话语的分析研究,不仅能对传统的话语理论作拓展和补充,而且也是我们把握美国东南亚政策的重要一环。
关键词 话语理论 语言统计 涉缅话语 相关分析
在线阅读 下载PDF
汉字层面的汉语语言统计模型
3
作者 王雪松 杜利民 《电子器件》 CAS 1997年第1期343-349,共7页
利用汉语语言的统计规律对汉语连续语音识别系统的声学到语音学的结果进行纠错及音字转换具有重要意义.本文介绍一个采用统计方法实现的字层面的三元语言模型.它较为充分地利用了前端声学匹配的结果,对于通常的汉语短语及句子的声学识... 利用汉语语言的统计规律对汉语连续语音识别系统的声学到语音学的结果进行纠错及音字转换具有重要意义.本文介绍一个采用统计方法实现的字层面的三元语言模型.它较为充分地利用了前端声学匹配的结果,对于通常的汉语短语及句子的声学识别结果,具有很高的纠错率及转换率. 展开更多
关键词 语言统计模型 语音识别
在线阅读 下载PDF
一种改进的汉语N元文法统计语言模型 被引量:3
4
作者 田斌 田红心 易克初 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2000年第1期62-64,75,共4页
提出一种利用声学匹配结果平滑语言模型的新方法.根据汉语语言的特点,利用声学识别中提供的汉语分词信息修正统计语言模型中N元文法转移概率分布,有效地提高了汉语语音识别系统统计模型的顽健性能.
关键词 语音识别 统计语言模型 汉语
在线阅读 下载PDF
利用覆盖歧义检测法和统计语言模型进行汉语自动分词 被引量:8
5
作者 王显芳 杜利民 《电子与信息学报》 EI CSCD 北大核心 2003年第9期1168-1173,共6页
该文探讨了利用覆盖歧义检测法和统计语言模型进行汉语自动分词的问题。采用了多次迭代的方法来进行汉语词层面统计语言模型的训练。该方法能够得到更优化的语言模型。该文详细介绍了统计语言模型的训练过程,给出了语言模型复杂度随迭... 该文探讨了利用覆盖歧义检测法和统计语言模型进行汉语自动分词的问题。采用了多次迭代的方法来进行汉语词层面统计语言模型的训练。该方法能够得到更优化的语言模型。该文详细介绍了统计语言模型的训练过程,给出了语言模型复杂度随迭代次数增加而减小的实验结果。还给出了在不同的统计语言模型阶数下切分正确率变化的情况,分析了切分正确率变化的原因。 展开更多
关键词 覆盖歧义检测法 统计语言模型 汉语 自动分词 切分正确率
在线阅读 下载PDF
一种基于加速度与表面肌电信息融合和统计语言模型的连续手语识别方法 被引量:6
6
作者 田建勋 陈香 +1 位作者 李云 杨基海 《中国生物医学工程学报》 CAS CSCD 北大核心 2011年第3期333-339,共7页
加速计(ACC)和表面肌电(SEMG)传感器是两种有效轻便的手势捕获设备。本研究提出一种采用多级决策树融合ACC和SEMG信息识别手语词根,并引入统计语言模型进行词根接续判断和错误纠正的中国手语连续语句识别方法。对包含有120个词根的200... 加速计(ACC)和表面肌电(SEMG)传感器是两种有效轻便的手势捕获设备。本研究提出一种采用多级决策树融合ACC和SEMG信息识别手语词根,并引入统计语言模型进行词根接续判断和错误纠正的中国手语连续语句识别方法。对包含有120个词根的200组连续中国手语句子展开的识别实验结果表明,该方法可以有效的从连续信号中识别出词根序列,120个手语词根全局平均识别率接近95%,句子识别率接近90%,采用纠错模型的方法与未采用纠错模型相比,词根的平均识别率提高了4%左右,句子识别率提高了10%。这种结合模式识别和自然语言处理的手语识别方法在连续手语识别和人机交互领域有着广阔的应用前景。 展开更多
关键词 手语识别 表面肌电 信息融合 统计语言模型
在线阅读 下载PDF
基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计
7
作者 方刚 《轻工学报》 CAS 2016年第4期88-94,共7页
针对合成生物学基因片段组装中选择最优"零件"组装功能性蛋白质表达载体费时且易出错的问题,提出一种基于引入统计语言模型(SLM)与动态规划算法的蛋白质表达载体设计方法.该方法通过统计合成生物学标准"零件"(Bio B... 针对合成生物学基因片段组装中选择最优"零件"组装功能性蛋白质表达载体费时且易出错的问题,提出一种基于引入统计语言模型(SLM)与动态规划算法的蛋白质表达载体设计方法.该方法通过统计合成生物学标准"零件"(Bio Brick)的参数,将基础"零件"组装过程转化为SLM,用动态规划算法找到最优路径,以实现蛋白质表达载体的设计.实验结果证明该方法准确率高,可以减少真实装配过程的冗余操作,节省时间和费用,可用来优化其他合成生物学软件设计结果,也可独立使用来模拟装配合成生物学基因片段产生蛋白质表达载体,还可被迭代从而给出不同的优化结果供选择. 展开更多
关键词 统计语言模型 动态规划算法 蛋白质表达载体 合成生物学标准“零件”
在线阅读 下载PDF
浅议统计语言学在作家语言风格研究中的实际应用
8
作者 万晓雯 《现代语文》 2018年第2期143-147,共5页
统计语言学是应用统计数学的方法来研究语言现象的语言学科,研究领域广泛,学界常常运用统计语言学,通过分析语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。通过"判定《静静的顿河》作者""... 统计语言学是应用统计数学的方法来研究语言现象的语言学科,研究领域广泛,学界常常运用统计语言学,通过分析语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。通过"判定《静静的顿河》作者""证明《红楼梦》是否出自一人之手"两个案例可以看出,统计语言学的研究方法在进入文学研究领域后,取得了非常好的实用效果。但是,在实际应用中,除了各类词汇等可控变量,还有其他潜在因素导致统计语言学的结论有时并非绝对精准。通过进行多方面、深层次地原因分析和推断,我们发现,要得到准确的研究结果,必须做好研究的前期准备,要选择具有相似语言环境的语料,要注意避开文学语言的形象思维影响,不能滥用统计语言学研究方法,并在操作过程中严格控制各种变量,以科学的思想指导研究。 展开更多
关键词 统计语言 语言风格研究 实际应用
在线阅读 下载PDF
统计语言学
9
作者 F.Z.W 《语文建设》 1985年第4期15-,共1页
应用数理统计、概率论和信息论等统计数学的方法来研究语言现象的语言学科,叫统计语言学,它是数理语言学的一个分支。统计语言学的研究领域,目前主要包括以下几个方面: 1.统计语言单位(如音素、字母、词素或词)的出现频率。早在十九世... 应用数理统计、概率论和信息论等统计数学的方法来研究语言现象的语言学科,叫统计语言学,它是数理语言学的一个分支。统计语言学的研究领域,目前主要包括以下几个方面: 1.统计语言单位(如音素、字母、词素或词)的出现频率。早在十九世纪末期,为了语言教学的需要,学者们就开始进行语言词汇频率的统计研究。此后,又进行了音位、语素频率的统计研究。2、计算作家的语言风格。 展开更多
关键词 统计语言 数理语言 统计研究 语言学科 语言词汇 统计数学 语言教学 计算语言 计算风格学 语言单位
在线阅读 下载PDF
哈希表在计算语言学中的运用 被引量:1
10
作者 高文利 朱丽 《现代语文(下旬.语言研究)》 2009年第6期110-111,共2页
在汉语词典查询算法中,哈希表知道搜索捷径,然而数组只知道正式的路线,因而与标准的二分检索相比,哈希表的搜索速度比数组快多了。在算法中,如果能恰当地使用哈希表,就会极大地提高效率。
关键词 哈希表 数组 二分检索 语言统计
在线阅读 下载PDF
大标记集汉语字(词)Markov 语言模型的建立 被引量:3
11
作者 王轩 李巍 +1 位作者 王晓龙 赵淑香 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1997年第5期23-27,共5页
给出了一种基于快速排序和归并排序的高阶汉语大标记集Markov统计语言模型的统计算法,并对算法的时间复杂性和空间复杂性进行了分析。依据这种统计算法,设计实现了一个汉语字(词)概率统计系统。通过对上千万字的汉语语料的统... 给出了一种基于快速排序和归并排序的高阶汉语大标记集Markov统计语言模型的统计算法,并对算法的时间复杂性和空间复杂性进行了分析。依据这种统计算法,设计实现了一个汉语字(词)概率统计系统。通过对上千万字的汉语语料的统计,建立起了汉语字(词)一元、二元和三元Markov模型,并对统计结果进行了分析。 展开更多
关键词 MARKOV模型 统计语言模型 汉语 信息处理
在线阅读 下载PDF
基于HTK的语音识别语言模型设计及性能分析 被引量:2
12
作者 张强 陶宏才 《成都信息工程学院学报》 2009年第2期142-146,共5页
在大词汇连续语音识别系统中,统计语言模型是该系统非常重要的一部分,对整个识别系统的识别效果产生重要的影响。分析了统计语言模型原理和相关技术,基于HTK设计了适合大词汇连续语音识别系统的统计语言模型,同时对该语言模型的复杂度... 在大词汇连续语音识别系统中,统计语言模型是该系统非常重要的一部分,对整个识别系统的识别效果产生重要的影响。分析了统计语言模型原理和相关技术,基于HTK设计了适合大词汇连续语音识别系统的统计语言模型,同时对该语言模型的复杂度、精确识别率进行分析,指出了影响统计语言模型性能的相关因素。 展开更多
关键词 语音识别 统计语言模型 HTK N-GRAM模型
在线阅读 下载PDF
汉语信息熵和语言模型的复杂度 被引量:14
13
作者 吴军 王作英 《电子学报》 EI CAS CSCD 北大核心 1996年第10期69-71,86,共4页
本文介绍了估计汉语信息摘的方法,井通过对大量语料的统计,给出了汉语信息熵的一个上界-5.17比特/汉字。本文还以此为基础对统计语言模型的能力进行了定量的描述,比较了常用的统计语言模型的性能,并给出了一种用低阶语言模型... 本文介绍了估计汉语信息摘的方法,井通过对大量语料的统计,给出了汉语信息熵的一个上界-5.17比特/汉字。本文还以此为基础对统计语言模型的能力进行了定量的描述,比较了常用的统计语言模型的性能,并给出了一种用低阶语言模型逼近高阶模型的方法。 展开更多
关键词 复杂度 统计语言模型 语音信号处理
在线阅读 下载PDF
结合主题依存特征和Bigram的汉语语言建模方法
14
作者 崔玉红 胡光锐 《上海交通大学学报》 EI CAS CSCD 北大核心 2002年第6期897-900,共4页
在 Bigram语言模型建模过程中 ,语言被看作符号集序列 ,没有考虑语言本身具有的语法和语义结构特征 .虽然在线的文本训练数据迅速增长 ,但语言模型的性能却很难再获得大幅度的提高 .基于统计方法语言建模的基本原理 ,提出了一种结合 Big... 在 Bigram语言模型建模过程中 ,语言被看作符号集序列 ,没有考虑语言本身具有的语法和语义结构特征 .虽然在线的文本训练数据迅速增长 ,但语言模型的性能却很难再获得大幅度的提高 .基于统计方法语言建模的基本原理 ,提出了一种结合 Bigram和主题依存特征的中文语言建模方法 .初步实验结果表明 ,该方法可有效地补充 Bigram模型提取特征的不足 。 展开更多
关键词 主题依存特征 汉语语言建模方法 统计语言模型 Bigram模型 主题依存模型 分支度 自然语语处理
在线阅读 下载PDF
言语统计和语料库 被引量:3
15
作者 白水 《语文建设》 1985年第3期27-28,37,共3页
1.言语统计是中文信息处理的一个重要组成部分:进行言语统计,目的在于根据量的描述给出质的评价,即依靠定量分析得出定性分析。统计结果一般是做出各种频度表,供各个不同专业的人员使用。近年来,利用电子计算机进行言语统计工作,既快又... 1.言语统计是中文信息处理的一个重要组成部分:进行言语统计,目的在于根据量的描述给出质的评价,即依靠定量分析得出定性分析。统计结果一般是做出各种频度表,供各个不同专业的人员使用。近年来,利用电子计算机进行言语统计工作,既快又准,统计量不受限制,而且能提供多种参数,因而促进了统计语言学的大发展。 展开更多
关键词 统计语言 中文信息处理 出质 词频统计 出现次数 静态数据 信息处理系统 双音节词 特定任务 速记法
在线阅读 下载PDF
数理语言学
16
作者 Z.W. 《语文建设》 1985年第2期61-,共1页
数理语言学是用数学思想和数学方法来研究语言现象的一门新兴的语言学科。这门新兴学科的出现,使语言学与现代数学、计算机科学、控制论、信息论以及人工智能挂上了钩,逐渐走上了现代化的道路。数理语言学是由于机器翻译、情报自动检索... 数理语言学是用数学思想和数学方法来研究语言现象的一门新兴的语言学科。这门新兴学科的出现,使语言学与现代数学、计算机科学、控制论、信息论以及人工智能挂上了钩,逐渐走上了现代化的道路。数理语言学是由于机器翻译、情报自动检索、自然语言理解。 展开更多
关键词 数理语言 语言学科 自然语言理解 数学方法 计算机科学 代数语言 现代数学 现代信息科学 自动检索 统计语言
在线阅读 下载PDF
基于大数据的服饰风格影响分析 被引量:2
17
作者 刘艳婷 刘静伟 《染整技术》 CAS 2020年第11期60-64,共5页
运用爬虫采集器从各大主流自媒体平台采集了唐代服饰相关的各种语料文本,运用大数据智能语义分析软件NLPIR-master对文本数据进行关键词提取和语言统计,发掘了与服饰相关的影响因素以及风格特征,证明了运用大数据分析方式进行指定主题... 运用爬虫采集器从各大主流自媒体平台采集了唐代服饰相关的各种语料文本,运用大数据智能语义分析软件NLPIR-master对文本数据进行关键词提取和语言统计,发掘了与服饰相关的影响因素以及风格特征,证明了运用大数据分析方式进行指定主题服饰风格及其相关特征因素分析的可行性。 展开更多
关键词 大数据 自媒体 语言统计 服饰风格 唐代服饰
在线阅读 下载PDF
基于文献的地质实体关系抽取方法研究 被引量:5
18
作者 吕鹏飞 王春宁 朱月琴 《中国矿业》 北大核心 2017年第10期167-172,共6页
实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语... 实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语言模型作为关系抽取方式、采用Bootstrapping算法作为关系扩展方式。最后据此进行了关联关系发现和关系扩展发现实验。 展开更多
关键词 文献 关系抽取 统计语言模型 BOOTSTRAPPING
在线阅读 下载PDF
基于相似度的词聚类算法 被引量:4
19
作者 袁里驰 钟义信 《微电子学与计算机》 CSCD 北大核心 2005年第8期93-95,共3页
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法。传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准。传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优。本文提出... 基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法。传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准。传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优。本文提出了词相似度定义、词集合相似度定义,一种自下而上的分层聚类算法。这种方法不但能改善聚类效果,而且可根据不同的模型选择不同的相似度定义,从而提高聚类的使用效果。 展开更多
关键词 词相似度 词聚类 统计语言模型
在线阅读 下载PDF
智能通信终端 被引量:3
20
作者 王仁华 《中兴通讯技术》 2001年第5期44-48,共5页
社会信息量的日益膨胀,带来了通信产业的迅猛发展,通信模式也随之日新月异。通信业发展到今天,正在逐步验证着“傻瓜”网与智能终端的通信模式,智能通信终端的市场已渐渐走热。虽然智能终端目前仍处于研制阶段,相信在不久的将来,它终将... 社会信息量的日益膨胀,带来了通信产业的迅猛发展,通信模式也随之日新月异。通信业发展到今天,正在逐步验证着“傻瓜”网与智能终端的通信模式,智能通信终端的市场已渐渐走热。虽然智能终端目前仍处于研制阶段,相信在不久的将来,它终将“飞”入寻常百姓家。本期讲述智能语音接口技术。上一期讲座已阐述信息化对现代通信的影响以及智能通信终端。下一期将继续本期未完的内容,并进一步讲述智能终端与语音门户。 展开更多
关键词 电话语音识别 语音信号 智能通信终端 连续语音识别 统计语言模型 语音合成器 识别系统 特征矢量 声学模型 智能终端
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部