期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
汉语韵律边界的声学实验研究 被引量:17
1
作者 胡伟湘 徐波 黄泰翼 《中文信息学报》 CSCD 北大核心 2002年第1期43-48,共6页
本文以带有韵律标注的语料库ASCCD为基础 ,从语音信号分析的角度 ,研究了汉语普通话韵律间断模式在语音的时长、基频和音强等三个方面的表现特征 ,并在大量统计分析的基础上建立了识别分类的决策树模型 ,实验证明 。
关键词 韵律边界 韵律结构 决策树 汉语 语音合成 语音识别
在线阅读 下载PDF
一种光谱识别的新方法 被引量:3
2
作者 郭平 覃冬梅 +1 位作者 胡占义 杜为民 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2003年第4期811-815,共5页
提出了一种对光谱信号识别的新方法。针对光谱信号的特征 ,我们设计了基于径向基函数神经网络组成的统计混合模型 ,并构造了识别系统的代价函数。通过优化系统的代价函数 ,导出了类EM算法去估计混合模型的参数 ,从而构建对光谱特征识别... 提出了一种对光谱信号识别的新方法。针对光谱信号的特征 ,我们设计了基于径向基函数神经网络组成的统计混合模型 ,并构造了识别系统的代价函数。通过优化系统的代价函数 ,导出了类EM算法去估计混合模型的参数 ,从而构建对光谱特征识别的识别器。利用实际的拉曼光谱 ,对本文所提出的估计模型参数的算法与建立的光谱识别器进行了检验。我们还讨论了利用特征波长与相应的光谱强度 ,以及利用主分量分析组成输入特征矢量 ,及其这些输入特征矢量对光谱识别器应用的效果。实验结果表明 ,所提出的算法可以有效地估计模型参数 ,其建立的光谱识别模型具有较高的识别准确率。所提出的对光谱信号识别的方法通用性强 ,因此具有较为广阔的应用前景。 展开更多
关键词 光谱信号识别 统计混合模型 径向基函数神经网络 类EM算法 拉曼光谱 光谱模式 特征谱线
在线阅读 下载PDF
基于说话人分类技术的分级说话人识别研究 被引量:5
3
作者 刘文举 孙兵 钟秋海 《电子学报》 EI CAS CSCD 北大核心 2005年第7期1230-1233,共4页
识别正确率和抗噪性能固然是说话人识别的研究重点,但识别响应速度也是决定系统实用化的关键所在.本文成功地提出了基于说话人分类技术的分级说话人辨识方法,极大地提高了系统运行速度,随着注册说话人数的增多,较之传统的说话人辨识方法... 识别正确率和抗噪性能固然是说话人识别的研究重点,但识别响应速度也是决定系统实用化的关键所在.本文成功地提出了基于说话人分类技术的分级说话人辨识方法,极大地提高了系统运行速度,随着注册说话人数的增多,较之传统的说话人辨识方法,其优势更加明显.同时在说话人确认中,该方法的使用,进一步提高了确认的正确率,有效地降低了错误接受和错误拒绝率.本文提出的可信度打分方法,也一定程度上改进了系统的性能.实验表明:基于说话人分类技术的说话人辨识方法使系统的运行速度平均提高了3.5倍,对说话人确认等误识率和最小误识率平均下降了53.75%. 展开更多
关键词 说话人辨识 说话人确认 说话人分类 Cohort集 可信度打分
在线阅读 下载PDF
基于MRI海马形状特征的阿尔茨海默病的自动判别 被引量:2
4
作者 李淑宇 石峰 +3 位作者 蒲放 蒋田仔 谢晟 王荫华 《中国医学影像技术》 CSCD 北大核心 2006年第9期1321-1324,共4页
目的通过海马的MRI影像学分析,研究阿尔茨海默病(AD)患者海马形状的局部异常模式,并构建最优的分类器函数辅助诊断AD。方法对19例AD患者和20名正常老年对照者行MRI扫描,建立海马表面模型,测量海马表面的局部萎缩,构建分类器函数自动判... 目的通过海马的MRI影像学分析,研究阿尔茨海默病(AD)患者海马形状的局部异常模式,并构建最优的分类器函数辅助诊断AD。方法对19例AD患者和20名正常老年对照者行MRI扫描,建立海马表面模型,测量海马表面的局部萎缩,构建分类器函数自动判别AD病。结果自动判别的正确率,用留一法交叉验证实验的平均正确率分别为右海马82.1%,左海马92.3%;100次3重交叉验证实验的平均正确率为右海马82.5%,左海马87.2%。结论利用MRI海马的形状特征自动判别AD是可行的。 展开更多
关键词 海马形状 磁共振成像 阿尔茨海默病 自动判别
在线阅读 下载PDF
LAMOST光谱数据自动处理软件系统
5
作者 杨金福 吴福朝 +1 位作者 罗阿理 赵永恒 《计算机工程》 CAS CSCD 北大核心 2007年第3期177-179,共3页
介绍了LAMOST光谱数据自动处理软件系统的设计及实现。阐述了系统实现中所使用的核心算法:基于覆盖算法的光谱分类方法,基于小波变换的晚型恒星识别算法和基于均值漂移的红移求取算法。在美国SDSS的天体数据库上测试表明,该软件系统具... 介绍了LAMOST光谱数据自动处理软件系统的设计及实现。阐述了系统实现中所使用的核心算法:基于覆盖算法的光谱分类方法,基于小波变换的晚型恒星识别算法和基于均值漂移的红移求取算法。在美国SDSS的天体数据库上测试表明,该软件系统具有较快的处理速度,并且能够获得较高的分类正确率和红移计算精度,可以满足大型巡天计划的实际需求。 展开更多
关键词 大天区面积多目标光纤光谱天文望远境 系统设计 覆盖算法 小波变换 均值漂移
在线阅读 下载PDF
乐谱识别中的结构拆分及图象恢复 被引量:1
6
作者 张登胜 徐秉铮 马颂德 《数据采集与处理》 CSCD 1997年第3期238-242,共5页
在电子出版及许多音乐研究中,均需将原文乐谱转化为被计算机可读的数据。本文提出一个用字符识别方法的乐谱图象识别系统。它基于拆分结构技术,将原文转换为局部结构图切分乐符,有效地减少了数据量,且不受图象弯曲和倾斜的影响。文... 在电子出版及许多音乐研究中,均需将原文乐谱转化为被计算机可读的数据。本文提出一个用字符识别方法的乐谱图象识别系统。它基于拆分结构技术,将原文转换为局部结构图切分乐符,有效地减少了数据量,且不受图象弯曲和倾斜的影响。文中给出了识别结果的文本输出及其图象恢复。 展开更多
关键词 结构拆分 图象恢复 乐谱识别 图象处理
在线阅读 下载PDF
基于异质图神经网络预训练的多标签文档分类研究
7
作者 吴家伟 方全 +1 位作者 胡骏 钱胜胜 《计算机科学》 CSCD 北大核心 2024年第1期143-149,共7页
多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考... 多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考虑标签的长尾分布,因此忽略了文档及其元数据之间的高阶关系和标签的分布规律等信息,从而影响到多标签文档分类的准确性。因此,文中提出一种新的基于异质图神经网络预训练的多标签文档分类方法。该方法通过构造文档与其元数据的异质图,采用两种对比学习预训练方法捕获文档与其元数据之间的关系,并通过平衡标签长尾分布的损失函数来提高多标签文档分类的准确性。在基准数据集上的实验结果表明,所提方法的准确率比Transformer提高了8%,比BertXML提高了4.75%,比MATCH提高了1.3%。 展开更多
关键词 多标签文档分类 元数据 异质图神经网络 预训练 长尾分布
在线阅读 下载PDF
声音转换技术的研究与进展 被引量:32
8
作者 左国玉 刘文举 阮晓钢 《电子学报》 EI CAS CSCD 北大核心 2004年第7期1165-1172,共8页
声音转换是一项改变说话人声音特征的技术 ,可以将一人的语音模式转换为与其特性不同的另一人语音模式 .声音转换算法的目标是确定一个什么样的模式转换规则 ,使转换语音保持第一个说话人原有语音信息内容不变 ,而具有第二个说话人的声... 声音转换是一项改变说话人声音特征的技术 ,可以将一人的语音模式转换为与其特性不同的另一人语音模式 .声音转换算法的目标是确定一个什么样的模式转换规则 ,使转换语音保持第一个说话人原有语音信息内容不变 ,而具有第二个说话人的声音特点 .本文介绍了当前声音转换技术领域的研究状态 ,主要分析现有声音转换技术中各种转换算法的实现原理 ,描述声音转换系统性能的各种评估方法 。 展开更多
关键词 声音转换 语音频谱 基频曲线 声门激励 码本映射 人工神经网络 高斯混合模型 隐马尔科夫模型
在线阅读 下载PDF
基于小波特征的星系光谱分类 被引量:9
9
作者 刘蓉 段福庆 +1 位作者 刘三阳 吴福朝 《电子学报》 EI CAS CSCD 北大核心 2005年第11期2059-2062,共4页
提出了一种新的星系光谱分类方法.首先,对原始光谱进行四级小波分解,选择主要包含谱线信息的第四级小波系数作为光谱的小波特征;然后,利用主分量分析对光谱的小波特征进行特征压缩,得到光谱的识别特征;最后,利用Fisher线性判别分析实现... 提出了一种新的星系光谱分类方法.首先,对原始光谱进行四级小波分解,选择主要包含谱线信息的第四级小波系数作为光谱的小波特征;然后,利用主分量分析对光谱的小波特征进行特征压缩,得到光谱的识别特征;最后,利用Fisher线性判别分析实现分类.该方法能够在红移值未知的情况下,对流量未定标的星系光谱进行识别.通过实验与其他几种分类方法进行了比较.实验结果表明,本文方法具有较强的鲁棒性,在流量未定标情况下的识别效果优于其他几种分类方法. 展开更多
关键词 光谱分类 小波特征 主分量分析 FISHER线性判别分析
在线阅读 下载PDF
基于图切分的交互式图像分割算法 被引量:5
10
作者 湛永松 雷德斌 +1 位作者 潘春洪 石民勇 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第3期799-802,共4页
提出一种基于图切分(Graph Cut)的交互式图像分割新算法。首先,使用图切分技术获取初始轮廓并采取非均匀有理B样条(NURBS)拟合边界曲线。由于NURBS具有局部可控性,其控制点可视为隐式马尔可夫模型(HMM)的隐状态,边界特征和区域同一性被... 提出一种基于图切分(Graph Cut)的交互式图像分割新算法。首先,使用图切分技术获取初始轮廓并采取非均匀有理B样条(NURBS)拟合边界曲线。由于NURBS具有局部可控性,其控制点可视为隐式马尔可夫模型(HMM)的隐状态,边界特征和区域同一性被视为HMM观察状态,然后采用轮廓平滑性作为约束来定义一个状态转移模型。最后,通过维特比算法递归求取最优轮廓。实验证明该法鲁棒性好,允许用户简易、高效地分割图像。 展开更多
关键词 图切分 非均匀有理B样条 隐式马尔可夫模型 交互式图像分割
在线阅读 下载PDF
阿尔茨海默病脑灰质体积异常的MRI研究 被引量:5
11
作者 李淑宇 蒲放 +3 位作者 蒋田仔 刘爱珍 谢晟 王荫华 《中国医学影像技术》 CSCD 北大核心 2006年第8期1162-1164,共3页
目的研究阿尔茨海默病(AD)患者MRI图像脑灰质萎缩的模式。方法对19例AD患者和20例正常老年对照者行MRI扫描,通过优化的基于体素的形态学(optimizedvoxelbasedmophometry,OVBM)分析方法,分析AD患者全脑和局部脑灰质的体积异常。结果AD患... 目的研究阿尔茨海默病(AD)患者MRI图像脑灰质萎缩的模式。方法对19例AD患者和20例正常老年对照者行MRI扫描,通过优化的基于体素的形态学(optimizedvoxelbasedmophometry,OVBM)分析方法,分析AD患者全脑和局部脑灰质的体积异常。结果AD患者全脑灰质体积相对于正常对照者明显降低(P=0.0048),双侧海马、双侧丘脑、双侧颞上回和左侧颞中回体积明显减少(多重校正后,相当于P<0.05)。结论AD患者的全脑灰质体积明显降低,局部区域明显萎缩。 展开更多
关键词 灰质 磁共振成像 阿尔茨海默病 基于体素的形态学分析
在线阅读 下载PDF
基于LMS减噪与改进的双门限语音端点检测方法 被引量:14
12
作者 朱春利 李昕 《系统仿真学报》 CAS CSCD 北大核心 2017年第9期1950-1959,1967,共11页
低信噪比环境下语音的端点检测在语音处理中占有十分重要的地位。对于一个受到加性噪声污染的语音信号通常采用滤波的方式,能够抑制噪声,并使原始语音保持相对不变。提出了一种基于最小均方误差(LMS)自适应滤波减噪与改进的双门限语音... 低信噪比环境下语音的端点检测在语音处理中占有十分重要的地位。对于一个受到加性噪声污染的语音信号通常采用滤波的方式,能够抑制噪声,并使原始语音保持相对不变。提出了一种基于最小均方误差(LMS)自适应滤波减噪与改进的双门限语音端点检测算法,在进行双参数双门限法端点检测的前后进行双重中值滤波平滑处理。通过Matlab仿真,将提出的语音端点检测方法与其它的方法进行对比,在信噪比较低的噪声环境下使得语音的端点检测效果具有更优的准确率与稳健性。 展开更多
关键词 端点检测 LMS自适应滤波 减噪 双门限法 中值滤波 平滑处理
在线阅读 下载PDF
基于条件数的摄像机自标定方法的鲁棒性分析 被引量:6
13
作者 黄凤荣 孙凤梅 胡占义 《自动化学报》 EI CSCD 北大核心 2006年第3期337-344,共8页
对基于绝对二次曲线和基于绝对二次曲面的两类摄像机自标定方法的鲁棒性进行了分析,并从矩阵条件数出发,通过大量仿真实验对两类方法进行了定量比较.实验结果表明, 基于绝对二次曲线的摄像机自标定方法的系数矩阵的条件数一般小于基于... 对基于绝对二次曲线和基于绝对二次曲面的两类摄像机自标定方法的鲁棒性进行了分析,并从矩阵条件数出发,通过大量仿真实验对两类方法进行了定量比较.实验结果表明, 基于绝对二次曲线的摄像机自标定方法的系数矩阵的条件数一般小于基于绝对二次曲面方法的系数矩阵的条件数.另外,当常数因子有误差时,基于绝对二次曲面方法的系数矩阵条件数的变化一般比基于绝对二次曲线方法系数矩阵条件数的变化更剧烈.上述二点表明,基于绝对二次曲线的自标定方法的鲁棒性一般要优于基于绝对二次曲面的自标定方法.上述结论与文献中的一些实验观察正好相佐. 展开更多
关键词 摄像机自标定 条件数 鲁棒性
在线阅读 下载PDF
自然语言处理中的语言模型及其比较研究 被引量:11
14
作者 张仰森 徐波 曹元大 《广西师范大学学报(自然科学版)》 CAS 2003年第A01期16-24,共9页
就自然语言处理中的各种语言模型进行了深入的分析、比较,就各模型的本质及它们之间的关系进行了探讨,并就语言模型的建立方法及解决建立过程中所遇问题的方法进行了讨论.
关键词 自然语言处理 语言模型 统计分析 语言模型的建立
在线阅读 下载PDF
基于空间矩的灰度边缘亚像元度量精度分析 被引量:8
15
作者 孔丹 李介谷 《红外与激光工程》 EI CSCD 1998年第2期6-10,共5页
灰度图像中边缘定位受采样密度限制,亚像元精度度量方法在需要高精度的应用中受到重视。要想知道到底需要多高的分辨率才能达到给定精度指标,就有必要分析特征定位方法的最坏情况的精度。文中用分析和实验的方法给出了基于空间矩的边... 灰度图像中边缘定位受采样密度限制,亚像元精度度量方法在需要高精度的应用中受到重视。要想知道到底需要多高的分辨率才能达到给定精度指标,就有必要分析特征定位方法的最坏情况的精度。文中用分析和实验的方法给出了基于空间矩的边缘定位方法,对于边缘点、边缘直线以及直边缘区域的最坏情况定位精度分析。分析和讨论的结果不但可以用来确定已知形状位置估计的最大误差,而且还可用于对准的形状几何参数,以获得较高的精度。 展开更多
关键词 边缘检测 空间矩 形状定位 图像处理 机器视觉
在线阅读 下载PDF
基于遗传径向基神经网络的声音转换 被引量:3
16
作者 左国玉 刘文举 阮晓钢 《中文信息学报》 CSCD 北大核心 2004年第1期78-84,共7页
声音转换技术可以将一个人的语音模式转换为与其特性不同的另一个人语音模式 ,使转换语音保持源说话人原有语音信息内容不变 ,而具有目标说话人的声音特点。本文研究了由遗传算法训练的RBF神经网络捕获说话人的语音频谱包络映射关系 ,... 声音转换技术可以将一个人的语音模式转换为与其特性不同的另一个人语音模式 ,使转换语音保持源说话人原有语音信息内容不变 ,而具有目标说话人的声音特点。本文研究了由遗传算法训练的RBF神经网络捕获说话人的语音频谱包络映射关系 ,以实现不同说话人之间声音特性的转换。实验对六个普通话单元音音素的转换语音质量分别作了客观和主观评估 ,结果表明用神经网络方法可以获得所期望的转换语音性能。实验结果还说明 ,与K -均值法相比 ,用遗传算法训练神经网络可以增强网络的全局寻优能力 ,使转换语音与目标语音的平均频谱失真距离减小约 10 %。 展开更多
关键词 人工智能 自然语言处理 声音转换 RBF神经网络 遗传算法 线谱频
在线阅读 下载PDF
COLING 2008会议介绍
17
作者 张家俊 宗成庆 《中文信息学报》 CSCD 北大核心 2008年第6期125-126,共2页
关键词 会议介绍 计算语言学 国际会议 曼彻斯特 大城市 英国
在线阅读 下载PDF
基于深度学习的合成孔径雷达图像去噪综述 被引量:4
18
作者 雷钰 刘帅奇 +2 位作者 张璐瑶 刘彤 赵杰 《兵器装备工程学报》 CAS CSCD 北大核心 2022年第11期71-80,共10页
传统的合成孔径雷达图像去噪算法在细节保存能力和运行时间上存在局限性,而深度学习方法具有独特优势。通过对国内外有关文献的归纳和总结,分析了基于深度学习的合成孔径雷达图像去噪算法的理论基础和优缺点,阐述了网络模型的具体实现... 传统的合成孔径雷达图像去噪算法在细节保存能力和运行时间上存在局限性,而深度学习方法具有独特优势。通过对国内外有关文献的归纳和总结,分析了基于深度学习的合成孔径雷达图像去噪算法的理论基础和优缺点,阐述了网络模型的具体实现细节。从监督模型和自监督模型方面对合成孔径雷达去噪算法进行分类。叙述了去噪算法的训练及测试过程,包括训练及测试数据的、训练过程中常用的损失函数和分析、模拟及具体测试数据评价指标;展望了合成孔径雷达图像散斑抑制的研究方向。 展开更多
关键词 合成孔径雷达图像 相干斑抑制 深度学习 卷积神经网络 图像去噪
在线阅读 下载PDF
基于动态基元选取的真实感可视语音合成系统
19
作者 周密 穆凯辉 陶建华 《系统仿真学报》 CAS CSCD 北大核心 2008年第S1期420-422,426,共4页
伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前... 伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统。 展开更多
关键词 可视语音 动态基元拼接 可视韵律 MPEG-4
在线阅读 下载PDF
基于二阶平滑先验的图像保边平滑快速算法
20
作者 王颢星 孟维亮 张晓鹏 《高技术通讯》 CAS CSCD 北大核心 2014年第7期732-738,共7页
研究了计算机图形处理与计算视觉处理中的图像保边平滑(保持图像边缘平滑)处理。考虑到基于优化方法的保边平滑算法多使用一阶平滑先验作为能量函数的正则项,但它会使平滑结果产生阶梯状的平滑效果,提出了一种基于二阶平滑先验的保边平... 研究了计算机图形处理与计算视觉处理中的图像保边平滑(保持图像边缘平滑)处理。考虑到基于优化方法的保边平滑算法多使用一阶平滑先验作为能量函数的正则项,但它会使平滑结果产生阶梯状的平滑效果,提出了一种基于二阶平滑先验的保边平滑算法,该算法能够避免一阶平滑先验存在的阶梯状平滑偏差,同时锋利地保持图像中显著的边缘。针对该算法的连续变量与0-1变量的混合优化问题,使用了一种快速的求解方法,该方法在使用图形处理器(GPU)并行加速的情况下能够快速获取平滑结果。通过实验验证了该算法在深度图保边平滑处理、JPEG卡通图像压缩瑕疵恢复以及边缘提取问题中的应用效果。 展开更多
关键词 二阶平滑先验 保边平滑 优化 图形处理器(GPU)加速 深度图处理
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部