题名 基于三维模型的前视红外目标匹配识别方法
被引量:6
1
作者
熊斌
丁晓青
王生进
机构
智能技术 与系统国家 重点实验室
出处
《激光与红外》
CAS
CSCD
北大核心
2011年第3期344-350,共7页
基金
国家重点基础研究发展计划(“973”计划)(No.2007CB311004)资助
文摘
针对前视红外图像中地面固定目标的识别问题,提出了一种基于三维模型的匹配识别方法。首先由场景的3D数据建立目标三维模型,并以人工标记的方式进行编号以保留交界线信息;然后根据实时观测参数进行二维投影绘制得到目标的二维模板图像;最后提取边缘加权HOG特征在观测图像中进行匹配。对大量实测数据的实验结果表明,该方法识别精度高、对噪声、遮挡与参数偏差的鲁棒性好,在各种视角、距离、环境条件以及复杂背景的情况下均能达到很好的识别性能。该方法具有很强的实用价值,同时对于精确制导、自主导航等领域的研究也提供了新的思路和途径。
关键词
信号与信息处理
目标识别
特征匹配
前视红外
三维模型
Keywords
signal and information processing
target recognition
feature matching
FLIR
3D model
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于PEG算法的QC-LDPC码构造
被引量:4
2
作者
雷伟龙
钱辰
王昭诚
杨知行
机构
清华信息科学与技术国家实验室清华大学电子工程系
出处
《电视技术》
北大核心
2011年第5期1-4,共4页
基金
清华大学自主科研计划(20091081280)资助
文摘
提出一种QC-LDPC码的构造方法,这种方法利用受约束的PEG算法构造一个符合给定度分布的LDPC码基矩阵,能够保证构造出来的LDPC码短环的数量比较少,且具有线性时间编码。该方法在基矩阵的基础上利用缩短RS码集合的构造方法得到对应位置的偏移地址,以保证所构造的LDPC码的最小码距。最后给出构造的QC-LDPC码与DVB-S2所用LDPC码的对比仿真结果与硬件实现的性能。
关键词
低密度奇偶校验码
PEG
线性时间编码
缩短RS码
Keywords
LDPC code
PEG
linear time encoding
shortened Reed-Solomon codes
分类号
TN911.73
[电子电信—通信与信息系统]
题名 一种联机手写算术表达式识别系统
被引量:4
3
作者
姜寒
刘长松
李士阳
邹燕明
机构
智能技术 与系统国家 重点实验室 清华信息科学与技术国家实验室清华大学电子工程系
诺基亚北京研究院多模态多媒体用户界面研究组
出处
《电子与信息学报》
EI
CSCD
北大核心
2010年第5期1126-1130,共5页
基金
国家973计划项目(2007CB311004)
国家自然科学基金(60772049
60872086)资助课题
文摘
该文介绍了一个完整的联机手写算术表达式识别系统。在笔划分组与符号识别方面,采用预处理结合搜索的方法优化置信度函数;在结构分析方面,提出了一套全新的基于符号分级的算法,并利用三叉树这种数据结构存储识别结果。实验表明,对于书写较为整齐的算术表达式,此系统能够对较复杂的结构予以正确率较高的分析与识别。
关键词
联机手写识别
算术表达式
结构分析
符号分级
Keywords
On-line handwriting recognition
Arithmetic expressions
Structural analysis
Symbol ranking
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
题名 卷积-RS级联译码器并行帧同步算法及实现
被引量:4
4
作者
苏承毅
张彧
潘长勇
机构
微波与数字通信技术 国家 重点实验室 清华信息科学与技术国家实验室清华大学电子工程系
出处
《电视技术》
北大核心
2010年第11期48-50,共3页
文摘
针对卷积-RS码级联译码器中的帧同步问题,提出了一种高速并行结构。该结构采用符号域同步算法替代传统的比特域同步算法,克服了传统级联译码器中帧同步器的速率瓶颈。该算法使用多路并行相关,再由状态机根据各路相关结果进行同步判断。设计中同时考虑了帧头容错和抗滑码功能。在Stratix II FPGA上,该帧同步器结构的实现可以达到1.2 Gbit/s以上的数据处理速率。
关键词
帧同步
级联码
并行结构
FPGA
Keywords
frame synchronization
concatenated code
parallel architecture
FPGA
分类号
TN911.2
[电子电信—通信与信息系统]
题名 MPEG-2/4 AAC音频编码器的低复杂度优化
被引量:3
5
作者
张树华
窦维蓓
杨华中
机构
清华信息科学与技术国家实验室清华大学电子工程系
出处
《电声技术》
2010年第4期71-74,89,共5页
文摘
优化了MPEG-2/4AAC编码器的复杂度,并在定点数字信号处理器(DSP)上实现了相应的优化编码器。提出了一种迭代求解非线性频谱量化比例因子的方法及一种不需要再量化的比特率控制方法。与定点DSP实现技术相结合,这两种方法可将编码器的运行效率相对参考代码提高30倍,而音质只有轻微下降。这使得移动设备上的高质量音频应用成为可能。
关键词
音频编码
定点实现
非线性量化
比特率控制
Keywords
audio coding
fixed-point implementation
nonlinear quantization
rate control
分类号
TN911
[电子电信—通信与信息系统]
题名 基于边缘特征的异质图像目标配准方法
被引量:3
6
作者
孙晓路
丁晓青
机构
智能技术 与系统国家 重点实验室 清华信息科学与技术国家实验室清华大学电子工程系
出处
《电视技术》
北大核心
2010年第12期130-134,共5页
文摘
目标检测作为计算机视觉的重要研究课题,在视频监控和智能导航方面有重要应用。图像配准技术是刚体目标检测方法之一。异质图像间目标的纹理差异极大,为此,对于目标的可见光俯视图像与机载红外摄像机观测异质图像,通过研究基于边缘特征的配准技术,实现对地面平面目标的配准检测。笔者首先通过建立机载运动摄像机空间模型,解决了红外观测图像的视角变换问题,将其换到与参考图像一致的视角,提出一种新颖的基于稳定区域轮廓合成的边缘提取方法,更好地控制异质图像的边缘提取效果,边缘特征匹配是在距离变换的基础上实现的,提出了一种基于稳定区域距离图像互相关的匹配度量准则。实验表明,算法能有效地实现异质图像间的目标配准检测。
关键词
异质图像配准
互相关度量
边缘提取
机载摄像机模型
Keywords
multi-modal image registration
correlation metrics
edge detection
airborne camera model
分类号
TN949.6
[电子电信—信号与信息处理]
题名 基于模块划分方法的MPEG-2解码芯片可测性设计
7
作者
廖富成
乔飞
周妮
谭斯斯
杨华中
机构
清华信息科学与技术国家实验室清华大学电子工程系
出处
《电视技术》
北大核心
2010年第11期35-39,共5页
基金
国家自然科学基金项目(60871005)
教育部博士点基金(新教师基金)(200800031073)
清华大学"结构化集成电路设计"课程研究项目(70230183)
文摘
以MPEG-2解码芯片为研究对象,采用基于模块划分方法进行可测性设计,包括边界扫描(JTAG)和内建自测试(BIST)。根据MPEG-2系统结构的特点,把模块划分为存储器类型、信号不相关类型和信号相关类型。针对模块特性,设计不同的测试向量生成器,3种类型模块之间并行测试。测试结果表明,与未加入可测试设计的系统比较,固定故障覆盖率由81%提升到95.1%,而硬件开销仅为3%。
关键词
MPEG-2
可测性设计
边界扫描测试
内建自测试
故障覆盖率
Keywords
MPEG-2
testability design
JTAG
BIST
fault coverage rate
分类号
TN919.83
[电子电信—通信与信息系统]
题名 篮球比赛视频节目中短管哨声检测方法
8
作者
曾春艳
窦维蓓
机构
清华信息科学与技术国家实验室清华大学电子工程系
出处
《电声技术》
2010年第9期53-56,共4页
文摘
提出了一种检测篮球比赛视频中重要音频关键词(短管哨声)的方法。通过分析短管哨声的频谱分布特性提出一种二级检测方法:首先提取特定子带能量峰指数特征,并采用门限决策方法获得关键词候选集;第二级再结合梅尔频率倒谱系数和支持向量机得到最终的关键词检测结果。选取时长为1378s的NBA篮球比赛音频片段作为测试序列,验证了本方法具有正确率和检出率分别为95.45%和91.3%的性能。
关键词
音频关键词
子带能量峰指数
二级检测
短管哨声
Keywords
audio keywords
SBEPI
two-stage detection
whistle sound
分类号
TN911.72
[电子电信—通信与信息系统]
题名 基于EaacPlus的可分层可分级音频编码系统
9
作者
张波
窦维蓓
机构
清华信息科学与技术国家实验室清华大学电子工程系
出处
《电声技术》
2010年第10期57-61,共5页
基金
国家自然科学基金项目(60862002)
文摘
在多媒体通信中,一方面要求音频业务质量能适应不断变化的网络带宽,体现一定的层次性;另一方面,要求音频信源能够按码率任意截断从而更好地适应信道变化,以保证音频业务质量要求。这种信源的分层分级码流在网络传输时,更便于信道不对等保护技术的使用。提出了一种音频业务的可分层模型和基于EaacPlus核心编码器的可分层可分级音频编码方案。实验表明,分层模型的使用使得音质具有较强的层次感;可分级码率的增加能够带来音质的连续增强。
关键词
可分层音频编码
精细粒度可分级
噪声遮蔽比
可伸缩音频编码
Keywords
layering audio coding
Fine Granularity Scalability (FGS)
Noise to Masking Ratio (NMR)
scalable audio coding
分类号
TN912
[电子电信—通信与信息系统]