-
题名边界模板和局部统计相结合的中国人名识别
被引量:13
- 1
-
-
作者
李中国
刘颖
-
机构
清华大学中文系计算语言学研究室
-
出处
《中文信息学报》
CSCD
北大核心
2006年第5期44-50,共7页
-
基金
清华大学亚洲研究中心2005年度青年项目资助(2005C-2)
-
文摘
本文提出了一种基于篇章信息的中国人名识别算法。我们从标注语料中提取人名左右边界词语及人名用字频度作为系统知识源。识别过程是:首先利用带有频度的边界模板识别出可能的人名,并把识别结果扩散到整篇文章以召回数据稀疏导致的遗漏人名。然后应用上下文局部统计量及几条启发式规则对识别结果进行边界校正。该算法具有线性时间复杂度,大规模开放测试(针对1354篇新闻报道约304万字,含人名3.7万个)的正确率为94.52%,召回率为98.97%,效果非常令人满意。
-
关键词
计算机应用
中文信息处理
人名识别
命名实体识别
边界模板
局部统计量
词法分析
-
Keywords
computer application
Chinese information processing
person name recognition
named entity recognition
boundary template
local frequency
lexical analysis
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名静止卫星图像配准中海陆边界模板的生成方法
被引量:1
- 2
-
-
作者
徐文
吕科
杨磊
林政宗
翟锐
-
机构
中国科学院大学工程管理与信息技术学院
国家卫星气象中心
-
出处
《计算机工程》
CAS
CSCD
2014年第4期154-158,共5页
-
基金
国家自然科学基金资助项目(61271435)
北京市自然科学基金资助重点项目(4141003)
-
文摘
在使用地标进行遥感图像导航与配准时,以海陆边界为特征进行匹配操作是一种常用的方法,尤其适合昼夜图像灰度值变化剧烈的红外通道遥感图像。将海陆边界模板图像作为匹配标准,其精确性对于导航与配准的精度具有决定性的作用。针对静止卫星图像配准过程的特点,对海陆边界模板的生成方法进行研究,提出一种静止卫星图像配准中海陆边界模板的生成方法,将生成过程分为目标网格生成、全球海岸线数据库选取及查找算法3个部分,通过不断挖掘数据特点给出3种查找算法,并对各算法的精度和效率进行分析。实验结果表明,该方法生成的海陆边界模板与主流工具的生成结果有90%以上的匹配度,且算法效率较高,具有良好的应用价值。
-
关键词
遥感图像配准
海陆边界模板
参考图像
静止卫星
遥感图像处理
目标网格
-
Keywords
remote sensing image registration
land-sea boundary template
reference image
geostationary satellite
remote sensingimage processing
aim grid
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于边界模板匹配算法的集装箱箱号识别
被引量:4
- 3
-
-
作者
安博文
李丹
庞然
-
机构
上海海事大学
-
出处
《科学技术与工程》
2010年第16期4043-4048,共6页
-
文摘
为了解决集装箱箱号识别精度差、速度慢的缺点,提出了一种新的识别方法。该方法从字符的边界信息中抽取出其特征向量并利用模板匹配法完成字符的初步识别。然后通过大量的实验确定易混淆的字符集,再利用这些字符的独有特征加以区分识别。实验结果表明此算法不但减少了运算量,而且提高了识别速度和精确度。
-
关键词
边界模板
特征抽取
模板匹配
集装箱箱号识别
-
Keywords
boundary template feature extraction template matching container code recognition
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名边界片段模板方法在空间探测识别中的应用
被引量:4
- 4
-
-
作者
安萌
姜志国
赵丹培
-
机构
北京航空航天大学宇航学院图像中心
-
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2009年第3期1231-1236,共6页
-
基金
国家自然科学青年基金(60802043)
CAST创新基金(CAST2000607)
-
文摘
以对具有复杂边缘的空间目标进行准确的检测识别为目的,提出一种基于边界片段模板(BoundaryFragment Model)训练模式的空间目标识别方法。方法的步骤是:首先从训练集中提取目标的边界片段组成弱分类器;然后使用Adaboost算法将它们提升训练成为强分类器;对方法进行旋转、尺度、视点的不变性增强;最后将训练好的强分类器模板应用到待识别图像上,进行目标的检测识别。实验结果表明,本方法对带有各种旋转,尺度,以及视点变化的具有复杂边缘空间有形目标具有较好的识别效果。
-
关键词
空间有形目标
边界片段模板
弱分类器与强分类器
旋转
尺度与视点不变性
-
Keywords
Space shape target
Boundary fragment model
Weak and strong classifiers
Rotation
Scale and viewpoint invariance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名彩色像对的邻域边界差值模板匹配算法研究
被引量:1
- 5
-
-
作者
梁柱
李大海
王琼华
张浩
-
机构
四川大学电子信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第33期147-148,167,共3页
-
基金
国家高技术研究发展计划(863)No.2007AA01Z301
四川省科技支撑计划(No.2008FZ0003)~~
-
文摘
分析了区域算法中SAD在非纹理区域容易产生错误匹配的缺点,提出了一种利用邻域边界差值模板的彩色图像立体匹配新算法。该算法利用了图像的边界信息来动态选择基准点邻域范围内的边界点,以该点为中心取一像素邻域作为伴随窗,将伴随窗的颜色信息加入到评价函数中以达到减少非纹理区域错误匹配目的。该算法的实验结果通过Middlebury网站评测,证明能够得到浓密视差图的同时有效地减少了非纹理区域的错误匹配。而且该算法简单易于实现,精度较高,具有良好的匹配效率。
-
关键词
立体匹配
邻域边界差值模板
视差图
绝对差值和(SAD)
-
Keywords
stereo matching
neighborhood edge difference templet
disparity map
Sum of Absolute Difference(SAD)
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于可信度模型的中文人名识别研究
被引量:6
- 6
-
-
作者
倪吉
孔芳
朱巧明
李培峰
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2011年第3期45-50,共6页
-
基金
国家自然科学基金资助项目(90920004
60970056
+2 种基金
60873150)
江苏省自然科学基金资助项目(BK2008160)
江苏省高校自然科学重大基础研究资助项目(08KJA520002)
-
文摘
该文根据中国人名的形成方式,总结和统计了人名的用字特征和边界模板特征,通过计算人名内聚度、人名区分度和边界模板可信度的综合概率作为人名可信度,对文本中人名进行识别或对已识别的人名进行纠正。该文将可信度检测模块嵌入到一个简易的命名实体平台中,在MSRA的语料上进行测试,实验结果说明可信度模型使得平台的人名识别F值提高了2.27%,整个系统的人名识别F值达到了91.72%。
-
关键词
人名识别
可信度
内聚度
边界模板
-
Keywords
Chinese name recognition
trustworthiness
cohesion
boundary templates
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于逆向工程的孔浮动位置度公差建模和配准
被引量:2
- 7
-
-
作者
丁立军
戴曙光
穆平安
侯文玫
-
机构
上海理工大学光电信息与计算机工程学院
上海医疗器械高等专科学校医疗器械工程系
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2015年第1期101-107,共7页
-
基金
国家自然科学基金资助项目(51075280)
上海市教委重点学科第五期基金资助项目(J50505)~~
-
文摘
在应用逆向工程技术对零件孔浮动位置度误差的检测中,提出一种孔位置度公差边界模板与被测孔的配准算法。根据位置度公差的平面浮动特点,将被测孔与孔公差边界模板向基准平面投影,建立被测孔的平面影响区域、区域中心以及边界模板中各孔中心线在基准平面的投影。定义了模板孔投影中心到被测孔影响区域中心的距离测度和相应的权重系数。结合对应点的加权利弗博格—马夸特迭代计算,实现了孔位置度公差边界模板与被测孔的合理配准。通过实例验证了算法的可行性和有效性。
-
关键词
逆向工程
浮动位置度误差
孔位置度公差边界模板
合理配准
-
Keywords
reverse engineering
float position error
holes position tolerance border template
reasonable registration
-
分类号
TG801
[金属学及工艺—公差测量技术]
-
-
题名基于Naive Bayes的中文人名识别研究
被引量:2
- 8
-
-
作者
曾辉
王俊
熊李艳
-
机构
华东交通大学信息工程学院
-
出处
《科学技术与工程》
北大核心
2015年第6期83-86,98,共5页
-
基金
国家自然科学基金(61363072)
教育部人文社科基金(11YJC740157
+1 种基金
09YJC740027)
江西省自然科学基金(20114BAB201027)资助
-
文摘
在传统的只统计人名用字的Naive Bayes分类算法的基础上,将人名上下文边界融入其中,并利用从大规模语料库中统计的人名用字、边界模板频率对人名定界,再通过扩散操作召回遗漏人名。该方法简单易行,并能取得很好的效果。实验结果表明,其F值达到了93.28%。
-
关键词
NAIVE
BAYES
分类算法
边界模板
人名识别
-
Keywords
Naive Bayesian classification algorithm
boundary templates
person name recognition
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于邮件正文的邮箱用户别名抽取
被引量:2
- 9
-
-
作者
尹美娟
陈庶民
刘晓楠
路林
-
机构
信息工程大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2011年第12期182-186,199,共6页
-
基金
某国防基金资助
-
文摘
邮箱用户身份信息挖掘是数据挖掘研究的一个热点。当前相关研究大多仅从邮件头中抽取邮箱用户的别名,遗漏了邮件正文中潜藏的更能代表通信双方身份的别名信息。针对纯文本邮件正文中邮箱用户别名信息抽取问题,提出了基于统计和规则过滤的称呼块和签名块定位算法,该算法能高效准确地从邮件正文中提取出蕴涵邮箱用户别名的称呼块和签名块文本片段;进一步提出了基于别名边界词汇模板修正的别名抽取方法,从而提高了仅基于命名实体识别或词性标注工具识别别名的准确率。实验结果表明,提出的方法可以有效地抽取出邮件正文中邮箱用户的别名。
-
关键词
实体解析
邮件正文
别名抽取
称呼块签名块定位
别名边界词汇模板
-
Keywords
Entity resolution, Email body, Alias Extraction, Salutation and signature blocks locating, Name boundaryword template
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于BFM算法的空间有形目标识别方法
被引量:3
- 10
-
-
作者
安萌
姜志国
许波
-
机构
北京航空航天大学图像中心
中国航天科工集团第四研究院
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2009年第5期1075-1077,共3页
-
文摘
为了对具有复杂边缘的目标进行更准确的检测识别,提出了一种基于边界片段模板(boundary frag-ment model)训练模式的目标识别方法。方法首先提取目标的边界片段组成弱分类器,然后使用AdaBoost算法将它们提升训练成为强分类器,并用其进行检测和识别目标。仿真实验表明,该方法对有形目标,特别是对具有复杂边缘的空间有形目标有较好的识别效果。
-
关键词
空间有形目标检测与识别
ADABOOST算法
边界片段模板
弱分类器与强分类器
-
Keywords
space objects detection and recognition
AdaBoost algorithm
boundary fragment model
weak and strong classifiers
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-