期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
面向互联网舆情的热词分析技术 被引量:18
1
作者 李渝勤 孙丽华 《中文信息学报》 CSCD 北大核心 2011年第1期48-53,59,共7页
热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而... 热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而采用基础权值和波动权值两项指标进行热度权值的计算。在热词关联阶段,按热词权值高低进行热词类的划分,通过同现率的原则确定热词类之间的关联计算。该文所采用的方法已经成功应用到TRS舆情监测系统的热点发现模块。 展开更多
关键词 热词 命名实体识别 热度计算 波动权值 词群关系
在线阅读 下载PDF
基于条件随机场的领域术语识别研究 被引量:14
2
作者 施水才 王锴 +1 位作者 韩艳铧 吕学强 《计算机工程与应用》 CSCD 2013年第10期147-149,155,共4页
领域术语是各个领域的核心词汇,在研究了大量领域文献的基础上,提出了一种识别领域术语的方法。该方法以现有成熟工具为依托,使用条件随机场模型统计领域术语的词性组合概率。在选定特征集后,通过调整特征和窗口的组合,制定一个最优特... 领域术语是各个领域的核心词汇,在研究了大量领域文献的基础上,提出了一种识别领域术语的方法。该方法以现有成熟工具为依托,使用条件随机场模型统计领域术语的词性组合概率。在选定特征集后,通过调整特征和窗口的组合,制定一个最优特征模板,同时通过10倍交叉验证法确定模型训练参数。实验结果表明,通过条件随机场模型分析领域术语的词性组合概率能够有效地识别领域术语。 展开更多
关键词 领域术语 条件随机场 词性组合 特征模板
在线阅读 下载PDF
基于多层条件随机场的中文命名实体识别 被引量:26
3
作者 胡文博 都云程 +1 位作者 吕学强 施水才 《计算机工程与应用》 CSCD 北大核心 2009年第1期163-165,227,共4页
命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识... 命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别的方法。对大规模真实语料进行开放测试,两项识别的召回率、准确率和F值分别达到91.95%、89.99%、90.50%和90.07%、88.72%、89.39%。 展开更多
关键词 条件随机场 命名实体识别 命名实体
在线阅读 下载PDF
中文专利文献术语抽取 被引量:11
4
作者 徐川 施水才 +1 位作者 房祥 吕学强 《计算机工程与设计》 CSCD 北大核心 2013年第6期2175-2179,共5页
为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基... 为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。 展开更多
关键词 术语 边界结合度 串边结合度 双字词性过滤法
在线阅读 下载PDF
基于加权距离的机械设计图像异步检索方法 被引量:5
5
作者 方乃伟 吕学强 +1 位作者 张丹 王弘蔚 《计算机应用》 CSCD 北大核心 2013年第5期1406-1410,共5页
根据机械设计图像的形状特征,提出一种利用加权距离实现的多特征异步检索方法。首先利用机械设计图像的外接圆距离特征进行初步检索,再结合初步检索结果集的位置计算输入图像和初步检索结果集的加权Hu不变矩特征距离,并据此获得最终的... 根据机械设计图像的形状特征,提出一种利用加权距离实现的多特征异步检索方法。首先利用机械设计图像的外接圆距离特征进行初步检索,再结合初步检索结果集的位置计算输入图像和初步检索结果集的加权Hu不变矩特征距离,并据此获得最终的检索结果。实验表明,与单一特征的检索方法相比,该方法在机械设计图像检索中有更高的查准率和查全率。 展开更多
关键词 机械设计图像 外接圆距离 HU不变矩 加权距离 异步检索
在线阅读 下载PDF
机械设计图像主轮廓提取算法研究 被引量:3
6
作者 方乃伟 吕学强 +1 位作者 张丹 王涛 《计算机工程与设计》 CSCD 北大核心 2013年第8期2778-2782,共5页
针对传统的轮廓提取方法在机械设计图像上无法获取令人满意结果的问题,提出基于区域填充和标引消除的主轮廓提取方法。根据机械图孔洞分布的特点,提出一种能自动选择种子点的种子填充算法实现图像内部孔洞填充,并结合图像形态学和轮廓... 针对传统的轮廓提取方法在机械设计图像上无法获取令人满意结果的问题,提出基于区域填充和标引消除的主轮廓提取方法。根据机械图孔洞分布的特点,提出一种能自动选择种子点的种子填充算法实现图像内部孔洞填充,并结合图像形态学和轮廓跟踪算法实现图像中标引的消除,从而得到图像主轮廓。实验结果表明,该方法能够对机械设计图准确而高效地进行填充,且能够准确提取出机械设计图像的主轮廓。 展开更多
关键词 机械设计图像 主轮廓提取 孔洞填充 形态学 轮廓跟踪
在线阅读 下载PDF
基于空间金字塔的镜头检测 被引量:3
7
作者 都云程 任绍美 +1 位作者 王涛 吕学强 《计算机工程与应用》 CSCD 2013年第11期187-190,270,共5页
提出一种HSV颜色直方图与像素的位置空间金字塔结合的方法,该方法既考虑像素的信息,又考虑了像素的位置信息,来进行视频镜头分割。将图像进行一次亚采样,对得到的第一层亚采样图像进行均匀的四分割;对得到的四块小区域分别计算其颜色直... 提出一种HSV颜色直方图与像素的位置空间金字塔结合的方法,该方法既考虑像素的信息,又考虑了像素的位置信息,来进行视频镜头分割。将图像进行一次亚采样,对得到的第一层亚采样图像进行均匀的四分割;对得到的四块小区域分别计算其颜色直方图,获得四个特征向量;将第一层亚采样的图像再进行一次亚采样,得到第二层亚采样图像,并计算其颜色特征向量;将五个特征向量级联,作为图像帧的特征,并计算相邻两个帧的相似度。该算法不仅考虑了像素信息,还考虑了像素位置信息,而且考虑的是全局位置信息和局部位置信息。实验结果显示,该方法较好地权衡了查全率和查准率。 展开更多
关键词 空间金字塔 亚采样 分块 直方图
在线阅读 下载PDF
基于自商图像的人脸图像增强 被引量:3
8
作者 施水才 杨忱 +1 位作者 王涛 吕学强 《计算机工程与应用》 CSCD 2013年第13期142-144,共3页
为了降低光照对人脸识别效果的影响,通过多层次自商图像的方法获得反射系数。将原图作为输入图像采用反锐化掩模滤波的方式进行增强,再通过自商图像方法获得反射系数和光照成分;把光照成分作为输入图像,重复以上操作,对每次得到的反射... 为了降低光照对人脸识别效果的影响,通过多层次自商图像的方法获得反射系数。将原图作为输入图像采用反锐化掩模滤波的方式进行增强,再通过自商图像方法获得反射系数和光照成分;把光照成分作为输入图像,重复以上操作,对每次得到的反射系数按比例融合得到最终的反射系数。YaleB人脸库上的实验结果表明,该方法能在一定程度上去除光照的影响,使人脸识别率有一定的提高。 展开更多
关键词 反射光照模型 自商图像 反锐化掩模滤波
在线阅读 下载PDF
基于特征分选策略的中文共指消解方法 被引量:2
9
作者 李渝勤 甘润生 +1 位作者 杨永红 施水才 《计算机工程》 CAS CSCD 北大核心 2011年第18期180-182,共3页
针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征... 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。 展开更多
关键词 共指消解 特征选择 自然语言处理 支撑向量机 数据词典
在线阅读 下载PDF
基于MapReduce的术语权重计算方法研究 被引量:1
10
作者 王锴 施水才 +1 位作者 王涛 吕学强 《电信科学》 北大核心 2011年第11期62-65,共4页
术语识别在本体构建、词典构建等领域应用广泛,而术语权重计算是术语识别中的关键步骤。本文通过改进TF-IDF公式,将组成术语词条的长度作为权重因素之一,同时考虑术语在文档集中的领域相关性。整个过程基于MapReduce编程模型实现,在Had... 术语识别在本体构建、词典构建等领域应用广泛,而术语权重计算是术语识别中的关键步骤。本文通过改进TF-IDF公式,将组成术语词条的长度作为权重因素之一,同时考虑术语在文档集中的领域相关性。整个过程基于MapReduce编程模型实现,在Hadoop云平台中以分布式方式计算候选领域术语的权重。实验结果表明,该方法不仅简化了术语权重计算的实施步骤,也提高了算法执行效率。 展开更多
关键词 术语权重 TF-IDF MAPREDUCE 分布式
在线阅读 下载PDF
基于轮廓线法的汽车类外观专利图像三维重建 被引量:1
11
作者 张丹 吕学强 +1 位作者 肖诗斌 刘坤 《计算机应用与软件》 CSCD 2015年第4期170-174,205,共6页
对立体产品的外观设计专利图像进行三维重建是外观设计专利三维检索的基本前提。结合汽车类外观专利图像的特点,提出汽车类外观专利图像三维重建方法。该方法利用三视图理论及汽车模型的对称性,根据俯视图信息确定主视图与后视图之间在... 对立体产品的外观设计专利图像进行三维重建是外观设计专利三维检索的基本前提。结合汽车类外观专利图像的特点,提出汽车类外观专利图像三维重建方法。该方法利用三视图理论及汽车模型的对称性,根据俯视图信息确定主视图与后视图之间在不同高度的距离,进而获取三维空间点坐标;对车轮部分的连接进行特殊处理,并按照子轮廓线连接法构造四角面片,实现三维模型的重建。实验结果表明:1)与传统方法相比错误面片数降低了19.4%;2)重建效果图在外形上与实际物体更为接近。 展开更多
关键词 汽车类外观专利图像 三维重建 三视图理论 子轮廓线连接
在线阅读 下载PDF
搜索日志中中文人名自动识别 被引量:1
12
作者 王玥 吕学强 +1 位作者 李卓 舒燕 《中文信息学报》 CSCD 北大核心 2015年第3期162-168,176,共8页
搜索日志中人名识别一直是日志挖掘中的一个重点和难点,其结果好坏直接关系搜索引擎的检索效率和准确率。由于分析了长文本中人名识别方法在搜索日志中使用存在很多困难与不足,因而该文提出了一种在搜索日志中识别中文人名的方法。该方... 搜索日志中人名识别一直是日志挖掘中的一个重点和难点,其结果好坏直接关系搜索引擎的检索效率和准确率。由于分析了长文本中人名识别方法在搜索日志中使用存在很多困难与不足,因而该文提出了一种在搜索日志中识别中文人名的方法。该方法将搜索日志中人名内部用字的概率特征引入条件随机场,再根据搜索日志的特点计算人名可信度提取搜索日志中的中文人名。在搜狗查询日志上进行实验,正确率平均达到了81.97%、召回率平均达到了85.81%,综合指标F值平均达到了83.79%。 展开更多
关键词 人名识别 搜索日志 条件随机场 可信度
在线阅读 下载PDF
基于扩展射线法的三维模型检索
13
作者 姜阳 吕学强 +1 位作者 李琳 施水才 《计算机应用》 CSCD 北大核心 2013年第2期463-467,共5页
针对原始射线法特征提取时间较长、仅利用三角形面片问题,提出一种基于不相交平面束原理的扩展射线法。从质心均匀散射出一组射线与三角形面片相交,利用射线确定的不相交平面束定位交点;根据交点、顶点到质心的距离,建立检索模型以改善... 针对原始射线法特征提取时间较长、仅利用三角形面片问题,提出一种基于不相交平面束原理的扩展射线法。从质心均匀散射出一组射线与三角形面片相交,利用射线确定的不相交平面束定位交点;根据交点、顶点到质心的距离,建立检索模型以改善三维模型的检索效果。利用普林斯顿大学三维模型库的10类模型作为实验数据,实验结果表明:与原始射线法对比,扩展射线法不仅提高了特征提取速度,而且提高了检索准确率。 展开更多
关键词 三维模型检索 扩展射线法 折扣增益值 相似性度量 时间复杂度
在线阅读 下载PDF
问答社区问句中多字词表达提取
14
作者 吴瑞红 吕学强 +1 位作者 李卓 舒燕 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2014年第6期1230-1238,共9页
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句... 基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和F值分别达到84%,52%和0.64,验证了该方法的有效性. 展开更多
关键词 多字词表达 问句理解 互信息 搜索引擎
在线阅读 下载PDF
基于引证文献的相关专利检索自动评测
15
作者 李超凡 王洪俊 肖诗斌 《情报学报》 CSSCI 北大核心 2010年第5期777-784,共8页
本文综合考虑了专利检索的业务特点以及智能语义分析技术与专利检索的结合点设计了一次信息检索评测,目的是检测专利语义检索技术的研究现状和系统有效性。为了提高评测的自动化程度,本文提出了一种基于引证文献的相关专利检索自动评测... 本文综合考虑了专利检索的业务特点以及智能语义分析技术与专利检索的结合点设计了一次信息检索评测,目的是检测专利语义检索技术的研究现状和系统有效性。为了提高评测的自动化程度,本文提出了一种基于引证文献的相关专利检索自动评测方法,实验结果表明,该方法可以取得与人工评价方法基本一致的测试结果。本次评测的相关工作为专利检索研究提供了有益参考。 展开更多
关键词 信息检索评测 专利语义检索 相关专利排序 基于引证文献的自动评测
在线阅读 下载PDF
基于特定目标的Radon变换模糊图像研究 被引量:5
16
作者 杨梅 施水才 +1 位作者 房祥 吕学强 《计算机工程与设计》 CSCD 北大核心 2013年第4期1307-1312,共6页
对运动模糊图像进行恢复处理需要两个关键参数的支持:模糊角度和模糊长度。为此,提出了一种时间复杂度比传统Radon变换更低的新方法对频域中的图像进行角度检测。根据傅里叶频谱的特性,新方法以扇形方式展开,扫描出一条穿过圆心且亮度... 对运动模糊图像进行恢复处理需要两个关键参数的支持:模糊角度和模糊长度。为此,提出了一种时间复杂度比传统Radon变换更低的新方法对频域中的图像进行角度检测。根据傅里叶频谱的特性,新方法以扇形方式展开,扫描出一条穿过圆心且亮度最大的直线,该直线的倾斜角度为频域图像中平行条纹的倾斜角度;利用Radon变换的性质将先前求得的模糊角度进行投影求和得到模糊长度。实验结果表明,新方法不仅降低了时间复杂度,还提高了模糊角度和模糊长度检测的准确性。 展开更多
关键词 模糊角度 模糊长度 RADON变换 傅里叶频谱 角度检测
在线阅读 下载PDF
基于轮廓与SIFT特征组合的商标图像检索 被引量:2
17
作者 向雷 肖诗斌 +1 位作者 林春雨 吕学强 《计算机工程与应用》 CSCD 2013年第19期167-172,共6页
针对单一特征对商标图像描述的局限性,提出了一种基于轮廓和SIFT特征组合的商标图像检索方法。该方法对二值化的商标图像进行轮廓提取,采用规则算法对其进行轮廓分解,对分解的参考点集进行Fourier变换,将得到的Fourier系数作为参考点的... 针对单一特征对商标图像描述的局限性,提出了一种基于轮廓和SIFT特征组合的商标图像检索方法。该方法对二值化的商标图像进行轮廓提取,采用规则算法对其进行轮廓分解,对分解的参考点集进行Fourier变换,将得到的Fourier系数作为参考点的轮廓特征。针对商标图像的尺度空间进行极值点检测,并对检测到的极值点进行特征描述,该特征描述即为商标图像的SIFT特征描述。最后,SIFT特征与轮廓特征进行特征融合,并将融合后的组合特征作为对商标图像的特征描述。 展开更多
关键词 轮廓特征 SIFT特征 轮廓提取 轮廓分解 FOURIER变换
在线阅读 下载PDF
基于特征补偿的视频字幕识别研究 被引量:2
18
作者 梁松涛 吕学强 +1 位作者 施水才 王涛 《计算机应用与软件》 CSCD 2010年第11期20-22,61,共4页
视频中的字幕对多媒体检索技术提供了重要的信息,主要介绍视频字幕识别技术中的特征提取方法。根据字幕不同于印刷体和手写体中常出现的问题,提出了字符位置特征和字符区域笔画分布特征、字符笔画密度特征两种修改过的特征提取方法与传... 视频中的字幕对多媒体检索技术提供了重要的信息,主要介绍视频字幕识别技术中的特征提取方法。根据字幕不同于印刷体和手写体中常出现的问题,提出了字符位置特征和字符区域笔画分布特征、字符笔画密度特征两种修改过的特征提取方法与传统的字符外围特征结合使用,并进行了实验测试,结果表明这些方法对字幕识别是可行的。 展开更多
关键词 视频字幕 汉字特征提取 特征相似度
在线阅读 下载PDF
条件随机场与多层算法模型的实体自动识别 被引量:3
19
作者 刘殷 吕学强 刘坤 《计算机工程与应用》 CSCD 北大核心 2016年第11期141-147,共7页
实体自动识别技术是人们获取信息的有力手段,也是自然语言处理研究的关键技术之一。目前命名实体识别的研究较多,且已趋于成熟,而对汉语文本中的其他实体(名词性、代词性)研究较少。因此提出了一体化识别命名实体识别和名词性实体的方法... 实体自动识别技术是人们获取信息的有力手段,也是自然语言处理研究的关键技术之一。目前命名实体识别的研究较多,且已趋于成熟,而对汉语文本中的其他实体(名词性、代词性)研究较少。因此提出了一体化识别命名实体识别和名词性实体的方法,该方法将实体的汉字、分词、词性标注等信息引入条件随机场;再利用多层算法模型优化已经识别出的实体,以及召回未识别出的实体。在标准ACE语料库上进行实验,正确率达到75.56%,召回率达到72.52%。结果表明该方法对于实体识别问题是有效的。 展开更多
关键词 实体识别 条件随机场 分词 多层算法模型
在线阅读 下载PDF
一种噪声无关的图像复原算法研究 被引量:1
20
作者 杨梅 吕学强 +1 位作者 马信龙 施水才 《计算机应用与软件》 CSCD 北大核心 2014年第5期191-196,共6页
目前获取数字图像的方法存在使图像质量明显下降的问题,迫切需要图像复原的方法,对图像进行重建。在已知点扩散函数的情况下,通过摒弃传统的依赖噪声求出增益矩阵的过程,从修复增益矩阵出发,使复原后的图像更接近原始图像。新方法在递... 目前获取数字图像的方法存在使图像质量明显下降的问题,迫切需要图像复原的方法,对图像进行重建。在已知点扩散函数的情况下,通过摒弃传统的依赖噪声求出增益矩阵的过程,从修复增益矩阵出发,使复原后的图像更接近原始图像。新方法在递推过程中矫正增益滤波偏大或偏小的现象,从而减少因为缺少噪声信息而产生的误差,而且相较于其他迭代算法,该方法时间复杂度较低。实验结果表明新方法可以有效地保证复原图像质量,并提高效率。 展开更多
关键词 卡尔曼滤波 增益矩阵 噪声估计 迭代算法 噪声
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部