检索结果-维普期刊中文期刊服务平台

基于HTML文档结构的向量空间模型的改进被引量：10: 1; 作者胡健陆一鸣马范援《情报学报》 CSSCI 北大核心 2005年第4期433-437,共5页; 根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型... 展开更多; 关键词 HTML文档结构信息检索向量空间模型链接文本TREC 向量空间模型 HTML文档文档结构向量模型分布特征检索性能标签; 在线阅读下载PDF 职称材料

基于音素解码的语种识别系统联合自适应算法研究被引量：3: 2; 作者邓妍张卫强刘加《自动化学报》 EI CSCD 北大核心 2012年第4期652-658,共7页; 针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系... 展开更多; 关键词语种识别音素识别器后接向量空间模型联合自适应受约束的最大似然线性回归支持向量机自适应; 在线阅读下载PDF 职称材料

改进的Web链接主题提取算法被引量：1: 3; 作者王卫玲刘培玉刘克非《计算机工程与设计》 CSCD 北大核心 2007年第2期294-296,共3页; HITS算法是影响相当广泛的链接分析算法。但是,深入的研究表明,它很容易产生主题漂移。而HITS算法产生主题漂移的很大一部分原因在于页面被投影到错误的潜在语义基上。提出一种基于权值调整的超链主题提取算法(weightedadjustments base... 展开更多; 关键词链接分析主题提取向量空间模型权值调整资源发现; 在线阅读下载PDF 职称材料

基于链接结构和内容相似度的聚焦爬虫系统被引量：3: 4; 作者倪贤贵蔡明《计算机工程与设计》 CSCD 北大核心 2008年第7期1709-1710,1763,共3页; 介绍了基于链接结构和内容相似度的主题Web Crawler系统结构,重点介绍了其中的联合网页链接结构和内容相似度来计算网页相关度算法。该算法计算种子网页集到抓取网页的链接数目和抓取网页到种子网页集的链接数目,及Web内容与主题的内容... 展开更多; 关键词聚焦爬虫链接结构内容相似度向量空间模型查准率; 在线阅读下载PDF 职称材料

基于网页结构与链接关系的中文文本分类方法被引量：3: 5; 作者郭晓蒋宗礼《现代电子技术》 2010年第22期54-56,63,共4页; 提出一种通过综合考虑网页的HTML结构信息以及网页间的链接关系,修改网页文本在向量空间模型表示中的权值,对网页进行分类的方法。考虑到页面里处在不同HTML标记下的内容具有不同的语义含义,某些特殊标记下的内容具有较重要的意义,对网... 展开更多; 关键词中文文本分类 HTML结构链接关系向量空间模型; 在线阅读下载PDF 职称材料

带参数的搜索引擎被引量：1: 6; 作者戴先宇王明文 +1 位作者吴水秀张石林《江西师范大学学报（自然科学版）》 CAS 2002年第4期344-348,共5页; 随着Internet上的信息量爆炸式地增长,当前的搜索引擎面临着许多巨大的挑战.该文针对现有搜索引擎中存在的问题提出了带参数的搜索引擎,并给出了参数策略和基于扩展的向量空间模型的识别器的设计.; 关键词机器人识别器搜索引擎向量空间模型参数策略数据库信息查询; 在线阅读下载PDF 职称材料

题名基于HTML文档结构的向量空间模型的改进被引量：10: 1; 作者胡健陆一鸣马范援; 机构上海交通大学计算机科学与工程系; 出处《情报学报》 CSSCI 北大核心 2005年第4期433-437,共5页; 基金国家自然科学基金; 文摘根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型对于这两个方面都有提高.; 关键词 HTML文档结构信息检索向量空间模型链接文本TREC 向量空间模型 HTML文档文档结构向量模型分布特征检索性能标签; Keywords html document structure, information retrieval, vector space model, anchor text, TREC.; 分类号 TP391 [自动化与计算机技术—计算机应用技术] TP311.1 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于音素解码的语种识别系统联合自适应算法研究被引量：3: 2; 作者邓妍张卫强刘加; 机构清华大学电子工程系清华信息科学与技术国家实验室(筹); 出处《自动化学报》 EI CSCD 北大核心 2012年第4期652-658,共7页; 基金国家自然科学基金(60931160443 61005019)资助~~; 文摘针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系统,引入联合自适应算法来解决系统中测试和训练条件的失配问题.研究了三种自适应方法用于系统的不同阶段:1)基于受约束的最大似然线性回归(Constr ained maximum likelihood linear regression,CMLLR)的声学模型自适应;2)基于全局N元文法的音位特征向量自适应;3)VSM模型中的支持向量机(Support vector machines,SVM)自适应.在综合采用多种自适应技术后,PRVSM系统的性能有了较大的提高,在NIST LRE 2009测试库上对于30s、10s和3s的测试段,基于不同音素识别器的PRVSM系统的等错误率(Equal errorrate,EER)分别相对降低了18%～23%、12%～20%以及5%～9%.; 关键词语种识别音素识别器后接向量空间模型联合自适应受约束的最大似然线性回归支持向量机自适应; Keywords Language recognition phone recognizer followed by vector space model（PRVSM） joint adaptation constrained maximum likelihood linear regression（CMLLR） adapt-support vector machines（SVM）; 分类号 TN912.34 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名改进的Web链接主题提取算法被引量：1: 3; 作者王卫玲刘培玉刘克非; 机构山东师范大学信息科学与工程学院; 出处《计算机工程与设计》 CSCD 北大核心 2007年第2期294-296,共3页; 文摘 HITS算法是影响相当广泛的链接分析算法。但是,深入的研究表明,它很容易产生主题漂移。而HITS算法产生主题漂移的很大一部分原因在于页面被投影到错误的潜在语义基上。提出一种基于权值调整的超链主题提取算法(weightedadjustments based hyperlinks topic distillation),先在获得根集的过程中,用改进的权值进行相似度计算,得到相对更为准确的个性化根集,再利用HITS算法计算Web页面的权威值和中心值。实验结果表明,基于权值调整的超链主题提取算法可以很好地改善HITS算法所导致的主题漂移问题,更适合于Web查询的需要。; 关键词链接分析主题提取向量空间模型权值调整资源发现; Keywords link analysis topic distillation VSM weighted adjustments resource discovery; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于链接结构和内容相似度的聚焦爬虫系统被引量：3: 4; 作者倪贤贵蔡明; 机构江南大学信息工程学院; 出处《计算机工程与设计》 CSCD 北大核心 2008年第7期1709-1710,1763,共3页; 文摘介绍了基于链接结构和内容相似度的主题Web Crawler系统结构,重点介绍了其中的联合网页链接结构和内容相似度来计算网页相关度算法。该算法计算种子网页集到抓取网页的链接数目和抓取网页到种子网页集的链接数目,及Web内容与主题的内容相似度,综合计算该网页的相关度权值,从中选择权威网页或hub网页作为种子网页,从而提高主题爬虫系统的爬行效率和抓取网页的查准率。; 关键词聚焦爬虫链接结构内容相似度向量空间模型查准率; Keywords focused crawler link structure content similarity VSM harvest ratio; 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于网页结构与链接关系的中文文本分类方法被引量：3: 5; 作者郭晓蒋宗礼; 机构北京工业大学计算机学院; 出处《现代电子技术》 2010年第22期54-56,63,共4页; 文摘提出一种通过综合考虑网页的HTML结构信息以及网页间的链接关系,修改网页文本在向量空间模型表示中的权值,对网页进行分类的方法。考虑到页面里处在不同HTML标记下的内容具有不同的语义含义,某些特殊标记下的内容具有较重要的意义,对网页的分类起较大的作用,因此对不同标记下的内容赋以不同的权值,可以提高分类效果。考虑到页面正文中链接指向的页面内容与原网页相关度较高,通过综合考虑这些页面的内容,可以有效加强类别关键词的权值,减少噪声,提高分类效果。经过实验证明这一方法提高了分类结果的F1值。; 关键词中文文本分类 HTML结构链接关系向量空间模型; Keywords Chinese text calssification HTML tags hyperlinks vector space model; 分类号 TN911-34 [电子电信—通信与信息系统] TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名带参数的搜索引擎被引量：1: 6; 作者戴先宇王明文吴水秀张石林; 机构中国南方证券有限公司信息技术总部江西师范大学计算机科学技术学院上海大学计算机科学技术学院; 出处《江西师范大学学报（自然科学版）》 CAS 2002年第4期344-348,共5页; 基金国家自然科学基金资助项目(69983003 60073033); 文摘随着Internet上的信息量爆炸式地增长,当前的搜索引擎面临着许多巨大的挑战.该文针对现有搜索引擎中存在的问题提出了带参数的搜索引擎,并给出了参数策略和基于扩展的向量空间模型的识别器的设计.; 关键词机器人识别器搜索引擎向量空间模型参数策略数据库信息查询; Keywords Robot identifying software search engine parametric intelligent search engine extended vector space model; 分类号 TP393.092 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于HTML文档结构的向量空间模型的改进	胡健陆一鸣马范援	《情报学报》 CSSCI 北大核心	2005	10	在线阅读下载PDF 职称材料
2	基于音素解码的语种识别系统联合自适应算法研究	邓妍张卫强刘加	《自动化学报》 EI CSCD 北大核心	2012	3	在线阅读下载PDF 职称材料
3	改进的Web链接主题提取算法	王卫玲刘培玉刘克非	《计算机工程与设计》 CSCD 北大核心	2007	1	在线阅读下载PDF 职称材料
4	基于链接结构和内容相似度的聚焦爬虫系统	倪贤贵蔡明	《计算机工程与设计》 CSCD 北大核心	2008	3	在线阅读下载PDF 职称材料
5	基于网页结构与链接关系的中文文本分类方法	郭晓蒋宗礼	《现代电子技术》	2010	3	在线阅读下载PDF 职称材料
6	带参数的搜索引擎	戴先宇王明文吴水秀张石林	《江西师范大学学报（自然科学版）》 CAS	2002	1	在线阅读下载PDF 职称材料