检索结果-维普期刊中文期刊服务平台

Web页面信息主动检索模型被引量：1: 1; 作者袁鼎荣钟宁《智能系统学报》 2010年第2期112-116,共5页; 单个页面信息量远远大于特定用户对页面中的信息需求.为快速准确从当前页面中获取特定用户所需求的兴趣信息,提出了页面信息主动检索模型.该检索模型中,根据页面Block特点将当前Web页面转化成信息树,根据用户过去的浏览行为构造用户特征... 展开更多; 关键词页面Block 页面信息树用户特征树主动检索; 在线阅读下载PDF 职称材料

生产管理与Web页面信息管理: 2; 作者夏骄雄许华虎施振夏《计算机工程》 CAS CSCD 北大核心 1997年第S1期160-162,共3页; 文章从分析当前企业生产管理中较流行的JIT管理原理出发,探讨了“看板”管理如何应用到Web页面信息管理的可能性,以期为Web页面信息管理的有序化和规范化提供新的思路。; 关键词 JIT管理原理 Web页面信息管理 “看板”管理; 在线阅读下载PDF 职称材料

一种区分索引与信息的网页分类数学模型及证明: 3; 作者王树西夏增艳《计算机科学》 CSCD 北大核心 2014年第B11期307-312,共6页; 综述了网页分类的国内外研究现状,分析了网页分类的核心技术,包括思想、算法、公式、评测标准。为了打击非法网络传销,必须对传销网页进行准确识别与分类。根据网页中"最大内容段"的长度,计算出这个网页为"信息网页"... 展开更多; 关键词网页分类索引页面信息页面网络传销网络传销国家监控中心; 在线阅读下载PDF 职称材料

基于多种策略的页面内容提取算法被引量：4: 4; 作者高琰谷士文谭立球《西南交通大学学报》 EI CSCD 北大核心 2007年第4期473-477,共5页; 针对W eb页面存在与主题无关的噪音的问题,提出了基于页面结构与页面内容相结合的多策略页面内容提取算法.该算法根据改进的VIPS(基于视觉信息的页面分割算法)生成页面的块结构树,通过定义内聚度阈值和块结构树的最大深度,实现了块结构... 展开更多; 关键词 VIPS(基于视觉信息的页面分割算法) 内聚度最大深度内容信息结构信息; 在线阅读下载PDF 职称材料

页面图文模型与元素特征归纳: 5; 作者于龙王金龙《计算机工程与科学》 CSCD 北大核心 2013年第4期136-143,共8页; 针对以图文内容为核心的页面信息抽取,以形式化的方式提出了对页面进行元素分析的理论模型。通过定义基础元素集与变换规则,页面图文模型简化了页面DOM树结构,并展现出页面内元素的图文特征。在此基础上,通过定义元素分类相似度,从页面... 展开更多; 关键词页面信息抽取页面元素图文模型特征归纳; 在线阅读下载PDF 职称材料

Relevance-based content extraction of HTML documents: 6; 作者吴麒陈兴蜀 +1 位作者朱锴王春晖《Journal of Central South University》 SCIE EI CAS 2012年第7期1921-1926,共6页; Content extraction of HTML pages is the basis of the web page clustering and information retrieval,so it is necessary to eliminate cluttered information and very important to extract content of pages accurately.A nove... 展开更多; 关键词 content extraction DOM NODE RELEVANCE information block; 在线阅读下载PDF 职称材料

题名Web页面信息主动检索模型被引量：1: 1; 作者袁鼎荣钟宁; 机构北京工业大学国际WIC研究院广西师范大学计算机科学与信息工程学院; 出处《智能系统学报》 2010年第2期112-116,共5页; 基金国家自然科学基金重大研究计划资助项目(90718020) 澳大利亚ARC资助项目(Australian Research Council Discovery Grant DP0667060); 文摘单个页面信息量远远大于特定用户对页面中的信息需求.为快速准确从当前页面中获取特定用户所需求的兴趣信息,提出了页面信息主动检索模型.该检索模型中,根据页面Block特点将当前Web页面转化成信息树,根据用户过去的浏览行为构造用户特征树,挖掘用户特征树产生用户需求信息集,然后从当前页面中检索需求的信息,获取用户兴趣信息集.详述了主动检索的基本原理,给出了相应的算法描述,并通过实验证明了该模型具有可行性.; 关键词页面Block 页面信息树用户特征树主动检索; Keywords Web Block page information tree user especial tree initiative retrieval; 分类号 TP391.3 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名生产管理与Web页面信息管理: 2; 作者夏骄雄许华虎施振夏; 机构上海大学计算机科学系; 出处《计算机工程》 CAS CSCD 北大核心 1997年第S1期160-162,共3页; 文摘文章从分析当前企业生产管理中较流行的JIT管理原理出发,探讨了“看板”管理如何应用到Web页面信息管理的可能性,以期为Web页面信息管理的有序化和规范化提供新的思路。; 关键词 JIT管理原理 Web页面信息管理 “看板”管理; Keywords The theory of Just In Time Management Information management on Web-pages Current-board management; 分类号 TP393.09 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名一种区分索引与信息的网页分类数学模型及证明: 3; 作者王树西夏增艳; 机构对外经济贸易大学信息学院北京邮电大学民族教育学院; 出处《计算机科学》 CSCD 北大核心 2014年第B11期307-312,共6页; 基金对外经济贸易大学"信息学院基金"(13YBLG02 X12511)资助; 文摘综述了网页分类的国内外研究现状,分析了网页分类的核心技术,包括思想、算法、公式、评测标准。为了打击非法网络传销,必须对传销网页进行准确识别与分类。根据网页中"最大内容段"的长度,计算出这个网页为"信息网页"的概率,通过严格的数学公式推导得到数学模型。本数学模型已经得到应用,"网络传销国家监控中心"用这个模型有效地对网络传销网页集合进行了分类。; 关键词网页分类索引页面信息页面网络传销网络传销国家监控中心; Keywords Web page classification Indexed page information page Internet pyramid selling National MLM monitor center; 分类号 TP392 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于多种策略的页面内容提取算法被引量：4: 4; 作者高琰谷士文谭立球; 机构中南大学信息科学与工程学院; 出处《西南交通大学学报》 EI CSCD 北大核心 2007年第4期473-477,共5页; 文摘针对W eb页面存在与主题无关的噪音的问题,提出了基于页面结构与页面内容相结合的多策略页面内容提取算法.该算法根据改进的VIPS(基于视觉信息的页面分割算法)生成页面的块结构树,通过定义内聚度阈值和块结构树的最大深度,实现了块结构树中不同区域内不同分块粒度的要求;根据W eb页面提供的结构信息和内容信息提取块结构树叶子节点中的"主题"块和"主题相关"块;最后,对主题块和主题相关块的内容进行合并,提取页面的主要内容.实验表明,对任意下载、不同内容类型的页面,该算法都能有效地提取页面内容.; 关键词 VIPS(基于视觉信息的页面分割算法) 内聚度最大深度内容信息结构信息; Keywords VIPS （ visual based page segment） degree of coherence maximum depth content information structure information; 分类号 TP393.092 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名页面图文模型与元素特征归纳: 5; 作者于龙王金龙; 机构解放军理工大学; 出处《计算机工程与科学》 CSCD 北大核心 2013年第4期136-143,共8页; 基金国家863计划资助项目(2010AA012404); 文摘针对以图文内容为核心的页面信息抽取,以形式化的方式提出了对页面进行元素分析的理论模型。通过定义基础元素集与变换规则,页面图文模型简化了页面DOM树结构,并展现出页面内元素的图文特征。在此基础上,通过定义元素分类相似度,从页面图文模型的元素特征中进行优选,归纳最佳分类特征,提出并实现了获取最佳分类特征集与识别阈值的算法。实验结果表明,页面图文模型简化了页面元素的规模,特征集归纳算法能够在较小的学习成本下获得理想的分类精度。; 关键词页面信息抽取页面元素图文模型特征归纳; Keywords web extraction web page element i picture-text model feature induction; 分类号 TP393.09 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名Relevance-based content extraction of HTML documents: 6; 作者吴麒陈兴蜀朱锴王春晖; 机构 Network and Trusted Computing Institute; 出处《Journal of Central South University》 SCIE EI CAS 2012年第7期1921-1926,共6页; 基金 Project(2012BAH18B05) supported by the Supporting Program of Ministry of Science and Technology of China; 文摘 Content extraction of HTML pages is the basis of the web page clustering and information retrieval,so it is necessary to eliminate cluttered information and very important to extract content of pages accurately.A novel and accurate solution for extracting content of HTML pages was proposed.First of all,the HTML page is parsed into DOM object and the IDs of all leaf nodes are generated.Secondly,the score of each leaf node is calculated and the score is adjusted according to the relationship with neighbors.Finally,the information blocks are found according to the definition,and a universal classification algorithm is used to identify the content blocks.The experimental results show that the algorithm can extract content effectively and accurately,and the recall rate and precision are 96.5% and 93.8%,respectively.; 关键词 content extraction DOM NODE RELEVANCE information block; Keywords HTML文件提取 HTML页面关联信息检索网页内容分类算法 DOM; 分类号 TP393.092 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	Web页面信息主动检索模型	袁鼎荣钟宁	《智能系统学报》	2010	1	在线阅读下载PDF 职称材料
2	生产管理与Web页面信息管理	夏骄雄许华虎施振夏	《计算机工程》 CAS CSCD 北大核心	1997	0	在线阅读下载PDF 职称材料
3	一种区分索引与信息的网页分类数学模型及证明	王树西夏增艳	《计算机科学》 CSCD 北大核心	2014	0	在线阅读下载PDF 职称材料
4	基于多种策略的页面内容提取算法	高琰谷士文谭立球	《西南交通大学学报》 EI CSCD 北大核心	2007	4	在线阅读下载PDF 职称材料
5	页面图文模型与元素特征归纳	于龙王金龙	《计算机工程与科学》 CSCD 北大核心	2013	0	在线阅读下载PDF 职称材料
6	Relevance-based content extraction of HTML documents	吴麒陈兴蜀朱锴王春晖	《Journal of Central South University》 SCIE EI CAS	2012	0	在线阅读下载PDF 职称材料