检索结果-维普期刊中文期刊服务平台

Deep Web数据采集查询构造方法研究被引量：2: 1; 作者林海伦杨晓刚 +3 位作者熊锦华王元卓贾岩涛程学旗《计算机科学与探索》 CSCD 北大核心 2015年第9期1025-1033,共9页; 网络大数据的大规模、多源异构、动态更新、高噪声给知识的获取带来了很大的挑战。特别地,很多网站隐藏在HTML表单后端的Web数据库中的Deep Web数据,只能通过提交表单查询的方式进行动态访问,网络爬虫难以通过页面之间的链接关系采集到... 展开更多; 关键词 DEEP WEB 查询接口查询构造网络爬虫; 在线阅读下载PDF 职称材料

基于本体推理的终端用户数据查询构造方法被引量：5: 2; 作者唐爽王亚沙 +2 位作者赵俊峰王江涛夏丁《软件学报》 EI CSCD 北大核心 2019年第5期1532-1546,共15页; 基于数据分析的智能决策对提升企业竞争力具有重要意义.根据待分析的问题,从内部信息系统的数据库中查询并获取与问题密切相关且信息完整的数据,是企业数据分析过程中的关键环节.基于本体的可视化数据查询系统为不掌握计算机专业技能的... 展开更多; 关键词终端用户数据访问基于本体的数据访问可视化查询构造可视化查询系统; 在线阅读下载PDF 职称材料

从Web获取部分整体关系语料的方法被引量：4: 3; 作者曹馨宇曹存根《中文信息学报》 CSCD 北大核心 2011年第5期17-23,共7页; 部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚... 展开更多; 关键词部分整体关系获取语料获取查询构造; 在线阅读下载PDF 职称材料

2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告: 4; 作者张志昌张宇 +4 位作者高立琦袁新成胡晓光刘挺李生《中文信息学报》 CSCD 北大核心 2006年第B03期83-90,共8页; 首先用向量空间模型工具Lucene从全部网页正文信息中检索，再用语言模型工具Lemur对结果集进行重排序，然后将两次的结果进行融合，远回融合结果的前1000篇文档作为最终结果集。构造查询输入时，从主题的〈title〉字段和〈dese〉字段选... 展开更多; 关键词查询构造向量空间模型语言模型结果融合; 在线阅读下载PDF 职称材料

题名Deep Web数据采集查询构造方法研究被引量：2: 1; 作者林海伦杨晓刚熊锦华王元卓贾岩涛程学旗; 机构中国科学院计算技术研究所网络数据科学与技术重点实验室新华社技术局实验室; 出处《计算机科学与探索》 CSCD 北大核心 2015年第9期1025-1033,共9页; 基金国家自然科学基金Nos.61173008 61232010 +5 种基金 61303244 61402442 2013CB329602 北京市自然科学基金No.4154086~~; 文摘网络大数据的大规模、多源异构、动态更新、高噪声给知识的获取带来了很大的挑战。特别地,很多网站隐藏在HTML表单后端的Web数据库中的Deep Web数据,只能通过提交表单查询的方式进行动态访问,网络爬虫难以通过页面之间的链接关系采集到这些数据,影响了获取到的知识资源的覆盖率,如何高效地采集这些数据并加以利用非常具有挑战性。为此对现有的Deep Web数据采集的查询构造方法进行了详细分析,分别介绍了针对不同类型的表单对应的Deep Web数据采集查询构造方法;总结了现有表层化方式的Deep Web数据采集查询构造方法的优缺点,并对Deep Web数据采集查询构造方法的未来工作进行了展望,以推动Deep Web数据采集技术的进一步发展。; 关键词 DEEP WEB 查询接口查询构造网络爬虫; Keywords Deep Web query interface query construction Web crawler; 分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于本体推理的终端用户数据查询构造方法被引量：5: 2; 作者唐爽王亚沙赵俊峰王江涛夏丁; 机构高可信软件技术教育部重点实验室(北京大学) 北京大学信息科学技术学院软件工程国家工程中心(北京大学) 北京大学(天津滨海)新一代信息技术研究院; 出处《软件学报》 EI CSCD 北大核心 2019年第5期1532-1546,共15页; 基金国家自然科学基金(61772045) 国家重点研发计划(2017YFB1002002)~~; 文摘基于数据分析的智能决策对提升企业竞争力具有重要意义.根据待分析的问题,从内部信息系统的数据库中查询并获取与问题密切相关且信息完整的数据,是企业数据分析过程中的关键环节.基于本体的可视化数据查询系统为不掌握计算机专业技能的终端用户提供了高效获取数据的手段,近年来成为研究热点.然而现有工作仅采用简单的映射规则,将数据库中的表、字段、外键关系等元素直接映射为本体中的概念、属性和关系,向终端用户暴露了过多数据库设计的技术细节,增加了用户理解的难度,降低了系统的可用性.而通过人工编写映射规则来屏蔽数据库细节,既低效又缺乏通用性.针对这一问题,提出了一种基于推理的终端用户本体查询构造方法.该方法利用本体模型的语义表达能力和推理能力,在原有基于数据库简单映射所生成的本体模型基础上注入领域知识,从而优化查询构造流程,使终端用户得以从其更为熟悉的业务知识的视角,而非数据库设计的视角来看待和操纵数据,提高系统可用性;同时,增加了对分组统计的支持,扩展了方法的适用范围.最后,通过对"餐饮前台信息管理"领域真实案例的分析,验证了该方法相对于已有方法,其可用性提高了53.44%,表达能力提高了20.43%.; 关键词终端用户数据访问基于本体的数据访问可视化查询构造可视化查询系统; Keywords end user data access ontology-based data access visual query formulation visual query system; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名从Web获取部分整体关系语料的方法被引量：4: 3; 作者曹馨宇曹存根; 机构中国科学院计算技术研究所智能信息处理重点实验室中国科学院研究生院; 出处《中文信息学报》 CSCD 北大核心 2011年第5期17-23,共7页; 基金国家自然科学基金资助项目(60773059); 文摘部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚不支持语义搜索,如何构造有效的查询以得到富含部分整体关系的语料,从而进一步获取部分整体关系,就成为一个重要的问题。该文提出了一种新的查询构造方法,目的在于从Web中获取部分整体关系语料。该方法能够构造基于语境词的查询,进而利用现有的搜索引擎从Web中获取部分整体关系语料。该方法在两个方面与人工构造查询方法和基于语料库查询构造查询方法所获取的语料进行对比,其一是语料中含有部分整体关系的语句数量;二是从语料中进一步获取部分整体关系的难易程度。实验结果表明,该方法远远优于后两者。; 关键词部分整体关系获取语料获取查询构造; Keywords part-whole relation acquisition corpus acquisition query formulation; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告: 4; 作者张志昌张宇高立琦袁新成胡晓光刘挺李生; 机构哈尔滨工业大学信息检索研究室; 出处《中文信息学报》 CSCD 北大核心 2006年第B03期83-90,共8页; 基金国家自然科学基金资助项目（60435020,60575042,60503072）; 文摘首先用向量空间模型工具Lucene从全部网页正文信息中检索，再用语言模型工具Lemur对结果集进行重排序，然后将两次的结果进行融合，远回融合结果的前1000篇文档作为最终结果集。构造查询输入时，从主题的〈title〉字段和〈dese〉字段选择关键词，并依据tf＊idf的思想对关键词赋予权值。时正式评测的50个主题集检索，获得的三项评价指标为：程序自动构造查询时，MAP=0．3107，P@10=0．624，R-Preeision=0．3672；人工构造查询时，MAP=0．3538，P@10=0．684，R-Preelsion=0．4078。; 关键词查询构造向量空间模型语言模型结果融合; Keywords query formulation vector space model language model result combination; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	Deep Web数据采集查询构造方法研究	林海伦杨晓刚熊锦华王元卓贾岩涛程学旗	《计算机科学与探索》 CSCD 北大核心	2015	2	在线阅读下载PDF 职称材料
2	基于本体推理的终端用户数据查询构造方法	唐爽王亚沙赵俊峰王江涛夏丁	《软件学报》 EI CSCD 北大核心	2019	5	在线阅读下载PDF 职称材料
3	从Web获取部分整体关系语料的方法	曹馨宇曹存根	《中文信息学报》 CSCD 北大核心	2011	4	在线阅读下载PDF 职称材料
4	2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告	张志昌张宇高立琦袁新成胡晓光刘挺李生	《中文信息学报》 CSCD 北大核心	2006	0	在线阅读下载PDF 职称材料