期刊文献+
共找到183篇文章
< 1 2 10 >
每页显示 20 50 100
基于Cookie劫持的Deep-Web用户数据安全性分析 被引量:3
1
作者 王昆 沙瀛 谭建龙 《计算机研究与发展》 EI CSCD 北大核心 2012年第S2期17-22,共6页
随着互联网的发展,人们越来越习惯于使用以社交网络和电子商务为代表的Deep-Web网站.由于Deep-Web包含了大量的用户信息,其安全性日益引发广泛关注.通过对主流社交网络和电子商务网站实施Cookie劫持攻击实验,发现虽然Deep-Web网站提供... 随着互联网的发展,人们越来越习惯于使用以社交网络和电子商务为代表的Deep-Web网站.由于Deep-Web包含了大量的用户信息,其安全性日益引发广泛关注.通过对主流社交网络和电子商务网站实施Cookie劫持攻击实验,发现虽然Deep-Web网站提供了诸如HTTPS协议等的安全保障措施,但大多数并不能抵御Cookie劫持攻击.攻击者可以仿冒合法用户行为,获取用户信息.最后,对实验结果进行了分析,并给出了安全建议. 展开更多
关键词 deep-web Cookie劫持 安全
在线阅读 下载PDF
区块链系统中反洗钱技术研究综述 被引量:1
2
作者 刘乐源 李湘叶 +7 位作者 蓝天 程亚坤 陈伟 李智鑫 曹晟 韩伟力 张小松 柴洪峰 《中国工程科学》 北大核心 2025年第2期287-303,共17页
在全球金融格局深刻变化的背景下,区块链技术成为Web 3.0金融的重要基础设施、全球金融科技发展的制高点,不法分子也在利用区块链技术规避监管审查、进行洗钱等非法交易,威胁着国家和全球金融安全;亟需梳理现有的反洗钱技术研究进展,前... 在全球金融格局深刻变化的背景下,区块链技术成为Web 3.0金融的重要基础设施、全球金融科技发展的制高点,不法分子也在利用区块链技术规避监管审查、进行洗钱等非法交易,威胁着国家和全球金融安全;亟需梳理现有的反洗钱技术研究进展,前瞻区块链系统中反洗钱技术研究方向,更好应对区块链技术应用伴生的新型金融安全挑战。本文阐述了传统反洗钱模式、区块链系统中的洗钱模式等反洗钱技术研究背景,辨识出反洗钱任务面临的迫切挑战;按照设置交易参数的阈值、地址与实体关联分析、跨链关联分析等基于规则的反洗钱方法,支持向量机、逻辑回归、决策树、随机森林、k均值聚类、结合链下信息等基于传统机器学习的反洗钱方法,卷积神经网络、循环神经网络、图神经网络、Transformer等基于深度学习的反洗钱方法的分类,全面梳理了区块链系统中反洗钱技术的研究现状,辨识了相关技术的应用特性,讨论了支持反洗钱研究的常用数据集。展望区块链系统中反洗钱技术发展,需在面向不平衡数据、不确定性标注的反洗钱数据集构建,可信反洗钱算法研究,针对隐蔽交易的反洗钱机制研究,兼顾隐私性和可监管性的新技术研发等方面开展部署,提高我国区块链系统中反洗钱技术能力,保障数字经济安全发展。 展开更多
关键词 反洗钱 区块链系统 机器学习 深度学习 数据集 Web 3.0
在线阅读 下载PDF
基于网络论坛数据的未满足用户需求挖掘方法研究 被引量:1
3
作者 李奕潼 徐照光 党延忠 《管理学报》 北大核心 2025年第1期125-134,共10页
为帮助企业改进产品,提出一种基于网络论坛数据的两阶段用户需求挖掘方法。第一阶段利用卷积神经网络模型,识别包含未满足用户需求的文本;第二阶段采用双向长短期记忆网络-条件随机场模型,从未满足用户需求的文本中提取用户观点四元组(... 为帮助企业改进产品,提出一种基于网络论坛数据的两阶段用户需求挖掘方法。第一阶段利用卷积神经网络模型,识别包含未满足用户需求的文本;第二阶段采用双向长短期记忆网络-条件随机场模型,从未满足用户需求的文本中提取用户观点四元组(主题,对象,属性,属性值),并转化为用户需求四元组(主题,对象,属性,属性期望值)。选取汽车之家论坛上某车系数据进行实验,研究表明,该挖掘方法通过构建四元组结构来表示用户需求,从细粒度层面展示产品特征,并逐层钻取需求细节,减小需求不确定性,明确具体的用户需求,从而提高产品竞争力。并通过比较说明该方法的可行性和有效性。 展开更多
关键词 用户需求 网络论坛 深度学习 用户生成内容
在线阅读 下载PDF
基于网络搜索数据和深度神经网络的社会消费品零售总额预测研究
4
作者 程开明 刘书成 +1 位作者 雷洛 陈晓颖 《运筹与管理》 CSSCI CSCD 北大核心 2024年第12期203-209,I0091-I0096,共13页
为弥补传统预测变量及预测技术的不足,本文基于深度学习长期和短期时间序列网络(LSTNet),结合网络搜索数据与政府统计指标,构建LSTNet&BI模型开展浙江省及地级市社会消费品零售总额的预测研究。研究发现:(1)引入网络搜索数据能够有... 为弥补传统预测变量及预测技术的不足,本文基于深度学习长期和短期时间序列网络(LSTNet),结合网络搜索数据与政府统计指标,构建LSTNet&BI模型开展浙江省及地级市社会消费品零售总额的预测研究。研究发现:(1)引入网络搜索数据能够有效提高LSTNet模型的预测性能与预测精度;(2)LSTNet&BI模型具有较好的泛化能力,对浙江省社会消费品零售总额的短期和长期预测效果较稳定,其预测性能与预测精度均优于其他基准模型;(3)LSTNet&BI模型具备较强的稳健性,对杭州市、绍兴市和衢州市社会消费品零售总额的预测效果也较好。 展开更多
关键词 社会消费品零售总额 网络搜索数据 深度神经网络 LSTNet&BI模型
在线阅读 下载PDF
JGZ97型万米超深井钻机死绳固定器研制与安全性研究
5
作者 秦赛博 易先中 +3 位作者 蔡星星 张徐文 王利军 张玺亮 《石油钻探技术》 CAS CSCD 北大核心 2024年第2期236-242,共7页
针对死绳固定器绳轮强度、安全裕度不足和结构失稳等安全问题,根据JZG97型万米超深井钻机死绳固定器绳轮受力及结构特点,提出采用增加腹板的方法来解决死绳固定器绳轮存在的问题。采用有限元法数值模拟,分析了不同腹板绳轮的结构力学性... 针对死绳固定器绳轮强度、安全裕度不足和结构失稳等安全问题,根据JZG97型万米超深井钻机死绳固定器绳轮受力及结构特点,提出采用增加腹板的方法来解决死绳固定器绳轮存在的问题。采用有限元法数值模拟,分析了不同腹板绳轮的结构力学性能,三腹板绳轮的强度、安全裕度均满足钻井作业时的安全要求,确定采用三腹板绳轮。实物测试试验中,三腹板绳轮仿真结果与试验结果的最大相对误差为12.95%,综合分析仿真结果与实验结果基本吻合;线性屈曲分析表明,最大死绳拉力作用下的三腹板绳轮临界屈曲载荷为绳轮实际受载的48.8倍,满足结构稳定性要求。研究表明,三腹板绳轮可以解决死绳固定器绳轮存在的问题,可以为万米超深井钻机结构设计提供支持。 展开更多
关键词 死绳固定器绳轮 万米深井钻机 腹板 绳轮增强设计 试验测试 安全性 线性屈曲 稳定性
在线阅读 下载PDF
基于UNet深度学习的VLCC横框架拓扑优化分析 被引量:1
6
作者 李振荣 夏利娟 冯朔 《中国舰船研究》 CSCD 北大核心 2024年第6期108-116,共9页
[目的]为将人工智能技术应用于复杂船舶结构优化设计,提出一种基于UNet的船体横框架拓扑优化方法。[方法]以某超大型油轮(VLCC)横框架为研究对象,首先根据优化数学原理创建UNet拓扑优化代理模型,然后将有限元网格物理量映射为张量,获得... [目的]为将人工智能技术应用于复杂船舶结构优化设计,提出一种基于UNet的船体横框架拓扑优化方法。[方法]以某超大型油轮(VLCC)横框架为研究对象,首先根据优化数学原理创建UNet拓扑优化代理模型,然后将有限元网格物理量映射为张量,获得供模型训练的数据集,最后采用交并比(IoU)方法对训练结果进行评估,并将该方法与SIMP法进行拓扑构型对比。[结果]结果显示,所提拓扑优化方法能够快速输出设计域的材料布局,与SIMP拓扑优化相比可以更加高效地获得结构拓扑构型。[结论]所提拓扑优化方法可为船舶横框架结构提供一种新型的设计手段。 展开更多
关键词 船舶设计 人工智能 形状优化 拓扑优化 深度学习 UNet 代理模型 数据映射 船舶横框架
在线阅读 下载PDF
Deep Web数据集成研究综述 被引量:137
7
作者 刘伟 孟小峰 孟卫一 《计算机学报》 EI CSCD 北大核心 2007年第9期1475-1489,共15页
随着World Wide Web(WWW)的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长.这些信息要通过查询接口在线访问其后端的Web数据库.尽管丰富的信息蕴藏在Deep Web中,由于Deep Web数据的异构性和动态性,有效地把这些信... 随着World Wide Web(WWW)的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长.这些信息要通过查询接口在线访问其后端的Web数据库.尽管丰富的信息蕴藏在Deep Web中,由于Deep Web数据的异构性和动态性,有效地把这些信息加以利用是一件十分挑战性的工作.Deep Web数据集成至今仍然是一个新兴的研究领域,其中包含有若干需要解决的问题.总体来看,在该领域已经开展了大量的研究工作,但各个方面发展并不均衡.文中提出了一个Deep Web数据集成的系统架构,依据这个系统架构对Deep Web数据集成领域中若干关键研究问题的现状进行了回顾总结,并对未来的研究发展方向作了较为深入的探讨分析. 展开更多
关键词 World Wide WEB DEEP WEB WEB数据库 查询接口 DEEP WEB数据集成
在线阅读 下载PDF
基于结果模式的Deep Web数据抽取 被引量:15
8
作者 马安香 张斌 +2 位作者 高克宁 齐鹏 张引 《计算机研究与发展》 EI CSCD 北大核心 2009年第2期280-288,共9页
高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep Web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式... 高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep Web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式生成和数据抽取两个阶段,属性语义标注放在结果模式生成阶段来完成,有效解决了重复语义标注问题;同时针对嵌套属性问题,提出一种有效的解决方法.与同类成果相比,基于结果模式的数据抽取方法提高了数据抽取的准确率及效率,并且为Deep Web数据集成奠定了良好的基础. 展开更多
关键词 DEEP WEB 数据集成 数据抽取 结果模式 语义标注 网页数据特征矩阵
在线阅读 下载PDF
基于网页上下文的Deep Web数据库分类 被引量:31
9
作者 马军 宋玲 +1 位作者 韩晓晖 闫泼 《软件学报》 EI CSCD 北大核心 2008年第2期267-274,共8页
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属... 讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较. 展开更多
关键词 DEEP Web 隐式Web 数据库分类 内容文本抽取 语义分类
在线阅读 下载PDF
一种基于语义及统计分析的DeepWeb实体识别机制 被引量:18
10
作者 寇月 申德荣 +1 位作者 李冬 聂铁铮 《软件学报》 EI CSCD 北大核心 2008年第2期194-208,共15页
分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合... 分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合等问题.SS-EIM主要由文本匹配模型、语义分析模型和分组统计模型组成,采用文本粗略匹配、表象关联关系获取以及分组统计分析的三段式逐步求精策略,基于文本特征、语义信息及约束规则来不断精化识别结果;根据可获取的有限的实例信息,采用静态分析、动态协调相结合的自适应知识维护策略,构建和完善表象关联知识库,以适应Web数据的动态性并保证表象关联知识的完备性.通过实验验证了SS-EIM中所采用的关键技术的可行性和有效性. 展开更多
关键词 DEEP WEB 数据集成 实体识别 数据消重 表象整合
在线阅读 下载PDF
基于本体的Deep Web数据标注 被引量:28
11
作者 袁柳 李战怀 陈世亮 《软件学报》 EI CSCD 北大核心 2008年第2期237-245,共9页
借鉴语义Web领域中深度标注的思想,提出了一种对Web数据库查询结果进行语义标注的方法.为了获得完整且一致的标注结果,将领域本体作为Web数据库遵循的全局模式引入到查询结果语义标注过程中.对查询接口及查询结果特征进行详细分析,并采... 借鉴语义Web领域中深度标注的思想,提出了一种对Web数据库查询结果进行语义标注的方法.为了获得完整且一致的标注结果,将领域本体作为Web数据库遵循的全局模式引入到查询结果语义标注过程中.对查询接口及查询结果特征进行详细分析,并采用查询条件重置的策略,从而确定查询结果数据的语义标记.通过对多个不同领域Web数据库的测试,在具有领域本体支持的条件下,该方法能够对Web数据库查询结果添加正确的语义标记,从而验证了该方法的有效性. 展开更多
关键词 DEEP WEB 本体 语义标注 深度标注 模式匹配
在线阅读 下载PDF
一种基于图模型的Web数据库采样方法 被引量:29
12
作者 刘伟 孟小峰 凌妍妍 《软件学报》 EI CSCD 北大核心 2008年第2期179-193,共15页
Web数据库中,海量的信息隐藏在具有特定查询能力的查询接口后面,使人无法了解一个Web数据库内容的特征,比如主题的分布、更新的频率等,这就为DeepWeb数据集成带来了巨大的挑战.为了解决这个问题,提出了一种基于图模型的Web数据库采样方... Web数据库中,海量的信息隐藏在具有特定查询能力的查询接口后面,使人无法了解一个Web数据库内容的特征,比如主题的分布、更新的频率等,这就为DeepWeb数据集成带来了巨大的挑战.为了解决这个问题,提出了一种基于图模型的Web数据库采样方法,可以通过查询接口从Web数据库中以增量的方式获取近似随机的样本,即每次查询获取一定数量的样本记录,并且利用已经保存在本地的样本记录生成下一次的查询.该方法的一个重要特点是不受查询接口中属性表现形式的局限,因此是一种一般的Web数据库采样方法.在本地的模拟实验和真实Web数据库上的大量实验表明,该方法可以在较小代价下获得高质量的样本. 展开更多
关键词 DEEP WEB WEB数据库 数据库采样
在线阅读 下载PDF
基于模板和领域本体的Deep Web信息抽取研究 被引量:16
13
作者 顾韵华 高原 +1 位作者 高宝 杜杰 《计算机工程与设计》 CSCD 北大核心 2014年第1期327-332,共6页
为简化模板的抽取规则、提高抽取的准确率,提出了一种基于双模板和领域本体的Deep Web信息抽取方法。该方法采用DIV块模板和表格模板结合的方法,建立双模板。利用基于中文分词的网页预处理结果,在领域本体知识的指导下,通过C4.5决策树... 为简化模板的抽取规则、提高抽取的准确率,提出了一种基于双模板和领域本体的Deep Web信息抽取方法。该方法采用DIV块模板和表格模板结合的方法,建立双模板。利用基于中文分词的网页预处理结果,在领域本体知识的指导下,通过C4.5决策树算法来训练分类模型,筛选出待抽取的DIV块序号,构建DIV块模板,从而可以精确定位到数据块。利用XML技术构建XSLT文档,得到表格模板的抽取规则,从而抽取出数据片段。选取天气领域进行Deep Web信息抽取实验,实验结果表明,抽取准确率和召回率都可以达到95%以上,取得了较好的抽取效果。 展开更多
关键词 DEEP WEB 信息抽取 模板 领域本体 决策树
在线阅读 下载PDF
D-EEM:一种基于DOM树的Deep Web实体抽取机制 被引量:17
14
作者 寇月 李冬 +2 位作者 申德荣 于戈 聂铁铮 《计算机研究与发展》 EI CSCD 北大核心 2010年第5期858-865,共8页
随着Web数据库的不断增长,通过对Deep Web的访问逐渐成为获取信息的主要手段.如何有效地抽取Deep Web中结果页面所包含的实体信息成为一个值得研究的问题.通过分析Deep Web结果页面的特点,提出了一种基于DOM树的Deep Web实体抽取机制(DO... 随着Web数据库的不断增长,通过对Deep Web的访问逐渐成为获取信息的主要手段.如何有效地抽取Deep Web中结果页面所包含的实体信息成为一个值得研究的问题.通过分析Deep Web结果页面的特点,提出了一种基于DOM树的Deep Web实体抽取机制(DOM-tree based entity extraction mechanism for Deepweb,D-EEM),能够有效解决Deep Web环境中的实体抽取问题.D-EEM采用基于DOM树的自动实体抽取策略,利用DOM树中的文本内容和层次结构来确定数据区域和实体区域,提高了实体抽取的准确性;另外,提出了一种基于上下文距离和共现次数的语义标注方法,有效地将来自不同数据源的抽取结果进行合成.通过实验验证了D-EEM中所采用的关键技术的可行性和有效性,同其他实体抽取策略相比,D-EEM在抽取效率及抽取准确性等方面具有一定的优势. 展开更多
关键词 实体抽取 DOM树 DEEPWEB 数据区域定位 实体区域定位
在线阅读 下载PDF
深层网站Ajax页面数据采集研究综述 被引量:26
15
作者 杨俊峰 黎建辉 杨风雷 《计算机应用研究》 CSCD 北大核心 2013年第6期1606-1610,1616,共6页
如果能够提高网络爬虫采集Ajax网页数据的能力,必然会提高搜索引擎的覆盖率和准确率。因此,深层网站Ajax页面数据采集成为当前网络爬虫技术研究的热点之一。从深层网站Ajax页面数据采集的研究目标、近年来国内外采取的研究方法和取得的... 如果能够提高网络爬虫采集Ajax网页数据的能力,必然会提高搜索引擎的覆盖率和准确率。因此,深层网站Ajax页面数据采集成为当前网络爬虫技术研究的热点之一。从深层网站Ajax页面数据采集的研究目标、近年来国内外采取的研究方法和取得的成果(研究领域、采集流程、支撑技术)、未来的研究方向三个方面进行了综述。 展开更多
关键词 AJAX 深层网 WEB2 0 数据采集
在线阅读 下载PDF
关于中国Deep Web的规模、分布和结构 被引量:13
16
作者 赵朋朋 崔志明 +1 位作者 高岭 仲华 《小型微型计算机系统》 CSCD 北大核心 2007年第10期1799-1802,共4页
随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:1中国Deep Web查... 随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:1中国Deep Web查询接口往往位于站点浅层,94.6%的Deep Web查询接口出现在站点的前3层;2中国Deep Web大约有24,000个站点,28,000个Web数据库和74,000个查询接口;3中国Deep Web大部分是非结构化的,其中64%是非结构化的Web数据库;4中国Deep Web分布于多种不同的主题领域;5目前主要的中文搜索引擎已覆盖国内Deep Web大约二分之一的页面. 展开更多
关键词 DEEPWEB WEB数据库 查询接口
在线阅读 下载PDF
Deep Web集成服务的不确定模式匹配 被引量:14
17
作者 姜芳艽 孟小峰 贾琳琳 《计算机学报》 EI CSCD 北大核心 2008年第8期1412-1421,共10页
随着Deep Web的迅猛发展,从高度自治、异构及动态变化的Web数据库中,为用户提供高质量的数据逐渐成为当前Deep Web集成服务的一个研究热点.在大部分Web数据库只能通过查询接口为用户提供服务的前提下,如何建立用户请求与集成查询接口模... 随着Deep Web的迅猛发展,从高度自治、异构及动态变化的Web数据库中,为用户提供高质量的数据逐渐成为当前Deep Web集成服务的一个研究热点.在大部分Web数据库只能通过查询接口为用户提供服务的前提下,如何建立用户请求与集成查询接口模式之间以及集成查询接口模式与Web数据库查询接口模式之间的匹配关系,是Deep Web集成服务中进行合理的用户请求转换的关键.之前的相关工作都是寻找最佳的匹配结果,回避匹配的不确定性,丢弃了可能有价值的其他匹配结果.文中首先剖析了请求转换中模式匹配的不确定性,提出了数字类型的相似度计算方法,给出了进行数字类型的模式匹配的有效的剪枝方法以及数据类型驱动的模式匹配优化方法,并在此基础上提出了一种基于相似度计算的不确定性模式匹配方法,最后通过大量的实验证明了该方法的有效性. 展开更多
关键词 DEEP WEB 集成服务 相似度 模式匹配 不确定性
在线阅读 下载PDF
面向Deep Web的动态竞争情报智能采集策略 被引量:13
18
作者 张玉峰 吴金红 王翠波 《情报学报》 CSSCI 北大核心 2008年第4期624-630,共7页
企业间竞争互动的高强度与高速度,突显出竞争情报的时效性,动态竞争情报是企业在复杂多变的环境下取得成功的关键。Web资源可分为surface Web和Deep Web。Surface Web由静态网页构成,Deep Web信息资源由动态页面、商业数据库、实时... 企业间竞争互动的高强度与高速度,突显出竞争情报的时效性,动态竞争情报是企业在复杂多变的环境下取得成功的关键。Web资源可分为surface Web和Deep Web。Surface Web由静态网页构成,Deep Web信息资源由动态页面、商业数据库、实时数据和企业内部数据库组成,具有质量高、实时性强、易于深度分析的特点,是企业动态竞争情报的重要来源,但常规网络信息采集工具不能直接获得这些信息。针对动态竞争情报采集中存在的信息源选择、信息抽取、信息分析中存在的障碍,提出面向Deep Web的动态竞争情报智能采集策略,详细探讨了动态数据源的智能选择、查询结果的智能抽取、智能化的数据集成和智能分析策略。 展开更多
关键词 DEEP WEB 动态竞争情报 数据集成
在线阅读 下载PDF
一种应用于Deep Web数据集成系统中的查询松弛策略 被引量:5
19
作者 申德荣 马也 +2 位作者 聂铁铮 寇月 于戈 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期88-95,共8页
针对Deep Web环境中存在的失败查询,提出了一种有效的查询松弛策略.所有Deep Web资源按查询接口属性分组,组成全局数据源关系图(DRG);针对特定查询将DRG转换为对应该查询请求的数据源关系图;利用该DRG,按照特定的规则进行查询松弛和执... 针对Deep Web环境中存在的失败查询,提出了一种有效的查询松弛策略.所有Deep Web资源按查询接口属性分组,组成全局数据源关系图(DRG);针对特定查询将DRG转换为对应该查询请求的数据源关系图;利用该DRG,按照特定的规则进行查询松弛和执行处理.针对查询松弛导致的部分结果可能与用户查询请求的相似度较低的问题,提出先通过Skyline方法对结果进行筛选,然后再根据各个结果实例与用户查询的相似度进行Top-k排序,最后将最接近用户要求的结果集返回给用户.通过实验验证了提出的查询松弛策略的有效性. 展开更多
关键词 DEEP WEB 查询松弛 数据源关系图 TOP-K SKYLINE
在线阅读 下载PDF
面向混合类型关键词查询的非合作结构化深网数据源选择 被引量:6
20
作者 万常选 邓松 +2 位作者 刘德喜 江腾蛟 刘喜平 《计算机研究与发展》 EI CSCD 北大核心 2014年第4期905-917,共13页
为有效地利用深网中的资源,深网集成应运而生.为了提高深网集成的效率和返回结果的质量,数据源选择成为深网集成的关键技术.深网数据源大多数是结构化和非合作型的.当前已有的非合作结构化深网数据源选择的研究分为2类:一类是面向离散... 为有效地利用深网中的资源,深网集成应运而生.为了提高深网集成的效率和返回结果的质量,数据源选择成为深网集成的关键技术.深网数据源大多数是结构化和非合作型的.当前已有的非合作结构化深网数据源选择的研究分为2类:一类是面向离散型关键词查询的源选择;另一类是面向字符型关键词查询的源选择,而未见面向混合类型关键词查询的结构化数据源选择的相关研究.基于此,将用户查询关键词分为检索型关键词和约束型关键词,基于主题词与主题词、主题词与特征词和直方图与直方图的关联特征构建了面向检索型、约束型混合关键词查询的层次化数据源摘要,有效地反映了非合作结构化深网数据源选择中检索型关键词的检索意图和约束型关键词的约束相关性,并依据此摘要给出了相应的数据源选择策略.实验结果表明,该方法在面向混合类型关键词查询的非合作结构化深网数据源选择时具有较好的记录召回率及准确率. 展开更多
关键词 混合类型关键词检索 非合作 结构化 深网 数据源选择
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部