-
题名网络搜索引擎的用户查询分析
被引量:20
- 1
-
-
作者
杨文峰
李星
-
机构
清华大学电子工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第6期20-21,97,共3页
-
基金
863计划资助项目(863-306-ZD02-02-7)
-
文摘
利用教科网搜索引擎"网络指南针"的查询记录,就其中102439个用户的810396次查询,在用户查询方式、查询表达以及查询词3个层次上,对用户查询行为进行了分析,得到了搜索引擎用户查询的一般规律。根据上述结论对搜索引擎的进一步发展进行了讨论。
-
关键词
搜索引擎
日志分析
用户查询
Internet
信息检索
-
Keywords
Search engine;Log analysis;User behavior
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-
-
题名信息检索用户查询语句的停用词过滤
被引量:16
- 2
-
-
作者
熊文新
宋柔
-
机构
北京外国语大学中国外语教育研究中心
北京语言大学语言信息处理研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第6期195-197,共3页
-
基金
国家自然科学基金资助项目(60272055)
国家"863"计划基金资助项目(2001AA114111)
+1 种基金
教育部科学技术研究资助重点项目(00128)
教育部人文社会科学重点研究基地资助重大项目(02JAZJD740007)
-
文摘
针对以自然语言形式提出的查询请求,区分信息需求表述和信息内容两部分。基于近20万语句的查询语料库和背景语料人民日报对照,提出汉语通用停用词和查询专用的相对停用词,采用左右熵和Ngram方法及KL距离脱机构造相应候选词表。根据候选词语的Bigram属性和句中不同位置的分布特点,给出了在线动态识别停用词的方法。实验结果表明,该文的方法比单纯根据静态停用词表标注效果要好。
-
关键词
用户查询
停用词
构造
识别
-
Keywords
Users request
Stop word
Building
Identification
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于用户查询日志的命名实体挖掘
被引量:8
- 3
-
-
作者
翟海军
郭嘉丰
王小磊
许洪波
-
机构
中国科学技术大学计算机学院
中国科学院计算技术研究所
-
出处
《中文信息学报》
CSCD
北大核心
2010年第1期71-76,116,共7页
-
文摘
针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际上命名实体往往可能从属于多个类别。该文通过引入一个弱指导话题模型,利用少量的人工指导信息,很好地解决了实体的类别模糊性,提高了挖掘的有效性。实验表明该文提出的方法在实体挖掘性能上显著优于已有的方法。
-
关键词
计算机应用
中文信息处理
分开命名实体
用户查询日志
话题模型
-
Keywords
computer application
Chinese information processing
named entity
query log
topic model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于半监督话题模型的用户查询日志命名实体挖掘
被引量:6
- 4
-
-
作者
曹雷
郭嘉丰
白露
程学旗
-
机构
中国科学院计算技术研究所网络数据科学与工程研究中心
中国科学院研究生院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第5期26-32,共7页
-
基金
国家自然科学基金资助项目(60903139
60873243
+2 种基金
60933005)
国家863计划重点资助项目(2010AA012502
2010AA012503)
-
文摘
基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体具有歧义性、查询模板具有多义性和未标注实体信息,因而不能够有效的对候选实体进行排序。该文采用半监督话题模型,利用查询模板之间的关系来学习实体类别的模板分布,进而改善候选实体的排序效果。实验结果表明了该文提出方法的有效性。
-
关键词
用户查询日志
命名实体挖掘
半监督话题模型
-
Keywords
query log
named entity mining~ Semi-supervised Topic Model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种融合用户学习过程的用户查询意图模型
被引量:3
- 5
-
-
作者
张博
张斌
孙达明
张书波
-
机构
东北大学计算机科学与工程学院
沈阳大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第6期1640-1646,共7页
-
基金
国家自然科学基金资助项目(61572116
61572117
+4 种基金
61502089)
国家关键科技研发基金资助项目(2015BAH09F02)
省科技攻关项目(2015302002)
中央高校东北大学基本科研专项基金资助项目(N150408001
N150404009)
-
文摘
用户查询意图模型是查询扩展和查询推荐研究的一个热点。然而,日志包含的大量噪声对主流的用户查询意图模型构建过程具有较大负面影响,观察日志发现,用户试探性点击行为是日志噪声产生的一个主要原因,并由此提出了一种融合用户学习过程的用户查询意图模型。该模型对用户从试探性点击行为进行建模,从而对试探性点击行为进行识别和过滤。一系列实验结果表明,该模型在日志噪声较高的情况下能够有效过滤试探性点击产生的噪声,提高用户查询意图描述的准确率;将该模型应用于查询推荐过程后,能有效提高查询条件相似性计算的准确率,并提高查询推荐结果的准确率和召回率。
-
关键词
用户查询意图模型
不相关反馈
用户学习过程
查询推荐
-
Keywords
user intent model
irrelevant feedback
user studying process
query recommendation
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于用户查询行为模型的案例查询算法
被引量:3
- 6
-
-
作者
乔丽
姜慧霖
-
机构
商丘师范学院计算机科学系
-
出处
《计算机工程与应用》
CSCD
2012年第6期139-142,共4页
-
基金
商丘师范学院青年科研基金(No.2010QN12)
河南省政府决策研究一般招标课题(No.2011B590)
+1 种基金
河南省科技厅科技攻关项目(No.112102210120)
商丘师范学院教育教学改革研究项目(No.2010-jgxm-47)
-
文摘
传统的案例查询算法通过被动响应用户的查询请求为用户返回与查询请求相关的案例,忽略了用户查询行为能够对案例查询过程进行指导。提出了一个基于用户查询行为模型的案例查询算法,通过收集用户的查询请求,利用用户查询行为之间的相似度建立用户查询行为的分类模型;分析了用户查询行为的分类算法,重点论述了用户查询行为模型对案例查询过程的指导过程。实验结果表明,该方法能够有效地提高查询结果召回率以及查询成功率。
-
关键词
案例查询
用户查询行为
相似度
-
Keywords
case search
user search behavior
similarity
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名面向用户查询意图的句子相似度分层计算
被引量:3
- 7
-
-
作者
李景玉
张仰森
陈若愚
-
机构
北京信息科技大学智能处理信息研究所
-
出处
《计算机科学》
CSCD
北大核心
2015年第1期227-231,共5页
-
基金
国家自然科学基金(61070119
61370139)
+2 种基金
北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)
北京市教委专项(PXM2013_014224_000042
PXM2014_014224_000067)资助
-
文摘
为进一步提高句子相似度算法的准确性并提升其在复杂语境中的适用性,综合编辑距离、关键词及同义词语义方法,设计出面向用户查询意图的句子相似度分层算法。在充分分析实验数据用途的基础上,研究数据的特征分布,借助自然标注将句子相似度计算建模为多层次优化问题。经仿真实验证实该算法是有效的,F值可达到0.6019。
-
关键词
句子相似度计算
语义一致
编辑距离
关键词特征
用户查询意图
-
Keywords
Sentence similarity computation
Semantic conformity
Edit distance
Keyword feature
User query intention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名用MPEG-7 DDL表示用户查询需求的方法
被引量:1
- 8
-
-
作者
富亮
薛向阳
-
机构
复旦大学计算机科学与工程系
-
出处
《计算机科学》
CSCD
北大核心
2005年第2期100-105,共6页
-
基金
国家自然科学基金(60003017
60373020
+4 种基金
69935010)
八六三计划(2001AA114120
2002AA103065)
上海市科技发展基金(03DZ15019
03DZ14015)
-
文摘
随着ISO MPEG-7标准在多媒体信息检索领域的深入应用,如何描述用户的查询信息需求变得越来越重要,本文提出一种新的用户查询需求的表示方法。该方法的主要特点是充分考虑MPEG-7标准对多媒体内容的标准化描述特性,因此对用户提交的信息需求具有很强的表达能力和较好的通用性。
-
关键词
用户查询
MPEG-7标准
表示方法
DDL
描述
通用性
领域
多媒体内容
多媒体信息检索
标准化
-
Keywords
MPEG-7
DDL
Description scheme
Descriptor
Information retrieval
Query language
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TN919
[电子电信—通信与信息系统]
-
-
题名基于用户查询计划的优化策略
- 9
-
-
作者
王安娜
万鹏
禹亮
-
机构
西北工业大学软件与微电子学院
西安陆军学院计算机教研室
西安交通大学软件学院
-
出处
《科学技术与工程》
2007年第9期2095-2097,共3页
-
文摘
在数据库系统中,查询优化对于提高数据库性能具有重大意义。文中通过对数据库和SQL语句的研究,分别从这两方面提出了查询优化过程中对用户查询计划的优化策略,减少了查询的计算量,提高了查询的响应速度,显著提高了数据库性能,具有较强的可操作性和实用性。
-
关键词
用户查询计划
索引优化
SQL语句优化
-
Keywords
wser guery plan optimiged index SQL optimigation
-
分类号
TP311.56
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于用户查询日志的双级缓存结构设计
被引量:2
- 10
-
-
作者
梁敏
解萍
郝向宁
-
机构
空军大连通信士官学校基础部
-
出处
《信息网络安全》
2012年第6期44-46,50,共4页
-
文摘
文章针对目前分布式缓存系统命中率低和查询处理时间长的问题,在分析某中文搜索引擎于2009年9月查询日志集的用户查询特征和热点内容分布特征的基础上,设计并实现了包括静态缓存和动态缓存的双级缓存结构。最后,从理论分析和实验数据两方面,论证了基于查询日志的双级缓存结构在性能方面更具优越性。
-
关键词
分布式缓存系统
用户查询日志
双级缓存结构
-
Keywords
distributed caching system
user query log
two-level cache structure
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
-
-
题名金融信用信息基础数据库查询用户管理研究
被引量:3
- 11
-
-
作者
王俊山
-
机构
中国人民银行征信管理局
-
出处
《征信》
2015年第7期1-3,共3页
-
文摘
金融信用信息数据库的查询用户由于可以不受限制地查询信息,相继暴露出一些问题,造成信息泄露或被违规使用。查询用户的管理涉及用户所在机构、征信中心和征信业监督管理部门,需要采取多项措施,防范违规问题的产生。
-
关键词
金融信用信息
数据库管理
查询用户管理
-
分类号
F832.2
[经济管理—金融学]
-
-
题名交互式多用户Skyline查询处理算法
被引量:2
- 12
-
-
作者
邵路伊
秦小麟
王潇逸
郭成盖
邓丹萍
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2018年第8期1202-1213,共12页
-
基金
国家自然科学基金Nos.61373015
61402225
江苏省自然科学基金No.BK20140832~~
-
文摘
传统的Skyline查询是在单用户场景下设计的,随着数据库技术的发展以及应用新需求的出现,实际应用中考虑到多用户共同参与Skyline查询。在分析现有Skyline查询算法解决该问题不足的基础上,提出了一种基于权重的交互式多用户Skyline查询(weight-based interactive multi-user Skyline query,MUSW)算法。该算法定义了一种满意度度量方法,由用户权重决定Skyline结果集中每个数据点的满意度大小。MUSW算法旨在选取满意度大的数据点,首先确定多个子空间Skyline候选集;然后通过用户交互对用户权重进行动态调整,系统根据用户的反馈判断是否终止查询,从而使返回结果更符合用户的真实需求。在模拟和真实数据上验证MUSW算法的可行性,且具有良好的交互性能。
-
关键词
多用户Skyline查询
交互查询
用户权重
动态调整
-
Keywords
multiple-user Skyline query
interactive query
user weight
dynamic adjustment
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名XML图书搜索中基于用户社会关系的查询推荐方法
被引量:2
- 13
-
-
作者
黄涵娟
李新叶
田航
-
机构
武夷学院机电工程学院电子信息工程系
华北电力大学电子与通信工程系
-
出处
《计算机应用与软件》
CSCD
2015年第2期33-36,共4页
-
基金
2012年河北省教育厅指导性计划项目(Z2012038)
-
文摘
基于关键词的图书搜索系统由于用户输入查询词的模糊性和简单性往往需要利用查询推荐技术对查询词进行扩展。目前的图书查询推荐方法不能辨别出不同用户在不同时期的图书请求意图和兴趣。提出一种基于用户社会关系的查询推荐方法,首先通过分析用户个人资料信息建立用户社会关系对象集合;其次获取用户社会关系对象对图书的标记词,计算输入查询词与标记词之间的共现率并建立用户社会关系标记词推荐集合,选取与查询词共现率最高的标注词进行查询词扩展。在实际图书数据集上的实验表明,该方法大大提高了查询结果的NDCG@10值,提高用户的满意度,表明该方法具有可行性。
-
关键词
XML图书搜索
查询推荐用户社会关系
兴趣对象标注词
共现率
-
Keywords
XML book search
Query recommendation
Users' social relations
Interested object
Mark word
Rate of co-occurrence
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于用户兴趣的个性化检索
被引量:7
- 14
-
-
作者
秦春秀
赵捧未
窦永香
-
机构
西安电子科技大学经济管理学院
-
出处
《情报学报》
CSSCI
北大核心
2005年第4期449-452,共4页
-
文摘
目前检索工具的设计大都面向所有用户,而不考虑用户个人的兴趣偏好.本文提出一种基于用户兴趣的个性化检索方法.该方法自动学习用户查询的历史记录,构建用户兴趣模型,以此推导用户新提问的真正意图.实验结果表明,该方法更适宜涉及多个类别的关键词的信息检索,可提高信息检索的查准率.
-
关键词
ONTOLOGY
用户查询
历史记录
用户兴趣模型
个性化检索
检索工具
个性化
信息检索
检索方法
关键词
-
Keywords
ontology, user search history, user interest model, personalized retrieval.
-
分类号
G354.2
[文化科学—情报学]
TP393.4
[自动化与计算机技术—计算机应用技术]
-
-
题名结合用户日志的局部上下文分析方法
被引量:3
- 15
-
-
作者
熊忠阳
向海燕
张玉芳
-
机构
重庆大学计算机学院
-
出处
《计算机工程与应用》
CSCD
2012年第12期74-77,87,共5页
-
基金
重庆市科委基金资助项目(No.CSTC2008BB2191)
-
文摘
传统的局部上下文分析其应用效果高度依赖于初次检索的结果。针对此局限,通过对用户查询日志的统计分析和过滤,得到用户最可能感兴趣的文章,代替初始检索得到的N篇文章,作为查询扩展词来源文档集,用局部上下文分析方法计算词间相关度。实验结果表明,该方法能够较大地提高查询精度。
-
关键词
局部上下文分析
用户查询日志
查询扩展
过滤
-
Keywords
local context analysis
user query log
query expansion
filtration
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名OLAP系统中用户浏览行为模型分析
被引量:1
- 16
-
-
作者
周继恩
张春阳
刘贵全
蔡庆生
-
机构
中国科学技术大学计算机系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2003年第6期1025-1029,共5页
-
基金
国家自然科学基金 ( 60 0 75 15 )资助
-
文摘
用户在 OL AP系统中的行为往往有一定的规律 .在认定用户的查询意图相对稳定的前提下 ,分析用户的行为能提高 OL AP系统的性能 .而在分析用户的行为之前 ,选择合适的用户查询模型 ,记录用户的行为显得尤为重要 .本文提出一个模型 ,包含了绝大多数的 OL AP系统的操作 .
-
关键词
数据仓库
OLAP系统
用户查询行为
多维操作
-
Keywords
data warehouse
OLAP system
user query behavior
multi dimension operation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名用户搜索请求中限定成分的识别及提取
被引量:1
- 17
-
-
作者
闫琪
张志伟
宁洪
-
机构
国防科技大学计算机学院
-
出处
《计算机工程与科学》
CSCD
2000年第3期57-59,68,共4页
-
文摘
本文在研究用户常用查询语句的基础上 ,针对当前信息检索中普遍采用的单纯词匹配模式之不足 ,归纳提出三种用户查询中心词的限定成分并讨论了各种限定成分的表示和识别方法。
-
关键词
信息检索
搜索引擎
中心词
用户查询
限定成分
-
Keywords
information searching
natural language process ing
AI
search engine
-
分类号
G354.4
[文化科学—情报学]
-
-
题名基于粗糙集的查询与规则不精确匹配近邻算法
- 18
-
-
作者
胡军华
陈晓红
刘咏梅
-
机构
中南大学商学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第21期175-177,共3页
-
基金
博士后基金项目
-
文摘
针对专家系统中用于用户查询和规则之间不精确匹配问题,提出了一种包含规则的权重和条件属性重要性的近邻算法。该算法部分匹配用户查询和规则左部,计算用户查询与规则之间的距离,找出与用户查询近邻的规则。规则的权重由规则的支持度和置信度决定,而条件属性的重要性在粗糙集理论的基础上客观地计算得出。近邻规则右部就是提供给用户查询的求解方案。该算法的可行性通过一个简单实例进行了论证。
-
关键词
用户查询
置信度
支持度
粗糙集
属性重要性
-
Keywords
user query, confidence, support, rough set, attribute significance
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名大规模数字图书馆系统中的查询导航技术
- 19
-
-
作者
袁琪
王无穷
王艳春
马春光
-
机构
齐齐哈尔大学信息工程学院
齐齐哈尔市龙江县国税局
-
出处
《沈阳工业大学学报》
EI
CAS
2001年第2期143-145,共3页
-
文摘
现代数字图书馆把大批的形式多样的信息源组织起来,但是对于用户提出的查询要求,传统数据管理系统无法有效地找到相关信息 .针对这一问题提出了查询导航技术,并提出用户查询描述文件和数据源描述文件的概念及对于给定查询,利用用户查询描述文件和数据源描述文件动态发现相关信息的方法 .
-
关键词
数字图书馆
查询导航技术
用户查询描述文件
数据源描述文件
信息查询
-
Keywords
digital libraries
query routing
navigation
-
分类号
G250.76
[文化科学—图书馆学]
-
-
题名一种支持联合搜索的多用户动态对称可搜索加密方案
被引量:5
- 20
-
-
作者
张蓝蓝
曹卫东
王怀超
-
机构
中国民航大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第10期2309-2322,共14页
-
基金
民航安全能力基金项目(SA2020280)。
-
文摘
近年来,满足前后向安全的动态对称可搜索加密(dynamic symmetric searchable encryption, DSSE)一直备受关注,它可以抵抗文件注入攻击,同时限制服务器学习已删除文档的相关信息.不过大多数满足前后向安全的DSSE方案仅支持单关键词搜索,Patranabis等人在NDSS 2021会议上提出了一种支持联合搜索且满足前后向安全的动态可搜索加密方案,但该方案在某些情况下不能得到准确的查询结果,同时不能支持多用户查询.针对以上问题,通过改进不经意交叉索引(oblivious cross tags, OXT)协议,提出了一种支持联合搜索的多用户动态对称可搜索加密方案.该方案利用有限域中元素具有乘法逆元的性质,引入了一次性盲因子,并结合数字信封技术实现了多客户端查询的功能.方案分析与实验表明,所提方案满足了前向安全与后向安全,不仅可以提供准确的联合查询功能,而且支持多客户端查询,同时计算效率仅与更新次数最低的关键词更新次数有关.
-
关键词
前后向安全
动态对称可搜索加密
联合搜索
多用户查询
不经意交叉索引
-
Keywords
forward and backward security
dynamic symmetric searchable encryption(DSSE)
conjunctive search
multi-user query
oblivious cross tags(OXT)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-