期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
关键词自动标引的最大熵模型应用研究 被引量:93
1
作者 李素建 王厚峰 +1 位作者 俞士汶 辛乘胜 《计算机学报》 EI CSCD 北大核心 2004年第9期1192-1197,共6页
关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现... 关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现有资源的实际情况 ,作者首先建立了最大熵模型的特征集合 ,然后提出了三种试验方法 ,并给出了相应的试验结果 ,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨 .该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示 . 展开更多
关键词 关键词标引 关键词抽取 最大熵模型 信息抽取
在线阅读 下载PDF
数据库模糊查询结果自动排序方法 被引量:4
2
作者 孟祥福 马宗民 严丽 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第7期960-964,共5页
数据库模糊查询会产生多个查询结果,因此有必要将查询结果按照用户需求进行排序.首先根据元组对模糊查询的隶属度,将查询结果中具有不同隶属度的元组分开.然后,利用PIR改进模型和历史查询记录来分析元组中被查询指定的属性值与未指定的... 数据库模糊查询会产生多个查询结果,因此有必要将查询结果按照用户需求进行排序.首先根据元组对模糊查询的隶属度,将查询结果中具有不同隶属度的元组分开.然后,利用PIR改进模型和历史查询记录来分析元组中被查询指定的属性值与未指定的属性值之间的关联程度,从而获得用户偏好并以此对具有相同隶属度的元组进行排序.在此基础上,提出了模糊查询下的DPR自动排序方法.实验及分析证明,提出的模糊查询结果自动排序方法能够极大地提高排序质量. 展开更多
关键词 数据库 模糊查询 pir模型 查询结果排序
在线阅读 下载PDF
信息检索的概率模型 被引量:14
3
作者 邢永康 马少平 《计算机科学》 CSCD 北大核心 2003年第8期13-17,共5页
The study of mathematical models on information retrieval is an important area in the Information Retrievalcommunity. Because of the uncertainty characteristic of IR,the probability model based on statistical probabil... The study of mathematical models on information retrieval is an important area in the Information Retrievalcommunity. Because of the uncertainty characteristic of IR,the probability model based on statistical probability is apromising model from recent to future. Those models can be classified into classical models and probability networkmodels. Several famous models are introduced and their shortcomings are pointed out in this paper. We also clarifythe relationship of these models and introduce a new models based on statistical language model curtly. 展开更多
关键词 信息检索 概率模型 多媒体信息 文档 数学模型
在线阅读 下载PDF
面向多用户的多层嵌套数据库加密方案 被引量:2
4
作者 周福才 张鑫月 +1 位作者 曾康 秦诗悦 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第12期1691-1696,共6页
围绕外包数据的安全性问题与用户隐私性问题,展开对加密数据库方案的研究,提出了一个面向多用户的多层嵌套数据库加密方案.该方案根据洋葱模型多层理论,采用多种不同类型的加密算法对用户的外包数据进行多层嵌套加密,实现了既保证数据... 围绕外包数据的安全性问题与用户隐私性问题,展开对加密数据库方案的研究,提出了一个面向多用户的多层嵌套数据库加密方案.该方案根据洋葱模型多层理论,采用多种不同类型的加密算法对用户的外包数据进行多层嵌套加密,实现了既保证数据机密性又满足多种不同SQL查询类型的数据库加密方案.针对用户递交包含敏感信息的查询语句在一定程度上泄露用户自身的隐私这一问题,设计了基于单服务器私有信息检索(private information retrieval,PIR)技术的用户隐私保护机制,实现了用户匿名查询.安全性分析表明,该方案满足数据机密性与用户隐私性. Sysbench基准测试实验分析表明,该方案具有良好的查询处理效率、读写吞吐量以及健壮性. 展开更多
关键词 外包数据 洋葱加密模型 数据库加密 pir 隐私保护
在线阅读 下载PDF
统计语言模型在信息检索中的应用 被引量:1
5
作者 赵正文 康耀红 《计算机工程与应用》 CSCD 北大核心 2006年第36期158-161,共4页
首先介绍了统计语言模型(SLM)的发展及常用的N元(n-gram)模型,对信息检索过程中的主要模型作了公式化描述并比较了不同模型,指出了它们之间及与传统概率检索方法的异同,分析了统计语言模型的弱点,最后介绍了对其可能的改进方法及最新研... 首先介绍了统计语言模型(SLM)的发展及常用的N元(n-gram)模型,对信息检索过程中的主要模型作了公式化描述并比较了不同模型,指出了它们之间及与传统概率检索方法的异同,分析了统计语言模型的弱点,最后介绍了对其可能的改进方法及最新研究进展,讨论了在中文信息检索中的应用和面对的挑战。 展开更多
关键词 统计语言模型 信息检索 概率模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部